Execute qualquer Skill no Manus
com um clique

Execute qualquer Skill no Manus com um clique

$pwd:

paddle-build

Name: Paddle Build
Author: PaddlePaddle

// Use when needing to compile, rebuild, or install Paddle from source after code changes. Covers cmake configuration, ninja incremental build, wheel packaging, and common build failure diagnosis.

Executar no Manus

$ git log --oneline --stat

stars:23.910

forks:5.996

updated:26 de março de 2026 às 15:27

Explorador de arquivos

2 arquivos

SKILL.md

readonly

name	paddle-build
description	Use when needing to compile, rebuild, or install Paddle from source after code changes. Covers cmake configuration, ninja incremental build, wheel packaging, and common build failure diagnosis.

Paddle 源码编译

概览

Paddle 使用 CMake + Ninja 构建。典型流程：cmake 配置 → ninja 编译 → whl 打包安装。修改 C++/CUDA 代码后需重新编译才能生效。

编译流程

1. 环境准备（venv）

cd /workspace/Paddle
uv venv --relocatable --seed --python 3.10   # 首次创建
source .venv/bin/activate
uv pip install -r python/requirements.txt
uv pip install func_timeout pandas numpy "numpy<2.0"

若 .venv 已存在，直接 source .venv/bin/activate 即可。

2. CMake 配置

mkdir -p build && cd build
cmake .. \
  -GNinja \
  -DCMAKE_BUILD_TYPE=Release \
  -DCMAKE_EXPORT_COMPILE_COMMANDS=ON \
  -DPY_VERSION=3.10 \
  -DPADDLE_VERSION=0.0.0 \
  -DCUDA_ARCH_NAME=Auto \
  -DWITH_GPU=ON \
  -DWITH_DISTRIBUTE=ON \
  -DWITH_CINN=ON \
  -DWITH_UNITY_BUILD=OFF \
  -DWITH_TESTING=OFF

配置只需首次执行或 CMake 选项变更时重新执行。

3. 编译

ninja -j$(nproc)

Ninja 自动增量编译，仅重编变更文件及其依赖。

4. 安装

cd /workspace/Paddle
uv pip install build/python/dist/*.whl --no-deps --force-reinstall

--no-deps 跳过依赖解析加速安装，--force-reinstall 确保覆盖旧版。

常用 CMake 选项

选项	默认	说明
`WITH_GPU`	ON(有CUDA时)	GPU 支持
`WITH_DISTRIBUTE`	OFF	分布式训练
`WITH_CINN`	OFF	CINN 编译器
`WITH_TESTING`	ON	C++ 单测（关闭可加速编译）
`WITH_UNITY_BUILD`	OFF	合并编译单元加速（可能掩盖头文件问题）
`CUDA_ARCH_NAME`	Auto	GPU 架构，Auto 自动检测当前卡
`CMAKE_BUILD_TYPE`	Release	Debug 可调试但更慢
`CMAKE_EXPORT_COMPILE_COMMANDS`	OFF	生成 `compile_commands.json` 供 clangd 使用
`WITH_TENSORRT`	OFF	TensorRT 推理加速
`WITH_ROCM`	OFF	AMD ROCm 支持
`WITH_XPU`	OFF	百度昆仑 XPU 支持

增量编译策略

digraph incremental {
  "修改了什么?" [shape=diamond];
  "Python 代码" [shape=box, label="无需编译\n同步源码到构建目录后测试"];
  "C++/CUDA kernel" [shape=box, label="ninja → 安装 whl"];
  "CMakeLists / cmake 选项" [shape=box, label="重新 cmake → ninja → 安装 whl"];
  "YAML (ops/backward)" [shape=box, label="ninja（触发代码生成）→ 安装 whl"];

  "修改了什么?" -> "Python 代码" [label="python/"];
  "修改了什么?" -> "C++/CUDA kernel" [label="paddle/phi/"];
  "修改了什么?" -> "CMakeLists / cmake 选项" [label="cmake/"];
  "修改了什么?" -> "YAML (ops/backward)" [label="ops.yaml 等"];
}

仅改 Python：无需编译。如果直接在 build/python 下编辑测试，改动即时生效。也可以在源码目录编辑后通过 cp python/<src> build/python/<src> 或者 cp test/<src> build/test/<src> 同步到构建目录。
改 C++/CUDA：cd build && ninja -j$(nproc) + 重新安装 whl。
改 CMake 配置：需重新 cmake .. 再 ninja。
改 YAML（ops.yaml / backward.yaml）：ninja 会自动触发代码生成脚本。

检查已有构建产物

复用已有 build 可大幅节约时间：

# 检查是否已有 whl
ls build/python/dist/*.whl 2>/dev/null && echo "已有构建产物" || echo "需要编译"

# 检查 compile_commands.json（clangd 需要）
ls build/compile_commands.json 2>/dev/null

常见编译问题

症状	原因	解决
`ninja: error: loading 'build.ninja'`	未执行 cmake 配置	先执行 cmake 命令
CUDA arch 不匹配	`CUDA_ARCH_NAME` 与实际 GPU 不符	设为 `Auto` 或指定具体架构
链接时 OOM	并行链接占用过多内存	`ninja -j4` 减少并行度
protobuf 版本冲突	系统 protobuf 与编译版本不一致	在 venv 内编译，隔离系统包
`ccache` 缓存失效导致全量重编	头文件路径变更	清理 ccache: `ccache -C`
whl 安装后 import 报错	旧 .so 残留	`--force-reinstall` 或清理 `site-packages/paddle`

完整一键编译示例

cd /workspace/Paddle
source .venv/bin/activate
cd build
ninja -j$(nproc) && cd .. && uv pip install build/python/dist/*.whl --no-deps --force-reinstall

调试编译（Debug 模式）

需要 gdb 调试 C++ 代码时，将 CMAKE_BUILD_TYPE 改为 Debug：

cmake .. -GNinja -DCMAKE_BUILD_TYPE=Debug [其他选项...]
ninja -j$(nproc)

Debug 模式编译产物更大、运行更慢，仅在需要调试时使用。

关键目录

目录	说明
`build/`	构建产物根目录
`build/python/dist/`	生成的 whl 文件
`build/compile_commands.json`	clangd 索引文件
`paddle/phi/kernels/`	PHI kernel 源码
`paddle/phi/ops/yaml/`	算子 YAML 定义
`cmake/`	CMake 模块和工具链

平台特定指南

平台	参考文档
macOS (Apple Silicon) CPU 编译	references/mac-build.md

related-skills.json

mesmo repositório

paddle-cross-ecosystem-custom-op.md

from "PaddlePaddle/Paddle"

将原生 PyTorch 自定义算子库、Torch extension、生态库（TorchCodec/FlashInfer/DeepEP 等）以及 Kernel DSL 生态（Triton/TileLang/TVM FFI 等）以最小修改方式接入 PaddlePaddle。遇到以下场景务必使用：迁移外部算子库到 Paddle；分析 PFCCLab fork 与上游的兼容差异；处理 paddle.enable_compat、paddle.utils.cpp_extension、TORCH_LIBRARY、torch.ops、at::Tensor/c10 compat 问题；为 compat gap 设计最小 workaround 并准备 Paddle issue 最小复现。

2026-05-0223.9k

paddle-debug.md

from "PaddlePaddle/Paddle"

在 Paddle 代码库中定位问题并输出高质量调试报告的专用技能。当遇到以下场景时优先使用：(1) Paddle 框架 bug 调试，(2) 算子实现问题排查，(3) 训练脚本异常诊断，(4) 分布式训练故障定位，(5) CUDA/GPU 相关错误处理，(6) 需要生成结构化调试报告。

2026-04-0123.9k

paddle-op-dev.md

from "PaddlePaddle/Paddle"

PaddlePaddle (飞桨) C++ 算子开发指南。提供从 YAML 配置、InferMeta 函数、Kernel 实现、Python API 封装、单元测试到编译验证的完整算子开发流程指导。在以下场景使用此 skill：(1) 为 Paddle 框架新增 C++ 算子 (2) 修改或调试已有 Paddle 算子 (3) 编写算子的 YAML 配置、InferMeta、Kernel、Python API 或单元测试 (4) 理解 Paddle 算子开发架构和流程 (5) 编译 Paddle 并验证算子正确性

2026-03-3023.9k

paddle-design-compiler.md

from "PaddlePaddle/Paddle"

Use when working with Paddle 3.0 compiler full pipeline: SOT (Symbolic Opcode Translator) for bytecode-level dy2st graph capture, PIR (Paddle IR) for SSA-based intermediate representation, CINN for fused CUDA kernel generation, operator decomposition (Prim), or the end-to-end flow from Python eager code to optimized GPU execution.

2026-03-2623.9k

paddle-design-distributed.md

from "PaddlePaddle/Paddle"

Use when working with Paddle's distributed training system: understanding parallelism strategies (DP, ZeRO, TP, PP, SP), semi-automatic parallel with ProcessMesh + shard_tensor, SPMD inference rules, pipeline scheduling, or auto_parallel Engine.

2026-03-2623.9k

paddle-eager-graph.md

from "PaddlePaddle/Paddle"

Use when navigating Paddle eager-mode (dynamic graph) source code, tracing forward/backward execution, debugging autograd issues, understanding PyLayer, or investigating complex-valued gradient computation. Covers Python API to C++ kernel call chain, backward graph topology sort, and inplace version tracking.

2026-03-2623.9k

package.json

"author": "PaddlePaddle"

"repository": "PaddlePaddle/Paddle"

Abrir repositório GitHub Ver repositórios do creator

$ install --global

$ download --local

Executar no Manus

$ useful --forSOC

Desenvolvedores de softwareInformática e Matemática15-1252L4

name	paddle-build
description	Use when needing to compile, rebuild, or install Paddle from source after code changes. Covers cmake configuration, ninja incremental build, wheel packaging, and common build failure diagnosis.

Paddle 源码编译

概览

Paddle 使用 CMake + Ninja 构建。典型流程：cmake 配置 → ninja 编译 → whl 打包安装。修改 C++/CUDA 代码后需重新编译才能生效。

编译流程

1. 环境准备（venv）

cd /workspace/Paddle
uv venv --relocatable --seed --python 3.10   # 首次创建
source .venv/bin/activate
uv pip install -r python/requirements.txt
uv pip install func_timeout pandas numpy "numpy<2.0"

若 .venv 已存在，直接 source .venv/bin/activate 即可。

2. CMake 配置

mkdir -p build && cd build
cmake .. \
  -GNinja \
  -DCMAKE_BUILD_TYPE=Release \
  -DCMAKE_EXPORT_COMPILE_COMMANDS=ON \
  -DPY_VERSION=3.10 \
  -DPADDLE_VERSION=0.0.0 \
  -DCUDA_ARCH_NAME=Auto \
  -DWITH_GPU=ON \
  -DWITH_DISTRIBUTE=ON \
  -DWITH_CINN=ON \
  -DWITH_UNITY_BUILD=OFF \
  -DWITH_TESTING=OFF

配置只需首次执行或 CMake 选项变更时重新执行。

3. 编译

ninja -j$(nproc)

Ninja 自动增量编译，仅重编变更文件及其依赖。

4. 安装

cd /workspace/Paddle
uv pip install build/python/dist/*.whl --no-deps --force-reinstall

--no-deps 跳过依赖解析加速安装，--force-reinstall 确保覆盖旧版。

常用 CMake 选项

选项	默认	说明
`WITH_GPU`	ON(有CUDA时)	GPU 支持
`WITH_DISTRIBUTE`	OFF	分布式训练
`WITH_CINN`	OFF	CINN 编译器
`WITH_TESTING`	ON	C++ 单测（关闭可加速编译）
`WITH_UNITY_BUILD`	OFF	合并编译单元加速（可能掩盖头文件问题）
`CUDA_ARCH_NAME`	Auto	GPU 架构，Auto 自动检测当前卡
`CMAKE_BUILD_TYPE`	Release	Debug 可调试但更慢
`CMAKE_EXPORT_COMPILE_COMMANDS`	OFF	生成 `compile_commands.json` 供 clangd 使用
`WITH_TENSORRT`	OFF	TensorRT 推理加速
`WITH_ROCM`	OFF	AMD ROCm 支持
`WITH_XPU`	OFF	百度昆仑 XPU 支持

增量编译策略

digraph incremental {
  "修改了什么?" [shape=diamond];
  "Python 代码" [shape=box, label="无需编译\n同步源码到构建目录后测试"];
  "C++/CUDA kernel" [shape=box, label="ninja → 安装 whl"];
  "CMakeLists / cmake 选项" [shape=box, label="重新 cmake → ninja → 安装 whl"];
  "YAML (ops/backward)" [shape=box, label="ninja（触发代码生成）→ 安装 whl"];

  "修改了什么?" -> "Python 代码" [label="python/"];
  "修改了什么?" -> "C++/CUDA kernel" [label="paddle/phi/"];
  "修改了什么?" -> "CMakeLists / cmake 选项" [label="cmake/"];
  "修改了什么?" -> "YAML (ops/backward)" [label="ops.yaml 等"];
}

仅改 Python：无需编译。如果直接在 build/python 下编辑测试，改动即时生效。也可以在源码目录编辑后通过 cp python/<src> build/python/<src> 或者 cp test/<src> build/test/<src> 同步到构建目录。
改 C++/CUDA：cd build && ninja -j$(nproc) + 重新安装 whl。
改 CMake 配置：需重新 cmake .. 再 ninja。
改 YAML（ops.yaml / backward.yaml）：ninja 会自动触发代码生成脚本。

检查已有构建产物

复用已有 build 可大幅节约时间：

# 检查是否已有 whl
ls build/python/dist/*.whl 2>/dev/null && echo "已有构建产物" || echo "需要编译"

# 检查 compile_commands.json（clangd 需要）
ls build/compile_commands.json 2>/dev/null

常见编译问题

症状	原因	解决
`ninja: error: loading 'build.ninja'`	未执行 cmake 配置	先执行 cmake 命令
CUDA arch 不匹配	`CUDA_ARCH_NAME` 与实际 GPU 不符	设为 `Auto` 或指定具体架构
链接时 OOM	并行链接占用过多内存	`ninja -j4` 减少并行度
protobuf 版本冲突	系统 protobuf 与编译版本不一致	在 venv 内编译，隔离系统包
`ccache` 缓存失效导致全量重编	头文件路径变更	清理 ccache: `ccache -C`
whl 安装后 import 报错	旧 .so 残留	`--force-reinstall` 或清理 `site-packages/paddle`

完整一键编译示例

cd /workspace/Paddle
source .venv/bin/activate
cd build
ninja -j$(nproc) && cd .. && uv pip install build/python/dist/*.whl --no-deps --force-reinstall

调试编译（Debug 模式）

需要 gdb 调试 C++ 代码时，将 CMAKE_BUILD_TYPE 改为 Debug：

cmake .. -GNinja -DCMAKE_BUILD_TYPE=Debug [其他选项...]
ninja -j$(nproc)

Debug 模式编译产物更大、运行更慢，仅在需要调试时使用。

关键目录

目录	说明
`build/`	构建产物根目录
`build/python/dist/`	生成的 whl 文件
`build/compile_commands.json`	clangd 索引文件
`paddle/phi/kernels/`	PHI kernel 源码
`paddle/phi/ops/yaml/`	算子 YAML 定义
`cmake/`	CMake 模块和工具链

平台特定指南

平台	参考文档
macOS (Apple Silicon) CPU 编译	references/mac-build.md

paddle-build

Paddle 源码编译

概览

编译流程

1. 环境准备（venv）

2. CMake 配置

3. 编译

4. 安装

常用 CMake 选项

增量编译策略

检查已有构建产物

常见编译问题

完整一键编译示例

调试编译（Debug 模式）

关键目录

平台特定指南

Mais deste repositório

Mais deste repositório

Paddle 源码编译

概览

编译流程

1. 环境准备（venv）

2. CMake 配置

3. 编译

4. 安装

常用 CMake 选项

增量编译策略

检查已有构建产物

常见编译问题

完整一键编译示例

调试编译（Debug 模式）

关键目录

平台特定指南