Manus에서 모든 스킬 실행
원클릭으로
원클릭으로
원클릭으로 Manus에서 모든 스킬 실행
시작하기$pwd:
$ git log --oneline --stat
stars:78
forks:10
updated:2026년 5월 10일 10:24
SKILL.md
hello-rocm 开源教程项目:AMD ROCm 上大模型环境、部署、微调与算子/Infra。 当用户询问 AMD GPU、ROCm、Windows/Linux 上本地 LLM 推理与部署、vLLM/Ollama/LM Studio、 LoRA 微调、HIP/RCCL、hello-rocm 仓库结构、学习顺序或贡献规范时,必须加载并遵循本 Skill。
P1 新用户闪电部署检查表 —— 最简路径跑通第一个模型
| name | hello-rocm-troubleshooting |
| description | 跨画像常见问题排查 —— 错误模式识别和修复建议 |
| version | 0.1.0 |
当用户遇到报错时触发。先匹配错误模式,再给出修复方案。
| 错误现象 | 可能原因 | 修复方向 |
|---|---|---|
rocminfo 找不到 GPU | ROCm 未正确安装或 GPU 不兼容 | 先查 docs/zh/00-environment/rocm-gpu-architecture-table.md / docs/en/00-environment/rocm-gpu-architecture-table.md,再对照环境教程重装 |
torch.cuda.is_available() 返回 False | PyTorch 不是 ROCm 版本 | 先查 docs/zh/04-references/index.md / docs/en/04-references/index.md 的 PyTorch ROCm 官方安装入口,再对照环境教程重装 |
| 显存不足 (OOM) | batch size 过大或模型过大 | 减小 batch size、开启 gradient accumulation、启用 DeepSpeed ZeRO、使用 LoRA |
| HIP 编译错误 | ROCm 版本与代码不匹配 | 确认 hipcc --version,参考 03-Infra/ 对应章节的 API 版本 |
Permission denied | 用户权限不足 | 检查 Docker 用户组(sudo usermod -aG docker $USER),或文件权限 |
| 多卡训练速度不理想 | 通信瓶颈 | rocm-bandwidth-test 检查带宽,确认 NCCL_DEBUG=INFO(或 HIP 等效环境变量) |
rocminfo / rocm-smipython -c "import torch; print(torch.__version__)"<details> FAQ 折叠区docs/zh/04-references/index.md / docs/en/04-references/index.md 的框架与推理服务表进入对应官方安装说明,再查 https://rocm.docs.amd.com/ 或 ROCm GitHub Issueshttps://zcnijjcepfie.feishu.cn/docx/R2a4dDRUBoo1R2x7mOjcPpPPnOO