Skip to main content
تشغيل أي مهارة في Manus
بنقرة واحدة
$pwd:

debug-training-logs

// Debug distributed training failures (NeMo, Megatron, PyTorch) from worker stderr logs and optional AIStore daemon logs. Finds root cause across NCCL timeouts, data loading errors, and storage failures.

$ git log --oneline --stat
stars:١٧٬٢٥٣
forks:٣٬٤١٧
updated:١٥ أبريل ٢٠٢٦ في ٢٠:٥٣
SKILL.md
readonly