Skip to main content
تشغيل أي مهارة في Manus
بنقرة واحدة

debug-training-logs

Debug distributed training failures (NeMo, Megatron, PyTorch) from worker stderr logs and optional AIStore daemon logs. Finds root cause across NCCL timeouts, data loading errors, and storage failures.

النجوم١٧٬٣٩٠
التفرعات٣٬٤٣٦
آخر تحديث١٥ أبريل ٢٠٢٦ في ٢٠:٥٣
SKILL.md
readonly