Skip to main content
تشغيل أي مهارة في Manus
بنقرة واحدة

miles-rl-training

النجوم٩٬٩٩٦
التفرعات٧٤٥
آخر تحديث٢٩ يناير ٢٠٢٦ في ٠١:٣٥

Provides guidance for enterprise-grade RL training using miles, a production-ready fork of slime. Use when training large MoE models with FP8/INT4, needing train-inference alignment, or requiring speculative RL for maximum throughput.

التثبيت

التثبيت باستخدام Codex أو Claude انسخ هذا Prompt والصقه في Codex أو Claude أو مساعد آخر ليراجع صفحة Skill ويثبّتها لك.

مستكشف الملفات
3 ملفات
SKILL.md
readonly