Skip to main content
تشغيل أي مهارة في Manus
بنقرة واحدة

slime-rl-training

النجوم٩٬٩٩٦
التفرعات٧٤٥
آخر تحديث٢٩ يناير ٢٠٢٦ في ٠١:٣٥

Provides guidance for LLM post-training with RL using slime, a Megatron+SGLang framework. Use when training GLM models, implementing custom data generation workflows, or needing tight Megatron-LM integration for RL scaling.

التثبيت

التثبيت باستخدام Codex أو Claude انسخ هذا Prompt والصقه في Codex أو Claude أو مساعد آخر ليراجع صفحة Skill ويثبّتها لك.

مستكشف الملفات
3 ملفات
SKILL.md
readonly