Skip to main content
تشغيل أي مهارة في Manus
بنقرة واحدة

verl-rl-training

النجوم٩٬٩٩٦
التفرعات٧٤٥
آخر تحديث٢٩ يناير ٢٠٢٦ في ٠١:٣٥

Provides guidance for training LLMs with reinforcement learning using verl (Volcano Engine RL). Use when implementing RLHF, GRPO, PPO, or other RL algorithms for LLM post-training at scale with flexible infrastructure backends.

التثبيت

التثبيت باستخدام Codex أو Claude انسخ هذا Prompt والصقه في Codex أو Claude أو مساعد آخر ليراجع صفحة Skill ويثبّتها لك.

مستكشف الملفات
3 ملفات
SKILL.md
readonly