Skip to main content
تشغيل أي مهارة في Manus
بنقرة واحدة

trl-training

// Train and fine-tune transformer language models using TRL (Transformers Reinforcement Learning). Supports SFT, DPO, GRPO, KTO, RLOO and Reward Model training via CLI commands.

$ git log --oneline --stat
stars:١٨٬٤٤٩
forks:٢٬٧٣٦
updated:١٦ فبراير ٢٠٢٦ في ١٦:٠٢
SKILL.md
readonly