Skip to main content
تشغيل أي مهارة في Manus
بنقرة واحدة
$pwd:

grpo-finetuning

// Implement GRPO (Group Relative Policy Optimization) fine-tuning for vision-language models on small datasets. Use when SFT underperforms or training data is limited (<1000 examples).

$ git log --oneline --stat
stars:٣١٤
forks:١٢١
updated:٢٧ يناير ٢٠٢٦ في ١٨:٤٧
SKILL.md
readonly