Skip to main content
تشغيل أي مهارة في Manus
بنقرة واحدة
$pwd:

evaluating-llms-harness

// lm-eval-harness: benchmark LLMs (MMLU, GSM8K, etc.).

$ git log --oneline --stat
stars:١٥٤٬٥٤٠
forks:٢٤٬٧٤٤
updated:٨ مايو ٢٠٢٦ في ٢١:٢٧
مستكشف الملفات
5 ملفات
SKILL.md
readonly