Skip to main content
تشغيل أي مهارة في Manus
بنقرة واحدة

evaluating-llms-harness

النجوم٢٠٠٬٧٨١
التفرعات٣٥٬٧٩٤
آخر تحديث٨ مايو ٢٠٢٦ في ٢١:٢٧

lm-eval-harness: benchmark LLMs (MMLU, GSM8K, etc.).

التثبيت

التثبيت باستخدام Codex أو Claude انسخ هذا Prompt والصقه في Codex أو Claude أو مساعد آخر ليراجع صفحة Skill ويثبّتها لك.

مستكشف الملفات
5 ملفات
SKILL.md
readonly