Skip to main content
تشغيل أي مهارة في Manus
بنقرة واحدة

evaluating-code-models

النجوم٩٬٩٩٦
التفرعات٧٤٥
آخر تحديث١٤ ديسمبر ٢٠٢٥ في ٠٠:٣٨

Evaluates code generation models across HumanEval, MBPP, MultiPL-E, and 15+ benchmarks with pass@k metrics. Use when benchmarking code models, comparing coding abilities, testing multi-language support, or measuring code generation quality. Industry standard from BigCode Project used by HuggingFace leaderboards.

التثبيت

التثبيت باستخدام Codex أو Claude انسخ هذا Prompt والصقه في Codex أو Claude أو مساعد آخر ليراجع صفحة Skill ويثبّتها لك.

مستكشف الملفات
4 ملفات
SKILL.md
readonly