Skip to main content
تشغيل أي مهارة في Manus
بنقرة واحدة
$pwd:

advanced-evaluation

// This skill should be used for advanced LLM evaluation: LLM-as-judge systems, direct scoring, pairwise comparison, rubric calibration, evaluator bias mitigation, confidence scoring, and automated quality assessment.

$ git log --oneline --stat
stars:١٥٬٩٠٢
forks:١٬٢٨٦
updated:١٩ مايو ٢٠٢٦ في ٠٦:٠٨
مستكشف الملفات
6 ملفات
SKILL.md
readonly