Skip to main content
تشغيل أي مهارة في Manus
بنقرة واحدة

evaluation

// This skill should be used when building agent evaluation systems: deterministic checks, regression suites, multi-dimensional rubrics, quality gates, production monitoring, baseline comparison, and outcome measurement for agent pipelines.

$ git log --oneline --stat
stars:١٥٬٩٠٢
forks:١٬٢٨٦
updated:١٩ مايو ٢٠٢٦ في ٠٦:٠٨
مستكشف الملفات
3 ملفات
SKILL.md
readonly