Skip to main content
Exécutez n'importe quel Skill dans Manus
en un clic

evaluation

// This skill should be used when building agent evaluation systems: deterministic checks, regression suites, multi-dimensional rubrics, quality gates, production monitoring, baseline comparison, and outcome measurement for agent pipelines.

$ git log --oneline --stat
stars:15 902
forks:1 286
updated:19 mai 2026 à 06:08
Explorateur de fichiers
3 fichiers
SKILL.md
readonly