Skip to main content
Ejecuta cualquier Skill en Manus
con un clic

evaluation

This skill should be used when building agent evaluation systems: deterministic checks, regression suites, multi-dimensional rubrics, quality gates, production monitoring, baseline comparison, and outcome measurement for agent pipelines.

Estrellas1
Forks1
Actualizado27 de mayo de 2026, 00:39
Explorador de archivos
3 archivos
SKILL.md
readonly