Skip to main content
在 Manus 中运行任何 Skill
一键导入

evaluation

This skill should be used when building agent evaluation systems: deterministic checks, regression suites, multi-dimensional rubrics, quality gates, production monitoring, baseline comparison, and outcome measurement for agent pipelines.

星标1
分支1
更新时间2026年5月27日 00:39
文件资源管理器
3 个文件
SKILL.md
readonly