Skip to main content
Manusで任意のスキルを実行
ワンクリックで

evaluation

This skill should be used when building agent evaluation systems: deterministic checks, regression suites, multi-dimensional rubrics, quality gates, production monitoring, baseline comparison, and outcome measurement for agent pipelines.

スター1
フォーク1
更新日2026年5月27日 00:39
ファイルエクスプローラー
3 ファイル
SKILL.md
readonly