Skip to main content
Manusで任意のスキルを実行
ワンクリックで
$pwd:

advanced-evaluation

// This skill should be used for advanced LLM evaluation: LLM-as-judge systems, direct scoring, pairwise comparison, rubric calibration, evaluator bias mitigation, confidence scoring, and automated quality assessment.

$ git log --oneline --stat
stars:15,902
forks:1,286
updated:2026年5月19日 06:08
ファイルエクスプローラー
6 ファイル
SKILL.md
readonly