Skip to main content
在 Manus 中运行任何 Skill
一键导入
$pwd:

advanced-evaluation

// This skill should be used for advanced LLM evaluation: LLM-as-judge systems, direct scoring, pairwise comparison, rubric calibration, evaluator bias mitigation, confidence scoring, and automated quality assessment.

$ git log --oneline --stat
stars:15,902
forks:1,286
updated:2026年5月19日 06:08
文件资源管理器
6 个文件
SKILL.md
readonly