Skip to main content
Manusで任意のスキルを実行
ワンクリックで

llm-eval

// LLM output evaluation pipeline: audit evals, failure analysis, synthetic data, LLM-as-Judge, RAG eval, annotation design. Triggers on: llm eval, evaluate ai, eval pipeline, judge calibration, rag eval, ai quality, /llm-eval.

$ git log --oneline --stat
stars:0
forks:1
updated:2026年4月18日 17:40
ファイルエクスプローラー
2 ファイル
SKILL.md
readonly