Skip to main content
Manusで任意のスキルを実行
ワンクリックで

sc-evaluate

LLM pipeline evaluation with oracle judge scoring. Runs prompts against gold standard datasets, evaluates output quality via LLM-as-judge, and generates scored reports with improvement recommendations.

概要

LLM pipeline evaluation with oracle judge scoring. Runs prompts against gold standard datasets, evaluates output quality via LLM-as-judge, and generates scored reports with improvement recommendations.

インストールコマンド
npx skills add https://github.com/Tony363/SuperClaude --skill sc-evaluate

このコマンドをClaude Codeにコピー&ペーストしてスキルをインストール

スター18
フォーク2
更新日2026年3月2日 00:23
SKILL.md
readonly