Skip to main content
Manusで任意のスキルを実行
ワンクリックで

ml-model-eval-benchmark

スター1
フォーク1
更新日2026年3月13日 04:04

Compare model candidates using weighted metrics and deterministic ranking outputs. Use for benchmark leaderboards and model promotion decisions.

インストール

Codex または Claude でインストール この Prompt をコピーして Codex、Claude、または他のアシスタントに貼り付けると、Skill ページを確認してインストールできます。

ファイルエクスプローラー
5 ファイル
SKILL.md
readonly