Skip to main content
Exécutez n'importe quel Skill dans Manus
en un clic

ml-model-eval-benchmark

Étoiles1
Forks1
Mis à jour13 mars 2026 à 04:04

Compare model candidates using weighted metrics and deterministic ranking outputs. Use for benchmark leaderboards and model promotion decisions.

Installation

Installer avec Codex ou Claude Copiez ce prompt, collez-le dans Codex, Claude ou un autre assistant, puis laissez-le vérifier la page du skill et l'installer pour vous.

Explorateur de fichiers
5 fichiers
SKILL.md
readonly