Skip to main content
Exécutez n'importe quel Skill dans Manus
en un clic
$pwd:

evaluating-llms-harness

// lm-eval-harness: benchmark LLMs (MMLU, GSM8K, etc.).

$ git log --oneline --stat
stars:154 540
forks:24 744
updated:8 mai 2026 à 21:27
Explorateur de fichiers
5 fichiers
SKILL.md
readonly