Skip to main content
Ejecuta cualquier Skill en Manus
con un clic
$pwd:

evaluating-llms-harness

// lm-eval-harness: benchmark LLMs (MMLU, GSM8K, etc.).

$ git log --oneline --stat
stars:154.540
forks:24.744
updated:8 de mayo de 2026, 21:27
Explorador de archivos
5 archivos
SKILL.md
readonly