Skip to main content
Ejecuta cualquier Skill en Manus
con un clic

evaluating-llms-harness

Estrellas200.781
Forks35.794
Actualizado8 de mayo de 2026, 21:27

lm-eval-harness: benchmark LLMs (MMLU, GSM8K, etc.).

Instalación

Instalar con Codex o Claude Copia este prompt, pégalo en Codex, Claude u otro asistente, y deja que revise la página de la skill y la instale por ti.

Explorador de archivos
5 archivos
SKILL.md
readonly