Skip to main content
Execute qualquer Skill no Manus
com um clique

evaluating-llms-harness

Estrelas200.781
Forks35.794
Atualizado8 de maio de 2026 às 21:27

lm-eval-harness: benchmark LLMs (MMLU, GSM8K, etc.).

Instalação

Instalar com Codex ou Claude Copie este prompt, cole no Codex, Claude ou outro assistente e deixe que ele revise a página da skill e instale para você.

Explorador de arquivos
5 arquivos
SKILL.md
readonly