Skip to main content
Execute qualquer Skill no Manus
com um clique

nemo-evaluator-sdk

Estrelas9.996
Forks745
Atualizado15 de janeiro de 2026 às 20:38

Evaluates LLMs across 100+ benchmarks from 18+ harnesses (MMLU, HumanEval, GSM8K, safety, VLM) with multi-backend execution. Use when needing scalable evaluation on local Docker, Slurm HPC, or cloud platforms. NVIDIA's enterprise-grade platform with container-first architecture for reproducible benchmarking.

Instalação

Instalar com Codex ou Claude Copie este prompt, cole no Codex, Claude ou outro assistente e deixe que ele revise a página da skill e instale para você.

Explorador de arquivos
5 arquivos
SKILL.md
readonly