Skip to main content
Jeden Skill in Manus ausführen
mit einem Klick

evaluating-llms-harness

Sterne200.781
Forks35.794
Aktualisiert8. Mai 2026 um 21:27

lm-eval-harness: benchmark LLMs (MMLU, GSM8K, etc.).

Installation

Mit Codex oder Claude installieren Kopieren Sie diesen Prompt, fügen Sie ihn in Codex, Claude oder einen anderen Assistant ein und lassen Sie die Skill-Seite prüfen und installieren.

Datei-Explorer
5 Dateien
SKILL.md
readonly