Skip to main content
Manusで任意のスキルを実行
ワンクリックで
$pwd:

evaluating-llms-harness

// lm-eval-harness: benchmark LLMs (MMLU, GSM8K, etc.).

$ git log --oneline --stat
stars:154,540
forks:24,744
updated:2026年5月8日 21:27
ファイルエクスプローラー
5 ファイル
SKILL.md
readonly