Skip to main content
Manus에서 모든 스킬 실행
원클릭으로
$pwd:

gsm8k-eval

// GSM8K evaluation protocol: answer extraction (####, \boxed, CoT), accuracy scoring, prompt formatting, few-shot exemplars, dataset loading, pitfalls. Use when: GSM8K, grade school math, openai/gsm8k, #### delimiter, parse_gsm8k_answer, detect_answer_failure, load_gsm8k, format_chat, math benchmark scoring, gsm8k few-shot, chain-of-thought eval.

$ git log --oneline --stat
stars:2
forks:0
updated:2026년 3월 23일 21:16
파일 탐색기
3 개 파일
SKILL.md
readonly