Skip to main content
تشغيل أي مهارة في Manus
بنقرة واحدة

gsm8k-eval

// GSM8K evaluation protocol: answer extraction (####, \boxed, CoT), accuracy scoring, prompt formatting, few-shot exemplars, dataset loading, pitfalls. Use when: GSM8K, grade school math, openai/gsm8k, #### delimiter, parse_gsm8k_answer, detect_answer_failure, load_gsm8k, format_chat, math benchmark scoring, gsm8k few-shot, chain-of-thought eval.

$ git log --oneline --stat
stars:٢
forks:٠
updated:٢٣ مارس ٢٠٢٦ في ٢١:١٦
مستكشف الملفات
3 ملفات
SKILL.md
readonly