Skip to main content
تشغيل أي مهارة في Manus
بنقرة واحدة

eval-guide

// Guide for running statistically meaningful agent-tty evals with trials, parallelism, and A/B comparison. Covers non-determinism baseline, recommended sample sizes, and result interpretation.

$ git log --oneline --stat
stars:٣
forks:٠
updated:١٩ أبريل ٢٠٢٦ في ١٤:٥٣
SKILL.md
readonly