Skip to main content
Manus에서 모든 스킬 실행
원클릭으로

rl-training-diagnoser

Use when analyzing RL training status from W&B or local logged metrics, especially actor KL loss, PPO KL, grad norm, clipfrac, critic score/reward/advantages, response length, global sequence length, entropy, invalid draft rates, and diagnosing failures by checking run config and Search-R1/verl implementation.

스타1
포크0
업데이트2026년 4월 18일 07:31
파일 탐색기
4 개 파일
SKILL.md
readonly