Skip to main content
Exécutez n'importe quel Skill dans Manus
en un clic

rl-policy-optimization

Étoiles13 557
Forks1 589
Mis à jour23 mars 2026 à 01:46

Best practices for reinforcement learning policy optimization. Use when working on RL agents, PPO, SAC, or reward design.

Installation

Installer avec Codex ou Claude Copiez ce prompt, collez-le dans Codex, Claude ou un autre assistant, puis laissez-le vérifier la page du skill et l'installer pour vous.

SKILL.md
readonly