Skip to main content
تشغيل أي مهارة في Manus
بنقرة واحدة

stable-baselines3

النجوم٢٩٬١٤٧
التفرعات٢٬٩٧٠
آخر تحديث١١ يونيو ٢٠٢٦ في ٢١:٢٣

Production-ready reinforcement learning algorithms (PPO, SAC, DQN, TD3, DDPG, A2C) with scikit-learn-like API. Use for standard RL experiments, quick prototyping, and well-documented algorithm implementations. Best for single-agent RL with Gymnasium environments. For high-performance parallel training, multi-agent systems, or custom vectorized environments, use pufferlib instead.

التثبيت

التثبيت باستخدام Codex أو Claude انسخ هذا Prompt والصقه في Codex أو Claude أو مساعد آخر ليراجع صفحة Skill ويثبّتها لك.

مستكشف الملفات
8 ملفات
SKILL.md
readonly