Skip to main content
تشغيل أي مهارة في Manus
بنقرة واحدة

hyperparameter-optimization

النجوم٠
التفرعات٠
آخر تحديث١١ فبراير ٢٠٢٦ في ٠٩:٣٠

Unified PPO hyperparameter and reward/penalty weight search for VBot navigation. Grid, random, and Bayesian optimization across learning rate, network architecture, training dynamics, and reward scales.

التثبيت

التثبيت باستخدام Codex أو Claude انسخ هذا Prompt والصقه في Codex أو Claude أو مساعد آخر ليراجع صفحة Skill ويثبّتها لك.

SKILL.md
readonly