Skip to main content
تشغيل أي مهارة في Manus
بنقرة واحدة

ai-agent-evaluation

النجوم١٦١
التفرعات١٦
آخر تحديث١٤ أبريل ٢٠٢٦ في ٠٧:٥٩

Comprehensive evaluation patterns for AI agents including multi-turn conversation testing, LLM-as-judge frameworks, benchmark suites, regression detection, and systematic eval pipelines for measuring agent quality and safety.

التثبيت

التثبيت باستخدام Codex أو Claude انسخ هذا Prompt والصقه في Codex أو Claude أو مساعد آخر ليراجع صفحة Skill ويثبّتها لك.

SKILL.md
readonly