Skip to main content
تشغيل أي مهارة في Manus
بنقرة واحدة
$pwd:

kernel-trace-analysis

// Profile GPU kernels using rocprofv3 to collect ATT instruction-level traces, then analyze the trace data using hotspot_analyzer.py to identify top-K stall hotspots (VMEM-load, VMEM-wait, LDS/SMEM-wait, barrier, MFMA stalls) mapped back to source lines, and produce an actionable optimization plan. Usage: /kernel-trace-analysis <cmd> Can also analyze an existing dispatch dir directly: /kernel-trace-analysis --dir <path>

$ git log --oneline --stat
stars:١٩٢
forks:٥٦
updated:٢٩ مايو ٢٠٢٦ في ٠٧:١٤
مستكشف الملفات
3 ملفات
SKILL.md
readonly