Skip to main content
Manus에서 모든 스킬 실행
원클릭으로
$pwd:

kernel-tileir-optimization

// Optimize existing Triton kernels for NVIDIA TileIR backend on Blackwell GPUs (sm_100+). Adds TileIR-specific autotune configs: occupancy, num_ctas, TMA descriptors. Covers kernel classification (dot-related, norm-like, elementwise, reduction), type-specific transformations, and PTX-vs-TileIR benchmarking. Triggered by: "optimize for TileIR", "add TileIR configs", "Blackwell optimization", "TMA descriptors", "2CTA mode", "occupancy tuning". Kernels use standard `import triton`; TileIR activates via ENABLE_TILE=1 when nvtriton is installed.

$ git log --oneline --stat
stars:13,702
forks:2,406
updated:2026년 5월 20일 07:35
파일 탐색기
5 개 파일
SKILL.md
readonly