Skip to main content
在 Manus 中运行任何 Skill
一键导入
$pwd:

triton-ascend-case-matmul-large-k

// 矩阵乘法矩阵乘法 A[M, K] @ B[K, N] = C[M, N]中,大K维度矩阵乘法(K>>M,N)优化:针对M/N较小但K极大(如M=N=256,K=131072)的场景,Split-K切分K维度并行化、Workspace+Reduce替代全局同步,实现显著性能提升

$ git log --oneline --stat
stars:254
forks:48
updated:2026年4月20日 12:09
SKILL.md
readonly