Skip to main content
Ejecuta cualquier Skill en Manus
con un clic
$pwd:

llm-serving-capacity-planner

// Parse SGLang/vLLM startup logs to explain GPU memory use and request capacity. Use for KV cache budget, mem-fraction-static comparisons, OOM triage, and max-concurrency estimates.

$ git log --oneline --stat
stars:483
forks:41
updated:20 de mayo de 2026, 12:13
Explorador de archivos
4 archivos
SKILL.md
readonly