Skip to main content
Exécutez n'importe quel Skill dans Manus
en un clic

llm-serving-capacity-planner

// Parse SGLang/vLLM startup logs to explain GPU memory use and request capacity. Use for KV cache budget, mem-fraction-static comparisons, OOM triage, and max-concurrency estimates.

$ git log --oneline --stat
stars:483
forks:41
updated:20 mai 2026 à 12:13
Explorateur de fichiers
4 fichiers
SKILL.md
readonly