Skip to main content
Manusで任意のスキルを実行
ワンクリックで

llm-serving-capacity-planner

// Parse SGLang/vLLM startup logs to explain GPU memory use and request capacity. Use for KV cache budget, mem-fraction-static comparisons, OOM triage, and max-concurrency estimates.

$ git log --oneline --stat
stars:483
forks:41
updated:2026年5月20日 12:13
ファイルエクスプローラー
4 ファイル
SKILL.md
readonly