Skip to main content
تشغيل أي مهارة في Manus
بنقرة واحدة

llm-serving-capacity-planner

// Parse SGLang/vLLM startup logs to explain GPU memory use and request capacity. Use for KV cache budget, mem-fraction-static comparisons, OOM triage, and max-concurrency estimates.

$ git log --oneline --stat
stars:٤٨٣
forks:٤١
updated:٢٠ مايو ٢٠٢٦ في ١٢:١٣
مستكشف الملفات
4 ملفات
SKILL.md
readonly