Skip to main content
Manus에서 모든 스킬 실행
원클릭으로

deployment

// Serve a quantized or unquantized LLM checkpoint as an OpenAI-compatible API endpoint using vLLM, SGLang, or TRT-LLM. Use when user says "deploy model", "serve model", "start vLLM server", "launch SGLang", "TRT-LLM deploy", "AutoDeploy", "benchmark throughput", "serve checkpoint", or needs an inference endpoint from a HuggingFace or ModelOpt-quantized checkpoint. Do NOT use for quantizing models (use ptq) or evaluating accuracy (use evaluation).

$ git log --oneline --stat
stars:2,749
forks:405
updated:2026년 5월 21일 22:16
파일 탐색기
9 개 파일
SKILL.md
readonly