Skip to main content
Manus에서 모든 스킬 실행
원클릭으로

llm-serving-expert

LLM serving expert: vLLM, TensorRT-LLM, Triton Inference Server, quantization (INT8/FP8/GPTQ/AWQ), continuous batching, PagedAttention, KV cache management. Use when deploying LLMs for inference.

개요

LLM serving expert: vLLM, TensorRT-LLM, Triton Inference Server, quantization (INT8/FP8/GPTQ/AWQ), continuous batching, PagedAttention, KV cache management. Use when deploying LLMs for inference.

설치 명령
npx skills add https://github.com/theneoai/awesome-skills --skill llm-serving-expert

이 명령을 Claude Code에 복사하여 붙여넣어 스킬을 설치하세요

스타75
포크28
업데이트2026년 4월 30일 04:37
파일 탐색기
5 개 파일
SKILL.md
readonly