Skip to main content
Exécutez n'importe quel Skill dans Manus
en un clic

llm-serving-expert

LLM serving expert: vLLM, TensorRT-LLM, Triton Inference Server, quantization (INT8/FP8/GPTQ/AWQ), continuous batching, PagedAttention, KV cache management. Use when deploying LLMs for inference.

Aperçu

LLM serving expert: vLLM, TensorRT-LLM, Triton Inference Server, quantization (INT8/FP8/GPTQ/AWQ), continuous batching, PagedAttention, KV cache management. Use when deploying LLMs for inference.

Commande d'installation
npx skills add https://github.com/theneoai/awesome-skills --skill llm-serving-expert

Copiez et collez cette commande dans Claude Code pour installer le skill

Étoiles75
Forks28
Mis à jour30 avril 2026 à 04:37
Explorateur de fichiers
5 fichiers
SKILL.md
readonly