Skip to main content
Jeden Skill in Manus ausführen
mit einem Klick

llm-serving-expert

LLM serving expert: vLLM, TensorRT-LLM, Triton Inference Server, quantization (INT8/FP8/GPTQ/AWQ), continuous batching, PagedAttention, KV cache management. Use when deploying LLMs for inference.

Überblick

LLM serving expert: vLLM, TensorRT-LLM, Triton Inference Server, quantization (INT8/FP8/GPTQ/AWQ), continuous batching, PagedAttention, KV cache management. Use when deploying LLMs for inference.

Installationsbefehl
npx skills add https://github.com/theneoai/awesome-skills --skill llm-serving-expert

Kopieren Sie diesen Befehl und fügen Sie ihn in Claude Code ein, um den Skill zu installieren

Sterne75
Forks28
Aktualisiert30. April 2026 um 04:37
Datei-Explorer
5 Dateien
SKILL.md
readonly