Skip to main content
Manusで任意のスキルを実行
ワンクリックで

llm-serving-expert

LLM serving expert: vLLM, TensorRT-LLM, Triton Inference Server, quantization (INT8/FP8/GPTQ/AWQ), continuous batching, PagedAttention, KV cache management. Use when deploying LLMs for inference.

概要

LLM serving expert: vLLM, TensorRT-LLM, Triton Inference Server, quantization (INT8/FP8/GPTQ/AWQ), continuous batching, PagedAttention, KV cache management. Use when deploying LLMs for inference.

インストールコマンド
npx skills add https://github.com/theneoai/awesome-skills --skill llm-serving-expert

このコマンドをClaude Codeにコピー&ペーストしてスキルをインストール

スター75
フォーク28
更新日2026年4月30日 04:37
ファイルエクスプローラー
5 ファイル
SKILL.md
readonly