Skip to main content
تشغيل أي مهارة في Manus
بنقرة واحدة

llm-serving-expert

LLM serving expert: vLLM, TensorRT-LLM, Triton Inference Server, quantization (INT8/FP8/GPTQ/AWQ), continuous batching, PagedAttention, KV cache management. Use when deploying LLMs for inference.

نظرة عامة

LLM serving expert: vLLM, TensorRT-LLM, Triton Inference Server, quantization (INT8/FP8/GPTQ/AWQ), continuous batching, PagedAttention, KV cache management. Use when deploying LLMs for inference.

أمر التثبيت
npx skills add https://github.com/theneoai/awesome-skills --skill llm-serving-expert

انسخ والصق هذا الأمر في Claude Code لتثبيت المهارة

النجوم٧٥
التفرعات٢٨
آخر تحديث٣٠ أبريل ٢٠٢٦ في ٠٤:٣٧
مستكشف الملفات
5 ملفات
SKILL.md
readonly