Ejecuta cualquier Skill en Manus
con un clic

Ejecuta cualquier Skill en Manus con un clic

Comenzar

llm-inference-optimization

Estrellas2

Forks2

Actualizado9 de febrero de 2026, 00:33

Quantization, caching, batching, and serving optimization for LLM inference.

Instalación

Instalar con Codex o Claude Copia este prompt, pégalo en Codex, Claude u otro asistente, y deja que revise la página de la skill y la instale por ti.

Ejecutar en Manus

Fuente

cgyudistira

cgyudistira/agentkit

Abrir repositorio de GitHub Ver repositorios del creador

Descarga

Ejecutar en Manus

Ocupaciones relacionadasSOC

Basado en la clasificación ocupacional SOC

Desarrolladores de softwareOcupaciones informáticas y matemáticas·SOC 15-1252

SKILL.md

readonly

name	LLM Inference Optimization
description	Quantization, caching, batching, and serving optimization for LLM inference.

LLM Inference Optimization

Quantization, caching, batching, and serving optimization for LLM inference.

When to Use

Use this skill when working on ai engineer tasks related to llm inference optimization.

Key Concepts

Best Practices: Follow industry standards
Implementation: Step-by-step guidance
Examples: Real-world applications

Guidelines

Start with understanding requirements
Apply proven patterns
Test and validate results

Más de este repositorio

mismo repositorio

affiliate-marketing

cgyudistira/agentkit

Affiliate program strategy, link optimization, and commission maximization.

2026-02-092

ai-code-generation

cgyudistira/agentkit

Code generation with LLMs, code review automation, and AI pair programming.

2026-02-092

ai-safety-alignment

cgyudistira/agentkit

RLHF, constitutional AI, safety evaluation, and alignment techniques.

2026-02-092

astro-sites

cgyudistira/agentkit

Astro static site generation, islands architecture, and content collections.

2026-02-092

brand-identity

cgyudistira/agentkit

Logo design, brand guidelines, and visual identity systems.

2026-02-092

case-study-writing

cgyudistira/agentkit

Compelling case studies that showcase results and drive conversions.

2026-02-092