Ejecuta cualquier Skill en Manus
con un clic

Ejecuta cualquier Skill en Manus con un clic

llm-engineering

Engenharia com LLMs — design de prompts, RAG, agentes, fine-tuning, APIs (OpenAI, Anthropic, Ollama, LiteLLM), avaliação de modelos, embeddings, vector databases, chains, orquestração com LangChain/LlamaIndex/DSPy e deployment de aplicações com IA. Use sempre que o usuário mencionar LLM, GPT, Claude API, Ollama, RAG, embeddings, vector store, agente de IA, prompt engineering, fine-tuning, langchain, llamaindex, ou qualquer desenvolvimento de aplicação baseada em modelos de linguagem.

Ejecutar en Manus

Estrellas1

Forks0

Actualizado31 de mayo de 2026, 03:03

Fuente

RAGton

RAGton/kryonix

Abrir repositorio de GitHub Ver repositorios del creador

Comando de instalación

Descarga

Ejecutar en Manus

Útil paraSOC

Desarrolladores de softwareOcupaciones informáticas y matemáticas15-1252L4

SKILL.md

readonly

name

llm-engineering

description

LLM Engineering

Hierarquia de decisão

Problema → Escolha de abordagem:
  Simples/pontual     → Prompt direto via API
  Precisa de contexto → RAG + retrieval
  Processo complexo   → Agente com ferramentas
  Domínio específico  → Fine-tuning
  Multi-modelo        → LiteLLM / gateway

APIs essenciais

Anthropic (Claude)

import anthropic

client = anthropic.Anthropic()  # usa ANTHROPIC_API_KEY

response = client.messages.create(
    model="claude-sonnet-4-6",
    max_tokens=1024,
    system="Você é um assistente técnico.",
    messages=[{"role": "user", "content": "Explique RAG"}]
)
print(response.content[0].text)

OpenAI

from openai import OpenAI
client = OpenAI()  # usa OPENAI_API_KEY

response = client.chat.completions.create(
    model="gpt-4o",
    messages=[{"role": "user", "content": "Explique RAG"}]
)

Ollama (local)

import ollama
response = ollama.chat(
    model='llama3.2',
    messages=[{'role': 'user', 'content': 'Explique RAG'}]
)

LiteLLM (gateway unificado)

from litellm import completion
# Troca provider só mudando model string
response = completion(
    model="anthropic/claude-sonnet-4-6",  # ou "openai/gpt-4o", "ollama/llama3"
    messages=[{"role": "user", "content": "Olá"}]
)

RAG — padrão completo

# 1. Indexação
from langchain_community.vectorstores import Chroma
from langchain_openai import OpenAIEmbeddings
from langchain.text_splitter import RecursiveCharacterTextSplitter

splitter = RecursiveCharacterTextSplitter(chunk_size=512, chunk_overlap=64)
chunks = splitter.split_documents(docs)
vectorstore = Chroma.from_documents(chunks, OpenAIEmbeddings())

# 2. Retrieval + Generation
retriever = vectorstore.as_retriever(search_kwargs={"k": 5})
context_docs = retriever.invoke(query)
context = "\n\n".join(d.page_content for d in context_docs)

prompt = f"""Use apenas o contexto abaixo para responder.
Contexto: {context}
Pergunta: {query}"""

Prompt Engineering — padrões

System prompt estruturado

Você é [papel]. Seu objetivo é [objetivo].
Restrições: [lista]
Formato de saída: [especificação]

Chain-of-Thought

Antes de responder, raciocine passo a passo entre <thinking></thinking>.
Depois dê a resposta final entre <answer></answer>.

Few-shot

Exemplos:
Input: X → Output: A
Input: Y → Output: B
Input: Z → Output: ?

Avaliação de LLMs

# LLM-as-judge
def avaliar(pergunta, resposta, gabarito):
    prompt = f"""
    Pergunta: {pergunta}
    Resposta do modelo: {resposta}
    Gabarito: {gabarito}
    Avalie de 1-5 e explique. Responda em JSON: {{"score": N, "reason": "..."}}
    """
    return client.messages.create(model="claude-sonnet-4-6", ...)

Streaming

with client.messages.stream(
    model="claude-sonnet-4-6",
    max_tokens=1024,
    messages=[{"role": "user", "content": prompt}]
) as stream:
    for text in stream.text_stream:
        print(text, end="", flush=True)

Referências adicionais

Agentes e ferramentas (tool use): ver references/agents-tools.md
Fine-tuning: ver references/fine-tuning.md
Vector databases (Chroma, Qdrant, Pinecone): ver references/vector-dbs.md
Deployment (FastAPI + LLM): ver references/deployment.md

Más de este repositorio

mismo repositorio

phase7-kryonix-shell

RAGton/kryonix

Executa a Fase 7 do refactor Kryonix — Kryonix Shell WM-first (Hyprland + Qt/QML + Rust + Home Manager). Use quando o usuário pedir para construir o shell próprio do Kryonix sobre Hyprland, kryonix-shell-daemon, kryonix-shell-ui, sddm-kryonix-theme puro (sem KDE), ou trabalhar na Fase 7.

2026-06-081

phase8-kryonix-aurora

RAGton/kryonix

Executa a Fase 8 do refactor Kryonix — Kryonix Aurora Shell (camada de experiência sobre KDE Plasma 6: theme engine, bar, control center, SDDM, perfis declarativos e HM sync bridge). Use quando o usuário pedir para customizar o KDE como produto próprio, kryonix-control-center, Aurora Shell, transparência KDE, perfis KDE declarativos, ou trabalhar na Fase 8.

2026-06-081

nixos-stability

RAGton/kryonix

Padrões de qualidade e segurança para modificar configurações NixOS/flake. Use esta skill SEMPRE que for editar qualquer arquivo .nix, mudar Display Manager, mexer em opções de Wayland/Hyprland/UWSM, atualizar inputs do flake, ou criar módulos novos. Também use ao revisar diffs antes de commitar ou ao diagnosticar black screen / TTY inacessível após nixos-rebuild. Esta skill define o contrato mínimo de qualidade — nenhuma mudança deve ser feita sem seguir este processo.

2026-06-041

data-engineering

RAGton/kryonix

External project skill — not related to kryonix internals. Use for data platform and analytics work on external projects (ETL/ELT pipelines, dbt, Airflow, Spark, Kafka, DuckDB, ClickHouse, data lakes, data warehouses). Not applicable to kryonix homelab operations.

2026-05-311

hyprland-performance

RAGton/kryonix

Diagnostica e reduz lentidão percebida em Hyprland/Caelestia no kryonix — launches lentos, animações excessivas, custo de blur/transparência e problemas de shell. Use quando o usuário reportar lentidão visual, animações pesadas, blur caro, travadas no Caelestia ou dúvida entre bug de launcher e custo gráfico do rice no glacier ou inspiron.

2026-05-311

kryonix-brain

RAGton/kryonix

Opera o sistema Brain do kryonix — LightRAG + Neo4j + Ollama + CAG no glacier. Use quando a tarefa envolver kryonix brain search/ask/index/cag, a API do Brain (porta 8000), indexação de documentos, diagnóstico do grafo de conhecimento, kora (assistente de voz/texto), rotas CAG, ou qualquer problema com os serviços kryonix-brain-api, kryonix-lightrag ou ollama no glacier.

2026-05-311

name

llm-engineering

description

LLM Engineering

Hierarquia de decisão

Problema → Escolha de abordagem:
  Simples/pontual     → Prompt direto via API
  Precisa de contexto → RAG + retrieval
  Processo complexo   → Agente com ferramentas
  Domínio específico  → Fine-tuning
  Multi-modelo        → LiteLLM / gateway

APIs essenciais

Anthropic (Claude)

import anthropic

client = anthropic.Anthropic()  # usa ANTHROPIC_API_KEY

response = client.messages.create(
    model="claude-sonnet-4-6",
    max_tokens=1024,
    system="Você é um assistente técnico.",
    messages=[{"role": "user", "content": "Explique RAG"}]
)
print(response.content[0].text)

OpenAI

from openai import OpenAI
client = OpenAI()  # usa OPENAI_API_KEY

response = client.chat.completions.create(
    model="gpt-4o",
    messages=[{"role": "user", "content": "Explique RAG"}]
)

Ollama (local)

import ollama
response = ollama.chat(
    model='llama3.2',
    messages=[{'role': 'user', 'content': 'Explique RAG'}]
)

LiteLLM (gateway unificado)

from litellm import completion
# Troca provider só mudando model string
response = completion(
    model="anthropic/claude-sonnet-4-6",  # ou "openai/gpt-4o", "ollama/llama3"
    messages=[{"role": "user", "content": "Olá"}]
)

RAG — padrão completo

# 1. Indexação
from langchain_community.vectorstores import Chroma
from langchain_openai import OpenAIEmbeddings
from langchain.text_splitter import RecursiveCharacterTextSplitter

splitter = RecursiveCharacterTextSplitter(chunk_size=512, chunk_overlap=64)
chunks = splitter.split_documents(docs)
vectorstore = Chroma.from_documents(chunks, OpenAIEmbeddings())

# 2. Retrieval + Generation
retriever = vectorstore.as_retriever(search_kwargs={"k": 5})
context_docs = retriever.invoke(query)
context = "\n\n".join(d.page_content for d in context_docs)

prompt = f"""Use apenas o contexto abaixo para responder.
Contexto: {context}
Pergunta: {query}"""

Prompt Engineering — padrões

System prompt estruturado

Você é [papel]. Seu objetivo é [objetivo].
Restrições: [lista]
Formato de saída: [especificação]

Chain-of-Thought

Antes de responder, raciocine passo a passo entre <thinking></thinking>.
Depois dê a resposta final entre <answer></answer>.

Few-shot

Exemplos:
Input: X → Output: A
Input: Y → Output: B
Input: Z → Output: ?

Avaliação de LLMs

# LLM-as-judge
def avaliar(pergunta, resposta, gabarito):
    prompt = f"""
    Pergunta: {pergunta}
    Resposta do modelo: {resposta}
    Gabarito: {gabarito}
    Avalie de 1-5 e explique. Responda em JSON: {{"score": N, "reason": "..."}}
    """
    return client.messages.create(model="claude-sonnet-4-6", ...)

Streaming

with client.messages.stream(
    model="claude-sonnet-4-6",
    max_tokens=1024,
    messages=[{"role": "user", "content": prompt}]
) as stream:
    for text in stream.text_stream:
        print(text, end="", flush=True)

Referências adicionais

Agentes e ferramentas (tool use): ver references/agents-tools.md
Fine-tuning: ver references/fine-tuning.md
Vector databases (Chroma, Qdrant, Pinecone): ver references/vector-dbs.md
Deployment (FastAPI + LLM): ver references/deployment.md