Execute qualquer Skill no Manus
com um clique

Execute qualquer Skill no Manus com um clique

$pwd:

sandeco-token-reduce

Name: Sandeco Token Reduce
Author: sandeco

// Comprime tokens de prompts usando LLMLingua-2 da Microsoft para reduzir custo e latencia. Use esta skill sempre que o usuario pedir para comprimir um prompt, reduzir tokens, economizar tokens, usar LLMLingua, ou quando um texto for longo demais para enviar a um LLM. Tambem use quando o usuario quiser pre-processar contexto antes de enviar ao Claude. Triggers: "comprimir", "reduzir tokens", "economizar tokens", "LLMLingua", "texto muito longo", "compressao de prompt", "token compression", "compress tokens", "inicializar compressao", "init token-reduce".

Executar no Manus

$ git log --oneline --stat

stars:824

forks:315

updated:16 de abril de 2026 às 19:01

Explorador de arquivos

8 arquivos

SKILL.md

readonly

name

sandeco-token-reduce

description

Comprime tokens de prompts usando LLMLingua-2 da Microsoft para reduzir custo e latencia. Use esta skill sempre que o usuario pedir para comprimir um prompt, reduzir tokens, economizar tokens, usar LLMLingua, ou quando um texto for longo demais para enviar a um LLM. Tambem use quando o usuario quiser pre-processar contexto antes de enviar ao Claude. Triggers: "comprimir", "reduzir tokens", "economizar tokens", "LLMLingua", "texto muito longo", "compressao de prompt", "token compression", "compress tokens", "inicializar compressao", "init token-reduce".

sandeco-token-reduce

Comprime tokens removendo os menos relevantes de um texto, preservando o significado semantico. Usa o modelo XLM-RoBERTa da Microsoft (LLMLingua-2) rodando localmente (CPU ou GPU).

Estrutura

sandeco-token-reduce/
├── SKILL.md          ← este arquivo
├── scripts/
│   ├── setup.py      ← inicializacao (cria .venv, instala libs, baixa modelo)
│   └── compress.py   ← compressao de texto (requer init)
└── .venv/            ← criado pelo setup.py (NAO distribuir)

IMPORTANTE: Fluxo de inicializacao

A skill precisa ser inicializada antes do primeiro uso. O .venv NAO e distribuido junto com a skill — cada usuario precisa rodar o init uma vez.

Antes de qualquer operacao de compressao:

Verifique se o .venv existe dentro do diretorio desta skill
Se NAO existir, informe ao usuario que a skill precisa ser inicializada e execute o setup:

python "<skill-dir>/scripts/setup.py"

O setup faz 4 coisas automaticamente:

Cria o ambiente virtual .venv
Atualiza o pip
Instala llmlingua e anthropic
Baixa o modelo LLMLingua-2 (~1 GB) do HuggingFace

Avise o usuario que a primeira execucao pode levar alguns minutos por causa do download do modelo.

Se o .venv JA existir, pule direto para a compressao.

Quando o usuario pedir para "inicializar", "configurar" ou "init" a skill:

Execute o setup.py diretamente, mesmo que o .venv ja exista (ele e idempotente).

Como comprimir

Depois de inicializado, use o script compress.py com o Python do venv.

O Python do venv esta em:

Windows: <skill-dir>/.venv/Scripts/python.exe
Unix: <skill-dir>/.venv/bin/python

So comprimir (texto direto)

"<venv-python>" "<skill-dir>/scripts/compress.py" --text "texto longo aqui" --rate 0.4

Comprimir a partir de arquivo

"<venv-python>" "<skill-dir>/scripts/compress.py" --file caminho/para/arquivo.txt --rate 0.4

Comprimir e salvar resultado em arquivo

"<venv-python>" "<skill-dir>/scripts/compress.py" --file entrada.txt --rate 0.4 --output comprimido.txt

Comprimir e enviar ao Claude com uma pergunta

"<venv-python>" "<skill-dir>/scripts/compress.py" --file entrada.txt --rate 0.4 --ask "Resuma este texto"

Saida JSON (para consumo programatico)

"<venv-python>" "<skill-dir>/scripts/compress.py" --file entrada.txt --rate 0.4 --json

Parametros do compress.py

Parametro	Padrao	Descricao
`--text`	—	Texto passado diretamente (mutuamente exclusivo com --file)
`--file`	—	Caminho para arquivo de texto
`--rate`	`0.4`	Fracao de tokens a manter
`--output`	—	Salva texto comprimido neste arquivo
`--json`	`false`	Saida em JSON estruturado
`--ask`	—	Pergunta a enviar ao Claude com o contexto comprimido
`--model`	`claude-sonnet-4-6`	Modelo Claude (so usado com --ask)
`--max-tokens`	`4096`	Max tokens na resposta do Claude

Guia de taxas de compressao

0.5 — Compressao leve, maxima fidelidade
0.4 — Equilibrio padrao (recomendado para a maioria dos casos)
0.33 — Compressao moderada
0.2 — Compressao agressiva para textos muito longos

Quando o usuario nao especificar uma taxa, use 0.4.

Formato da saida JSON

Quando --json e usado:

{
  "compression": {
    "compressed_prompt": "texto comprimido...",
    "origin_tokens": 312,
    "compressed_tokens": 124,
    "ratio": 2.52,
    "saving": 188,
    "rate_requested": 0.4
  },
  "claude": {
    "answer": "resposta do Claude...",
    "model": "claude-sonnet-4-6",
    "input_tokens": 150,
    "output_tokens": 200
  }
}

O campo claude so aparece quando --ask e usado.

Notas tecnicas

Modelo HuggingFace: microsoft/llmlingua-2-xlm-roberta-large-meetingbank
Cache do modelo: ~/.cache/huggingface/ (baixado uma vez pelo setup, reusado sempre)
force_tokens preserva: \n, ., ,, ?, !, :, negacoes PT (nao, sem, nenhum, nunca, nem, nenhuma)
force_reserve_digit=True protege qualquer token com digitos (IDs como RF-01, valores como 1000ms)
GPU e detectada automaticamente se torch + CUDA estiver disponivel; caso contrario usa CPU
A variavel ANTHROPIC_API_KEY precisa estar definida no ambiente para usar --ask

Pre-processamento automatico

Antes de comprimir, o texto passa por strip_markdown() que remove:

Separadores ---
Grid de tabelas |---|---|
Marcadores **bold** (mantem texto)
Prefixos ## de headers (mantem texto)
Checkboxes - [ ]
Code fences ```
Linhas vazias multiplas (colapsa para uma)

Isso reduz ~6% do texto antes de entrar no modelo, melhorando a qualidade da compressao.

Chunking automatico

O modelo XLM-RoBERTa tem janela de 512 tokens. Para textos maiores, o script divide automaticamente em chunks de ate 400 tokens (cortando em limites de linha), comprime cada um separadamente e concatena os resultados. Isso elimina o scoring degradado que ocorria em tokens apos a posicao 512.

related-skills.json

mesmo repositório

sandeco-token-reduce-ollama.md

from "sandeco/prompts"

Comprime tokens de prompts usando reescrita generativa com um modelo Ollama local (default: qwen3:8b) para reduzir custo e latencia ao enviar ao Claude. Aceita texto direto, arquivo .txt ou PDF como entrada: extrai o PDF para markdown (via pymupdf4llm), salva o .md ao lado do PDF e comprime o markdown. Use esta skill sempre que o usuario pedir para comprimir/reduzir/economizar tokens E mencionar Ollama, qwen, qwen3, llm local, modelo local, rodar localmente, "sem BERT", ou quiser compressao via LLM generativo em vez de classificador. Tambem use quando o usuario quiser pre-processar contexto localmente (incluindo PDFs) antes de enviar ao Claude usando Ollama. Triggers: "comprimir com ollama", "comprimir localmente", "ollama compress", "qwen3", "qwen", "reescrever com ollama", "resumir com llm local", "compressao generativa", "pdf com ollama", "ler pdf com ollama", "inicializar token-reduce-ollama", "init token-reduce-ollama".

2026-04-16824

master-skill.md

from "sandeco/prompts"

Orquestrador mestre de frameworks e skills de desenvolvimento com IA. ATIVE ESTE SKILL EXCLUSIVAMENTE quando o usuário chamar o comando /master-skill. NÃO ative em nenhuma outra situação — este skill responde APENAS ao comando explícito /master-skill. Quando ativado, interpreta a instrução fornecida após o comando e executa: - Inicialização via `/master-skill init` - Instalação de frameworks de IA no projeto atual: BMad Method, Spec-Kit, Antigravity Kit - Busca e instalação de skills de uma pasta externa no projeto atual Exemplos de ativação (SOMENTE via /master-skill): - /master-skill init - /master-skill instale o BMad - /master-skill instale o Antigravity Kit - /master-skill configure o Spec-Kit nesse projeto - /master-skill quero a skill de brainstorm - /master-skill instale a skill de code-review - /master-skill liste as skills disponíveis

2026-03-26824

sandeco-maestro.md

from "sandeco/prompts"

Executa uma lista de skills em sequência ou em paralelo conforme a necessidade informada pelo usuário.

2026-03-16824

youtube-descricoes-premium.md

from "sandeco/prompts"

Cria descrições otimizadas para YouTube baseadas em legendas .srt. Inclui hooks chamativos, links de grupos, capítulos automáticos e o catálogo de livros do Prof. Sandeco.

2026-03-16824

youtube-tags-seo.md

from "sandeco/prompts"

Gera tags de SEO para YouTube extraindo conceitos-chave da legenda .srt. Foca em termos de busca (search intent) e variações semânticas.

2026-03-16824

youtube-titulos.md

from "sandeco/prompts"

Especialista Ph.D. em SEO e CTR para YouTube. Gera, avalia e otimiza títulos usando critérios analíticos e técnicas do Joba. Ativa-se quando o usuário fornece um título inicial ou solicita ideias baseadas em um roteiro/legenda (.srt).

2026-03-16824

package.json

"author": "sandeco"

"repository": "sandeco/prompts"

Abrir repositório GitHub Ver repositórios do creator

$ install --global

$ download --local

Executar no Manus

$ useful --forSOC

Desenvolvedores de softwareInformática e Matemática15-1252L4

name

sandeco-token-reduce

description

sandeco-token-reduce

Comprime tokens removendo os menos relevantes de um texto, preservando o significado semantico. Usa o modelo XLM-RoBERTa da Microsoft (LLMLingua-2) rodando localmente (CPU ou GPU).

Estrutura

sandeco-token-reduce/
├── SKILL.md          ← este arquivo
├── scripts/
│   ├── setup.py      ← inicializacao (cria .venv, instala libs, baixa modelo)
│   └── compress.py   ← compressao de texto (requer init)
└── .venv/            ← criado pelo setup.py (NAO distribuir)

IMPORTANTE: Fluxo de inicializacao

A skill precisa ser inicializada antes do primeiro uso. O .venv NAO e distribuido junto com a skill — cada usuario precisa rodar o init uma vez.

Antes de qualquer operacao de compressao:

Verifique se o .venv existe dentro do diretorio desta skill
Se NAO existir, informe ao usuario que a skill precisa ser inicializada e execute o setup:

python "<skill-dir>/scripts/setup.py"

O setup faz 4 coisas automaticamente:

Cria o ambiente virtual .venv
Atualiza o pip
Instala llmlingua e anthropic
Baixa o modelo LLMLingua-2 (~1 GB) do HuggingFace

Avise o usuario que a primeira execucao pode levar alguns minutos por causa do download do modelo.

Se o .venv JA existir, pule direto para a compressao.

Quando o usuario pedir para "inicializar", "configurar" ou "init" a skill:

Execute o setup.py diretamente, mesmo que o .venv ja exista (ele e idempotente).

Como comprimir

Depois de inicializado, use o script compress.py com o Python do venv.

O Python do venv esta em:

Windows: <skill-dir>/.venv/Scripts/python.exe
Unix: <skill-dir>/.venv/bin/python

So comprimir (texto direto)

"<venv-python>" "<skill-dir>/scripts/compress.py" --text "texto longo aqui" --rate 0.4

Comprimir a partir de arquivo

"<venv-python>" "<skill-dir>/scripts/compress.py" --file caminho/para/arquivo.txt --rate 0.4

Comprimir e salvar resultado em arquivo

"<venv-python>" "<skill-dir>/scripts/compress.py" --file entrada.txt --rate 0.4 --output comprimido.txt

Comprimir e enviar ao Claude com uma pergunta

"<venv-python>" "<skill-dir>/scripts/compress.py" --file entrada.txt --rate 0.4 --ask "Resuma este texto"

Saida JSON (para consumo programatico)

"<venv-python>" "<skill-dir>/scripts/compress.py" --file entrada.txt --rate 0.4 --json

Parametros do compress.py

Parametro	Padrao	Descricao
`--text`	—	Texto passado diretamente (mutuamente exclusivo com --file)
`--file`	—	Caminho para arquivo de texto
`--rate`	`0.4`	Fracao de tokens a manter
`--output`	—	Salva texto comprimido neste arquivo
`--json`	`false`	Saida em JSON estruturado
`--ask`	—	Pergunta a enviar ao Claude com o contexto comprimido
`--model`	`claude-sonnet-4-6`	Modelo Claude (so usado com --ask)
`--max-tokens`	`4096`	Max tokens na resposta do Claude

Guia de taxas de compressao

0.5 — Compressao leve, maxima fidelidade
0.4 — Equilibrio padrao (recomendado para a maioria dos casos)
0.33 — Compressao moderada
0.2 — Compressao agressiva para textos muito longos

Quando o usuario nao especificar uma taxa, use 0.4.

Formato da saida JSON

Quando --json e usado:

{
  "compression": {
    "compressed_prompt": "texto comprimido...",
    "origin_tokens": 312,
    "compressed_tokens": 124,
    "ratio": 2.52,
    "saving": 188,
    "rate_requested": 0.4
  },
  "claude": {
    "answer": "resposta do Claude...",
    "model": "claude-sonnet-4-6",
    "input_tokens": 150,
    "output_tokens": 200
  }
}

O campo claude so aparece quando --ask e usado.

Notas tecnicas

Modelo HuggingFace: microsoft/llmlingua-2-xlm-roberta-large-meetingbank
Cache do modelo: ~/.cache/huggingface/ (baixado uma vez pelo setup, reusado sempre)
force_tokens preserva: \n, ., ,, ?, !, :, negacoes PT (nao, sem, nenhum, nunca, nem, nenhuma)
force_reserve_digit=True protege qualquer token com digitos (IDs como RF-01, valores como 1000ms)
GPU e detectada automaticamente se torch + CUDA estiver disponivel; caso contrario usa CPU
A variavel ANTHROPIC_API_KEY precisa estar definida no ambiente para usar --ask

Pre-processamento automatico

Antes de comprimir, o texto passa por strip_markdown() que remove:

Separadores ---
Grid de tabelas |---|---|
Marcadores **bold** (mantem texto)
Prefixos ## de headers (mantem texto)
Checkboxes - [ ]
Code fences ```
Linhas vazias multiplas (colapsa para uma)

Isso reduz ~6% do texto antes de entrar no modelo, melhorando a qualidade da compressao.

sandeco-token-reduce

sandeco-token-reduce

Estrutura

IMPORTANTE: Fluxo de inicializacao

Antes de qualquer operacao de compressao:

Quando o usuario pedir para "inicializar", "configurar" ou "init" a skill:

Como comprimir

So comprimir (texto direto)

Comprimir a partir de arquivo

Comprimir e salvar resultado em arquivo

Comprimir e enviar ao Claude com uma pergunta

Saida JSON (para consumo programatico)

Parametros do compress.py

Guia de taxas de compressao

Formato da saida JSON

Notas tecnicas

Pre-processamento automatico

Chunking automatico

Mais deste repositório

sandeco-token-reduce

Estrutura

IMPORTANTE: Fluxo de inicializacao

Antes de qualquer operacao de compressao:

Quando o usuario pedir para "inicializar", "configurar" ou "init" a skill:

Como comprimir

So comprimir (texto direto)

Comprimir a partir de arquivo

Comprimir e salvar resultado em arquivo

Comprimir e enviar ao Claude com uma pergunta

Saida JSON (para consumo programatico)

Parametros do compress.py

Guia de taxas de compressao

Formato da saida JSON

Notas tecnicas

Pre-processamento automatico

Chunking automatico

Mais deste repositório