Jeden Skill in Manus ausführen
mit einem Klick

Jeden Skill in Manus mit einem Klick ausführen

data-engineering

External project skill — not related to kryonix internals. Use for data platform and analytics work on external projects (ETL/ELT pipelines, dbt, Airflow, Spark, Kafka, DuckDB, ClickHouse, data lakes, data warehouses). Not applicable to kryonix homelab operations.

In Manus ausführen

Sterne1

Forks0

Aktualisiert31. Mai 2026 um 03:03

Quelle

RAGton

RAGton/kryonix

GitHub-Repository öffnen Creator-Repositorys ansehen

Installationsbefehl

Download

In Manus ausführen

Nützlich fürSOC

SoftwareentwicklerInformatik- und Mathematikberufe15-1252L4

SKILL.md

readonly

Mehr aus diesem Repository

gleiches Repository

phase7-kryonix-shell

RAGton/kryonix

Executa a Fase 7 do refactor Kryonix — Kryonix Shell WM-first (Hyprland + Qt/QML + Rust + Home Manager). Use quando o usuário pedir para construir o shell próprio do Kryonix sobre Hyprland, kryonix-shell-daemon, kryonix-shell-ui, sddm-kryonix-theme puro (sem KDE), ou trabalhar na Fase 7.

2026-06-081

phase8-kryonix-aurora

RAGton/kryonix

Executa a Fase 8 do refactor Kryonix — Kryonix Aurora Shell (camada de experiência sobre KDE Plasma 6: theme engine, bar, control center, SDDM, perfis declarativos e HM sync bridge). Use quando o usuário pedir para customizar o KDE como produto próprio, kryonix-control-center, Aurora Shell, transparência KDE, perfis KDE declarativos, ou trabalhar na Fase 8.

2026-06-081

nixos-stability

RAGton/kryonix

Padrões de qualidade e segurança para modificar configurações NixOS/flake. Use esta skill SEMPRE que for editar qualquer arquivo .nix, mudar Display Manager, mexer em opções de Wayland/Hyprland/UWSM, atualizar inputs do flake, ou criar módulos novos. Também use ao revisar diffs antes de commitar ou ao diagnosticar black screen / TTY inacessível após nixos-rebuild. Esta skill define o contrato mínimo de qualidade — nenhuma mudança deve ser feita sem seguir este processo.

2026-06-041

hyprland-performance

RAGton/kryonix

Diagnostica e reduz lentidão percebida em Hyprland/Caelestia no kryonix — launches lentos, animações excessivas, custo de blur/transparência e problemas de shell. Use quando o usuário reportar lentidão visual, animações pesadas, blur caro, travadas no Caelestia ou dúvida entre bug de launcher e custo gráfico do rice no glacier ou inspiron.

2026-05-311

kryonix-brain

RAGton/kryonix

Opera o sistema Brain do kryonix — LightRAG + Neo4j + Ollama + CAG no glacier. Use quando a tarefa envolver kryonix brain search/ask/index/cag, a API do Brain (porta 8000), indexação de documentos, diagnóstico do grafo de conhecimento, kora (assistente de voz/texto), rotas CAG, ou qualquer problema com os serviços kryonix-brain-api, kryonix-lightrag ou ollama no glacier.

2026-05-311

launcher-diagnosis

RAGton/kryonix

Encontra e corrige a causa real de apps abrindo errado, lentos ou não abrindo pelo launcher Caelestia no kryonix — problemas com desktop entries, uwsm, app2unit, wrappers e cache. Use quando o usuário reportar regressão no launcher, app abrindo pelo binário errado, falha em uwsm app --, ou dúvida entre desktop entry, wrapper e cache no glacier ou inspiron.

2026-05-311

name	data-engineering
description	External project skill — not related to kryonix internals. Use for data platform and analytics work on external projects (ETL/ELT pipelines, dbt, Airflow, Spark, Kafka, DuckDB, ClickHouse, data lakes, data warehouses). Not applicable to kryonix homelab operations.

Engenharia de Dados

Stack moderna de dados

Ingestão      → Airbyte / Fivetran / Kafka / scripts
Armazenamento → S3/MinIO (raw) → DuckDB/ClickHouse (analytics)
Transformação → dbt (SQL) / Spark (big data)
Orquestração  → Airflow / Prefect / Dagster
Visualização  → Superset / Metabase / Grafana
Qualidade     → Great Expectations / dbt tests

dbt — transformação SQL

# models/staging/stg_contracts.sql
{{ config(materialized='view') }}

SELECT
    id,
    tenant_id,
    unit_id,
    CAST(start_date AS DATE) AS start_date,
    CAST(end_date AS DATE)   AS end_date,
    monthly_value,
    status,
    created_at
FROM {{ source('raw', 'contracts') }}
WHERE status != 'deleted'

# models/marts/fct_revenue.sql
{{ config(materialized='table', partition_by={'field': 'month', 'data_type': 'date'}) }}

SELECT
    DATE_TRUNC('month', c.start_date) AS month,
    c.tenant_id,
    COUNT(*)                           AS active_contracts,
    SUM(c.monthly_value)               AS mrr
FROM {{ ref('stg_contracts') }} c
WHERE c.status = 'active'
GROUP BY 1, 2

# schema.yml — testes automáticos
models:
  - name: stg_contracts
    columns:
      - name: id
        tests: [unique, not_null]
      - name: tenant_id
        tests: [not_null]
      - name: monthly_value
        tests:
          - dbt_utils.accepted_range:
              min_value: 0

DuckDB — analytics local rápido

import duckdb

con = duckdb.connect('analytics.duckdb')

# Lê Parquet direto (S3 ou local)
con.execute("""
    CREATE TABLE IF NOT EXISTS contracts AS
    SELECT * FROM read_parquet('data/contracts/*.parquet')
""")

# Query analítica
result = con.execute("""
    SELECT
        tenant_id,
        DATE_TRUNC('month', start_date) AS month,
        SUM(monthly_value)              AS mrr
    FROM contracts
    WHERE status = 'active'
    GROUP BY 1, 2
    ORDER BY 2 DESC, 3 DESC
""").df()  # retorna pandas DataFrame

# Exportar para Parquet
con.execute("COPY contracts TO 'output/contracts.parquet' (FORMAT PARQUET)")

Apache Spark — big data

from pyspark.sql import SparkSession
from pyspark.sql import functions as F

spark = SparkSession.builder \
    .appName("DataPipeline") \
    .config("spark.sql.extensions", "io.delta.sql.DeltaSparkSessionExtension") \
    .getOrCreate()

# Leitura
df = spark.read.parquet("s3a://bucket/raw/contracts/")

# Transformação
result = df \
    .filter(F.col("status") == "active") \
    .withColumn("month", F.date_trunc("month", F.col("start_date"))) \
    .groupBy("tenant_id", "month") \
    .agg(F.sum("monthly_value").alias("mrr"),
         F.count("*").alias("count"))

# Escrita Delta Lake (ACID, time travel)
result.write.format("delta").mode("overwrite") \
    .partitionBy("month") \
    .save("s3a://bucket/processed/revenue/")

Airflow — orquestração

from airflow.decorators import dag, task
from airflow.utils.dates import days_ago

@dag(schedule_interval='@daily', start_date=days_ago(1), catchup=False)
def pipeline_contratos():

    @task()
    def extrair():
        # Extrai do banco origem
        return {"rows": 1000}

    @task()
    def transformar(dados: dict):
        # dbt run ou Spark job
        return {"processed": dados["rows"]}

    @task()
    def carregar(dados: dict):
        # Carrega no DW
        print(f"Carregados: {dados['processed']}")

    dados = extrair()
    transformados = transformar(dados)
    carregar(transformados)

dag = pipeline_contratos()

Kafka — streaming

from confluent_kafka import Producer, Consumer

# Produtor
producer = Producer({'bootstrap.servers': 'localhost:9092'})
producer.produce('contracts', key='123', value='{"event": "created", ...}')
producer.flush()

# Consumidor
consumer = Consumer({
    'bootstrap.servers': 'localhost:9092',
    'group.id': 'pipeline-group',
    'auto.offset.reset': 'earliest'
})
consumer.subscribe(['contracts'])

while True:
    msg = consumer.poll(1.0)
    if msg and not msg.error():
        print(f"Evento: {msg.value().decode()}")

Modelagem dimensional

-- Fato: evento mensurável
CREATE TABLE fct_pagamentos (
    pagamento_id  BIGINT PRIMARY KEY,
    data_id       INT REFERENCES dim_data(data_id),
    tenant_id     INT REFERENCES dim_tenant(tenant_id),
    contrato_id   BIGINT,
    valor         DECIMAL(12,2),
    status        VARCHAR(20)
);

-- Dimensão: contexto descritivo
CREATE TABLE dim_data (
    data_id       INT PRIMARY KEY,
    data          DATE,
    ano           INT,
    mes           INT,
    trimestre     INT,
    dia_semana    VARCHAR(15)
);

Qualidade de dados — Great Expectations

import great_expectations as gx

context = gx.get_context()
validator = context.sources.pandas_default.read_parquet("contracts.parquet")

# Defina expectativas
validator.expect_column_values_to_not_be_null("tenant_id")
validator.expect_column_values_to_be_between("monthly_value", min_value=0)
validator.expect_column_values_to_be_unique("id")

results = validator.validate()
if not results.success:
    raise ValueError("Qualidade de dados falhou — pipeline abortado")

Referências adicionais

ClickHouse: ver references/clickhouse.md
Delta Lake / Iceberg: ver references/lakehouse.md
Prefect / Dagster: ver references/orchestration.md