Run any Skill in Manus with one click

Get Started

data-pipeline

ETL and data transformation: CSV, JSON, Parquet, NDJSON processing with filtering, mapping, joining, aggregating.

Run Skill in Manus

Overview

ETL and data transformation: CSV, JSON, Parquet, NDJSON processing with filtering, mapping, joining, aggregating.

Install command

npx skills add https://github.com/JansenAnalytics/claudex --skill data-pipeline

Copy and paste this command into Claude Code to install the skill

Source

JansenAnalytics/claudex

Stars4

Forks1

UpdatedJune 3, 2026 at 20:50

SKILL.md

readonly

name	data-pipeline
description	ETL and data transformation: CSV, JSON, Parquet, NDJSON processing with filtering, mapping, joining, aggregating.
category	data
maturity	stable
tags	["etl","csv","parquet","ndjson","transform"]

data-pipeline

ETL and data transformation: CSV, JSON, Parquet, NDJSON processing with filtering, mapping, joining, aggregating.

When to Use

Converting between data formats (CSV ↔ JSON, NDJSON, etc.)
Cleaning or filtering datasets
Merging/joining files on a common key
Aggregating data (sum, avg, count, min, max by group)
Detecting file formats automatically
Building multi-step data processing pipelines

Scripts

Script	Purpose	Usage
`csv-to-json.py`	Convert CSV → JSON array	`python3 csv-to-json.py input.csv [output.json]`
`json-to-csv.py`	Convert JSON array → CSV	`python3 json-to-csv.py input.json [output.csv]`
`data-merge.py`	Join two files on a key	`python3 data-merge.py left.csv right.csv --key id [--how inner]`
`data-filter.py`	Filter + aggregate data	`python3 data-filter.py input.csv --filter "col=val" --agg "col:sum"`
`detect-format.py`	Auto-detect file format	`python3 detect-format.py file.ext`

All scripts read from stdin if no file argument given. Output goes to stdout by default.

References

references/jq-cheatsheet.md — Common jq patterns for JSON processing
references/csvkit-patterns.md — csvkit one-liners
references/large-file-handling.md — Strategies for big datasets

Examples

# Convert CSV to JSON
python3 scripts/csv-to-json.py sales.csv > sales.json

# Filter rows and aggregate
python3 scripts/data-filter.py sales.csv --filter "region=Europe" --agg "revenue:sum,count"

# Merge two CSVs on 'id' column
python3 scripts/data-merge.py users.csv orders.csv --key user_id --how left

# Detect format
python3 scripts/detect-format.py mystery_file.dat

Dependencies

Python 3 (standard library only — csv, json, argparse)
No external packages required

More from this repository

same repository

memory-search

JansenAnalytics/claudex

Semantic memory search across all agent memories and conversation history. Use BEFORE answering questions about prior work, decisions, dates, people, preferences, projects, or past conversations. Also use when asked "do you remember", "what did we discuss", "when did we", etc.

2026-06-034

weather

JansenAnalytics/claudex

Get current weather and forecasts. Use when the user asks about weather, temperature, or forecasts for any location.

2026-06-034

1password

JansenAnalytics/claudex

Set up and use 1Password CLI (op). Use when installing the CLI, enabling desktop app integration, signing in (single or multi-account), or reading/injecting/running secrets via op.

2026-06-034

a11y-audit

JansenAnalytics/claudex

Accessibility auditing: WCAG compliance checking, contrast ratios, ARIA labels, keyboard navigation, semantic HTML, screen reader compatibility.

2026-06-034

adr-manager

JansenAnalytics/claudex

ADR Manager Skill

2026-06-034

api-critic

JansenAnalytics/claudex

Autonomous API testing and evaluation. Tests any REST API for correctness, security, performance, error handling, and standards compliance. Discovers endpoints, probes with valid/invalid/edge-case payloads, checks auth, response times, injection vulnerabilities, and generates severity-scored reports with actionable fixes. Use before any API "done" claim.

2026-06-034

Source

JansenAnalytics

JansenAnalytics/claudex

View GitHub Repository View Creator Repositories

Install command

Download

Run Skill in Manus

Useful forSOC

Software DevelopersComputer and Mathematical Occupations15-1252L4

name	data-pipeline
description	ETL and data transformation: CSV, JSON, Parquet, NDJSON processing with filtering, mapping, joining, aggregating.
category	data
maturity	stable
tags	["etl","csv","parquet","ndjson","transform"]

data-pipeline

ETL and data transformation: CSV, JSON, Parquet, NDJSON processing with filtering, mapping, joining, aggregating.

When to Use

Converting between data formats (CSV ↔ JSON, NDJSON, etc.)
Cleaning or filtering datasets
Merging/joining files on a common key
Aggregating data (sum, avg, count, min, max by group)
Detecting file formats automatically
Building multi-step data processing pipelines

Scripts

Script	Purpose	Usage
`csv-to-json.py`	Convert CSV → JSON array	`python3 csv-to-json.py input.csv [output.json]`
`json-to-csv.py`	Convert JSON array → CSV	`python3 json-to-csv.py input.json [output.csv]`
`data-merge.py`	Join two files on a key	`python3 data-merge.py left.csv right.csv --key id [--how inner]`
`data-filter.py`	Filter + aggregate data	`python3 data-filter.py input.csv --filter "col=val" --agg "col:sum"`
`detect-format.py`	Auto-detect file format	`python3 detect-format.py file.ext`

All scripts read from stdin if no file argument given. Output goes to stdout by default.

References

references/jq-cheatsheet.md — Common jq patterns for JSON processing
references/csvkit-patterns.md — csvkit one-liners
references/large-file-handling.md — Strategies for big datasets

Examples

# Convert CSV to JSON
python3 scripts/csv-to-json.py sales.csv > sales.json

# Filter rows and aggregate
python3 scripts/data-filter.py sales.csv --filter "region=Europe" --agg "revenue:sum,count"

# Merge two CSVs on 'id' column
python3 scripts/data-merge.py users.csv orders.csv --key user_id --how left

# Detect format
python3 scripts/detect-format.py mystery_file.dat

Dependencies

Python 3 (standard library only — csv, json, argparse)
No external packages required