Run any Skill in Manus with one click

data-validator

Autonomous data quality validation — schema inference and validation, completeness/uniqueness/consistency checks, statistical anomaly detection, time-series gap detection, referential integrity, dataset comparison and drift detection. Supports CSV, JSON, SQLite, APIs. Use after any data pipeline work.

Run Skill in Manus

Overview

Install command

npx skills add https://github.com/JansenAnalytics/claudex --skill data-validator

Copy and paste this command into Claude Code to install the skill

Source

JansenAnalytics/claudex

Stars4

Forks1

UpdatedJune 3, 2026 at 20:50

File Explorer

9 files

SKILL.md

readonly

More from this repository

same repository

memory-search

JansenAnalytics/claudex

Semantic memory search across all agent memories and conversation history. Use BEFORE answering questions about prior work, decisions, dates, people, preferences, projects, or past conversations. Also use when asked "do you remember", "what did we discuss", "when did we", etc.

2026-06-034

weather

JansenAnalytics/claudex

Get current weather and forecasts. Use when the user asks about weather, temperature, or forecasts for any location.

2026-06-034

1password

JansenAnalytics/claudex

Set up and use 1Password CLI (op). Use when installing the CLI, enabling desktop app integration, signing in (single or multi-account), or reading/injecting/running secrets via op.

2026-06-034

a11y-audit

JansenAnalytics/claudex

Accessibility auditing: WCAG compliance checking, contrast ratios, ARIA labels, keyboard navigation, semantic HTML, screen reader compatibility.

2026-06-034

adr-manager

JansenAnalytics/claudex

ADR Manager Skill

2026-06-034

api-critic

JansenAnalytics/claudex

Autonomous API testing and evaluation. Tests any REST API for correctness, security, performance, error handling, and standards compliance. Discovers endpoints, probes with valid/invalid/edge-case payloads, checks auth, response times, injection vulnerabilities, and generates severity-scored reports with actionable fixes. Use before any API "done" claim.

2026-06-034

Source

JansenAnalytics

JansenAnalytics/claudex

View GitHub Repository View Creator Repositories

Install command

Download

Run Skill in Manus

Useful forSOC

Software DevelopersComputer and Mathematical Occupations15-1252L4

name	data-validator
user-invocable	false
description	Autonomous data quality validation — schema inference and validation, completeness/uniqueness/consistency checks, statistical anomaly detection, time-series gap detection, referential integrity, dataset comparison and drift detection. Supports CSV, JSON, SQLite, APIs. Use after any data pipeline work.
triggers	["validate data","data quality","check data","data validator","schema validation"]
category	data
maturity	stable
tags	["data-quality","schema-inference","anomaly-detection","drift","integrity"]

data-validator

Autonomous data quality validation for any data source — databases, CSVs, APIs, JSON files.

Quick Start

data-validator /path/to/data.csv --infer          # Auto-detect schema & validate
data-validator /path/to/data.csv --schema s.json   # Validate against schema
data-validator /path/to/data.csv --full            # All checks including timeseries

Binary: `~/bin/data-validator`

data-validator [command] <source> [options]

Commands

Command	Description
`review` (default)	Full orchestrated validation
`schema`	Schema validation / inference
`quality`	Data quality scoring
`compare`	Diff two datasets
`integrity`	Referential integrity checks
`timeseries`	Time-series specific analysis
`report`	Generate report from results JSON

Sources

file.csv — CSV with headers
file.json — JSON array of objects
file.jsonl / file.ndjson — Newline-delimited JSON
sqlite:/path/to/db.sqlite:tablename — SQLite table
http://api/endpoint — JSON API

Options

Option	Description
`--schema FILE`	Schema JSON to validate against
`--infer`	Auto-infer schema from data
`--compare FILE2`	Compare with second dataset
`--timeseries`	Run time-series analysis
`--time-field NAME`	Specify time field
`--primary-key NAME`	Primary key field (default: id)
`--quick`	Schema + quality only
`--full`	All checks
`--output-dir DIR`	Write individual reports to directory
`--format md\|json`	Output format
`--output FILE`	Output file (per-script)

Schema Format

{
  "fields": {
    "id": { "type": "integer", "required": true, "unique": true, "min": 1 },
    "email": { "type": "string", "required": true, "pattern": "^[^@]+@[^@]+$" },
    "amount": { "type": "number", "min": 0, "max": 1000000 },
    "status": { "type": "enum", "values": ["active", "inactive", "pending"] },
    "created_at": { "type": "date", "format": "ISO8601", "after": "2020-01-01" },
    "tags": { "type": "array", "minLength": 1, "itemType": "string" }
  }
}

Quality Dimensions

The quality score (0-100) is computed from:

Completeness — % populated fields, flags >5% nulls
Validity — Schema conformance per field
Consistency — Format consistency, encoding
Accuracy — Outlier detection (>3σ from mean)
Timeliness — Gap detection in time-series data
Integrity — Referential integrity, FK violations

Scripts

Script	Purpose
`schema.cjs`	Schema inference & validation
`quality.cjs`	Quality scoring (completeness, uniqueness, accuracy, distribution)
`compare.cjs`	Dataset diff & drift detection
`integrity.cjs`	FK violations, orphans (SQLite + file relationships)
`timeseries.cjs`	Gaps, duplicates, monotonicity, anomalies, staleness
`review.cjs`	Orchestrator — runs all checks
`report.cjs`	Report generator (MD + JSON)

Dependencies

Node.js (built-in modules only, except better-sqlite3 for SQLite)
better-sqlite3 (only for SQLite sources) — shared from the kanban-agent skill's node_modules (${CLAUDE_SKILLS_DIR:-$HOME/.claude-agent/.claude/skills}/kanban-agent/node_modules). See INSTALL.md.

data-validator

More from this repository

More from this repository

data-validator

Quick Start

Binary: ~/bin/data-validator

Commands

Sources

Options

Schema Format

Quality Dimensions

Scripts

Dependencies

data-validator

Quick Start

Binary: ~/bin/data-validator

Commands

Sources

Options

Schema Format

Quality Dimensions

Scripts

Dependencies

Binary: `~/bin/data-validator`

Binary: `~/bin/data-validator`