Skip to main content
Manusで任意のスキルを実行
ワンクリックで

nemo-curator

GPU-accelerated data curation for LLM training. Supports text/image/video/audio. Features fuzzy deduplication (16× faster), quality filtering (30+ heuristics), semantic deduplication, PII redaction, NSFW detection. Scales across GPUs with RAPIDS. Use for preparing high-quality training datasets, cleaning web data, or deduplicating large corpora.

概要

GPU-accelerated data curation for LLM training. Supports text/image/video/audio. Features fuzzy deduplication (16× faster), quality filtering (30+ heuristics), semantic deduplication, PII redaction, NSFW detection. Scales across GPUs with RAPIDS. Use for preparing high-quality training datasets, cleaning web data, or deduplicating large corpora.

インストールコマンド
npx skills add https://github.com/NousResearch/hermes-agent --skill nemo-curator

このコマンドをClaude Codeにコピー&ペーストしてスキルをインストール

スター178,912
フォーク30,651
更新日2026年5月8日 21:27
ファイルエクスプローラー
3 ファイル
SKILL.md
readonly