Run any Skill in Manus with one click

scientific-clinical-nlp

Stars3

Forks1

UpdatedFebruary 15, 2026 at 02:08

臨床自然言語処理スキル。MedSpaCy / cTAKES / scispaCy による臨床テキスト NER、セクション検出、否定文検出、 ICD-10/SNOMED-CT エンティティリンキング、匿名化 (De-identification) パイプライン。 TU 外スキル (直接 Python ライブラリ)。

Installation

Install with Codex or Claude Copy this prompt, paste it into Codex, Claude, or another assistant, and let it review the skill page and install it for you.

Run Skill in Manus

Source

nahisaho

nahisaho/satori

View GitHub Repository View Creator Repositories

Download

Run Skill in Manus

Related occupationsSOC

Based on SOC occupation classification

Data ScientistsComputer and Mathematical Occupations·SOC 15-2051

SKILL.md

readonly

More from this repository

same repository

scientific-audit-report

nahisaho/satori

実験の監査レポート・データ来歴（プロベナンス）生成スキル。データ変換履歴・使用ツールのバージョン・データ整合性チェックを含むトレーサビリティレポートを自動生成する。「監査レポート作成」「データ来歴を記録」「トレーサビリティ」で発火。

2026-03-203

scientific-experiment-fork

nahisaho/satori

派生実験設計スキル。既存の実験をベースに条件を変更した派生実験を設計する。実験計画法（DOE）に基づくパラメータ探索を支援。「派生実験を設計して」「条件を変えて実験」「パラメータ探索」で発火。

2026-03-203

scientific-experiment-template

nahisaho/satori

実験テンプレート生成スキル。研究目的・仮説・手法・実験条件・評価基準・スケジュールを構造化した実験計画書を自動作成する。「実験テンプレート作成して」「実験計画を立てて」「実験プロトコルを作成」で発火。

2026-03-203

scientific-latex-export

nahisaho/satori

実験結果を論文形式（LaTeX / IMRaD）にエクスポートするスキル。 Introduction・Materials & Methods・Results・Discussion の構造で出版準備用の原稿を自動生成する。「論文にして」「LaTeX出力」「出版準備」で発火。

2026-03-203

scientific-peer-review

nahisaho/satori

実験結果の査読・レビュースキル。再現性・統計的妥当性・方法論の健全性を体系的に評価し、構造化されたレビューレポートを生成する。「レビューして」「査読して」「実験結果を評価して」で発火。

2026-03-203

scientific-academic-writing

nahisaho/satori

科学技術・学術論文の執筆スキル。IMRaD 標準、Nature/Science 系、ACS 系、IEEE 系、 Elsevier 系のジャーナル形式に対応した論文構成・セクション設計・文章パターンを提供。「論文を書いて」「Abstract を作成して」「Methods セクションを書いて」で発火。 assets/ に主要ジャーナル形式の Markdown テンプレートを同梱。

2026-02-153

name	scientific-clinical-nlp
description	臨床自然言語処理スキル。MedSpaCy / cTAKES / scispaCy による臨床テキスト NER、セクション検出、否定文検出、 ICD-10/SNOMED-CT エンティティリンキング、匿名化 (De-identification) パイプライン。 TU 外スキル (直接 Python ライブラリ)。
tu_tools	[{"key":"umls","name":"UMLS","description":"医学用語統一システム検索"}]

Scientific Clinical NLP

MedSpaCy・scispaCy を中心とした臨床テキスト自然言語処理パイプラインを提供する。電子カルテテキストからの臨床エンティティ抽出・否定文検出 (NegEx)・セクション検出・標準用語へのリンキングを行う。

When to Use

電子カルテ / 臨床ノートから疾患・薬剤・症状を抽出するとき
臨床テキストの否定文 (NegEx/ConText) を検出するとき
テキストセクション (主訴/HPI/Assessment/Plan) を分類するとき
ICD-10 / SNOMED-CT コードへのリンキングを行うとき
PHI 匿名化 (De-identification) を実施するとき
バイオメディカル文献テキストマイニングとの連携

Quick Start

1. MedSpaCy 臨床 NER

import medspacy
from medspacy.ner import TargetRule
from medspacy.visualization import visualize_ent


def clinical_ner(text, rules=None):
    """
    MedSpaCy — 臨床テキスト NER パイプライン。

    Parameters:
        text: str — 臨床テキスト
        rules: list[dict] | None — カスタムルール
    """
    nlp = medspacy.load(
        enable=["medspacy_pyrush",
                "medspacy_target_matcher",
                "medspacy_context"])

    if rules:
        target_matcher = nlp.get_pipe(
            "medspacy_target_matcher")
        for r in rules:
            target_matcher.add(TargetRule(
                literal=r["literal"],
                category=r.get("category",
                               "CONDITION")))

    doc = nlp(text)

    entities = []
    for ent in doc.ents:
        entities.append({
            "text": ent.text,
            "label": ent.label_,
            "start": ent.start_char,
            "end": ent.end_char,
            "is_negated": ent._.is_negated,
            "is_uncertain": ent._.is_uncertain,
            "is_historical": ent._.is_historical,
            "is_family": ent._.is_family,
        })

    n_neg = sum(1 for e in entities
                if e["is_negated"])
    print(f"Clinical NER: {len(entities)} entities, "
          f"{n_neg} negated")
    return entities


def clinical_ner_batch(texts, rules=None):
    """
    MedSpaCy — バッチ臨床 NER。

    Parameters:
        texts: list[str] — 臨床テキストリスト
        rules: list[dict] | None — カスタムルール
    """
    all_entities = []
    for i, text in enumerate(texts):
        ents = clinical_ner(text, rules)
        for e in ents:
            e["doc_id"] = i
        all_entities.extend(ents)

    import pandas as pd
    df = pd.DataFrame(all_entities)
    print(f"Batch NER: {len(texts)} docs, "
          f"{len(df)} total entities")
    return df

2. セクション検出

def clinical_section_detect(text):
    """
    MedSpaCy — 臨床テキストセクション検出。

    Parameters:
        text: str — 臨床テキスト
    """
    import medspacy
    nlp = medspacy.load(
        enable=["medspacy_pyrush",
                "medspacy_sectionizer"])

    doc = nlp(text)

    sections = []
    for section in doc._.sections:
        sections.append({
            "category": section.category,
            "title": (section.title_span.text
                      if section.title_span else ""),
            "body": (section.body_span.text[:200]
                     if section.body_span else ""),
        })

    print(f"Sections detected: {len(sections)}")
    for s in sections:
        print(f"  [{s['category']}] "
              f"{s['title'][:50]}")
    return sections

3. SNOMED-CT / ICD-10 リンキング

def clinical_entity_linking(text,
                              linker_name="umls"):
    """
    scispaCy — 臨床エンティティの UMLS/SNOMED リンキング。

    Parameters:
        text: str — 臨床テキスト
        linker_name: str — リンカー ("umls", "mesh",
                           "snomed")
    """
    import spacy
    import scispacy
    from scispacy.linking import EntityLinker

    nlp = spacy.load("en_core_sci_md")
    nlp.add_pipe("scispacy_linker",
                 config={"resolve_abbreviations": True,
                         "linker_name": linker_name})

    doc = nlp(text)
    linker = nlp.get_pipe("scispacy_linker")

    linked = []
    for ent in doc.ents:
        for cui, score in ent._.kb_ents[:3]:
            concept = linker.kb.cui_to_entity.get(
                cui, {})
            linked.append({
                "text": ent.text,
                "cui": cui,
                "score": round(score, 3),
                "canonical_name": (
                    concept.canonical_name
                    if hasattr(concept,
                               "canonical_name")
                    else str(concept)),
            })

    import pandas as pd
    df = pd.DataFrame(linked)
    print(f"Entity linking: {len(doc.ents)} entities → "
          f"{len(df)} CUI mappings")
    return df

4. 臨床 NLP 統合パイプライン

def clinical_nlp_pipeline(texts,
                            output_dir="results"):
    """
    臨床 NLP 統合パイプライン。

    Parameters:
        texts: list[str] — 臨床テキストリスト
        output_dir: str — 出力ディレクトリ
    """
    import pandas as pd
    from pathlib import Path
    output_dir = Path(output_dir)
    output_dir.mkdir(parents=True, exist_ok=True)

    # 1) NER + 否定文検出
    ner_df = clinical_ner_batch(texts)
    ner_df.to_csv(output_dir / "clinical_ner.csv",
                  index=False)

    # 2) セクション検出
    all_sections = []
    for i, text in enumerate(texts):
        secs = clinical_section_detect(text)
        for s in secs:
            s["doc_id"] = i
        all_sections.extend(secs)
    section_df = pd.DataFrame(all_sections)
    section_df.to_csv(
        output_dir / "clinical_sections.csv",
        index=False)

    # 3) エンティティリンキング (最初のテキスト)
    if texts:
        link_df = clinical_entity_linking(texts[0])
        link_df.to_csv(
            output_dir / "entity_linking.csv",
            index=False)

    print(f"Clinical NLP pipeline → {output_dir}")
    return {"ner": ner_df, "sections": section_df}

パイプライン統合

text-mining-nlp → clinical-nlp → clinical-reporting
  (PubMed/文献)     (NER/NegEx)     (構造化レポート)
       │                 │                 ↓
  biomedical-ner ───────┘       pharmacogenomics
    (scispaCy)                   (PGx 処方支援)

パイプライン出力

ファイル	説明	次スキル
`results/clinical_ner.csv`	臨床エンティティ+否定	→ phenotype-hpo
`results/clinical_sections.csv`	セクション分類	→ clinical-reporting
`results/entity_linking.csv`	UMLS/SNOMED リンキング	→ disease-research

ToolUniverse 連携

TU Key	ツール名	連携内容
`umls`	UMLS	医学用語統一システム検索