| name | thematic-analysis |
| description | テーマ分析 (Thematic Analysis) - テキストファイル群から質的研究のテーマ分析を行うスキル。対象ディレクトリ内のテキストファイル(.txt, .md, .docx等)に対して、ファイル名へのインデックス付与、文単位でのCSV保存、テーマ抽出、深層構造分析を実行する。「テーマ分析して」「thematic analysis」「質的分析」「テキストを分析して」などのリクエストで使用する。 |
テーマ分析 (Thematic Analysis)
テキストファイル群から質的研究のテーマ分析を実行する。
処理フロー
0. context.md読み込み → 1. ファイル名インデックス付与 → 2. sentences.csv作成 → 3. テーマ抽出 → 4. 深層構造分析(総括) → 5. themes.md作成
ステップ0: context.mdの読み込み(任意)
対象ディレクトリのルートにcontext.mdがある場合、分析開始前に読み込む。
context.mdの内容例:
- データ収集時の状況・背景
- 分析の目的・研究課題
- 対象者の属性情報
- 収集方法(インタビュー、アンケート等)
- その他、分析に影響する文脈情報
このファイルは分析対象データとしては処理されず(インデックス付与・CSV化されない)、分析者がテーマを解釈する際のコンテキストとして使用する。
ステップ1: ファイル名へのインデックス付与
$SKILL_ROOT/scripts/add_index.pyを実行してファイル名にインデックスを付与。
python "$SKILL_ROOT/scripts/add_index.py" [対象ディレクトリ]
処理内容:
- 対象: .txt, .md, .docx ファイル
- 既にインデックス付き(例: 01_xxx.txt)のファイルはスキップ
- 既存の最大インデックスの次の番号から付与
田中太郎.txt → 01_田中太郎.txt
山田花子.md → 02_山田花子.md
ステップ2: sentences.csv作成
$SKILL_ROOT/scripts/create_csv.pyを実行して文単位のCSVを作成。
python "$SKILL_ROOT/scripts/create_csv.py" [対象ディレクトリ] [出力ファイル名]
分割ルール:
- 句点(。)で区切る
- 改行で区切る
- 見出し行(#や**で始まる)は1単位
CSV形式:
id,content
01-001,最初のファイルの1文目
01-002,最初のファイルの2文目
02-001,2番目のファイルの1文目
id形式: [ファイル番号2桁]-[文番号3桁]
ステップ3: テーマ抽出
context.mdが存在する場合は、必ず先に読み込んでコンテキストを把握してから分析を開始する。
sentences.csvを読み込み、質的研究のテーマ分析手法に基づき分析。設問やインタビュイーの質問に該当する行はコンテキストとして扱い、テーマ抽出の対象から除外する。:
- データに親しむ(全体を通読)
- 初期コードを生成
- テーマを探索
- テーマを検討・精緻化
- テーマを定義・命名
- 各テーマにID(T01, T02, ...)を付与
テーマ数の目安: 内容に応じて5〜15程度
ステップ4: 深層構造分析(総括)
抽出したテーマを単にまとめるのではなく、以下の観点から深層構造を分析する。ただしあくまでデータに基づくようにし、飛躍しすぎないように留意する:
分析の観点
- 背景にあるメカニズム: なぜそのテーマが語られるのか、その背景にある構造や力学
- テーマ間の関係性: 複数のテーマがどのように関連し、影響し合っているか
- 領域特有の文脈: 対象領域(医療、教育等)の特性がどう影響しているか
- 暗黙の前提や価値観: 回答者が無意識に共有している前提は何か
- 逆説や緊張関係: 一見矛盾するように見える認識の背後にある論理
- 変化の方向性: 現状から将来への移行において何が起きているか
総括の構成
総括は3〜6個程度の「深層構造」として記述する。各深層構造には:
- 関連するテーマID
- 背景・メカニズムの分析
- 代表的な引用(文id付き)
を含める。最後に全体を統合する結論を記述する。
ステップ5: themes.md作成
themes.md形式
# テーマ分析結果
- **分析対象**: [対象の説明]
- **分析日**: [日付]
---
## T01: [テーマ名]
- 関連するid:
- 01-001, 01-005, 02-003
### テーマに関する記述:
[テーマの説明・解釈]
### 代表的な引用:
- 「[引用文]」(01-001)
- 「[引用文]」(02-003)
---
## T02: [テーマ名]
...
---
## 総括:テーマの深層構造分析
### 1. [深層構造のタイトル]
**関連テーマ:** T01, T03, T05
[背景・メカニズムの分析。単なるテーマの要約ではなく、なぜそのような認識が生まれるのか、その構造や力学を考察する。]
#### 代表的な引用:
- 「[引用文]」(01-001)
- 「[引用文]」(03-005)
---
### 2. [深層構造のタイトル]
...
出力ファイル
| ファイル | 内容 |
|---|
| sentences.csv | 全文のインデックス付きデータ |
| themes.md | テーマ分析結果(テーマ+深層構造分析+テーマ一覧) |
深層構造分析の例
悪い例(単なるテーマの要約)
「効率化と本質の二層構造」
AIを効率化可能な領域で活用しつつ、人間固有の領域は守るという認識が共有されている。
良い例(背景・メカニズムの分析)
「『教育者とは何か』というアイデンティティの再定義」
AIの登場は、教育者たちに「自分の存在価値は何か」という根源的な問いを突きつけている。従来、教育者の価値の一部は「知識を持っている」「情報を整理できる」ことにあった。しかしAIがこれらを代替可能になったとき、教育者は自らの役割を再定義せざるを得なくなる。これは単なる業務分担の話ではなく、専門職としてのアイデンティティの再構築というより深い営みである。
注意事項
- 元のファイルはリネームされる(バックアップ推奨)
- テーマIDは必ず付与する(T01, T02, ...形式)
- 総括では関連テーマIDと引用(文id付き)を必ず含める
- 深層構造分析は表面的な要約ではなく、背景・メカニズム・構造に踏み込む