| name | tw-research-content-analysis |
| description | 內容分析工具,協助研究者對文本、媒體或文件資料進行系統性、 量化的內容分析。提供編碼類別設計、編碼矩陣生成、 Cohen's Kappa 信度計算(含詮釋指引),以及頻率統計輸出。 支援:傳播學媒體分析、政策文件分析、教科書分析、 社群媒體文字分析、歷史文獻分析。 當使用者提及「內容分析」「content analysis」「編碼矩陣」 「媒體分析」「文件分析」「Kappa 係數」「類別頻率」時觸發。 分類:學術研究(tw-research-*) 參考來源:Krippendorff (2019) Content Analysis + Cohen's Kappa
|
| version | 1.0.0 |
| author | 奇老師・數位敘事力社群 |
| allowed-tools | Bash, Read, Write |
內容分析工具 v1.0
核心哲學
「內容分析讓「軟」的文本資料,說出「硬」的量化結論。
關鍵在於:編碼類別是否清楚、編碼者是否一致。
信度不高的內容分析,比沒有分析更糟。」
學術依據:
- Krippendorff, K. (2019). Content Analysis: An Introduction to Its Methodology (4th ed.)
- Cohen, J. (1960). A coefficient of agreement for nominal scales
- Neuendorf, K. A. (2017). The Content Analysis Guidebook
Step 0:讀取參考資源
references/content_analysis_codebook_guide.md — 編碼手冊設計指南
references/kappa_calculation_guide.md — Cohen's Kappa 計算說明
Step 1:概念對齊確認卡
╔══════════════ 內容分析工具啟動 ══════════════╗
📌 任務:系統性內容分析設計 + 信度評估
🎯 目標:編碼矩陣 + 頻率統計 + 信度係數
請提供:
1. 分析材料類型(新聞/教科書/政策文件/社群媒體等)
2. 研究問題(想知道這些材料的什麼特徵?)
3. 材料數量(N = X 篇/條/段)
4. 是否有多位編碼者(影響信度設計)
╚═══════════════════════════════════════════════╝
Step 2:內容分析基本設定
Q1:「分析單元(Unit of Analysis)?
A. 整篇文章/文件(粗粒度)
B. 段落
C. 句子
D. 字詞/詞彙
E. 圖像/影像元素
F. 主題/議題(最常用於傳播研究)」
Q2:「分析類型?
A. 顯性內容分析(表面意思,較客觀)
B. 隱性內容分析(潛藏意義,需詮釋)
C. 兩者並用」
Q3:「編碼系統?
A. 類別編碼(Nominal)— 是否屬於某類別
B. 方向編碼(Ordinal)— 正面/中立/負面
C. 強度評分(Interval)— 1-5 分程度評估
D. 混合:先分類再評強度」
Q4:「是否有既有分類框架可參考?
A. 是,參考 [理論/先行研究]
B. 否,從資料中歸納(Inductive)
C. 混合(先演繹再修正)」
Step 3:編碼手冊(Codebook)設計
編碼手冊標準格式:
編碼類別:[類別名稱]
編號:C01
定義:[清楚的操作性定義,2-3句]
包含(Include):
• [符合此類別的例子]
• [邊界案例說明]
不包含(Exclude):
• [常見的誤判案例]
典型範例:
• [正面範例引述]
• [負面範例引述]
邊界案例處理:[如何處理不確定的案例]
示範編碼手冊(以新聞框架分析為例):
類別:F1 衝突框架(Conflict Frame)
定義:新聞報導強調不同政治派系、個人或團體間
的不同意見或對抗情況。
包含:
• 明確的對立意見描述(支持vs.反對)
• 政治攻防、批評言論
• 贊成/反對的量化統計
不包含:
• 純事實陳述無明顯立場
• 歷史事件回顧
• 科學研究結果報告
典型範例:
✅ 「執政黨與在野黨就該法案激烈交鋒,雙方各持立場...」
❌ 「政府昨日公布最新統計數字...」(無衝突)
編碼指示:若報導主要篇幅(>50%)呈現對立立場 → 編碼為 F1
Step 4:編碼矩陣輸出格式
╔═════════════════════════════════════════════════════════╗
內容分析編碼矩陣
研究主題:[研究主題]
分析材料:[N] 篇/條/段
分析期間:[日期範圍]
編碼者:[代號清單]
╠═════════════════════════════════════════════════════════╣
材料編號 │ [類別C01] │ [類別C02] │ [類別C03] │ ... │ 備注
────────────────────────────────────────────────────────
M001 │ 1 │ 0 │ 1 │ ... │
M002 │ 0 │ 1 │ 0 │ ... │
M003 │ 1 │ 1 │ 0 │ ... │
...
────────────────────────────────────────────────────────
頻率 │ X │ X │ X │ ... │
百分比 │ X.X% │ X.X% │ X.X% │ ... │
╚═════════════════════════════════════════════════════════╝
Step 5:Cohen's Kappa 信度計算
5.1 為何需要信度?
內容分析的核心要求:不同編碼者看同一份材料,
應得到高度一致的結果(編碼者間信度)。
若一致性低,說明編碼定義不夠清楚,結論不可信。
5.2 Cohen's Kappa 計算步驟
公式:κ = (Po - Pe) / (1 - Pe)
其中:
Po = 實際觀察一致率(Observed Agreement)
Pe = 機率期望一致率(Expected Agreement by Chance)
手動計算步驟:
步驟 1:建立混淆矩陣(2分類為例)
編碼者 B
類別1 類別2 合計
編碼者A 類別1 a b a+b
類別2 c d c+d
合計 a+c b+d N
步驟 2:計算 Po
Po = (a + d) / N
步驟 3:計算 Pe
Pe = [(a+b)/N × (a+c)/N] + [(c+d)/N × (b+d)/N]
步驟 4:計算 κ
κ = (Po - Pe) / (1 - Pe)
示範計算:
N = 50 筆材料
編碼者B
類別1 類別2
編碼者A 類別1 20 3
類別2 2 25
Po = (20+25)/50 = .90
Pe = [(23/50 × 22/50)] + [(27/50 × 28/50)]
= (.46 × .44) + (.54 × .56)
= .202 + .302 = .504
κ = (.90 - .504) / (1 - .504) = .396 / .496 = .80
5.3 κ 值詮釋標準
κ 值 │ 評估等級 │ 處理建議
─────────────────────────────────────────────
< .00 │ 低於隨機 │ 🔴 重新訓練,重新設計
.00-.20 │ 微弱一致 │ 🔴 不可接受,需大幅修訂
.21-.40 │ 尚可一致 │ 🟠 修訂編碼手冊,討論爭議案例
.41-.60 │ 中等一致 │ 🟡 可以接受(部分研究標準)
.61-.80 │ 高度一致 │ 🟢 良好(建議達到此標準)
.81-1.00 │ 幾乎完美 │ ✅ 優秀
─────────────────────────────────────────────
學術界最低標準:κ ≥ .70(Cohen, 1960)
κ ≥ .80(傳播研究慣例)
Step 6:頻率統計與圖表輸出建議
基本統計輸出:
□ 各類別出現頻率(絕對數 + 百分比)
□ 類別間交叉分析(Chi-square test)
□ 時間趨勢分析(若有時間軸)
視覺化建議:
• 橫條圖(各類別頻率比較)
• 折線圖(時間序列變化)
• 熱圖(兩個分類交叉分析)
報告格式:
「在 [N] 篇分析材料中,[類別X] 出現最頻繁(N = X,占 X%),
其次為 [類別Y](N = X,占 X%)。
卡方檢定顯示不同媒體間的框架差異達統計顯著水準
(χ² = X.XX, df = X, p < .001)。」
降級方案
若使用者資料為網路爬蟲資料或大量文本:
- 建議使用 Python
pandas 進行頻率統計
- 推薦
krippendorff 套件計算 Krippendorff's α
- 轉介
tw-research-stat-consultant 進行統計分析