| name | tw-research-data-management |
| description | 研究資料管理與隱私保護工具,協助研究者建立符合規範的資料管理計畫。 涵蓋資料分類、命名規範、備份策略、匿名化程序, 以及台灣《個人資料保護法》、GDPR(適用於國際投稿)合規檢查。 生成:資料管理計畫(DMP)、隱私風險評估報告、.gitignore 敏感資料模板。 當使用者提及「資料管理」「個資保護」「資料匿名化」「DMP」 「data management」「個人資料」「隱私」「GDPR」「資料安全」時觸發。 分類:學術研究(tw-research-*) 參考來源:agent-research-skills (data-analysis) + 台灣個資法
|
| version | 1.0.0 |
| author | 奇老師・數位敘事力社群 |
| allowed-tools | Bash, Read, Write |
研究資料管理與隱私保護工具 v1.0
核心哲學
「研究者有責任妥善保管受試者的信任。
資料管理不是麻煩的行政作業——
而是對研究倫理最基本的落實。」
法規依據:
- 台灣《個人資料保護法》(民國 104 年修正)
- GDPR(適用於有歐盟受試者或投稿歐洲期刊時)
- 國科會《學術研究倫理教育課程》指引
Step 0:讀取參考資源
references/taiwan_privacy_law_guide.md — 台灣個資法重點說明
references/data_anonymization_techniques.md — 匿名化技術指引
references/dmp_template.md — 資料管理計畫模板
Step 1:概念對齊確認卡
╔══════════════ 研究資料管理工具啟動 ══════════════╗
📌 任務:研究資料管理規劃 + 隱私保護評估
🎯 目標:DMP 草稿 + 隱私風險報告 + 保護措施
請提供:
1. 研究資料類型(問卷/訪談錄音/影像/醫療記錄等)
2. 受試者類型(一般成人/未成年/特殊族群)
3. 資料儲存方式(雲端/本機/機構伺服器)
╚══════════════════════════════════════════════════╝
Step 2:資料敏感度分類
第一級:非個人識別資料(最低風險)
✅ 可直接公開
包含:匿名化統計數據、無個人識別的問卷彙總、
公開語料庫數據、已匿名的訪談逐字稿
第二級:間接識別資料(中等風險)
⚠️ 需加密儲存,限制存取
包含:含代號的受試者資料(可透過交叉比對識別)、
工作單位/職稱+年齡組合、模糊地理資訊
第三級:直接個人識別資料(高風險)
🔴 需最高等級保護,盡快去識別化
包含:姓名、身分證號、電話、地址、面貌影像、
生物特徵(指紋/聲紋)
第四級:敏感個人資料(最高風險)
🔴🔴 需特別保護,依台灣個資法第六條處理
包含:健康醫療、犯罪記錄、性生活/性取向、
政治觀點/宗教信仰/種族
Step 3:資料命名與組織規範
推薦檔案命名規範:
[研究代號]_[資料類型]_[受試者代號]_[日期版本].[副檔名]
範例:
TW2024_INT_S001_2024-03-15.docx ← 訪談逐字稿
TW2024_SUR_raw_2024-04-01.xlsx ← 問卷原始資料
TW2024_SUR_clean_v2_2024-04-10.xlsx ← 清理後版本
⚠️ 禁止事項:
❌ 使用受試者真實姓名命名檔案
❌ 在雲端服務(Google Drive/Dropbox)儲存未匿名資料
❌ 使用個人信箱傳輸原始資料
目錄結構建議:
project-folder/
├── raw/ ← 原始資料(最高保護,不修改)
│ └── .gitignore ← 排除原始資料上傳 git
├── processed/ ← 處理後資料(去識別化)
├── analysis/ ← 分析腳本
├── output/ ← 研究輸出(可公開)
└── docs/ ← 研究文件(IRB/同意書等)
Step 4:匿名化程序
直接識別資料去識別化步驟:
1. 代碼化(Pseudonymization)
姓名 → S001, S002...(受試者代號)
機構名 → 「北部某大學」「某縣市國中」
地點 → 省略或模糊化(「台灣北部城市」)
2. 資料泛化(Generalization)
精確年齡(24歲)→ 年齡區間(20-29歲)
精確薪資 → 薪資區間
職稱 → 職業類別
3. 雜訊添加(Noise Addition,量化資料)
在不影響統計結論的前提下,對識別性強的數值加入微小變動
4. k-匿名性檢查(k-Anonymity)
確保任一筆資料至少與其他 k-1 筆資料無法區分
最低標準:k ≥ 5
5. 質性資料匿名化
訪談引述中:
□ 刪除/模糊化所有人名、地名、機構名
□ 省略可識別的個人特殊經歷描述
□ 修改可識別的職稱或工作細節
Step 5:台灣個資法合規清單
台灣《個人資料保護法》重點義務:
□ 蒐集目的說明(第 19 條)
是否已告知受試者資料收集目的?
→ 知情同意書中必須載明
□ 利用範圍限制(第 20 條)
資料是否僅用於原告知之目的?
→ 不可將研究資料用於商業或其他目的
□ 資料安全(第 27 條)
是否採取適當安全措施防止資料外洩?
→ 需說明加密方式、存取控制
□ 當事人權利(第 3 條)
受試者是否知道可要求查閱、更正、刪除?
→ 知情同意書中需告知
□ 資料保存期限
台灣個資法未明定期限,但需有合理說明
學術研究建議:研究結束後 5-10 年或依資助機構規定
特殊類別個資(第 6 條)額外義務:
健康/犯罪/性生活/政治/宗教/種族資料需:
□ 當事人書面同意 或
□ 法律明文授權 或
□ 學術機構依法進行且採適當保護
Step 6:.gitignore 敏感資料模板
# 研究原始資料(敏感,不上傳 GitHub)
raw/
data/raw/
*.csv # 若含個人資料
*.xlsx # 若含個人資料
# 訪談錄音
*.mp3
*.mp4
*.wav
*.m4a
# 影像資料
*.jpg
*.png
*.jpeg
# 若要排除特定目錄:
photos/
videos/
# 個資相關文件
*consent_form*
*irb_application*
*participant_list*
*contact_info*
# 金鑰/認證(絕對不上傳)
*.env
*.key
*.pem
api_keys.txt
credentials*
# 備份檔(可能含個資)
*_backup*
*_original*
# 統計軟體工作區(可能含資料)
*.RData
*.sav # SPSS
*.dta # Stata
Step 7:資料管理計畫(DMP)草稿
╔══════════════════════════════════════════════════╗
研究資料管理計畫(Data Management Plan)
研究名稱:[研究題目]
研究者:[姓名]
機構:[機構名稱]
日期:[日期]
╠══════════════════════════════════════════════════╣
一、資料概述
資料類型:[清單]
資料量估計:[X GB / X 頁]
資料語言:[中/英]
二、資料收集與儲存
收集方式:[問卷/訪談/觀察]
儲存位置:[機構加密伺服器/本機加密硬碟]
備份策略:3-2-1 原則(3份/2種媒介/1份異地)
三、個人資料保護
去識別化時程:[收集後X天內完成]
存取控制:[僅研究主持人及協助者可存取]
加密方式:[AES-256 加密]
四、資料保存期限
保存期限:[研究結束後X年]
銷毀方式:[安全刪除/實體銷毀]
部分資料是否公開:[說明]
五、合規聲明
□ 符合台灣《個人資料保護法》
□ 已取得 IRB 核准(編號:___)
□ 所有受試者均已簽署知情同意書
╚══════════════════════════════════════════════════╝
降級方案
若研究僅使用公開資料或完全匿名問卷:
- 簡化版 DMP(5 分鐘完成)
- 提供最低限度的合規清單
- 說明哪些條文不適用