mit einem Klick
experiment-design
// 學術研究實驗設計技能——從研究假設到可重現實驗計畫的完整流程。當使用者需要規劃實驗、設計 ablation study、選擇 baseline、確定評估指標,或問「我應該跑哪些實驗」時,一定要使用此技能。觸發詞包括:實驗設計、experiment design、ablation、baseline、跑什麼實驗、evaluation metric、如何驗證方法。適用於機器學習、NLP、CV 等領域的實驗規劃。
// 學術研究實驗設計技能——從研究假設到可重現實驗計畫的完整流程。當使用者需要規劃實驗、設計 ablation study、選擇 baseline、確定評估指標,或問「我應該跑哪些實驗」時,一定要使用此技能。觸發詞包括:實驗設計、experiment design、ablation、baseline、跑什麼實驗、evaluation metric、如何驗證方法。適用於機器學習、NLP、CV 等領域的實驗規劃。
Complete academic research skill suite covering the full pipeline: paper reading (read/explain papers with storytelling), idea generation (brainstorm research directions), experiment design (plan experiments, ablation, baselines), proof writing (mathematical proofs, LaTeX theorems), paper writing (draft to camera-ready for top venues like NeurIPS/ICLR/ACL), paper review (structured 4-step review with scoring), and professor fit analysis (evaluate advisors, cold emails, interview strategy). Trigger keywords: read paper, brainstorm, experiment design, prove, write paper, review, professor fit, advisor, cold email, LaTeX, research, NeurIPS, ICLR, ACL, arXiv, 讀論文, 寫論文, 審稿, 實驗設計, 數學證明, 研究方向, 教授分析, 選指導教授.
analyze a professor from google scholar, publication lists, personal websites, lab pages, and field-specific bibliographic databases (e.g., DBLP, PubMed, SSRN, PhilPapers, MathSciNet, arXiv, Scopus) to evaluate research strength, mentoring quality, collaboration network, lab resources, research taxonomy, future directions, applicant fit, outreach emails, and interview strategy. designed for students at all levels — PhD applicants, master's students, and undergraduate researchers (capstone/thesis/independent study) — across all academic disciplines. use when the user wants to assess whether a professor or lab is worth applying to, compare advisors, prepare a cold email, find a thesis or capstone advisor, infer future research openings, or build a structured dossier from public academic evidence.
學術研究的 Idea 產生技能——從發散到收斂,系統化地產出高品質研究構想。當使用者想腦力激盪研究方向、找新 research idea、或問「我接下來可以做什麼研究」時,一定要使用此技能。觸發詞包括:brainstorm、想 idea、研究方向、下一步做什麼、有什麼可以研究的、找 gap、research proposal。適用於任何階段的學術研究構想生成。
太奶讀論文 — 一位百歲阿嬤用繁體中文、生活比喻和動漫梗,帶你讀懂學術論文。當使用者提供論文 PDF、arXiv 連結、或貼上論文文字,並想理解論文內容時,一定要使用此技能。觸發詞包括:讀論文、解釋論文、看不懂、幫我理解這篇、這篇在說什麼、paper reading、explain this paper。適用於任何學術論文的直觀導讀。
學術論文審稿技能 — 以結構化四步驟流程完成深度論文審查,涵蓋批判性審查、分數預測、要點精煉與正式審稿產出。當使用者需要 review 一篇論文、模擬 reviewer 反應、評估論文能否被接收、或幫助判斷論文優缺點時,一定要使用此技能。觸發詞包括:review 這篇、幫我審稿、reviewer 會怎麼說、這篇能上嗎、paper review、給分數、找 weakness。適用於任何學術論文的審稿模擬與評估。
頂級會議論文寫作技能——以嚴格 reviewer 視角指導從草稿到終稿的完整寫作流程。當使用者要寫論文、改善論文草稿、修改特定章節(introduction、method、experiments、conclusion)、潤色學術英文、回應 reviewer 意見,或問「這段怎麼寫」時,一定要使用此技能。觸發詞包括:寫論文、paper writing、improve my paper、幫我修改、review comments、rebuttal、LaTeX、NeurIPS/ICLR/ACL 投稿。適用於所有學術論文寫作場景。
| name | experiment-design |
| description | 學術研究實驗設計技能——從研究假設到可重現實驗計畫的完整流程。當使用者需要規劃實驗、設計 ablation study、選擇 baseline、確定評估指標,或問「我應該跑哪些實驗」時,一定要使用此技能。觸發詞包括:實驗設計、experiment design、ablation、baseline、跑什麼實驗、evaluation metric、如何驗證方法。適用於機器學習、NLP、CV 等領域的實驗規劃。 |
| license | MIT |
| compatibility | Works with Claude Code, ChatGPT/Codex CLI, and Gemini CLI. |
| metadata | {"author":"Research Reading Agent","version":"1.0.0"} |
本技能提供一套結構化的實驗設計流程,適用於機器學習、自然語言處理、電腦視覺等領域的學術研究。目標是協助研究者從模糊的研究想法出發,產出一份嚴謹、可重現、且具說服力的實驗計畫。
好的實驗設計應具備以下特質:
完整的實驗設計遵循以下六步流程:
假設 → 變數 → 指標 → Baseline → Ablation → 計算預算
每一步的產出都是下一步的輸入,形成嚴謹的推導鏈。
將模糊的研究動機轉化為可驗證的具體假設。
| 標準 | 說明 |
|---|---|
| 具體性 | 明確指出預期的效果方向與幅度 |
| 可測量性 | 可以用量化指標來驗證 |
| 可證偽性 | 存在可能否定假設的實驗結果 |
| 相關性 | 與研究問題直接相關 |
詳見:實驗規劃參考
研究者主動操控的變數,即實驗中「改變的東西」。
用來衡量實驗結果的變數,即「被測量的東西」。
實驗中保持不變的變數,確保比較的公平性。
詳見:實驗規劃參考
| 類別 | 指標範例 |
|---|---|
| 分類任務 | Accuracy、Precision、Recall、F1-score、AUC-ROC |
| 生成任務 | BLEU、ROUGE、METEOR、BERTScore、人工評估 |
| 資訊擷取 | MAP、MRR、NDCG、Recall@K |
| 效率指標 | FLOPs、參數量、推論延遲、記憶體佔用 |
| 穩健性 | 跨資料集表現、對抗樣本準確率 |
Ablation Study 是驗證方法中各組件貢獻的關鍵實驗。本技能定義四種 Ablation 模式:
逐一移除或替換方法中的各個組件,觀察效能變化。
探討關鍵超參數對效能的影響。
驗證方法的泛化能力。
透過可視化與案例分析深入理解模型行為。
單次實驗成本
實驗總量計算
總 GPU 時數 = 單次時數 × 模型變體數 × 資料集數 × 隨機種子數 × 超參組合數
安全係數
實驗計畫必須包含完整的可重現性資訊,確保他人能夠精確重現結果。
硬體環境
軟體環境
隨機性控制
訓練協定
資料處理
評估協定
詳見:可重現性清單
本技能的最終產出為一份結構化的實驗計畫文件,包含以下章節:
使用模板:實驗計畫模板
在完成實驗計畫後,請確認以下項目: