| name | counterfactual-reasoning |
| description | 反事实思维工具(Counterfactual Reasoning)。对研究结论进行系统性压力测试:
枚举竞争性解释、检查选择性偏差、识别推论边界、模拟审稿人质疑。
当用户说"帮我挑战这个结论""有没有其他解释""审稿人会怎么质疑这个"
"这个结论成立吗""反驳一下我的论点""还有没有别的可能""结论太强了吗"
"帮我做压力测试"时触发此 skill。
注意:这不是"找不同意见"或"泼冷水"的工具,而是帮助研究者
在提交前系统性发现论证弱点、主动处理潜在质疑的防御性分析工具。
|
反事实思维工具(Counterfactual Reasoning)
本 skill 基于 King、Keohane & Verba(1994)的因果推断逻辑、
Campbell & Stanley(1963)的威胁效度框架,以及社会学实证研究的评审标准,
对研究结论进行系统性压力测试,帮助研究者在提交前识别和处理论证弱点。
核心立场:一个经得住检验的结论,是被竭力反驳之后仍然成立的结论,而不是没有被反驳过的结论。
主动寻找竞争性解释并处理它们,比等待审稿人指出要有价值得多。
启动:获取必要信息
触发后,收集以下信息:
必填 1:核心结论或论点
用户希望进行压力测试的结论,尽量具体,例如:
"平台工人通过'时间自由叙事'内化了平台对劳动时间管理责任的转移,
这是一种主体性的屈从(subjectivation),而非单纯的意识形态灌输。"
必填 2:支撑结论的主要证据
简要说明结论建立在什么数据/材料基础上:
- 定性研究:受访者人数、类型、核心资料来源
- 定量研究:样本量、变量操作化、核心统计结果
选填 3:研究设计概述
选填 4:用户已意识到的弱点
研究者自己已经注意到的潜在问题(优先处理)。
选填 5:目标期刊
不同期刊的审稿文化不同,可以影响压力测试的侧重点。
执行流程
收到信息后,自动连续执行以下四个阶段,无需每步等待用户确认。
第一阶段:结论解剖
在压力测试之前,先精确解析结论的逻辑结构:
- 核心主张:结论声称 A 导致(或解释了)B,其中 A 和 B 分别是什么?
- 因果方向:是单向因果?双向?还是条件性关系?
- 适用范围:结论明示或暗示适用于哪类情境、人群、时间段?
- 机制描述:结论背后声称发生了什么机制?(不只是"A→B",而是"A 通过 X 过程导致 B")
- 证据-结论的跨度:现有证据直接支撑到哪里?从证据到结论做了多大的推论跳跃?
输出格式:
【结论解剖】
核心主张:A = [ ],B = [ ]
因果/解释方向:
适用范围(显性):
适用范围(隐性预设):
声称的机制:
证据实际覆盖到:[具体到哪里]
推论跨度评估:小 / 中 / 大
第二阶段:竞争性解释枚举
系统枚举所有可能与当前结论竞争的替代解释。按以下五类来源逐一检索:
来源 1:混淆变量(Confounding Variables)
有没有第三个变量同时影响了原因变量和结果变量,使得观察到的关系是虚假的?
针对研究的具体情境,提出 2-4 个最可能的混淆变量候选,并说明:
- 该变量如何同时影响两端?
- 研究设计是否控制了这个变量?
- 如果没有控制,结论的稳健性受到多大威胁?
来源 2:反向因果(Reverse Causation)
B 有没有可能是 A 的原因,而非结果?
或者两者互为因果?
说明反向因果的可能路径,并评估:
- 时间顺序是否足够清晰?
- 有没有工具变量或其他因果识别策略?
来源 3:选择性偏差(Selection Bias)
研究的样本/案例是否系统性地倾向某种特征,导致结论不具代表性?
检查:
- 样本如何被选入研究?选入过程有没有内生性?
- "沉默的多数"——那些没有进入样本的对象,会和样本有什么系统性差异?
- 访谈研究中:接受访谈的人与拒绝访谈的人,有没有系统性差异?
来源 4:观察者效应(Observer Effects)
研究者的存在或研究过程本身,是否改变了被研究现象?
在定性研究中尤其重要:
- 受访者是否在研究者面前呈现了与日常不同的行为或叙述?
- 受访者是否猜测了研究者的期望并迎合它?
- 反思性:研究者的身份、立场如何影响了数据收集和解读?
来源 5:替代机制(Alternative Mechanisms)
即使 A→B 的关系成立,有没有与当前解释不同的机制也能产生同样的结果?
这是最具挑战性的一类:机制的竞争。
列出 2-3 个替代机制,每个替代机制说明:
- 这个替代机制的逻辑是什么?
- 它会产生和当前结论相同的可观测模式吗?
- 什么样的证据能够区分这两个机制?
输出格式(每类竞争性解释):
[竞争性解释类型:混淆变量/反向因果/选择偏差/观察者效应/替代机制]
具体威胁描述:
威胁的严重程度:高 / 中 / 低
当前研究的处理情况:已处理 / 部分处理 / 未处理
如果未处理,对结论可信度的影响:
可能的回应策略:
第三阶段:结论范围检验
压力测试结论的适用边界,防止过度概括:
检验 1:案例代表性
研究者选择的案例/样本能否支撑所声称的普遍性程度?
- 如果结论声称"在X情境下普遍成立",当前证据覆盖了X的哪些子类型?
- 有没有明显遗漏的子类型,而那些子类型可能产生不同结果?
检验 2:时间稳健性
结论是在特定历史时刻成立,还是具有一定的时间稳健性?
- 数据收集的时间背景有什么特殊性?
- 如果在其他时间点重复这项研究,结论可能如何变化?
检验 3:情境转移
结论能在多大程度上迁移到其他情境?
- 哪些情境特征对结论至关重要(改变这些特征,结论就不成立)?
- 哪些情境特征不影响结论(这些构成结论的稳健性证明)?
输出格式:
【结论范围检验】
当前证据实际支撑的范围:[比结论声称的范围更窄?还是基本匹配?]
遗漏的重要子类型:
时间特殊性风险:
情境迁移的边界条件:
建议的结论措辞调整:[将当前过宽的结论收窄至证据能支撑的范围]
第四阶段:模拟审稿人质疑
模拟 2-3 种不同立场的审稿人,提出最可能的核心质疑,并给出应对建议:
审稿人 A:方法论严格派
关注:研究设计的效度、因果推断的严谨性、抽样的合理性
"[模拟质疑内容]"
建议回应策略:
审稿人 B:理论对话派
关注:与现有文献的对话是否准确、理论贡献的原创性、对替代理论的处理
"[模拟质疑内容]"
建议回应策略:
审稿人 C:经验领域专家
关注:对该研究情境的了解是否准确、数据解读是否符合领域常识
"[模拟质疑内容]"
建议回应策略:
第五阶段:综合建议
综合以上分析,给出:
- 最需要主动处理的 2-3 个弱点(按威胁程度排序)
- 可以通过文本修辞处理的问题(承认局限性、限定结论范围、说明研究设计选择的理由)
- 需要补充数据或分析才能真正解决的问题(如果有)
- 结论强度建议:当前结论是否过强?建议修改为什么强度?
在所有输出之后,输出以下固定文字:
压力测试的目的是强化结论,而非摧毁结论。
以下问题请研究者判断后告知:
- 你认为哪个竞争性解释威胁最大?你有没有尚未告知我的应对材料?
- 结论范围的调整建议,你是否认可?
- 有没有你刻意保持的结论强度,而不是疏忽?如果是,说明理由。
参考文献
- King, G., Keohane, R. O., & Verba, S. (1994). Designing Social Inquiry: Scientific Inference in Qualitative Research. Princeton University Press.
- Campbell, D. T., & Stanley, J. C. (1963). Experimental and Quasi-Experimental Designs for Research. Houghton Mifflin.
- Mahoney, J. (2010). After KKV: The new methodology of qualitative research. World Politics, 62(1), 120–147.
- Seawright, J. (2016). Multi-Method Social Science: Combining Qualitative and Quantitative Tools. Cambridge University Press.
语言
- 默认中文
- 若用户用英文输入,输出用英文,frontmatter 字段名保持英文