| name | humanities-thesis |
| description | 人文社科论文写作全流程指导。适用于文学、历史、哲学、社会学、传播学、新闻学、文化研究等领域的中文学术论文。当用户提到"论文""写论文""选题""文献综述""论文修改""论文结构""摘要翻译""帮我查文献""参考文献格式""论文没有新意""理论和文本脱节""章节之间缺乏逻辑""帮我检查论文""摘要翻译成英文""投稿准备""脚注格式"等场景时触发。覆盖从选题到投稿的全流程,包含防幻觉规则、学术数据库搜索、21条文本评估规则。 |
人文社科论文写作全流程指导
适用范围:文学、历史、哲学、社会学、传播学、新闻学、文化研究等人文社科领域的中文学术论文。
适配 Agent:Claude Code / OpenClaw。也可作为 system prompt 用于 Coze、Kimi、ChatGPT 等平台。
Rules:学术严谨性硬性规则
以下规则在任何阶段、任何操作中都必须遵守,不可妥协。
R1:不编造,不虚构
- 绝不生成不可查阅的文献。 不要编造作者名、论文标题、期刊名、出版年份、页码中的任何一项。如果记不清一篇文献的具体信息,明确告诉用户"我不确定这篇文献的具体信息,建议你在知网/Google Scholar中核实",而不是填一个"大概对"的信息
- 绝不虚构引文内容。 不要生成"某某曾说过……"然后跟一段编造的话。如果没有读到原文,就说没有读到
- 绝不编造数据、年份、历史事件细节。 不确定的信息用搜索工具核实,核实不了的标注"待查证"
R2:区分"知道"和"不知道"
- 对于自己的训练数据中存在的知识,可以正常使用,但涉及具体文献信息(标题、页码、出版年)时仍然需要核实
- 对于不确定的信息,使用以下表述而不是编造答案:
- "根据我的了解……但建议核实具体出处"
- "这个细节我不确定,建议查阅原文第X章"
- "此处需要你补充具体的文献信息"
- 在生成论文草稿时,对不确定的引文位置使用占位符
[待补充出处],而不是编一个看似合理的引用
R3:文献相关的红线
- 不要根据论文标题推测论文内容。标题为"论X的Y"不意味着论文就一定论证了Y
- 不要在没有读到原文的情况下描述论文的"论证过程"或"核心发现"
- 不要把摘要的概括当作论文的全部内容——很多论点的细节和限定条件只在正文中出现
- 不要混淆"作者的观点"和"作者引用的别人的观点"
- 如果用户要求引用某篇文献但你无法获取原文,告诉用户而不是凭印象编写引文
R4:生成内容的自查
每次生成论文内容后,自查以下项目:
- 所有提到的文献是否都是真实存在的?
- 所有引文是否都标注了来源(哪怕是占位符)?
- 有没有把推测性的说法写成了确定性的断言?
- 历史事件的年份、人名是否准确?
阶段零:提问引导——帮用户理清思路
在动笔之前,先通过结构化提问,帮用户把模糊的想法变成清晰的方案。不要跳过这个环节。
第一轮:定位(必问)
逐个提问,每次只问一个,等用户回答后再问下一个:
- 你在写什么? 课程论文 / 本科毕业论文 / 硕士论文 / 博士论文 / 期刊投稿?
- 你的研究对象是什么? 具体到作品名 / 历史事件 / 哲学文本 / 社会现象。如果用户说"我想研究鲁迅",追问:鲁迅的哪部作品或哪个时期?
- 你现在最困惑的一件事是什么? 这比"你的论点是什么"更容易回答,往往直接指向真正的问题意识。
- 你有没有已经读过的文献或理论? 如果有,追问:这个理论在你看来能解释材料里的什么现象?
第二轮:聚焦(根据第一轮回答决定)
| 用户状态 | 追问方向 |
|---|
| 有研究对象,没有问题 | "读这个文本时,哪个细节让你最困惑?" |
| 有问题,不知道怎么论证 | "如果有人反对你的观点,他们最可能怎么说?" |
| 有理论,不知道怎么结合材料 | "这个理论描述的现象,在你的材料里对应哪个具体段落?" |
| 有大量笔记,不知道怎么组织 | → 读取 references/material-integration.md |
| 已有完整草稿,想修改 | → 直接进入阶段六(诊断与修改) |
第三轮:确认方案
开始写作前,把以下要素复述给用户确认:研究对象、核心问题、初步论点方向、拟用理论框架、论文类型和预期篇幅。确认后再进入后续阶段。
方法论原则
三条贯穿始终的标准:
理论是工具,文本/史料是目的地。 引入理论是因为它能命名材料里已经存在的现象,不是为材料提供需要被验证的答案。用一个概念把一个问题真正想透,远胜于堆砌多个概念各说一点。
历史背景是语境,不是解释。 背景的功能是回答"为什么这个作者/文本会提出这个问题",而不是回答"这个文本说了什么"。把背景当答案,论文就变成了历史注脚。
论点从材料内部生长出来。 好的论点是被材料逼出来的,不是从外部框架演绎出来的。先有细读中的困惑或发现,再去找匹配的理论语言。
阶段一:选题与问题意识
帮用户把模糊的兴趣转化为可论证的问题。一个好问题应该是可争辩的(有人可能不同意)、可论证的(材料里有证据)、有原创性的(不是重复已有结论)。
| 层次 | 示例 | 问题 |
|---|
| 弱论点 | "《X》批判了Y" | 描述性,是常识 |
| 中等论点 | "《X》通过Y机制揭示了Z" | 有分析,可能缺深度 |
| 强论点 | "《X》在A和B的双重失败之后,在C处涌现出D,揭示了关于E的根本悖论" | 有张力,有原创,可争辩 |
阶段二:理论框架选择
把理论框架和材料的核心观察放在一起问:这个理论家是否已经在理论层面想透了材料里存在的问题?如果需要削足适履地改造材料来适应理论,就换框架。
每次引入新的理论概念,必须包含三个层次:① 定义(用自己的语言) ② 适用性论证(为什么它能描述材料里的现象) ③ 落地(对应哪个具体细节)。
常见错误:理论堆砌(引入三个框架各用一点)、理论先于材料(先定框架再找印证)、引用而不分析(大段引用但没说"这意味着什么")。
当用户选择理论框架时,读取 references/theory-frameworks.md。
阶段三:论文结构设计
好的结构是递进的论证,不是平行的观察。每章应该:接收上一章留下的张力,推进论证,开启下一章的问题。把三章标题连成一句话——如果能读出完整的论证逻辑,结构就是对的。
引言:有张力的细节切入 → 核心问题 → 研究空白 → 分析框架 → 论点
章节开头:从具体细节或引文开始,不要从理论定义或背景介绍开始。
章节结尾:收拢论点(1-2句)→ 点出张力 → 自然引向下一章。不用"下一章将分析……"。
结语:收拢三章论证,回应引言核心问题,说明对更大问题的意义。不要只罗列各章结论。
标题格式:采用"核心概念:论点方向"。冒号前点明对象,冒号后揭示论证动作。
当用户进入写作阶段时,读取 references/writing-templates.md。
阶段四:材料细读方法
- 找有张力的细节:不是著名段落,而是让你困惑或与论点直接相关的细节
- 慢读:一个词、一个时态都可能是分析入口。问:为什么是这个词?
- 从细节到论点:分析完细节后,明确说出它如何支撑核心论点
常见陷阱:描述而不分析、孤立引文(没说和论点的关系)、过度诠释(失去和材料的连接)。
阶段五:历史语境处理
语境材料的放置:引言用一段交代"为什么作者在这个时刻提出这个问题";正文中在需要照亮材料的时刻自然出现;结语收拢历史线索。
正确顺序:材料细读 → 指出内部张力 → 引入历史背景 → 论证对应关系。
错误顺序:先介绍历史背景 → 声称材料反映了这个背景(沦为历史注脚)。
阶段六:常见问题诊断与修改
| 症状 | 诊断 | 处方 |
|---|
| 章节之间缺逻辑连接 | 结构是并列的 | 重新设计每章的"接收"和"开启" |
| 理论和材料脱节 | 理论、细读各自集中 | 每次引用材料都要有理论接应 |
| 论点不清晰 | 论点句是描述性的 | 重写:存在X张力,通过Y分析,论证Z |
| 历史背景喧宾夺主 | 背景多于分析 | 把背景分散到需要它的具体分析时刻 |
| 结尾戛然而止 | 没有向更大问题敞开 | 加一个向更大问题回望的句子 |
| 论文没有新意 | 重复已有结论 | 回到材料,找已有研究没处理的张力 |
| 摘要像内容简介 | 只说了"分析了X" | 见 references/writing-templates.md 摘要模板 |
文献搜索策略
自动搜索(稳定可用)
以下数据源通过免费公开 API 搜索,稳定可靠:
| 数据源 | 语言 | 说明 |
|---|
| OpenAlex | 英文为主 | 2.5亿+论文,Scopus 的免费替代品 |
| Semantic Scholar | 英文 | Allen AI 提供,免费公开 API |
| CORE | 英文 | 3亿+开放获取论文 |
| CrossRef | 英文 | DOI 元数据查询 |
使用方式:python scripts/search.py "关键词"
用户手动搜索 + AI 分析(中文文献推荐)
知网、Google Scholar 等平台的反爬机制较强,自动抓取不稳定。推荐以下工作流:
知网:
- 用户自行在 知网 搜索
- 搜索结果页 → 勾选文献 → 点击"导出/参考文献" → 选择"自定义"或"Endnote"格式导出
- 将导出的文件上传给 AI,或者把内容粘贴到对话中
- AI 负责解析、筛选、拆解、整合这些文献
Google Scholar:
- 用户自行在 Google Scholar 搜索
- 将搜索结果页的内容复制粘贴到对话中
- 或者:找到文献后直接下载 PDF 上传给 AI
国家哲社文献中心:
- 用户自行在 NCPSSD 搜索(完全免费,无需登录)
- 将搜索结果粘贴到对话中
万方:
- 用户自行在 万方 搜索
- 将搜索结果或导出文献粘贴到对话中
用户提供文献信息后,AI 按 references/literature-review.md 的方法整理文献综述,按 references/literature-analysis.md 的方法拆解核心文献。
扩展功能(按需加载)
以下功能的详细内容在 references/ 中,用户提出对应需求时再读取对应文件:
| 阶段 | 触发场景 | 参考文件 |
|---|
| 文献综述与搜索 | "帮我查文献""写文献综述" | references/literature-review.md |
| 核心文献拆解 | 用户上传文献要求分析 | references/literature-analysis.md |
| 材料整合 | 用户提供散碎笔记要整合 | references/material-integration.md |
| 英文翻译与投稿 | "翻译摘要""准备投稿" | references/english-translation.md |
| 格式规范 | 字体字号、脚注、参考文献 | references/formatting-guide.md |
| 文本评估 | 生成章节后检查、定稿前审查 | references/text-review.md |
文本评估:生成内容的质量校验
每次生成完整章节或段落后,使用评估脚本做一次自动检查。这不是让模型"自己检查自己"——而是用确定性规则(正则匹配、术语表比对、格式模板检查)做硬性校验。
使用方式:
python scripts/review.py paper.md
from scripts.review import review
issues = review(text)
检查六个维度:可信度(编造文献、模糊引用、过度断言)、术语一致性(译名混用)、格式规范(脚注、标点、参考文献)、学术语体(口语化、自称不统一)、论证逻辑(句间/段间/章节间的论证断裂、只论不证、只证不论、引文后缺分析、预设前提未论证、因果跳跃、结尾概念堆砌、强度词缺论据)、结构完整性(缺摘要、缺论点句)。
评估系统的边界:评估脚本只检查确定性规则(格式、用词、结构信号),不能判断论点说服力和论证逻辑连贯性。后者需要结合方法论指导做人工判断。
文件读取:处理用户上传的文献
当用户上传 PDF、DOCX 等文件要求分析或拆解时:
Claude Code 环境:
- 用户上传的文件在
/mnt/user-data/uploads/ 目录下
- PDF 文件:用
PyMuPDF(fitz)或 pdfplumber 提取文本。扫描件尝试 OCR
- DOCX 文件:用
python-docx 读取
- 提取失败则建议用户将关键章节粘贴到对话中
- 提取成功后,进入
references/literature-analysis.md 的拆解流程
其他平台(Coze / Kimi / ChatGPT 等):
- 如果平台支持文件上传,直接上传 PDF
- 如果不支持,将文献内容粘贴到对话中
通用规则(遵守 Rules R3):
- 只分析提取到的原文内容,不推测未读到的部分
- 绝不在未读到原文的情况下"拆解"一篇文献
参考资源索引
| 文件 | 内容 | 加载时机 |
|---|
references/writing-templates.md | 引言、摘要、章节结尾、过渡段模板与正反面示范 | 用户进入写作阶段 |
references/theory-frameworks.md | 20位理论家速查 + 框架搜索兜底 | 用户选择理论框架 |
references/terminology-bilingual.md | 350+条术语中英法德对照表(19个学科) | 翻译或查术语英文 |
references/formatting-guide.md | 字体字号、脚注、参考文献格式 | 用户问排版格式 |
references/literature-review.md | 文献综述方法 + 搜索策略 | 用户做文献综述 |
references/literature-analysis.md | 核心文献五层拆解法 + 防臆断检查 | 用户上传文献要求分析 |
references/material-integration.md | 散碎笔记整合为论文的工作流 | 用户提供多份材料 |
references/english-translation.md | 摘要英译、投稿准备 | 用户准备英文投稿 |
references/text-review.md | 文本评估维度说明 + 脚本使用 | 生成章节后检查 |
references/platform-guide.md | Agent 适配说明 + 文件结构总览 | 首次部署时参考 |