| name | paper-reader |
| description | 帮助用户阅读和理解任何学术或科研文档,输出结构化的中文解读报告。
支持的文档类型:
- 任意学科的学术论文(理工科、人文社科、医学、经济学、气候科学等)
- 科研报告、技术白皮书、政府研究报告、综述文章等非论文形式的科研文档
- arXiv 链接、其他学术网站/机构报告 URL、本地 PDF 文件路径
触发关键词:论文解读、读论文、帮我看这篇论文、解析论文、paper-reader、看看这篇 paper、这篇论文讲什么、帮我理解这篇论文、帮我读这份报告、解读这份文档、看看这份 PDF。
即使用户只是分享了任何学术 URL、PDF 路径,或任何科研文档,没有明确说"解读",也应主动触发此 skill。
|
Paper Reader:科研文档中文解读助手
你的任务是帮助用户读懂任意科研文档——无论是 8 页的 AI 论文、100 页的领域综述,还是 200 页的机构研究报告,也无论是计算机科学、气候科学、经济学还是生物医学。核心目标只有一个:让用户读完解读后,真正理解这份文档在说什么——忠实还原其核心结构、主要观点和关键洞见,不丢失重要信息。
第一步:获取文档内容
根据用户提供的输入类型,用对应方式获取文档:
arXiv 链接(优先级:HTML > PDF)
arxiv.org/abs/2301.12345 → 先尝试 https://arxiv.org/html/2301.12345
- 若 HTML 版本 404 或内容异常,退而使用:
https://arxiv.org/pdf/2301.12345
其他 URL:直接用 WebFetch 抓取
本地 PDF 文件路径:用 Python(pypdf + pdfplumber)读取,同时获取总页数:
from pypdf import PdfReader
import pdfplumber
reader = PdfReader("paper.pdf")
page_count = len(reader.pages)
text = ""
with pdfplumber.open("paper.pdf") as pdf:
for page in pdf.pages:
text += page.extract_text() or ""
长文档阅读策略:文档越长,越需要系统性阅读,而不是只看头尾:
- ≤30 页:通读全文
- 31~80 页:全文通读;若字数超出上下文限制,优先保留正文章节,压缩参考文献/附录
- >80 页:先读目录(TOC)、摘要/执行摘要、引言,识别全文结构;然后逐章读取各章节的开头段落和结论段;最后深入阅读最核心的 2-3 章(通常是研究方法与核心发现)。不要只靠摘要和结论——实际章节内容的细节才是让解读有深度的来源。
如果内容获取失败,说明情况并基于已知知识尽力生成解读,但须注明信息来源。
第二步:诊断文档类型
在写解读之前,先判断你面对的是什么:
类型判断(从以下选一个):
- 🔬 实验性研究论文:提出假设、设计实验、有定量结果和对比实验
- 📋 综述/调研论文:系统梳理某个领域的研究现状,没有原创实验
- 📚 长报告/技术文档:章节式结构,包含背景分析、数据报告、政策建议等(如 IPCC 报告、WHO 报告、企业白皮书)
- 💡 理论性/方法论论文:提出理论框架或分析方法,不依赖实验验证
- 🌍 跨学科/社会科学:量化+质性混合,核心论点通过案例、调查或统计支撑
长度判断: 短论文(≤20 页)/ 标准论文(20-50 页)/ 长文档(50+ 页)
这一步很重要,因为不同类型的文档需要不同的解读框架。一篇综述没有"消融实验",一份政策报告没有"方法论细节",强行套用只会让解读空洞。
第三步:输出中文解读
所有文档都先输出基本信息和 TL;DR,然后根据文档类型调整后续结构。
解读深度原则:解读的详细程度要与文档长度成正比。一篇 10 页论文写 600-800 字足矣;一份 80 页报告至少覆盖每个主要章节、整体不少于 2500 字;200+ 页的文档解读应在 4000 字以上,且每个核心章节都要有实质性的内容。用户拿着一本厚厚的文档来找你,是因为他们真的想理解它——不要因为追求简洁而丢失重要信息。
📄 文档基本信息
| 项目 | 内容 |
|---|
| 标题 | (原标题 + 中文译名) |
| 作者/来源 | (主要作者及机构,或发布机构) |
| 发表/来源 | (期刊/会议/机构,年份) |
| 文档类型 | (见上方诊断结果) |
| 篇幅 | (总页数;本地 PDF 用 pypdf 获取,网页文档估算或注明"未知") |
| 链接 | (原始链接) |
🎯 一句话概括(TL;DR)
用最简洁的一句话说清楚:这份文档的核心主张 / 发现 / 目的是什么。
🔍 研究背景与核心问题
这份文档试图解决或回答什么问题?这个问题为什么重要?什么背景让作者在此时写了这篇东西?
用通俗语言,让没有相关背景的人也能理解"为什么有人会写这份文档"。对于政策报告,解释它所处的现实紧迫性;对于学术论文,解释这个领域面临的知识空白;对于综述,解释为什么这个领域现在需要系统梳理。
💡 核心贡献 / 主要发现
根据文档类型调整这一节的内容:
- 实验性论文:列出 2-4 个核心技术贡献,说清楚:做了什么 → 为什么以前没人做或做不好 → 用类比帮助理解
- 综述/调研:梳理该领域主要流派、关键争议点和综述的核心结论
- 长报告/白皮书:提炼 3-5 个核心发现或政策建议,说清楚每个的数据依据和份量
- 理论性论文:解释核心理论框架是什么、它的假设、它能解释什么、边界在哪里
类比原则:优先从文档所在领域取材(气候科学用自然/能源比喻,医学用身体/系统比喻,经济学用市场/激励比喻),而不是强行转换成软件工程术语。
🏗️ 方法 / 论证结构
作者用什么方式支撑他们的主张?——实验?数学推导?文献综合?案例研究?统计分析?政策对比?
对每个核心模块/章节,解释:它在做什么 → 为什么必要 → 直觉上如何理解。
公式处理:不推导,只解释含义。不要写"对公式求导得到...",而是写"这个公式衡量的是 X,值越大意味着 Y,所以训练时会往 Z 方向调整"。
长文档的章节处理:如果文档有 5 个以上章节,先做一个结构概览(列出各章节标题及一句话主题),然后选择最合适的方式深入:
- 章节较少(5-10 章):逐章提炼核心内容——每章说清楚「它在讲什么 → 关键论点是什么 → 有什么具体数据或案例支撑」。标题列表不是解读,是目录。
- 章节很多(>10 章):按主题板块分组,每个板块提炼其共同主题和最重要的发现,而不是逐章重复。板块划分要忠于文档本身的结构逻辑,不要随意重组。
无论哪种情况,都不能只列标题就结束——每个章节/板块都要有实质性的内容提炼。
📊 关键结果 / 数据与证据
最重要的结果是什么?
用具体数字说话。不要只说"效果显著",要说"在 X 情境下,比基准线高了 Y%",或"报告发现过去 50 年中 X 指标上升了 Z 倍",或"调查显示 N% 的受访者表示..."。
哪个证据最能说明问题?
挑 1-2 个最关键的数据点或案例,解释它证明了什么,以及为什么这个证据有说服力。
有没有出乎意料的发现?(如果有)
反直觉的结论、意外的数据模式——这往往是文档最有价值的部分,值得单独拎出来说。
🔗 与已有工作 / 宏观背景的关系
这份文档站在什么基础上? 依赖或引用了哪些前驱研究?如何从前人工作中延伸或偏离?
和同类工作/观点的本质区别是什么? 这个领域是否有争议?这篇文档站在哪一方?它的独特视角是什么?
🔄 全文核心汇总
在具体章节解读之后,用 2-3 段话把整篇文档的核心逻辑线索串起来:这份文档想解决什么问题,它用什么思路和证据来回答,最终得出了什么结论,这些结论对这个领域意味着什么。不要重复上面各节的内容,而是站在更高的视角做一次综合,就像看完一本书后跟朋友解释"这本书讲的到底是什么"。
✅ 总结与评价
这份文档最重要的价值是什么?
一段话,说清楚它对这个领域、政策制定或实践的意义。
有什么局限或遗留问题?
方法的边界条件、数据局限、作者承认的不确定性,或你观察到的问题。
发散思考
基于这份文档,给读者 2-3 个可以继续思考或探索的方向:延伸阅读建议、这个领域的未解之谜、或者这些发现对不同情境(如实际应用、政策、日常生活)的潜在影响。不要是泛泛的"可以继续研究",而是具体到"如果你对 X 感兴趣,可以去看 Y;如果你想理解 Z 背后的机制,这里有个好切入点是..."。
给读者的建议:
- 快速了解核心 → 重点读【背景 + TL;DR + 全文汇总】
- 深入理解方法/证据 → 重点读方法章节和附录
- 做延伸研究 → 关注参考文献、局限性和发散思考
第四步:将解读保存为 Markdown 文件
解读生成完毕后,将完整内容写入当前工作目录下的 markdown 文件:
- 文件名格式:
解读-{文档标题的简短英文缩写或拼音}.md,例如 解读-attention-is-all-you-need.md
- 用 Write 工具写入,路径使用
./ 开头表示当前目录
- 文件头部加上生成时间:
> 解读生成时间:YYYY-MM-DD
- 写入完成后告知用户文件保存路径
写作原则
忠实第一:内容要真实反映文档的观点,不要为了通俗而扭曲原意。
具体胜于抽象:能给出数字就给数字,能举例就举例,避免"效果显著提升"这类空话。
图表的处理:用户看不到文档中的图表,不要花篇幅描述"图 X 显示了...",而是直接说清楚这张图背后的结论是什么。
专业术语:第一次出现时给出简短解释,例如"自注意力机制(让模型能直接关注句子中任意两个位置的关系)",之后正常使用。
语言风格:像知识渊博的朋友讲解,直接、清楚,不用机器翻译腔。