| name | ai_detect_for_sanqian |
| description | 中文学术论文去AI化检测与改写。扫描AIGC高频特征,逐段评估,针对性改写降低AI检测率。适用于本科/硕士毕设论文。当用户说"降AI率"、"去AI化"、"检测AI痕迹"时触发。 |
中文学术论文去AI化 (deai-academic)
概述
本 skill 用于检测和消除中文学术论文中的 AIGC 写作痕迹。
实战验证:在一篇本科毕设论文(29000字)上,经过4轮迭代,维普AIGC检测率从 53.34% 降至 16.32%,知网AIGC检测 0%。
核心原则
零捏造原则
- 绝不新增数据、指标、实验结论
- 绝不新增引用或断言
- 仅改进表达方式,不改变技术内容
信息密度原则
- 每句话必须传递可核查的具体信息
- 用系统独有的名词、参数、表名替换通用描述
- 空话删掉,不要替换成另一句空话
维普AIGC检测底层原理(实测验证)
维普检测不是看你说了什么,而是看你怎么说的。它从三个维度打分:
| 维度 | AI 文本特征 | 人类文本特征 |
|---|
| 困惑度 | 低且稳定(AI总选最可能的下一个词) | 高且波动大 |
| 突发度 | 句长均匀(每句25-40字) | 长短交替(有8字短句也有50字长句) |
| 结构模式 | 段落对称、总分总工整 | 段落长短不一、有跳跃 |
各章节降AI难度(实测数据)
| 章节类型 | 典型起始AI率 | 可降至 | 难度 | 原因 |
|---|
| 实验分析 | 26% | 0% | 最易 | 大量具体数字和表格,天然像人写的 |
| 方法研究 | 34% | 6% | 易 | 有公式、参数、算法细节 |
| 技术基础 | 68% | 10% | 中 | 百科式描述,但术语密集有利于改写 |
| 系统设计 | 50% | 10% | 中 | 有具体模块名、接口路径可注入 |
| 绪论 | 71% | 24% | 较难 | 文献综述部分模式固定 |
| 摘要 | 100% | 60-70% | 难 | 字数少、结构固定,改措辞效果有限 |
| 总结展望 | 99% | 99% | 几乎不可能 | 内容本身就是"总结型",跟AI模板完全重合 |
| 英文Abstract | 98% | 95% | 几乎不可能 | 学术英语句式跟AI输出高度重合 |
关键发现:摘要和总结章虽然AI率高,但字数占比小(合计<6%),对总分影响有限。真正决定总分的是方法研究、系统设计、实验分析这些大章。
三轮递进降AI法(实战验证的最优路径)
第一轮:措辞替换(预期效果:-20pts)
这一轮不动结构,只换措辞。效果最快、风险最低。
词汇替换规则
| 原词 | 替换为 |
|---|
| 采用 / 使用 | 运用 / 选用 / 把...当作...来使用 |
| 基于 | 依据 / 鉴于 |
| 利用 | 借助 / 凭借 |
| 通过 | 借助 / 依靠 |
| 和 / 及 / 与 | 以及(列举多项时) |
| 并 | 并且 / 还 / 同时 |
| 实现 | 得以实现 / 来实现 |
句式替换规则
| 原句式 | 替换为 |
|---|
| "将X移动到Y" | "把X移动到Y"(把字句) |
| "若…,则…" | "如果…的话,就…" |
| "X(缩写)" | "X 即缩写" 或 "X 也就是缩写" |
| "管理" | "开展…的管理工作" |
| "提供功能" | "有…功能" / "拥有…功能" |
高危词消灭清单
全文搜索并删除/替换以下词汇:
| 必须消灭 | 替换方式 |
|---|
| 需要强调/指出/说明/注意的是 | 直接删除,后面的内容直接陈述 |
| 也就是说 | 改为"因此""简言之""可见"或直接删除 |
| 由此可见 | 改为"据此可知""以上数据表明" |
| 综上所述 / 综合来看 | 直接删除 |
| 换句话说 | 改为"即"或直接删除 |
| 共同构成 | 改为"合在一起""一起形成" |
| 形成闭环 | 改为"完成循环""保持联动" |
| 并不是…而是… | 每处改法不同(见下方) |
| 首先…其次…最后 | 打散为自然段落 |
| 此外 / 与此同时 | 部分删除,用逻辑衔接 |
| 不可或缺 / 至关重要 | 删除或换具体说明 |
"并不是…而是…"的多样化替换
此句式是最大AI指纹,全文不能超过3次。每次出现用不同方式改:
① 并非A,而要B
② 有别于A,其核心在于B
③ A → 直接删掉,只保留B
④ B,而非A(调换顺序)
⑤ 不宜简单理解为A,实际上B
⑥ 与其说A,不如说B
第二轮:突发度注入(预期效果:再-8pts)
这一轮是降AI的核心杀招,对第一轮效果不好的段落特别有效。
什么是突发度?
AI生成的文本每句都是25-40字,句长分布非常均匀。人写的文章会突然蹦出很短的句子。
AI风格(句长均匀):
系统在连续交互的条件下需要保持可接受的响应速度。(23字)
在多图层叠加的场景下保持较好的绘制效率。(20字)
从而降低大范围浏览时的单次传输压力。(17字)
人类风格(长短交替):
响应速度必须跟上。(8字)
用户缩放一下地图,后台可能就要同时处理十几个瓦片请求,
如果每个请求都卡个几百毫秒,界面马上就会感觉到延迟。(50字)
突发度制造方法
-
短句开头法:段落第一句控制在10字以内
- "但这几年情况变了。"
- "问题不在某一层。"
- "散点瓦片的结果最稳。"
-
设问句法:偶尔用反问或设问打破叙述节奏
- "效果怎么样?"(注意:摘要等正式章节不要用,方法和实验章节可以)
- "代价是什么?"
-
三短一长规则:每3个短句(≤15字)后接1个长句(≥30字)
-
段落长度不对称:相邻段落字数差距要大,不能每段都是5-6行
第三轮:结构重组(预期效果:再-5pts)
对前两轮仍然标紫的段落做结构级改写。
段落合并
总结章 6 段压成 3 段是最有效的结构改写:
- 散点结果 + 航迹结果 + 系统实现 → 合成1段
- 不足 + 展望 → 合成1段
- 去掉"其一/其二/其三/其四"编号,改用分号连接
语序调换
AI总是"背景→问题→方法→结果"。偶尔调换:
插入实操细节
只有做过系统的人才知道的细节,例如:
- "光这套过滤逻辑的 SQL 拼接就调了好几轮"
- "用 ST_Intersects 做空间相交判定"
- "倍率 1× 对应原始表,10× 以上切到简化表的不同 level"
- "连接池启动阶段就创建好,避免每次请求都重新建连"
加入不确定性表达
AI几乎不说"可能""大概""不太确定"。适当加入:
- "换成城市交通轨迹的话,方案还能不能直接搬过去?还没验证过。"
- "这组参数换一个场景的话可能就需要重新调整了"
- "这算是一个遗留问题"
五问检测法(逐段必检)
对每一个被标记或疑似的段落,依次回答以下 5 个问题:
-
这段里有没有你系统独有的名词、参数、接口、表名或时间窗?
→ 没有则补入具体实现细节
-
有没有至少一个实测数值或实验条件?
→ 没有则补入数据,或标注【待补实测数据】
-
有没有写清楚"为什么是这个机制带来了这个结果"?
→ 缺乏因果链则补充机制解释
-
有没有边界条件、例外情况或适用范围?
→ 没有则加一句限定
-
这段如果贴到别人的论文里,是否也几乎成立?
→ 如果答案是"是",这段就还不够好
第 5 个问题是终极判据。
AI 痕迹检测清单
A. 结构性痕迹(最容易被检测器捕获)★★★
| 模式 | 示例 | 危险度 |
|---|
| 工整排比 (1)(2)(3)(4) | "第一,……;第二,……;第三,……" | ★★★ |
| "在X层面"三段并列 | "在A层面……在B层面……在C层面……" | ★★★ |
| "并不是…而是…"高频出现 | 全文超过3次即高危 | ★★★ |
| 事实+解释的固定节奏 | 每段都跟"这意味着……""这说明……" | ★★★ |
| 段落长度对称 | 每段都是5-6行 | ★★ |
| 标准化摘要结构 | 严格"问题→方法→结果"四段 | ★★ |
| 本章小结排比 | "在X层面…在Y层面…在Z层面…" | ★★★ |
B. 词汇性痕迹 ★★
见上方"高危词消灭清单"。
C. 节奏性痕迹(突发度) ★★★
| 模式 | 问题 | 修复 |
|---|
| 每句25-40字,分布均匀 | 困惑度低 | 制造8-10字短句穿插50字长句 |
| 每段都有总结句 | 像教科书 | 删掉部分总结 |
| 连续3句以上相同开头 | 机械重复 | 变换主语和句式 |
| 每段都是"定义→展开→意义" | AI模板 | 打乱顺序 |
改写策略(按优先级排序)
策略 1:突发度注入(效果最强)★★★★★
制造句长的剧烈波动。短句(≤10字)和长句(≥40字)交替出现。
策略 2:注入系统特异性 ★★★★
将通用描述替换为系统中的具体表名、模块名、接口路径、参数值。
❌ "系统在数据库侧组织多种数据结构"
✅ "系统在 PostgreSQL 中维护了 raw_tracks(原始轨迹)、simplified_tracks(多级简化轨迹)和 hotspot_cache(网格缓存)三张核心表"
策略 3:段落合并/拆分 ★★★★
打破维普的段落对称模板匹配。6段→3段,3段→4段等。
策略 4:措辞替换 ★★★
把字句、条件句口语化、括号整合、动词扩展。见第一轮详细规则。
策略 5:加入不确定性表达 ★★★
"可能""大概""还没验证过""这算是遗留问题"等。
策略 6:打破排比结构 ★★★
不超过2条并列,第3条起必须换结构。
策略 7:去掉"万能解释句" ★★
删除贴到任何论文里都成立的句子。
策略 8:加入边界条件和失败案例 ★★
人写的论文会主动暴露局限。
工作流程
模式 A:扫描诊断(不改写)
- 读取论文全文(用 python 从 docx 提取)
- 统计全文 AI 指纹词频率
- 对每章评估危险等级
- 输出诊断报告
模式 B:分轮迭代改写(推荐)
第1轮:措辞替换(全文,预期 -20pts)
↓ 送检
第2轮:突发度+结构改写(仅紫色段落,预期 -8pts)
↓ 送检
第3轮:实操细节+不确定表达(仅剩余紫色段落,预期 -5pts)
↓ 送检
关键原则:每轮只改紫色段落,不动白色段落。
模式 C:维普报告分析
- 读取维普 PDF 报告
- 提取各章节 AI 率
- 计算每章紫色字数对总分的贡献
- 按投入产出比排序:优先改"字数多且AI率高"的章节
- 输出改写优先级清单
实战经验总结
有效的做法
- 突发度(长短句交替)是降AI率最有效的单一手段
- 段落合并对总结类章节有明显效果
- 注入具体表名/模块名/参数值能让段落变得"只有作者能写"
- 实验分析章天然容易降,因为数字和表格多
- 分轮迭代比一次性全改效果好(每轮针对紫色段落精准打击)
无效的做法
- 对总结与展望章反复改措辞——内容模式本身就是AI模板,改不动(实测4轮仍99%)
- 对英文Abstract改措辞——学术英语句式跟AI输出高度重合(实测维持95%)
- 全局替换某个词(如把所有"并不是"→"并非")——会制造新的统一模式,反而更像AI
- 零宽字符/Unicode替换——2026年的检测器已能识别,且被发现后果严重
性价比排序(按章节类型,适用于任何论文)
- 方法研究章:改写效果最好(实测34%→6%),字数大,值得优先投入
- 实验分析章:用突发度+实操细节可以直接到0%,数字和表格天然像人写的
- 系统设计章:注入模块名和接口路径效果好(实测50%→10%)
- 技术基础章:术语密集,措辞替换就够(实测68%→10%)
- 绪论章:文献综述部分较难,但字数占比不大
- 摘要:改措辞能降一些,但字数太少影响不大(<3%总字数)
- 总结与展望:几乎改不动,但字数小,放弃也可接受(<4%总字数)
- 英文Abstract:放弃,对总分影响<1%
改动类型标注
每次改写标注改动类型:
[突发度] — 制造句长波动
[注入特异性] — 补入系统独有名词/参数/表名
[段落重组] — 合并或拆分段落
[措辞替换] — 替换用词和句式
[不确定表达] — 加入保留性措辞
[打破排比] — 拆散工整并列结构
[删除万能句] — 删掉通用句子
[加边界条件] — 补入适用范围或局限
检测工具
| 工具 | 用途 | 说明 |
|---|
| 维普 AIGC | 中文论文主流检测 | 多数高校采用,比知网严格 |
| 知网 AIGC | 知网官方 | 比维普宽松很多,同一篇论文可能差30+pts |
| GPTZero | 英文检测 | 英文部分用 |
实测对比:同一篇论文维普 16.32%,知网 0%。如果学校用知网,压力小很多。
建议流程:改写 → 维普检测 → 针对紫色段再改 → 重测,迭代至目标率以下。