| name | writing-dna |
| version | v1.0.1 |
| description | This skill should be used when the user wants to distill their personal writing style, techniques, and thought patterns from their past articles (especially WeChat public account posts) into a reusable writing DNA profile. Use this skill to analyze writing samples, extract style fingerprints through multi-layer validation, and generate new content that faithfully replicates the user's unique voice. |
🖌️ 神笔马良 · 写作DNA蒸馏
将自己公众号/小红薯/X/twitter的文章蒸馏成属于你自己的「写作基因包」。
核心路径:七维并行采集 → 三重验证降噪 → 硬规则/软范式分类 → 增量迭代进化
理念来源:借鉴认知蒸馏方法论,将隐性的个人写作风格,
转化为 AI 可直接执行的显性规则,本质是人文本范式的萃取与固化。
技能触发场景
- 用户提供文章样本,说"蒸馏文章"或"分析我的写作风格"
- 用户说"按我的风格写一篇文章"
- 用户新增文章,说"更新我的DNA"(增量蒸馏)
- 用户查看当前DNA档案
- 用户说"帮我找出我写作的盲区/反模式"
核心工作流
阶段一:文本预处理(Preprocessing)
公众号文章文本进入蒸馏前,必须完成清洗:
- 格式清洗:去除多余空行、特殊符号、排版标记
- 话题语义切片:不按段落机械切分,而按话题单元划分(一个完整的论点或叙事片段为一个切片)
- 重复内容识别:标记在多篇文章中反复出现的段落(固定套路 or 口头禅),这类重复是 DNA 的重要信号
阶段二:七路并行特征采集(7-Collector)
读取 references/writing-dna-framework.md 获取每个维度的详细分析指南。
七个维度独立并行分析,各自提取碎片化特征,最终汇入「原始特征池」:
| # | 采集器 | 萃取内容 |
|---|
| 1 | 表达范式 | 句式习惯、标志性词汇、口头禅、修辞手法、段落结构偏好 |
| 2 | 思维逻辑 | 惯用论证套路、推理路径、切入角度偏好、因果链条构建方式 |
| 3 | 知识体系 | 高频话题领域、常用类比素材库、知识边界(懂什么/不懂什么) |
| 4 | 情感决策 | 与读者的关系定位、情绪调性频谱、共情策略、价值观优先级 |
| 5 | 选题视角 | 话题切入独特性、标题命名规律、选题偏好领域 |
| 6 | 节奏控制 | 句长分布、段落节奏、短句爆破节点、留白风格 |
| 7 | 反模式 ⚠️ | 思维盲区、逻辑漏洞、被引用数据但可能有误的认知、表达短板、刻意回避的话题 |
反模式维度同等重要——知道这个人不会/不该怎么写,和知道他擅长怎么写一样关键。
阶段三:三重验证降噪(Triple Validator)
原始特征池中混有大量偶然发挥、情绪话、一次性观点,必须经过三道过滤,
只保留稳定、可信、具有代表性的特征:
✅ 验证一:频次验证(Frequency Check)
- 同一特征/句式/观点,必须在多篇不同文章、不同话题切片中重复出现
- 阈值:见
config.yaml → validation.frequency_threshold(默认 ≥3 篇)
- 丢弃:仅出现一次、无法确认是否稳定的特征
✅ 验证二:语境一致性验证(Context Consistency Check)
- 同一特征在不同话题、不同情绪的文章中表现稳定,不剧烈反差
- 检查:同一个"论证套路"是否在多种主题文章中都适用
- 丢弃:只在特定类型文章中出现、其他文章完全没有的孤立特征
✅ 验证三:逻辑自洽验证(Internal Consistency Check)
- 提炼出的多条特征之间无明显矛盾
- 检查:若某条特征和已有DNA档案中的规则相悖,需标记冲突
- 处理:标记冲突特征为
[待确认],不直接丢弃,等待更多样本裁定
经过三重验证后:低质特征被丢弃,剩余有效稳定特征集进入下一阶段。
阶段四:特征聚合与建模(Aggregation)
把碎片化特征抽象为两种形式,分类存储:
🔴 硬规则(Hard Rules)— 直接执行
不需要 AI 理解,直接做成拦截/替换指令:
- 口头禅:
必须出现 / 偶尔出现 / 绝不出现 的固定词语
- 禁忌话题:明确不写的领域或表达方式
- 固定句式模板:开头/结尾的标准格式
- 标题规则:字数限制、是否用数字、标题结构
🔵 软范式(Soft Paradigms)— Few-shot 引导
需要 AI 理解后模仿,以示例形式呈现:
- 思维框架示例:「先给结论 → 再讲原因 → 最后补故事」的完整段落示例
- 情感调性示例:典型的情感表达段落
- 论证模式示例:典型的反直觉切入段落
分析结果写入 / 更新 references/my-writing-dna.md。
阶段五:风格复刻(Replication)
用户要求按此风格写作时:
- 加载
references/my-writing-dna.md(若存在)
- 先执行硬规则(口头禅、禁忌、句式模板)
- 再调用软范式(Few-shot 示例引导整体风格)
- 写完后自检清单(对照七维度逐项核查,尤其检查反模式是否误触)
增量蒸馏(Incremental Update)
新增文章时无需全量重跑,按以下流程增量更新:
新文章 → 预处理 → 七路采集新特征片段
→ 与已有特征库对比 → 再走三重验证
✅ 验证通过:合并入库,更新 DNA 规则/范式
❌ 验证不通过:丢弃,不影响现有 DNA
→ 更新 my-writing-dna.md 版本号与变更说明
触发增量蒸馏:用户说"更新我的DNA"或"我有新文章要加进去"
蒸馏命令
| 命令 | 效果 |
|---|
蒸馏文章 / distill | 分析提供的文章,三重验证后更新DNA档案 |
增量更新 / update dna | 只分析新文章,合并入已有档案 |
DNA档案 / show dna | 展示当前写作DNA全貌 |
硬规则 / hard rules | 只展示硬规则部分 |
软范式 / soft paradigms | 只展示软范式与示例 |
反模式 / anti patterns | 展示写作盲区与禁忌 |
按我风格写 [主题] | 加载DNA,创作新内容 |
重置DNA | 清空当前档案,重新蒸馏 |
核心原则
- 忠实优先:复刻风格时,宁可保留"不完美"也要保持原汁原味,不擅自优化用户的表达习惯。
- 稳定特征优先:只蒸馏反复出现的特征,一次性灵感不入库。
- 来源可溯:每条DNA规则都应标注来自哪篇文章(Article-[N]),出错可回溯。
- DNA 是活的:文章越多越准确,用
config.yaml 中的阈值控制蒸馏严格度。
- 反模式同权重:盲区和禁忌与优点一样重要,不得忽略。
参考资源
references/writing-dna-framework.md — 七维分析框架详细指南
references/dna-template.md — DNA档案标准输出模板(含硬规则/软范式分区)
references/my-writing-dna.md — 用户个人写作DNA档案(自动生成/增量更新)
scripts/distill_writing_dna.py — 批量蒸馏 + 三重验证 + 增量更新脚本
config.yaml — 验证阈值与采集规则配置