name	writing-dna
version	v1.0.1
description	This skill should be used when the user wants to distill their personal writing style, techniques, and thought patterns from their past articles (especially WeChat public account posts) into a reusable writing DNA profile. Use this skill to analyze writing samples, extract style fingerprints through multi-layer validation, and generate new content that faithfully replicates the user's unique voice.

🖌️ 神笔马良 · 写作DNA蒸馏

将自己公众号/小红薯/X/twitter的文章蒸馏成属于你自己的「写作基因包」。核心路径：七维并行采集 → 三重验证降噪 → 硬规则/软范式分类 → 增量迭代进化

理念来源：借鉴认知蒸馏方法论，将隐性的个人写作风格，转化为 AI 可直接执行的显性规则，本质是人文本范式的萃取与固化。

技能触发场景

用户提供文章样本，说"蒸馏文章"或"分析我的写作风格"
用户说"按我的风格写一篇文章"
用户新增文章，说"更新我的DNA"（增量蒸馏）
用户查看当前DNA档案
用户说"帮我找出我写作的盲区/反模式"

核心工作流

阶段一：文本预处理（Preprocessing）

公众号文章文本进入蒸馏前，必须完成清洗：

格式清洗：去除多余空行、特殊符号、排版标记
话题语义切片：不按段落机械切分，而按话题单元划分（一个完整的论点或叙事片段为一个切片）
重复内容识别：标记在多篇文章中反复出现的段落（固定套路 or 口头禅），这类重复是 DNA 的重要信号

阶段二：七路并行特征采集（7-Collector）

读取 references/writing-dna-framework.md 获取每个维度的详细分析指南。七个维度独立并行分析，各自提取碎片化特征，最终汇入「原始特征池」：

#	采集器	萃取内容
1	表达范式	句式习惯、标志性词汇、口头禅、修辞手法、段落结构偏好
2	思维逻辑	惯用论证套路、推理路径、切入角度偏好、因果链条构建方式
3	知识体系	高频话题领域、常用类比素材库、知识边界（懂什么/不懂什么）
4	情感决策	与读者的关系定位、情绪调性频谱、共情策略、价值观优先级
5	选题视角	话题切入独特性、标题命名规律、选题偏好领域
6	节奏控制	句长分布、段落节奏、短句爆破节点、留白风格
7	反模式 ⚠️	思维盲区、逻辑漏洞、被引用数据但可能有误的认知、表达短板、刻意回避的话题

反模式维度同等重要——知道这个人不会/不该怎么写，和知道他擅长怎么写一样关键。

阶段三：三重验证降噪（Triple Validator）

原始特征池中混有大量偶然发挥、情绪话、一次性观点，必须经过三道过滤，只保留稳定、可信、具有代表性的特征：

✅ 验证一：频次验证（Frequency Check）

同一特征/句式/观点，必须在多篇不同文章、不同话题切片中重复出现
阈值：见 config.yaml → validation.frequency_threshold（默认 ≥3 篇）
丢弃：仅出现一次、无法确认是否稳定的特征

✅ 验证二：语境一致性验证（Context Consistency Check）

同一特征在不同话题、不同情绪的文章中表现稳定，不剧烈反差
检查：同一个"论证套路"是否在多种主题文章中都适用
丢弃：只在特定类型文章中出现、其他文章完全没有的孤立特征

✅ 验证三：逻辑自洽验证（Internal Consistency Check）

提炼出的多条特征之间无明显矛盾
检查：若某条特征和已有DNA档案中的规则相悖，需标记冲突
处理：标记冲突特征为 [待确认]，不直接丢弃，等待更多样本裁定

经过三重验证后：低质特征被丢弃，剩余有效稳定特征集进入下一阶段。

阶段四：特征聚合与建模（Aggregation）

把碎片化特征抽象为两种形式，分类存储：

🔴 硬规则（Hard Rules）— 直接执行

不需要 AI 理解，直接做成拦截/替换指令：

口头禅：必须出现 / 偶尔出现 / 绝不出现 的固定词语
禁忌话题：明确不写的领域或表达方式
固定句式模板：开头/结尾的标准格式
标题规则：字数限制、是否用数字、标题结构

🔵 软范式（Soft Paradigms）— Few-shot 引导

需要 AI 理解后模仿，以示例形式呈现：

思维框架示例：「先给结论 → 再讲原因 → 最后补故事」的完整段落示例
情感调性示例：典型的情感表达段落
论证模式示例：典型的反直觉切入段落

分析结果写入 / 更新 references/my-writing-dna.md。

阶段五：风格复刻（Replication）

用户要求按此风格写作时：

加载 references/my-writing-dna.md（若存在）
先执行硬规则（口头禅、禁忌、句式模板）
再调用软范式（Few-shot 示例引导整体风格）
写完后自检清单（对照七维度逐项核查，尤其检查反模式是否误触）

增量蒸馏（Incremental Update）

新增文章时无需全量重跑，按以下流程增量更新：

新文章 → 预处理 → 七路采集新特征片段
→ 与已有特征库对比 → 再走三重验证
   ✅ 验证通过：合并入库，更新 DNA 规则/范式
   ❌ 验证不通过：丢弃，不影响现有 DNA
→ 更新 my-writing-dna.md 版本号与变更说明

触发增量蒸馏：用户说"更新我的DNA"或"我有新文章要加进去"

蒸馏命令

命令	效果
`蒸馏文章` / `distill`	分析提供的文章，三重验证后更新DNA档案
`增量更新` / `update dna`	只分析新文章，合并入已有档案
`DNA档案` / `show dna`	展示当前写作DNA全貌
`硬规则` / `hard rules`	只展示硬规则部分
`软范式` / `soft paradigms`	只展示软范式与示例
`反模式` / `anti patterns`	展示写作盲区与禁忌
`按我风格写 [主题]`	加载DNA，创作新内容
`重置DNA`	清空当前档案，重新蒸馏

核心原则

忠实优先：复刻风格时，宁可保留"不完美"也要保持原汁原味，不擅自优化用户的表达习惯。
稳定特征优先：只蒸馏反复出现的特征，一次性灵感不入库。
来源可溯：每条DNA规则都应标注来自哪篇文章（Article-[N]），出错可回溯。
DNA 是活的：文章越多越准确，用 config.yaml 中的阈值控制蒸馏严格度。
反模式同权重：盲区和禁忌与优点一样重要，不得忽略。

参考资源

references/writing-dna-framework.md — 七维分析框架详细指南
references/dna-template.md — DNA档案标准输出模板（含硬规则/软范式分区）
references/my-writing-dna.md — 用户个人写作DNA档案（自动生成/增量更新）
scripts/distill_writing_dna.py — 批量蒸馏 + 三重验证 + 增量更新脚本
config.yaml — 验证阈值与采集规则配置

name	writing-dna
version	v1.0.1
description	This skill should be used when the user wants to distill their personal writing style, techniques, and thought patterns from their past articles (especially WeChat public account posts) into a reusable writing DNA profile. Use this skill to analyze writing samples, extract style fingerprints through multi-layer validation, and generate new content that faithfully replicates the user's unique voice.