name	mp-content-checker
description	公众号内容敏感检测工具。检测文章中的敏感词、违禁词、联系方式等，规避删文和封号风险。支持本地词库检测和可选微信API检测。
version	1
depends_on	[]

公众号内容敏感检测

检测公众号文章内容，识别敏感词、违禁词、联系方式泄露等风险内容。

触发场景

用户说"检测这篇文章的敏感内容"
用户说"帮我自查公众号内容违规"
用户说"这篇文章有没有敏感词"
用户提供了文章内容并询问是否安全
研报/文章发布前的安全检查

检测维度

维度	检测内容	检测方式
政治敏感	政治人物、敏感事件、政策话题	词库匹配
暴恐违禁	恐怖主义、暴力描述、违禁品	词库匹配
色情低俗	色情描述、低俗用语	词库匹配
广告违禁	广告法违禁词（绝对化用语）	词库匹配
联系方式	手机号、微信号、QQ号、外链	正则匹配
诱导分享	诱导分享、强制关注话术	规则匹配

使用方式

基础用法

python scripts/sensitivity_checker.py --input "文章内容或文件路径"

参数说明

参数	说明	默认值
`--input`	待检测内容（文本或文件路径）	必填
`--output`	输出报告路径	可选，默认屏幕输出
`--format`	输出格式（text/json/markdown）	text
`--level`	检测级别（quick/full）	quick
`--wechat-api`	启用微信API检测（需配置）	false

输出结果

检测结果
├─ 风险等级：高/中/低
├─ 敏感词列表
│   ├─ 词内容
│   ├─ 所属类别
│   ├─ 出现位置
│   └─ 建议处理方式
├─ 联系方式检测
│   ├─ 手机号数量
│   ├─ 微信号数量
│   └─ 外链数量
└─ 修改建议

技术实现

检测流程

输入内容
    ↓
文本预处理（分段、清洗）
    ↓
本地词库检测（快速）
    ├─ 政治敏感词库
    ├─ 暴恐违禁词库
    ├─ 色情低俗词库
    └─ 广告违禁词库
    ↓
正则表达式检测
    ├─ 手机号检测
    ├─ 微信号检测
    ├─ QQ号检测
    ├─ 外链检测
    └─ 二维码描述检测
    ↓
规则引擎检测
    ├─ 诱导分享话术
    ├─ 强制关注话术
    └─ 营销灌水内容
    ↓
结果整合与报告生成

词库结构

敏感词库采用JSON格式，按类别组织：

{
  "political": {
    "keywords": ["敏感词1", "敏感词2"],
    "severity": "high"
  },
  "terrorism": {
    "keywords": [...],
    "severity": "critical"
  }
}

微信API增强（已配置）

当前已配置微信官方内容安全API：

AppID: wx279400d486f15c17
配置文件: ~/.hermes/config/mp-content-checker.json

使用方式

# 启用微信API检测
python scripts/sensitivity_checker.py --input "内容" --wechat-api

# 微信API单独调用
python scripts/wechat_api_client.py --content "待检测内容"

API版本说明

Version 1（默认）：简单检测，返回是否违规（errcode=0表示安全）
Version 2：详细检测，返回违规类型和具体信息，但需要有效用户openid

检测结果解读

微信API检测结果与本地词库检测结果可能不完全一致：

情况	说明
微信API通过 + 本地检测违规	本地词库更严格，建议仍需修改
微信API违规 + 本地检测通过	微信API更敏感，必须修改
双方都违规	严重违规，必须立即修改
双方都通过	内容安全，可以发布

注意：微信API检测可能对广告法违禁词不够敏感，本地词库检测作为补充是必要的。

注意事项

词库时效性：敏感词库持续更新，建议定期更新词库
检测结果不保证100%准确：最终审核有微信人工参与
联系方式检测仅供参考：正则可能误判正常内容
建议发布前再次检测：热点事件可能导致新敏感词出现

文件结构

mp-content-checker/
├─ SKILL.md
├─ scripts/
│   ├─ sensitivity_checker.py    # 核心检测脚本
│   ├─ word_library_loader.py    # 词库加载器
│   └─ wechat_api_client.py      # 微信API客户端（可选）
├─ references/
│   ├─ sensitive_words.json      # 敏感词库
│   ├─ advertising_law.json      # 广告法违禁词
│   ├─ contact_patterns.json     # 联系方式检测规则
│   └─诱导分享.json              # 诱导分享话术库
└─ templates/
    └─ report_template.md        # 检测报告模板

name	mp-content-checker
description	公众号内容敏感检测工具。检测文章中的敏感词、违禁词、联系方式等，规避删文和封号风险。支持本地词库检测和可选微信API检测。
version	1
depends_on	[]

公众号内容敏感检测

检测公众号文章内容，识别敏感词、违禁词、联系方式泄露等风险内容。

触发场景

用户说"检测这篇文章的敏感内容"
用户说"帮我自查公众号内容违规"
用户说"这篇文章有没有敏感词"
用户提供了文章内容并询问是否安全
研报/文章发布前的安全检查

检测维度

维度	检测内容	检测方式
政治敏感	政治人物、敏感事件、政策话题	词库匹配
暴恐违禁	恐怖主义、暴力描述、违禁品	词库匹配
色情低俗	色情描述、低俗用语	词库匹配
广告违禁	广告法违禁词（绝对化用语）	词库匹配
联系方式	手机号、微信号、QQ号、外链	正则匹配
诱导分享	诱导分享、强制关注话术	规则匹配

使用方式

基础用法

python scripts/sensitivity_checker.py --input "文章内容或文件路径"

参数说明

参数	说明	默认值
`--input`	待检测内容（文本或文件路径）	必填
`--output`	输出报告路径	可选，默认屏幕输出
`--format`	输出格式（text/json/markdown）	text
`--level`	检测级别（quick/full）	quick
`--wechat-api`	启用微信API检测（需配置）	false

输出结果

检测结果
├─ 风险等级：高/中/低
├─ 敏感词列表
│   ├─ 词内容
│   ├─ 所属类别
│   ├─ 出现位置
│   └─ 建议处理方式
├─ 联系方式检测
│   ├─ 手机号数量
│   ├─ 微信号数量
│   └─ 外链数量
└─ 修改建议

技术实现

检测流程

输入内容
    ↓
文本预处理（分段、清洗）
    ↓
本地词库检测（快速）
    ├─ 政治敏感词库
    ├─ 暴恐违禁词库
    ├─ 色情低俗词库
    └─ 广告违禁词库
    ↓
正则表达式检测
    ├─ 手机号检测
    ├─ 微信号检测
    ├─ QQ号检测
    ├─ 外链检测
    └─ 二维码描述检测
    ↓
规则引擎检测
    ├─ 诱导分享话术
    ├─ 强制关注话术
    └─ 营销灌水内容
    ↓
结果整合与报告生成

词库结构

敏感词库采用JSON格式，按类别组织：

{
  "political": {
    "keywords": ["敏感词1", "敏感词2"],
    "severity": "high"
  },
  "terrorism": {
    "keywords": [...],
    "severity": "critical"
  }
}

微信API增强（已配置）

当前已配置微信官方内容安全API：

AppID: wx279400d486f15c17
配置文件: ~/.hermes/config/mp-content-checker.json

使用方式

# 启用微信API检测
python scripts/sensitivity_checker.py --input "内容" --wechat-api

# 微信API单独调用
python scripts/wechat_api_client.py --content "待检测内容"

API版本说明

Version 1（默认）：简单检测，返回是否违规（errcode=0表示安全）
Version 2：详细检测，返回违规类型和具体信息，但需要有效用户openid

检测结果解读

微信API检测结果与本地词库检测结果可能不完全一致：

情况	说明
微信API通过 + 本地检测违规	本地词库更严格，建议仍需修改
微信API违规 + 本地检测通过	微信API更敏感，必须修改
双方都违规	严重违规，必须立即修改
双方都通过	内容安全，可以发布

注意：微信API检测可能对广告法违禁词不够敏感，本地词库检测作为补充是必要的。

注意事项

词库时效性：敏感词库持续更新，建议定期更新词库
检测结果不保证100%准确：最终审核有微信人工参与
联系方式检测仅供参考：正则可能误判正常内容
建议发布前再次检测：热点事件可能导致新敏感词出现

文件结构

mp-content-checker/
├─ SKILL.md
├─ scripts/
│   ├─ sensitivity_checker.py    # 核心检测脚本
│   ├─ word_library_loader.py    # 词库加载器
│   └─ wechat_api_client.py      # 微信API客户端（可选）
├─ references/
│   ├─ sensitive_words.json      # 敏感词库
│   ├─ advertising_law.json      # 广告法违禁词
│   ├─ contact_patterns.json     # 联系方式检测规则
│   └─诱导分享.json              # 诱导分享话术库
└─ templates/
    └─ report_template.md        # 检测报告模板