| name | mp-content-checker |
| description | 公众号内容敏感检测工具。检测文章中的敏感词、违禁词、联系方式等,规避删文和封号风险。支持本地词库检测和可选微信API检测。 |
| version | 1 |
| depends_on | [] |
公众号内容敏感检测
检测公众号文章内容,识别敏感词、违禁词、联系方式泄露等风险内容。
触发场景
- 用户说"检测这篇文章的敏感内容"
- 用户说"帮我自查公众号内容违规"
- 用户说"这篇文章有没有敏感词"
- 用户提供了文章内容并询问是否安全
- 研报/文章发布前的安全检查
检测维度
| 维度 | 检测内容 | 检测方式 |
|---|
| 政治敏感 | 政治人物、敏感事件、政策话题 | 词库匹配 |
| 暴恐违禁 | 恐怖主义、暴力描述、违禁品 | 词库匹配 |
| 色情低俗 | 色情描述、低俗用语 | 词库匹配 |
| 广告违禁 | 广告法违禁词(绝对化用语) | 词库匹配 |
| 联系方式 | 手机号、微信号、QQ号、外链 | 正则匹配 |
| 诱导分享 | 诱导分享、强制关注话术 | 规则匹配 |
使用方式
基础用法
python scripts/sensitivity_checker.py --input "文章内容或文件路径"
参数说明
| 参数 | 说明 | 默认值 |
|---|
--input | 待检测内容(文本或文件路径) | 必填 |
--output | 输出报告路径 | 可选,默认屏幕输出 |
--format | 输出格式(text/json/markdown) | text |
--level | 检测级别(quick/full) | quick |
--wechat-api | 启用微信API检测(需配置) | false |
输出结果
检测结果
├─ 风险等级:高/中/低
├─ 敏感词列表
│ ├─ 词内容
│ ├─ 所属类别
│ ├─ 出现位置
│ └─ 建议处理方式
├─ 联系方式检测
│ ├─ 手机号数量
│ ├─ 微信号数量
│ └─ 外链数量
└─ 修改建议
技术实现
检测流程
输入内容
↓
文本预处理(分段、清洗)
↓
本地词库检测(快速)
├─ 政治敏感词库
├─ 暴恐违禁词库
├─ 色情低俗词库
└─ 广告违禁词库
↓
正则表达式检测
├─ 手机号检测
├─ 微信号检测
├─ QQ号检测
├─ 外链检测
└─ 二维码描述检测
↓
规则引擎检测
├─ 诱导分享话术
├─ 强制关注话术
└─ 营销灌水内容
↓
结果整合与报告生成
词库结构
敏感词库采用JSON格式,按类别组织:
{
"political": {
"keywords": ["敏感词1", "敏感词2"],
"severity": "high"
},
"terrorism": {
"keywords": [...],
"severity": "critical"
}
}
微信API增强(已配置)
当前已配置微信官方内容安全API:
- AppID: wx279400d486f15c17
- 配置文件: ~/.hermes/config/mp-content-checker.json
使用方式
python scripts/sensitivity_checker.py --input "内容" --wechat-api
python scripts/wechat_api_client.py --content "待检测内容"
API版本说明
- Version 1(默认):简单检测,返回是否违规(errcode=0表示安全)
- Version 2:详细检测,返回违规类型和具体信息,但需要有效用户openid
检测结果解读
微信API检测结果与本地词库检测结果可能不完全一致:
| 情况 | 说明 |
|---|
| 微信API通过 + 本地检测违规 | 本地词库更严格,建议仍需修改 |
| 微信API违规 + 本地检测通过 | 微信API更敏感,必须修改 |
| 双方都违规 | 严重违规,必须立即修改 |
| 双方都通过 | 内容安全,可以发布 |
注意:微信API检测可能对广告法违禁词不够敏感,本地词库检测作为补充是必要的。
注意事项
- 词库时效性:敏感词库持续更新,建议定期更新词库
- 检测结果不保证100%准确:最终审核有微信人工参与
- 联系方式检测仅供参考:正则可能误判正常内容
- 建议发布前再次检测:热点事件可能导致新敏感词出现
文件结构
mp-content-checker/
├─ SKILL.md
├─ scripts/
│ ├─ sensitivity_checker.py # 核心检测脚本
│ ├─ word_library_loader.py # 词库加载器
│ └─ wechat_api_client.py # 微信API客户端(可选)
├─ references/
│ ├─ sensitive_words.json # 敏感词库
│ ├─ advertising_law.json # 广告法违禁词
│ ├─ contact_patterns.json # 联系方式检测规则
│ └─诱导分享.json # 诱导分享话术库
└─ templates/
└─ report_template.md # 检测报告模板