| name | file-diff-checker |
| description | 重复文件差异对比。自动去重、智能归类,构建文件知识关联 This skill should be used when the user asks about 重复文件差异对比. Keywords: 文件对比, 差异分析, 去重. |
重复文件差异对比
自动去重、智能归类,构建文件知识关联
前置依赖
pip install pandas
核心能力
能力1:读取指定目录下的文件(read_file)
用 web_fetch 抓取页面内容 / 用 read_file 读取文件。
能力2:检测重复和相似文件
用 read_file 逐个读取目标文件,用 execute_command 运行diff工具进行精确对比。
能力3:生成差异对比报告(高亮不同之处)
用 write_to_file 生成文件。
能力4:提供去重合并建议
用 read_file 逐个读取目标文件,用 execute_command 运行diff工具进行精确对比。
能力5:输出整理后的文件清单
用 write_to_file 生成文件。
使用流程
步骤 1:收集用户需求
向用户确认以下信息(如果未主动提供):
- 需要对比哪些文件?(提供文件路径或目录)
- 是否需要忽略特定类型的差异?(空格/注释/编码)
- 输出差异报告的格式?(Markdown/HTML)
步骤 2:运行脚本处理数据
python3 scripts/file_diff_checker_tool.py run \
--input "用户提供的输入" \
--output "/path/to/output_file"
读取脚本输出的结果,确认数据处理成功。
步骤 3:生成最终产出
基于脚本输出和搜索到的资源,用 write_to_file 生成以下文件:
输出格式要求:Markdown 差异报告 + 去重建议清单
步骤 4:汇总交付
向用户展示:
- 生成的文件路径和内容摘要
- 搜集到的资源链接列表
- 关键发现和建议
输出格式
# 📋 重复文件差异对比 — 执行报告
**生成时间**: YYYY-MM-DD HH:MM
**目标用户**: 办公人员、项目管理者、文档管理员
## 执行摘要
[基于实际执行结果的一段话摘要]
## 详细结果
### 📊 生成的文件
| 文件名 | 类型 | 说明 |
|--------|------|------|
| [文件名] | [类型] | [说明] |
### 🔗 资源链接
| 名称 | 链接 | 说明 |
|------|------|------|
| [资源] | [URL] | [说明] |
## 行动建议
[具体的下一步建议]
验收标准
- ✅ 所有文件已读取
- ✅ 重复检测准确
- ✅ 差异高亮清晰
- ✅ 去重建议可执行
场景化适配
根据文件类型(代码/文档/表格)调整对比策略
依赖 Skills
本 Skill 参考以下已有 Skill 的能力进行增强:
注意事项
- 所有数据必须来自
web_search / web_fetch 的真实搜索结果,严禁编造数据
- 数据缺失时标注"数据不可用"而非猜测
- 报告必须保存为文件(
write_to_file),不能只在对话中输出
- 建议结合人工判断使用,AI 分析仅供参考