ワンクリックで
legal-qa-extractor
从律师与客户沟通记录中提取有价值的法律问答对,生成结构化知识库内容。本技能应在用户需要整理客户咨询记录、从对话中提取可复用法律知识、创建问答知识库、或准备内容营销素材时使用。支持严格客户信息脱敏处理。
メニュー
从律师与客户沟通记录中提取有价值的法律问答对,生成结构化知识库内容。本技能应在用户需要整理客户咨询记录、从对话中提取可复用法律知识、创建问答知识库、或准备内容营销素材时使用。支持严格客户信息脱敏处理。
SOC 職業分類に基づく
基于现有文章、专栏、课程讲稿、逐字稿、访谈、课件、会议纪要、案例材料、PDF 文本、Word 文档和笔记等内容资产,判断它们最适合转化为书、小册子、课程、系列文章、实务手册或知识库,并输出精简策划意见;用户提到“把现有内容整理成书”“判断素材适合做书还是课程”“把文章/直播稿/课程稿/笔记重组成知识产品”等场景时,应使用本技能。
使用本地 FunASR 服务将音频或视频文件转录为带时间戳的 Markdown 文件,支持 mp4、mov、mp3、wav、m4a 等常见格式。本技能应在用户需要语音转文字、会议记录、视频字幕、播客转录时使用。
Git 工作流安全助手。本技能应在需要执行分支管理、Monorepo 安全合并、PR 创建/审查/合并、冲突处理、cherry-pick、安全回退,以及 stale/已合并分支审计与清理(branch cleanup,含 squash/rebase merge 校验)时使用。不要用于:批量生成提交信息、项目任务分配、长期任务状态管理或本地多 Agent 会话编排。
本技能应在用户需要 OCR、扫描识别、图片文字识别、文档识别,或将 PDF、图片、Office 文档、URL 转换为 Markdown 时使用。检测到法律材料时可进行保守的法律术语与文书结构优化。不要用于法律事实判断、补写缺失内容、语义改写、印章深度识别或图表实体分析。
Skill 质量验收与格式审查工具,也可称 Skilllint。本技能应在用户需要审查 Claude Code Skill 的目录结构、Frontmatter、引用一致性、发布版本、业务流深度、可评估性和安全风险时使用。不要用于:创建新技能、代码审查、应用功能测试、通用编程任务。
转录稿纠错与轻度优化。本技能应在用户需要按用户词典纠正 ASR 转录稿同音字与英文专有名称漂移时使用。不要用于:重写为课程章节、报告、总结,或完全空白的素材创作。
| name | legal-qa-extractor |
| homepage | https://github.com/cat-xierluo/legal-skills |
| author | 杨卫薪律师(微信ywxlaw) |
| version | 1.0.0 |
| license | CC-BY-NC |
| description | 从律师与客户沟通记录中提取有价值的法律问答对,生成结构化知识库内容。本技能应在用户需要整理客户咨询记录、从对话中提取可复用法律知识、创建问答知识库、或准备内容营销素材时使用。支持严格客户信息脱敏处理。 |
从律师与客户的沟通记录中提取有价值的法律问答对(客户问题 + 律师解答),生成结构化知识库内容。适用于将客户咨询转化为可复用的法律知识,供后续整理成文章、案例或学习材料。
核心价值:提取那些可以被其他客户复用的问答内容,而不是单一客户的具体案情。
绝对禁止在问答内容中包含:
脱敏处理标准:
提取的问答应该满足以下条件之一:
获取沟通记录文档和用户的具体要求,理解:
完整梳理文档中的问答内容,按以下维度识别价值:
输出文件保存至原文档的同一目录,文件命名:{原文档名}_法律问答提取_{YYYYMMDD}.md
输出格式详见 output-template.md。
每个问答对包含以下部分:
提供以下分析维度:
本技能接受以下类型的输入:
本技能支持通过 config/.env 文件自定义扫描行为:
# 复制模板
cp config/.env.example config/.env
# 编辑配置
QA_EXTRACTOR_SCAN_PATHS=~/Desktop/Clawd/10 - ⚖️ 法律工作/工作文档/011 - 潜在项目
QA_EXTRACTOR_SCAN_DEPTH=3
QA_EXTRACTOR_FILE_TYPES=md,txt
技能会维护 archive/scan-log.json 记录扫描状态:
{
"version": "1.1.0",
"last_full_scan": "2026-05-10T23:00:00+08:00",
"watch_paths": [
{
"path": "~/Desktop/Clawd/10 - ⚖️ 法律工作/工作文档/011 - 潜在项目",
"last_scanned": "2026-05-10T23:00:00+08:00",
"status": "active"
}
],
"projects": {
"潜在项目_A": {
"source_files": ["path/to/file1.md", "path/to/file2.md"],
"last_extracted": "2026-05-10",
"qa_count": 8,
"output_file": "archive/extractions/2026-05-10_潜在项目_A_qa.md",
"status": "active"
}
},
"files": {
"path/to/file.md": {
"content_hash": "sha256:abc123...",
"last_modified": "2026-05-09",
"last_extracted": "2026-05-10",
"qa_count": 5,
"status": "active"
}
},
"archived": {
"path/to/old_project": {
"archived_at": "2026-05-01",
"reason": "moved_by_user"
}
}
}
字段说明:
| 字段 | 用途 |
|---|---|
files.*.content_hash | 文件内容指纹,变化时触发重新提取 |
files.*.status | active / archived,归档后跳过扫描 |
projects.*.source_files | 同一项目的多份沟通记录,合并输出 |
projects.*.status | active / archived,项目归档后锁定 |
archived.* | 记录已移走的路径,防止重复扫描 |
增量扫描逻辑:
文件夹类型判断(用于识别归档与活动项目):
| 命名模式 | 类型 | 处理方式 |
|---|---|---|
纯数字 / 日期区间(如 24、25 01-06、26 01-06) | 归档容器 | 深度扫描内部子文件夹 |
日期+姓名(如 260323 张美金...、260404 顾忆芬...) | 直接项目 | 直接扫描该文件夹 |
| 其他 | 项目 | 直接扫描该文件夹 |
content_hash抽取的问答对保存在 archive/extractions/ 目录,按项目聚合:
archive/
├── scan-log.json # 扫描状态记录
└── extractions/
├── 2026-05-10_潜在项目_A_qa.md # 项目A的多轮咨询合并
├── 2026-05-10_潜在项目_B_qa.md # 项目B的单次记录
└── 2026-05-11_潜在项目_C_qa.md # 项目C(后续增量新增)
多轮咨询合并逻辑:
.md/.txt 文件视为同一项目的多轮沟通{日期}_{项目名}_qa.md注意:archive/ 目录不纳入 Git 版本控制。