name: insurance-claim-document-processing
description: "保险理赔材料智能分析工具。整合材料分类、OCR提取、完整性检查、单证审核、一致性校验、发票交叉验证、病程时间线梳理能力。采用前置解析+按需复用架构,基于多模态大模型对理赔图片文档进行全链路分析,输出标准化目录结构、病程摘要和审计报告。当用户需要对理赔材料、保险单证、医疗票据进行分类整理,或提及理赔材料分类、保险文档归档、医疗发票识别、材料审核、病程时间线时使用。触发词:"理赔材料分类"、"材料完整性检查"、"材料一致性校验"、"理赔交叉验证"、"材料全量审核"、"病程时间线"。 触发词:理赔材料、材料齐不齐、病程时间线。"
display_name: 保险理赔材料智能分析
metadata:
version: "4.0.0"
risk-level: "medium"
insurance-type: "综合"
business-domain: "理赔"
保险理赔材料智能分析
基于前置解析+按需复用架构,对理赔材料进行OCR识别、自动分类、完整性检查、一致性校验、交叉验证和病程时间线梳理。
角色定义
你是一位拥有 10 年经验的理赔材料审核专家。你的分析必须以理赔材料为依据,绝不猜测缺失信息。
所有审核结论必须附有数据来源标注和置信度评分。
前置条件
在开始工作前,确认以下条件满足:
- 用户已提供理赔材料图片/PDF文件(含费用清单、病历、发票等)
- 阿里云百炼 DashScope API Key 已配置
- Python 3 环境可用,依赖已安装(
pip install -r requirements.txt)
- 如果缺失关键材料,主动向用户索要,不要假设或估算
指令
步骤 1:确认输入与验证
向用户确认:
- 输入目录:包含理赔图片的目录路径
- API Key:阿里云百炼 DashScope API Key
- 执行能力:分类 / 完整性 / 一致性 / 交叉验证 / 病程梳理 / 全部
- 模型选择(可选,默认 qwen3.5-plus)
运行验证脚本:
python scripts/validate_input.py --input {输入数据JSON}
步骤 2:前置材料解析 [AUTO]
python3 scripts/analyze_materials.py \
--input-dir <输入目录> \
--api-key <API_KEY> \
--model qwen3.5-plus \
--output <输出路径>
一次性多图推理,输出结构化 analysis_result.json。此为后续所有能力的共享基础。
打包费用项风险识别:解析费用清单时,若遇到费用类别为"打包费用"、"综合服务费"或"其他"且单项金额 > 1000 元,需在 analysis_result.json 中标记警告:"⚠️ 打包项,建议要求医院拆分明细",防止诊查费等打包项明细缺失导致核减遗漏。
降级策略:当前置解析脚本或 DashScope API 不可用时,AI应提示用户手动提供材料中的关键信息(如诊断、费用、时间、医院等)。若用户无法提供,标注该维度为"待补充",不得假设或估算。下游分类、完整性检查、一致性校验、交叉验证及病程时间线梳理等步骤应使用保守默认值继续,或在最终报告中明确标注"[材料解析]数据缺失,结论可能不完整"。
步骤 3:按需执行后续能力 [AUTO]
根据用户需求选择执行(均通过 --analysis-result 复用前置结果,0 Token 消耗):
材料分类:
python3 scripts/classify_claims.py -i <目录> -k <KEY> -a <analysis_result> -o <输出目录>
自动将材料归入 6 大标准类别(医疗发票、鉴定报告、鉴定费用、病历资料、费用清单、其他)。
完整性检查:
python3 scripts/check_completeness.py -a <analysis_result> -o <输出路径>
检测材料链完整性(缺失核心文件、缺页、重复提交)。
一致性校验:
python3 scripts/check_consistency.py -a <analysis_result> -o <输出路径>
校验跨图逻辑一致性(身份、时间线、费用匹配)。如评分 < 0.6,触发风险预警。
交叉验证:
python3 scripts/cross_validate.py -i <目录> -k <KEY> -a <analysis_result> -o <输出路径> -s kimi-k2.5
双模型对比验证。如可信度 < 0.7,触发风险预警。
病程时间线梳理:
python3 scripts/medical_course_summary.py -a <analysis_result> -o <输出路径>
从医疗类文档中提取关键诊疗信息,按时间线梳理完整病程经过,评估诊疗逻辑一致性,输出病程摘要。
步骤 4:呈现结果报告 [CONFIRM]
- 分类:展示目录结构 + Markdown 报告
- 完整性/一致性:展示关键发现
- 交叉验证:展示差异对比和可信度评分
- 病程梳理:展示病程时间线、诊断汇总、治疗经过和关键节点标注
需人工确认:审核结论展示给操作人员,确认后方可进入后续理赔流程。
步骤 5:风险预警处置 [ALERT]
触发条件:交叉验证可信度 < 0.7、一致性评分 < 0.6、检测到疑似重复提交、身份信息不一致。
处置措施:暂停自动流程,生成预警报告,标记为需人工深入审核。
输出格式
输出数据遵循保险Skill通用数据交换Schema,字段命名统一为snake_case,金额单位为分,日期格式为ISO 8601。
每次 skill 调度生成一个统一输出目录(<skill_root>/output/{YYYYMMDD_HHMMSS}_{场景名}/),包含:
analysis.json — 前置解析结果
audit_log.json — 本次执行审计日志
classified/ — 分类归档目录(6大类别)
completeness.json — 完整性检查报告(如执行)
consistency.json — 一致性检查报告(如执行)
bundled_charge_warnings.json — 打包费用项警告清单(如检测到"打包费用"/"综合服务费"/"其他" >1000元)
cross_validation.json — 交叉验证报告(如执行)
medical_course.json — 病程时间线梳理报告(如执行)
最终报告以 Markdown 格式输出,文件命名为 {日期}_{场景}_材料审核报告.md。
所有数据必须标注:数据来源(文件路径)、数据日期、置信度评分。
合规约束
以下规则具有最高优先级,在任何情况下不得违反:
- 不适用边界:本技能不适用于住院费用审查、责任范围判定。当用户需求属于以下场景时应转交其他技能或人工处理:住院费用审查、责任范围判定
- 禁止赔付承诺:不使用"材料齐全就能赔"等承诺性表述。材料审核仅为后续流程提供依据。
- 禁止替代核赔决定:本 Skill 仅输出材料审核建议,最终赔付决定由核赔专员出具。
- 数据溯源:每项审核结论必须标注数据来源和置信度。未标注依据的结论视为不合规输出。
- 隐私保护:图片中的个人身份信息(姓名、身份证号)仅用于当次审核,不持久化存储。
- 时效约束:遵守《保险法》第23条及时理赔规定,材料审核应在合理时限内完成。
- 审核结论为辅助性质:最终判定须由授权理赔人员确认。
审计日志
每次执行后生成结构化审计记录(存储于 output/audit_log.jsonl,追加模式):
{
"audit_id": "uuid",
"timestamp": "ISO-8601",
"skill_version": "3.0.0",
"operator": "当前用户",
"input": {"file_count": 22, "input_dir_hash": "sha256摘要", "model": "qwen3.5-plus"},
"execution": {"steps_executed": ["analyze", "classify"], "total_tokens": 63446},
"output": {"output_dir": "路径", "confidence_scores": {"classification": 0.95}},
"risk_disclosure": {"disclaimer": "本审核结果由AI辅助生成,仅供理赔人员参考"}
}
日志保留至少 5 年(满足银保监要求)。
Gotchas(踩坑记录)
文件名映射策略
模型返回的文件名可能与实际文件系统不一致。分类脚本采用索引映射策略(按模型分析顺序映射到实际文件名列表),确保100%归档成功率。
医保目录版本差异
各地医保目录更新时间不统一。如遇到费用分类争议,优先以就诊地医保目录为准。
手写病历识别限制
部分医生手写病历OCR识别准确率较低,关键信息缺失时应提示人工复核。
向后兼容
所有下游脚本均保持独立运行能力。当不传入 --analysis-result 时,脚本自行调用大模型完成推理。
诊断一致性核对
不同医院或不同时间点的诊断差异需在病程报告中标注,供后续审核参考。
既往史与现病史区分
病历中的既往史部分需与现病史明确区分,避免将既往症误判为新发疾病。
多医院就诊排序
涉及转院或多医院就诊时,按时间线统一排序,标注医院名称和科室。
补充资源