with one click
p8a-rax-risk-assessor
// RAX 风险评估器。基于《AI时代的用户体验》RAX 框架(Risk, Ambiguity, eXposure), 系统性评估 AI 产品的风险、模糊性和暴露程度,帮助产品团队识别和管理用户体验风险。
// RAX 风险评估器。基于《AI时代的用户体验》RAX 框架(Risk, Ambiguity, eXposure), 系统性评估 AI 产品的风险、模糊性和暴露程度,帮助产品团队识别和管理用户体验风险。
[HINT] Download the complete skill directory including SKILL.md and all related files
| name | p8a-rax-risk-assessor |
| description | RAX 风险评估器。基于《AI时代的用户体验》RAX 框架(Risk, Ambiguity, eXposure), 系统性评估 AI 产品的风险、模糊性和暴露程度,帮助产品团队识别和管理用户体验风险。 |
系统性评估 AI 产品的风险(Risk)、模糊性(Ambiguity)和暴露程度(eXposure),找出用户体验的弱点。
产品描述 + 用户场景 + 已知问题。
示例输入:
产品: AI 医疗诊断助手
场景: 帮助医生诊断疾病
用户: 临床医生
已知问题: 医生担心 AI 诊断错误导致误诊
定义:AI 出错时用户要承担什么后果?
评估项:
输出格式:
Risk 评估:
error_probability: "出错概率"
error_cost:
financial: "金钱损失"
career: "职业风险"
health: "健康风险"
legal: "法律风险"
reputation: "声誉风险"
reversibility: "是否可逆"
rollback: "回滚机制"
risk_level: "低/中/高/极高"
定义:用户能不能理解 AI 在做什么?
评估项:
输出格式:
Ambiguity 评估:
explainability: "可解释性"
boundary_clarity: "能力边界清晰度"
output_consistency: "输出一致性"
trust_boundary: "信任边界"
ambiguity_level: "低/中/高"
定义:用户在多大程度上依赖 AI 的输出?
评估项:
输出格式:
eXposure 评估:
optional_usage: "使用是否可选"
output_review: "输出是否可审核"
ai_role: "辅助/决策"
exit_option: "退出机制"
exposure_level: "低/中/高"
低暴露 中暴露 高暴露
低风险 ✓ 安全 ✓ 可接受 ⚠ 需要监控
中风险 ✓ 可接受 ⚠ 需要监控 ⚠ 需要改进
高风险 ⚠ 需要监控 ⚠ 需要改进 ✗ 危险
高优先级:
中优先级:
低优先级:
rax_assessment:
input:
product: "产品名称"
scenario: "使用场景"
user: "目标用户"
known_issues: ["已知问题"]
risk:
error_probability: "出错概率"
error_cost: "出错代价"
reversibility: "可逆性"
rollback: "回滚机制"
level: "低/中/高/极高"
ambiguity:
explainability: "可解释性"
boundary_clarity: "能力边界"
output_consistency: "输出一致性"
trust_boundary: "信任边界"
level: "低/中/高"
exposure:
optional_usage: "使用可选性"
output_review: "输出可审核性"
ai_role: "辅助/决策"
exit_option: "退出机制"
level: "低/中/高"
matrix:
risk_level: "风险等级"
exposure_level: "暴露等级"
ambiguity_level: "模糊等级"
overall_status: "安全/可接受/需改进/危险"
recommendations:
critical: ["立即要做的"]
high: ["高优先级改进"]
medium: ["中优先级改进"]
low: ["低优先级改进"]
| 维度 | 评估 | 等级 |
|---|---|---|
| Risk | 出错可能导致误诊,代价极高 | 高 |
| Ambiguity | 医生不太理解 AI 的判断逻辑 | 中 |
| eXposure | AI 只是辅助,最终诊断权在医生 | 中 |
综合判断:需要改进
建议:
定义:当 AI 出错时,预期损失有多大。不是简单的"出错概率"或"损失金额",而是概率、后果和不可逆性三者的有机结合。
关键点:
来源:书稿 ch08「Risk Exposure——不可逆错误的量化」
定义:AI 错误后果被修复或逆转的难度,不是二元变量(可逆/不可逆),而是一个连续光谱。
关键点:
来源:书稿 ch08「不可逆性:AI 时代风险的新维度」
定义:基于 RE = P × C × I 的结构,风险缓解可以从三个维度展开。
关键点:
来源:书稿 ch08「风险缓解策略:从量化到行动」
定义:将 Risk、Ambiguity、eXposure 三个维度交叉形成评估矩阵,用于快速判断整体风险状态和优先级。
关键点:
来源:主 Skill SKILL.md「RAX 矩阵」章节
定义:Risk Exposure 衡量单次错误的预期损失,但未直接考量错误事件的频率和错误间的级联效应。
关键点:
来源:书稿 ch08「超越 Risk Exposure:系统性风险的考量」
操作说明: 列出产品中所有 AI 参与的场景,按业务领域和用户任务分类。对每个场景标注其核心用户任务、AI 的角色(辅助/建议/决策)和已知问题。
输出物:
场景清单:
场景A: {任务描述, AI角色, 已知问题}
场景B: {任务描述, AI角色, 已知问题}
...
操作说明: 对每个场景分别评估 P(错误概率)、C(后果严重度)、I(不可逆性)。P 需分场景统计而非笼统平均值;C 使用 1-10 分量表评估多维损失;I 使用 0.0-1.0 操作化量表。计算 RE = P × C × I。
输出物:
risk_exposure:
场景A:
P: "错误概率及统计依据"
C: "后果严重度(1-10分)及多维损失说明"
I: "不可逆性(0.0-1.0)及理由"
RE: "计算结果"
RE_level: "低/中/高/极高"
操作说明: 评估用户对 AI 行为的理解程度:可解释性、能力边界清晰度、输出一致性、信任边界。识别"用户不知道 AI 在做什么"的场景。
输出物:
ambiguity_assessment:
场景A:
explainability: "高/中/低"
boundary_clarity: "清晰/部分清晰/模糊"
output_consistency: "一致/部分一致/不一致"
ambiguity_level: "低/中/高"
操作说明: 评估用户对 AI 输出的依赖程度:使用是否可选、输出是否可审核、AI 是辅助还是决策、是否有退出机制。
输出物:
exposure_assessment:
场景A:
optional_usage: "是/否"
output_review: "可审核/部分可审核/不可审核"
ai_role: "辅助/建议/决策"
exit_option: "有/无"
exposure_level: "低/中/高"
操作说明: 将 Risk、Ambiguity、eXposure 三个维度的评估结果填入 RAX 矩阵,判定每个场景的整体状态(安全/可接受/需改进/危险)。按优先级排序:先处理危险场景,再处理需改进场景。
输出物:
rax_matrix:
场景A:
risk_level: "高"
exposure_level: "中"
ambiguity_level: "低"
overall_status: "需改进"
priority: "高"
操作说明: 针对每个高优先级场景,从三条路径(降低 P、降低 C、降低 I)设计具体缓解策略。优先考虑降低 I(设计撤销/恢复机制),因为这是 AI 时代最具杠杆效应的路径。
输出物:
mitigation:
场景A:
降低P: ["策略1", "策略2"]
降低C: ["人工复核机制", "降级策略"]
降低I: ["延迟窗口", "快速撤销", "确认环节"]
critical_actions: ["立即要做的"]
场景描述: 蚂蚁集团智能风控系统每天处理数亿笔交易,识别欺诈行为。系统曾将普通用户标记为欺诈嫌疑人,账户被冻结 72 小时,用户无法付款、转账、买高铁票。需要系统性评估该系统的 RAX 风险。
用户输入:
产品: 智能风控系统
场景: 实时交易风控,自动冻结可疑账户
用户: 普通消费者
已知问题: 存在误伤正常用户的情况,冻结后申诉流程耗时长
执行流程:
场景枚举:
Risk Exposure 评估:
场景A(欺诈拦截):
P = 0.02(2% 误拦截率,分场景统计)
C = 6(用户无法完成支付,错过促销时机)
I = 0.4(可通过客服申诉恢复,但损失已部分发生)
RE = 0.02 × 6 × 0.4 = 0.048
场景B(账户冻结):
P = 0.005(0.5% 误冻率)
C = 8(用户完全无法使用账户,影响出行和支付)
I = 0.7(申诉需数天,期间损失无法弥补)
RE = 0.005 × 8 × 0.7 = 0.028
Ambiguity 评估:
eXposure 评估:
RAX 综合判定:
场景A: Risk=中, Ambiguity=高, eXposure=高 → 需改进
场景B: Risk=高, Ambiguity=高, eXposure=高 → 危险
输出结果:
rax_assessment:
product: "智能风控系统"
risk_exposure:
欺诈拦截:
P: "2% 误拦截率"
C: "6/10 - 支付中断"
I: "0.4 - 可申诉恢复"
RE: 0.048
level: "中"
账户冻结:
P: "0.5% 误冻率"
C: "8/10 - 完全无法使用"
I: "0.7 - 损失已部分发生"
RE: 0.028
level: "高"
overall_status: "需改进"
recommendations:
critical:
- "账户冻结前增加二次确认环节(降低 I)"
- "冻结时提供即时申诉入口(降低 I)"
high:
- "引入'观察模式'替代直接冻结(降低 C)"
- "向用户透明展示触发冻结的原因(降低 Ambiguity)"
medium:
- "建立分层风控策略,区分高/中/低风险交易(降低 P)"
场景描述: 百度萝卜快跑在武汉运营自动驾驶出租车。需要评估自动驾驶系统在城市复杂路况下的 RAX 风险,为运营策略提供依据。
用户输入:
产品: 萝卜快跑自动驾驶出租车
场景: 城市道路载客运营
用户: 乘客(无驾驶能力)
已知问题: 复杂路况下偶有碰撞事故,公众对安全性存疑
执行流程:
场景枚举:
Risk Exposure 评估:
场景A(常规行驶):
P = 0.0001(每百万英里约 0.1 次需安全员接管)
C = 8(涉及乘客人身安全)
I = 0.95(事故后果几乎不可逆)
RE = 0.0001 × 8 × 0.95 = 0.00076
场景B(复杂路口):
P = 0.001(接管频率显著上升)
C = 9(高风险场景)
I = 0.95
RE = 0.001 × 9 × 0.95 = 0.00855
RAX 综合判定:
场景A: Risk=高(I高), Ambiguity=中, eXposure=高 → 需改进
场景B: Risk=极高, Ambiguity=中, eXposure=高 → 危险
输出结果:
rax_assessment:
product: "萝卜快跑自动驾驶"
risk_exposure:
常规行驶:
P: "0.01%"
C: "8/10"
I: "0.95"
RE: 0.00076
level: "高"
复杂路口:
P: "0.1%"
C: "9/10"
I: "0.95"
RE: 0.00855
level: "极高"
overall_status: "需改进(场景A)/ 危险(场景B)"
recommendations:
critical:
- "复杂路口区域降速运行(降低 C)"
- "保留安全员或远程监控机制(降低 C + I)"
high:
- "限制运营区域,避开高风险路段(降低 P)"
- "设计渐进式降级策略:检测到超出能力范围时自动减速靠边(降低 I)"
medium:
- "建立实时风险监控仪表盘,动态调整运营策略"
场景描述: 某内容平台使用 AI 推荐算法向用户推送个性化内容。用户长期被投喂单一观点,认知框架逐渐固化。需要评估推荐算法在认知影响维度的 RAX 风险。
用户输入:
产品: AI 内容推荐引擎
场景: 个性化内容推送
用户: 普通用户
已知问题: 用户反馈"看到的内容越来越同质化"
执行流程:
Risk Exposure 评估:
场景(信息茧房):
P = 0.8(高概率持续推送同质内容)
C = 5(认知能力退化、观点极化,长期累积)
I = 0.8(认知一旦形成极难改变,不可逆性高)
RE = 0.8 × 5 × 0.8 = 3.2(相对高风险)
RAX 综合判定:
输出结果:
rax_assessment:
product: "AI 内容推荐引擎"
risk_exposure:
信息茧房:
P: "80% 持续推送同质内容"
C: "5/10 - 认知退化(长期累积)"
I: "0.8 - 认知固化不可逆"
RE: 3.2
level: "高"
overall_status: "需改进"
recommendations:
critical:
- "提供'关闭推荐'选项,让用户回归时间线(降低 eXposure)"
high:
- "引入多样化推荐机制,主动推送异质内容(降低 P)"
- "展示推荐逻辑透明度,让用户知道为什么看到这些内容(降低 Ambiguity)"
medium:
- "定期推送'信息茧房报告',让用户了解自己的内容消费结构"
note: >
这些功能帮助用户在事前和事中调整信息摄入(降低 C),
但一旦认知固化已经发生,这些功能并不能逆转用户的认知框架(I 的局限)。
降低 C ≠ 降低 I,两者需要区分对待。
RAX 的核心不是消除风险,而是让风险可见、可管理、可接受。