en un clic
smart-data-analysis
// 数据分析员工(Data Analyst Agent)的唯一总入口:凡与数据资产、取数、指标、表/视图、 治理职责、知识网络等相关的问题,必须先经本 skill 做编排与路由,再进入找表或问数等子流程。 当用户提出数据类问题、需要知识网络选择、或需要在找表与问数之间切换时使用。
// 数据分析员工(Data Analyst Agent)的唯一总入口:凡与数据资产、取数、指标、表/视图、 治理职责、知识网络等相关的问题,必须先经本 skill 做编排与路由,再进入找表或问数等子流程。 当用户提出数据类问题、需要知识网络选择、或需要在找表与问数之间切换时使用。
| name | smart-data-analysis |
| version | 1.0.0 |
| user-invocable | true |
| description | 数据分析员工(Data Analyst Agent)的唯一总入口:凡与数据资产、取数、指标、表/视图、 治理职责、知识网络等相关的问题,必须先经本 skill 做编排与路由,再进入找表或问数等子流程。 当用户提出数据类问题、需要知识网络选择、或需要在找表与问数之间切换时使用。 |
| metadata | {"openclaw":{"skillKey":"smart-data-analysis"}} |
| allowed-tools | Bash(kweaver *), Bash(npx kweaver *) |
| argument-hint | ["数据任务描述,可包含 kn_id、时间范围、指标口径"] |
本 skill 是数据分析员工的唯一前门,负责编排与路由,不直接替代找表与问数子流程。
子技能参考:
references/smart-ask-data.mdreferences/smart-search-tables.mdreferences/smart-apply-data-auth.mdreferences/smart-reporting.mdreferences/smart-json2plot.mdreferences/smart-data-insights.md(含归因子场景 references/attribution_analysis.md)search_schema HTTP):references/search-schema-scripts.mdassets 索引(报告三场景填空模版 + 解读规范入口):见 assets/README.md。
smart-search-tables:找表/找视图/找字段/找职责smart-ask-data:问数(第 10 步按查询类型分流执行;仅 complex_query 走 SQL,返回数据结果与口径)smart-apply-data-auth:为指定数据视图申请 data_query/view_detail 权限smart-json2plot:画图数据转换(仅消费上游结构化数据,不新增取数)smart-data-interpretation(data_interpretation):基于既有取数结果做趋势/异常/贡献/建议解读(不新增取数)smart-reporting:将既有找数/问数/归因结果组装为可复核报告(不新增取数)smart-data-insights:当用户要求「解读数据/趋势/异常/贡献/建议」或「多角度/多维度/分布」或「对比/同比/环比」或「归因/根因/为什么/MECE 证据链」等时使用;若用户同轮要求 归因分析报告 书面终态,须在洞察(含归因子场景)交付证据包后 同轮 衔接 smart-reporting(attribution_analysis_report)。kn_id、时间范围、过滤条件、业务口径。SOUL.md 为准。smart-search-tables 与 smart-ask-data、 smart-data-insights使用的 kn_id 必须来自 SOUL.md 已声明配置。complex_query 场景产生 SQL(内部执行且不对用户展示);不得扩写为主观分析结论。目标:确认当前环境可执行 KWeaver 命令。
kweaver 是否安装可用(如 kweaver --version 可正常返回)。kweaver 版本必须满足 >= 0.7.2。0.7.2:立即停止后续流程,并明确提示用户先升级 kweaver 到 0.7.2 或更高版本后再继续。目标:确保本 skill 的运行配置可用(含知识网络配置、kn_id 上下文)并完成约束注入。
SOUL.md 可读取且包含可用 kn_id 声明。SOUL.md 确认本次请求可用的 kn_id 与上下文(时间、过滤、口径)。kn_id 在平台中是否真实存在且可访问;若 kn_id 不存在或不可用,必须提示用户先配置或创建知识网络(并补充有效 kn_id)后再继续。SOUL.md、KN 必须声明、问数按第 10 步分流执行并返回结果+口径等)。目标:根据用户问题进行分流。
smart-data-insights(其内部再按 smart-ask-data 第 5~9 步完成取数),不得仅因为出现“查/统计/汇总/多少”等词就路由到 smart-ask-data。smart-ask-data(按问数流程执行,不进入 smart-data-insights)。smart-json2plot。smart-data-insights(启用 references/attribution_analysis.md 等对应子场景模板)smart-ask-datasmart-ask-data。smart-data-insights。smart-data-insights(其内完成取数并输出洞察)。smart-ask-data。smart-ask-data。smart-data-insights。smart-search-tablessmart-reportingsmart-json2plot(参考 references/smart-json2plot.md)smart-ask-data 之前,若用户问题中已出现或可唯一定义的公历日期或日期区间(自然语言如「某年某月某日」「A 到 B」等),须先做日历合法性校核。若出现不存在的月日、不存在的公历日(如 13 月、非闰年的 2 月 29 日等,按公历规则判定)或区间不合法(上界早于下界、开闭与业务冲突且无法自洽等),立即终止总入口后续步,不得进入子流程,并向用户点名无效处及建议改法;在日期/区间无法识别为需要校验时,可不在此步作实质校核。本步是问数在平台侧的首道日期门闸,与 smart-ask-data 第 10 步查询数据校验配合(dsl_query/metric_aggregation/complex_query,simple_aggregation 为兼容别名;见 references/smart-ask-data.md 第 10 步)。目标:将总入口门禁与子流程门禁打通,避免重复编号和跳号。
smart-ask-data 时,继续执行其第 5-11 步(第 5 步为“检查知识网络”)。
kn_id_ask_data(明细条件查询)为必校验;kn_id_metric(指标聚合/同环比)仅在命中指标分支时必校验。命中分支所需网络需通过 kweaver bkn get 后再进入第 6 步。smart-search-tables 时,继续执行其第 5-10 步(第 5 步为“确认知识网络”,第 6 步使用 kweaver context-loader query-object-instance <知识网络id> <查询命令>)。smart-data-interpretation(或 data_interpretation)时:令 S 为进入解读前已完成的最后一步编号,继续执行 7 个解读步,全局为 第 S+1 步至第 S+7 步(不得固定写死为第 5–11 步)。smart-data-insights 时:令 S 为进入解读前已完成的最后一步编号,继续执行 7 个解读步,全局为 第 S+1 步至第 S+7 步(不得固定写死为第 5–11 步)。常见:仅总入口后自备证据直解读(S=4)→ 第 5–11 步;接找数完结(S=11)→ 第 12–18 步;接问数完结(S=13)→ 第 14–20 步。smart-reporting 时:令 S 为进入报告前已完成的最后一步编号,继续执行 6 个报告步,全局为 第 S+1 步至第 S+6 步(不得固定写死为第 5–10 步)。常见:接问数完结(S=13)→ 第 14–19 步;接找数完结(S=11)→ 第 12–17 步;仅总入口后自备证据直出报告(S=4)→ 第 5–10 步。smart-reporting 的最后一步为 S+6(其中 S 的定义见「子流程衔接」中 smart-reporting 条)。推荐模板:
## 📋 任务进度清单(阶段:总控制台)
- [ ] 已完成 · 步骤N(步骤名称)
- [ ] 待完成 · 步骤N+1(步骤名称)
步骤 1/2 复用前文结果时、以及进入子流程后,均继续使用同一“任务进度清单”模板(仅更新“已完成步骤、待完成步骤”两项)。
## 📋 任务进度清单(阶段:问数)
- [x] 已完成 · 步骤8(校验候选表数据查询权限)
- [ ] 进行中 · 步骤9(获取候选表详情)
- [ ] 待完成 · 步骤10(查询数据)
- [ ] 待完成 · 步骤11(画图需求分支)
- [ ] 待完成 · 步骤12(总结结果)
smart-search-tables)当用户目标是定位数据资产时进入该分支,例如:
交付形态:候选表/视图/字段/职责信息,不直接代替问数结果。
smart-ask-data)当用户目标是查询具体数据时进入该分支,例如:
交付形态:查询结果 + 最小口径说明(时间、过滤、数据来源);仅 complex_query 在内部生成并执行 SQL,且不对用户展示 SQL 原文。
若用户需求超出已接入分支能力(例如要求脱离证据的主观判断、无法复核的推断、或需要外部系统能力),需明确告知边界并引导用户收敛为「找表」「可 SQL 表达的问数」「数据洞察(解读/维度/对比/归因等子场景,见 references/smart-data-insights.md)」或「基于既有证据的报告(smart-reporting)」。
smart-data-insights)当用户要求「解读数据/趋势/异常/贡献/建议」或「多角度/多维度/分布」或「对比/同比/环比的分析解读」或「归因/根因/为什么/MECE 证据链」等洞察型输出时进入该分支:
smart-data-insights(其内部按新版 smart-ask-data 第 5~9 步完成取数,再按模板合成洞察;归因子场景见 references/attribution_analysis.md)。smart-ask-data 最终交付原文(每段含 kn_id、原样 SQL、原样结果、最小口径),或已提供与 attribution_analysis_report 输入契约一致的归因证据包,且明确“不再新取数/不要重新查库/仅基于以下结果…” → 仍路由到 smart-data-insights,走其模式 B降级路径。交付形态:洞察摘要 + 证据口径 +(数据解读 / 维度分析 / 对比分析 / 归因分析 章节按需)+ 建议 + 局限与下一步;取数时需包含「原样 SQL + 原样结果 + 最小口径」作为可复核证据。若同轮要求归因报告终态,证据包就绪后须衔接 smart-reporting(attribution_analysis_report)。
smart-reporting)当用户需要将已有找数/问数/归因结果整理为标准报告时进入该分支。
交付形态:标准报告框架(口径、证据、结论、限制、下一步),仅复用输入证据,不新增取数。
smart-json2plot)当用户仅要求将已有结构化数据转换为图表数据(柱状图/饼图/折线图/散点图),且不包含找数、问数、洞察、报告意图时进入该分支。
交付形态:Markdown + 标识符的图表数据对象(不执行查询、不直接出图,参考 references/smart-json2plot.md)。
/smart-data-analysis 查企业基本信息相关表
/smart-data-analysis 查询近30天个体工商户数量
/smart-data-analysis 用 d71o5e1e8q1nr9l7mb80 查询快讯传媒有限公司住址
数据权限管理技能:支持资源权限查询与权限申请。 先判定“查询权限”还是“申请权限”,再按资源类型执行对应接口。 当用户提出“申请权限”、“查是否有权限”、“给某资源授权”时使用。
向飞书指定用户(通过 user_id)推送消息。 支持文本、卡片、图片、文件等多种消息类型。当用户需要给飞书用户发送推送消息时自动使用。
全局归档协议。只要任务需要写入任何文件(含 PLAN.md、报告、JSON 等归档物),必须按本技能执行 Session→ARCHIVE_ID、TIMESTAMP、双轨路径(根段须为 archives/)、回读校验与状态回执;WebUI 的 archive_grid 必须用 Markdown 中语言标识为 json 的围栏代码块输出。
KWeaver CLI 操作层 — 内化自 kweaver-core。 覆盖认证、平台业务域(config)、知识网络管理与查询、Agent CRUD 与对话、 数据源管理、数据视图、Skill 注册、Vega 可观测、context-loader 语义搜索、通用 API 调用。 仅由 bkn-creator pipeline 内部读取,不独立注册到宿主 skill 系统。
BKN 全生命周期编排入口。自包含 KWeaver CLI 操作层(内化 bkn-kweaver)。 凡涉及创建 BKN、从 PRD/文档提取对象关系、 生成或更新 `.bkn`、做数据视图绑定、环境检查、测试集生成、校验与推送时, 优先使用 bkn-creator 进行流程路由、阶段门禁、子 skill 编排与结果回执。 适用于 BKN 的 create/read/update/delete/extract/copy/validate 场景, 技能包能力补齐/skill 草案生成场景, 以及使用反馈巡检与改进场景(定时任务触发、Agent 对话质量异常、 feedback_brief 传入、知识网络持续优化)。 不应用于纯数据语义查询,该场景应交由 data-semantic 处理。
评分式领域识别。从业务文本判断所属领域。