with one click
obdiag-multi-cluster
// 标准 SOP:多集群发现 list_obdiag_clusters、当前会话 show_current_cluster、/use 切换与 cluster_config_path 定向。多套 ~/.obdiag/*.yml、切换默认集群、或一句话点名某集群时使用。
// 标准 SOP:多集群发现 list_obdiag_clusters、当前会话 show_current_cluster、/use 切换与 cluster_config_path 定向。多套 ~/.obdiag/*.yml、切换默认集群、或一句话点名某集群时使用。
备份、日志归档、物理恢复、恢复时间窗、NFS/OSS/COS 归档路径、对象存储权限、备租户恢复源、ob_admin 读取归档位点、oblogminer schema_meta 等问题;OMS 迁移同步问题不使用本 skill。
标准 SOP:集群巡检 check_cluster/check_list 与 RCA 入口(rca_run/rca_list)。用户要健康检查、巡检时使用;RCA 场景映射与手动降级详见 obdiag-rca skill;与 observer-log-analysis、observer-sql-analysis、obproxy-log-analysis 分工明确。
性能类采集与主机 IO:ASH、AWR、perf 火焰图、sysstat、磁盘 IO。在用户说卡顿、慢、会话堆积、要看 ASH/AWR/火焰图或主机负载时使用;与 observer-sql-analysis、observer-log-analysis 互补。
OceanBase 集群所有根因分析场景的统一 SOP。覆盖事务超时/回滚/断连、内存不足、合并卡住、日志盘满、DDL 失败、Schema 泄漏、GC 异常、弱一致性读、OMS 等。始终先执行 rca_run,如 RCA 脚本无法给出结论再按本 skill 降级到手动日志采集分析。
未知/未分类问题的统一分诊 SOP:用户描述集群异常但症状不明确、不知从何入手,或问题无法直接对应 rca/observer-log-analysis/observer-sql-analysis 等专项 skill 时,强制先执行全量巡检 check_cluster,再根据巡检结果决定下一步路径。
obdiag agent 工具使用指南:配置文件生成、gather/analyze/check/rca 各命令的调用方式、参数说明与典型场景。用户询问"怎么用 obdiag"、"如何采集日志"、"怎么生成配置"、"如何巡检/根因分析",或 agent 自身不确定该调哪个工具时加载本 skill。
| name | obdiag-multi-cluster |
| description | 标准 SOP:多集群发现 list_obdiag_clusters、当前会话 show_current_cluster、/use 切换与 cluster_config_path 定向。多套 ~/.obdiag/*.yml、切换默认集群、或一句话点名某集群时使用。 |
cluster_config_path,避免误操作默认集群| 工具 | 作用 |
|---|---|
list_obdiag_clusters | 列出 ~/.obdiag/ 下发现的集群配置文件(短名与路径) |
show_current_cluster | 当前会话 活跃 的 config_path 及解析结果 |
/use 还是只传 cluster_config_path?| 用户诉求 | 推荐 |
|---|---|
| 一次性对 obdiag_test 做 gather/check,不改会话默认 | 各工具传 cluster_config_path="obdiag_test",不必 /use。 |
之后 check_list / rca_list 也要针对 另一套 集群 | 先 /use(短名或 yml 完整路径)切换会话活跃配置,再 list(因 list 无 cluster_config_path)。 |
| 用户明确说 以后默认用生产 | 在 agent 里执行 /use 加短名或完整路径切换。 |
| 同一轮对话里 两个集群交替操作 | 每个工具调用带对的 cluster_config_path,勿混用上一轮假设。 |
list_obdiag_clusters,再 show_current_cluster 确认默认值。cluster_config_path="obdiag_test"(或完整路径);无需先切换,除非用户明确要求改会话默认。/use <短名|完整路径>(行首斜杠内置命令)切换活跃集群;切换后 check_list / rca_list 等依赖当前配置的列表会与新区一致。cluster_config_path 规则(与实现一致)obdiag_test → 解析为 ~/.obdiag/obdiag_test.yml(可带或不带 .yml 后缀,按解析逻辑)绝大多数 obdiag 工具(gather_*、check_cluster、rca_run、analyze_log、db_query 等)都支持 cluster_config_path。
check_list、rca_list 没有 cluster_config_path 参数,它们读取 当前会话 的 config_path。要看 另一集群 的清单时:先 /use 切换,或告知用户当前列表对应的是 哪一个配置文件。cluster_config_path,不要依赖上一轮残留假设。query_oceanbase_knowledge_base;多集群只影响 对哪套环境跑命令,不改变知识库用法。完成标准:用户已知 有哪些配置、当前默认是哪套、下一步操作应带 cluster_config_path 还是已 /use。
自检:
check_list/rca_list 时是否已 /use 或说明限制?cluster_config_path?