一键在 Manus 中运行任何 Skill

flux-operations

星标0

分支0

更新时间2026年2月12日 15:14

Diagnose and manage Flux CD across all 3 clusters (Ottawa, Robbinsdale, StPetersburg). Multi-cluster Flux management including source health, kustomization status, HelmRelease debugging, and reconciliation operations. Use when: You need to check or fix Flux across multiple clusters, diagnose cross-cluster Flux issues, force reconcile across all clusters, or manage suspended resources. This is the multi-cluster Flux skill. Don't use when: Debugging Flux for the OpenClaw namespace specifically (main agent's flux-debugging skill handles that). Don't use for pod-level issues after Flux applies successfully (use pod-troubleshooting). Don't use for making code/manifest changes (use pr-workflow). Outputs: Flux status report across all clusters, or targeted diagnosis of a specific Flux failure with remediation commands.

安装

用 Codex 或 Claude 帮你安装复制这段 Prompt，粘贴到 Codex、Claude 或其他助手里，让它检查 Skill 页面并帮你完成安装。

在 Manus 中运行

来源

rajsinghtech

rajsinghtech/openclaw-workspace

打开 GitHub 仓库查看创作者相关仓库

下载

在 Manus 中运行

Flux Operations

Routing

Use This Skill When

Checking Flux health across all 3 clusters
A kustomization or HelmRelease is failing on any cluster
Investigating why a GitOps change isn't being applied
Force-reconciling resources across clusters
Debugging SOPS, dependency, or source fetch issues
Heartbeat health check includes Flux status

Don't Use This Skill When

The issue is specifically the OpenClaw pod's Flux kustomization → the main agent has flux-debugging for that
A pod is crashing after Flux successfully applied → use pod-troubleshooting
You need to make manifest changes → use pr-workflow
Ceph/storage is the issue → use storage-ops
You need a full health scan (nodes, pods, certs, etc.) → use cluster-health

Cluster Contexts

⚠️ Always use --context <ctx> — never rely on current-context.

Cluster	Context
Ottawa	`talos-ottawa`
Robbinsdale	`talos-robbinsdale`
StPetersburg	`talos-stpetersburg`

Diagnostic Chain

Run these in order to trace Flux issues from source to workload:

1. Sources

flux --context <ctx> get sources git -A
flux --context <ctx> get sources helm -A
flux --context <ctx> get sources oci -A

Check all sources are fetching successfully
Note last fetch time — stale fetches (>10m old) indicate connectivity issues

2. Kustomizations

flux --context <ctx> get kustomizations -A

Identify any with Ready: False
Check the message field for the error

3. HelmReleases

flux --context <ctx> get helmreleases -A

Identify any with Ready: False or Suspended: True
For failed releases: check Helm history with helm --kube-context <ctx> history <release> -n <ns>

4. Events

kubectl --context <ctx> get events -n flux-system --sort-by='.lastTimestamp' | tail -30

Look for reconciliation errors, auth failures, or timeout events

Common Failures

Stale GitRepository Source

Symptom: Source shows old revision, kustomizations not updating Diagnosis:

flux --context <ctx> get sources git -A
kubectl --context <ctx> describe gitrepository <name> -n flux-system

Fix: Force reconcile flux --context <ctx> reconcile source git <name> -n flux-system

SOPS Decryption Error

Symptom: Kustomization fails with "decryption failed" or "unable to decrypt" Diagnosis:

flux --context <ctx> get kustomization <name> -n flux-system
kubectl --context <ctx> logs -n flux-system deploy/kustomize-controller --tail=30 | grep -i sops

Fix: This is a secrets issue — escalate to user. Dyson cannot fix SOPS problems.

Dependency Not Ready

Symptom: Kustomization shows "dependency not ready" Diagnosis:

flux --context <ctx> get kustomization <name> -A -o json | jq '.items[].spec.dependsOn'

Fix: Trace the dependency chain and fix the root kustomization first.

Substitution Variable Missing

Symptom: "variable not found" or rendered manifest has literal ${VAR} Diagnosis:

kubectl --context <ctx> get configmap -n flux-system cluster-settings -o yaml
kubectl --context <ctx> get configmap -n flux-system common-settings -o yaml

Fix: Check if the variable is defined in the expected ConfigMap. Open PR to add missing variable.

HelmRelease Upgrade Failed

Symptom: HelmRelease stuck in "upgrade retries exhausted" Diagnosis:

helm --kube-context <ctx> history <release> -n <ns>
kubectl --context <ctx> describe helmrelease <name> -n <ns>

Fix: Often resolved by bumping the chart version or fixing values. Open PR with the fix.

Operations

Force Reconcile

# Reconcile a specific kustomization with its source
flux --context <ctx> reconcile kustomization <name> -n flux-system --with-source

# Reconcile all kustomizations
flux --context <ctx> get kustomizations -A --no-header | awk '{print $1, $2}' | while read ns name; do
  flux --context <ctx> reconcile kustomization "$name" -n "$ns"
done

Suspend / Resume

Use sparingly — only for debugging or temporarily blocking reconciliation:

flux --context <ctx> suspend kustomization <name> -n <ns>
flux --context <ctx> resume kustomization <name> -n <ns>

Check Flux Controllers

kubectl --context <ctx> get pods -n flux-system
kubectl --context <ctx> logs -n flux-system deploy/source-controller --tail=20
kubectl --context <ctx> logs -n flux-system deploy/kustomize-controller --tail=20
kubectl --context <ctx> logs -n flux-system deploy/helm-controller --tail=20

Compaction Notes

When checking Flux across all 3 clusters:

mkdir -p /tmp/outputs before writing any artifacts
Write per-cluster findings to /tmp/outputs/flux-status-<cluster>.md to preserve state across compaction boundaries.

Security Notes

Never expose SOPS keys or decrypted secret content in reports
Flux controller logs may contain sensitive resource names — sanitize before sharing
Suspended resources should be resumed promptly — forgotten suspensions cause drift

同仓库更多 Skills

同仓库

code-review

rajsinghtech/openclaw-workspace

Structured PR review — security scan, correctness, consistency, style. Covers diff analysis, comment posting via gh, and priority-based finding reports. Use when: A PR needs review, someone asks for code feedback, or changes need security/correctness validation before merge. Also use for pre-commit review of your own changes. Don't use when: The issue is a runtime pod failure (use pod-troubleshooting), a Flux reconciliation error (use flux-debugging), or a CI build failure (use ci-diagnosis). Don't use for architecture-level design discussions (use architecture-design instead). Outputs: Review comment posted on the PR via `gh pr review`, or a structured findings report grouped by severity (Critical/High/Medium/Low).

2026-02-200

openspec-workflow

rajsinghtech/openclaw-workspace

Spec-driven development workflow — proposals, requirements, design docs, task breakdowns, and implementation using the OpenSpec framework. Use when: Starting a new feature or change that needs planning, someone says "I want to build X", creating proposals or specs, breaking down requirements into tasks, or transitioning from planning to implementation. Don't use when: Debugging or troubleshooting (use appropriate troubleshooting skill). Don't use for Kubernetes manifest changes (use pr-workflow). Don't use for reviewing existing code (use code-review). Outputs: OpenSpec change folder with proposal.md, specs/, design.md, and tasks.md. Implementation follows directly from tasks.md.

2026-02-200

session-review

rajsinghtech/openclaw-workspace

Analyze agent sessions for tool failures, retry patterns, knowledge gaps, context limits, and config drift. Use when: Running periodic session reviews (cron), investigating agent reliability issues, looking for recurring failure patterns, or identifying workspace improvements from real usage. This is the primary skill for Robert's review cron job. Don't use when: You're making changes to fix issues (use workspace-improvement for that). Don't use for live debugging of a current issue (use the appropriate troubleshooting skill). Don't use for code review of PRs (use code-review). Outputs: Session analysis report with categorized findings (tool failures, retries, knowledge gaps, config drift), severity ratings, and proposed fixes. Written to /tmp/outputs/session-review.md for handoff.

2026-02-200

cluster-context

rajsinghtech/openclaw-workspace

OpenClaw pod architecture, volumes, networking, secrets, and provider configuration reference. Use when: Debugging container, mount, networking, or credential issues. Also use when you need to understand pod structure, check which providers are configured, verify volume mounts, or inspect secrets configuration. Don't use when: Debugging pod crashes (use pod-troubleshooting). Don't use for Flux issues (use flux-debugging). Don't use for deploying changes (use gitops-deploy). This is a reference skill, not a diagnostic workflow. Outputs: Architecture reference information. No artifacts — this skill provides context for other skills to use.

2026-02-200

gitops-deploy

rajsinghtech/openclaw-workspace

End-to-end deployment workflow — commit, CI, Flux reconcile, pod restart, verify. Includes ConfigMap changes, Flux postBuild escaping, and SOPS secret management. Use when: You need to deploy changes to the OpenClaw pod — config updates, workspace changes, image rebuilds, or secret rotations. Also use when someone asks "how do I deploy this?" or "push this change live." Don't use when: You're debugging why a deployment failed (use flux-debugging or pod-troubleshooting). Don't use for changes to kubernetes-manifests repo (Dyson's pr-workflow handles that). Don't use for registry/image inspection (use zot-registry). Outputs: Deployed changes verified in the running pod. Confirmation includes CI status, Flux reconciliation state, pod status, and startup logs.

2026-02-200

openclaw-docs-lookup-morty

rajsinghtech/openclaw-workspace

Look up OpenClaw documentation via web_fetch for config validation and verification. Use when: You need to verify a config key, understand OpenClaw configuration options, or check documentation for Kubernetes-specific settings before making changes. Don't use when: The answer is already in CONFIG.md, AGENTS.md, TOOLS.md in your workspace.

2026-02-200

name	Flux Operations
description	Diagnose and manage Flux CD across all 3 clusters (Ottawa, Robbinsdale, StPetersburg). Multi-cluster Flux management including source health, kustomization status, HelmRelease debugging, and reconciliation operations. Use when: You need to check or fix Flux across multiple clusters, diagnose cross-cluster Flux issues, force reconcile across all clusters, or manage suspended resources. This is the multi-cluster Flux skill. Don't use when: Debugging Flux for the OpenClaw namespace specifically (main agent's flux-debugging skill handles that). Don't use for pod-level issues after Flux applies successfully (use pod-troubleshooting). Don't use for making code/manifest changes (use pr-workflow). Outputs: Flux status report across all clusters, or targeted diagnosis of a specific Flux failure with remediation commands.
requires	[]

Flux Operations

Routing

Use This Skill When

Checking Flux health across all 3 clusters
A kustomization or HelmRelease is failing on any cluster
Investigating why a GitOps change isn't being applied
Force-reconciling resources across clusters
Debugging SOPS, dependency, or source fetch issues
Heartbeat health check includes Flux status

Don't Use This Skill When

The issue is specifically the OpenClaw pod's Flux kustomization → the main agent has flux-debugging for that
A pod is crashing after Flux successfully applied → use pod-troubleshooting
You need to make manifest changes → use pr-workflow
Ceph/storage is the issue → use storage-ops
You need a full health scan (nodes, pods, certs, etc.) → use cluster-health

Cluster Contexts

⚠️ Always use --context <ctx> — never rely on current-context.

Cluster	Context
Ottawa	`talos-ottawa`
Robbinsdale	`talos-robbinsdale`
StPetersburg	`talos-stpetersburg`

Diagnostic Chain

Run these in order to trace Flux issues from source to workload:

1. Sources

flux --context <ctx> get sources git -A
flux --context <ctx> get sources helm -A
flux --context <ctx> get sources oci -A

Check all sources are fetching successfully
Note last fetch time — stale fetches (>10m old) indicate connectivity issues

2. Kustomizations

flux --context <ctx> get kustomizations -A

Identify any with Ready: False
Check the message field for the error

3. HelmReleases

flux --context <ctx> get helmreleases -A

Identify any with Ready: False or Suspended: True
For failed releases: check Helm history with helm --kube-context <ctx> history <release> -n <ns>

4. Events

kubectl --context <ctx> get events -n flux-system --sort-by='.lastTimestamp' | tail -30

Look for reconciliation errors, auth failures, or timeout events

Common Failures

Stale GitRepository Source

Symptom: Source shows old revision, kustomizations not updating Diagnosis:

flux --context <ctx> get sources git -A
kubectl --context <ctx> describe gitrepository <name> -n flux-system

Fix: Force reconcile flux --context <ctx> reconcile source git <name> -n flux-system

SOPS Decryption Error

Symptom: Kustomization fails with "decryption failed" or "unable to decrypt" Diagnosis:

flux --context <ctx> get kustomization <name> -n flux-system
kubectl --context <ctx> logs -n flux-system deploy/kustomize-controller --tail=30 | grep -i sops

Fix: This is a secrets issue — escalate to user. Dyson cannot fix SOPS problems.

Dependency Not Ready

Symptom: Kustomization shows "dependency not ready" Diagnosis:

flux --context <ctx> get kustomization <name> -A -o json | jq '.items[].spec.dependsOn'

Fix: Trace the dependency chain and fix the root kustomization first.

Substitution Variable Missing

Symptom: "variable not found" or rendered manifest has literal ${VAR} Diagnosis:

kubectl --context <ctx> get configmap -n flux-system cluster-settings -o yaml
kubectl --context <ctx> get configmap -n flux-system common-settings -o yaml

Fix: Check if the variable is defined in the expected ConfigMap. Open PR to add missing variable.

HelmRelease Upgrade Failed

Symptom: HelmRelease stuck in "upgrade retries exhausted" Diagnosis:

helm --kube-context <ctx> history <release> -n <ns>
kubectl --context <ctx> describe helmrelease <name> -n <ns>

Fix: Often resolved by bumping the chart version or fixing values. Open PR with the fix.

Operations

Force Reconcile

# Reconcile a specific kustomization with its source
flux --context <ctx> reconcile kustomization <name> -n flux-system --with-source

# Reconcile all kustomizations
flux --context <ctx> get kustomizations -A --no-header | awk '{print $1, $2}' | while read ns name; do
  flux --context <ctx> reconcile kustomization "$name" -n "$ns"
done

Suspend / Resume

Use sparingly — only for debugging or temporarily blocking reconciliation:

flux --context <ctx> suspend kustomization <name> -n <ns>
flux --context <ctx> resume kustomization <name> -n <ns>

Check Flux Controllers

kubectl --context <ctx> get pods -n flux-system
kubectl --context <ctx> logs -n flux-system deploy/source-controller --tail=20
kubectl --context <ctx> logs -n flux-system deploy/kustomize-controller --tail=20
kubectl --context <ctx> logs -n flux-system deploy/helm-controller --tail=20

Compaction Notes

When checking Flux across all 3 clusters:

mkdir -p /tmp/outputs before writing any artifacts
Write per-cluster findings to /tmp/outputs/flux-status-<cluster>.md to preserve state across compaction boundaries.

Security Notes

Never expose SOPS keys or decrypted secret content in reports
Flux controller logs may contain sensitive resource names — sanitize before sharing
Suspended resources should be resumed promptly — forgotten suspensions cause drift