一键在 Manus 中运行任何 Skill

observability

星标97

分支7

更新时间2026年4月17日 16:04

OpenTelemetry, distributed tracing, structured logging, metrics (Prometheus, Grafana, Datadog). Use when implementing monitoring, tracing, or debugging production issues.

安装

用 Codex 或 Claude 帮你安装复制这段 Prompt，粘贴到 Codex、Claude 或其他助手里，让它检查 Skill 页面并帮你完成安装。

在 Manus 中运行

来源

TheBeardedBearSAS

TheBeardedBearSAS/claude-craft

打开 GitHub 仓库查看创作者相关仓库

下载

在 Manus 中运行

Observability — OpenTelemetry & Distributed Tracing

Instrumentation moderne avec OpenTelemetry pour métriques, traces et logs structurés.

Piliers de l'Observabilité

Pilier	Technologies	Métriques clés
Metrics	Prometheus, Grafana, Datadog	RED (Rate, Errors, Duration), USE (Utilization, Saturation, Errors)
Traces	OpenTelemetry, Jaeger, Tempo	P95 latency, span duration, error rate
Logs	Loki, ElasticSearch, Datadog	Structured JSON, correlation IDs

OpenTelemetry (OTel) Stack

// Node.js — Auto-instrumentation
const { NodeSDK } = require('@opentelemetry/sdk-node');
const { getNodeAutoInstrumentations } = require('@opentelemetry/auto-instrumentations-node');

const sdk = new NodeSDK({
  traceExporter: new OTLPTraceExporter(),
  instrumentations: [getNodeAutoInstrumentations()],
});

sdk.start();

Golden Signals (Google SRE)

Signal	Description	Seuil typique
Latency	P50, P95, P99 response time	P95 < 200ms
Traffic	Requests per second	Baseline + alerting
Errors	Error rate (5xx, exceptions)	< 0.1%
Saturation	CPU, Memory, Disk	< 80% sustained

Structured Logging (JSON)

{
  "timestamp": "2026-04-17T10:30:00Z",
  "level": "error",
  "message": "Payment processing failed",
  "trace_id": "4bf92f3577b34da6a3ce929d0e0e4736",
  "span_id": "00f067aa0ba902b7",
  "service.name": "payment-api",
  "error.type": "PaymentGatewayTimeout"
}

SLI / SLO / SLA

Concept	Exemple
SLI (Indicator)	99.5% requests < 200ms
SLO (Objective)	99.9% uptime mensuel
SLA (Agreement)	99.95% uptime + pénalités

Pour instrumentation détaillée par stack : invoquer @observability-engineer

同仓库更多 Skills

同仓库

docker-hadolint

TheBeardedBearSAS/claude-craft

Docker & Hadolint validation (2026). Use when working with Docker, containers, or validating Dockerfiles.

2026-06-0997

security

TheBeardedBearSAS/claude-craft

Security guidelines and OWASP Top 10. Use when reviewing security, implementing authentication or authorization, hardening code, or discussing vulnerabilities.

2026-06-0997

ecosystem-tools

TheBeardedBearSAS/claude-craft

Third-party Claude Code token/context/code-review tools. Use when choosing or recommending an external tool to reduce token usage, manage context, or review large codebases (caveman, code-review-graph, token-savior, context-mode...).

2026-06-0297

ecosystem-tools

TheBeardedBearSAS/claude-craft

Third-party Claude Code token/context/code-review tools. Use when choosing or recommending an external tool to reduce token usage, manage context, or review large codebases.

2026-06-0297

testing-flutter

TheBeardedBearSAS/claude-craft

Testing Flutter 3.44 / BLoC v9 / Riverpod 3 - Stratégie Complète. Use when writing tests, reviewing test coverage, or setting up testing.

2026-06-0297

testing-reactnative

TheBeardedBearSAS/claude-craft

Testing React Native 0.85+. Use when writing tests, reviewing test coverage, or setting up testing.

2026-06-0297

name	observability
description	OpenTelemetry, distributed tracing, structured logging, metrics (Prometheus, Grafana, Datadog). Use when implementing monitoring, tracing, or debugging production issues.
triggers	{"files":["*/otel","*/prometheus","*/grafana","*/jaeger","*/tempo","*/loki"],"keywords":["opentelemetry","otel","tracing","distributed tracing","prometheus","grafana","datadog","structured logging","metrics","observability","monitoring","SLI","SLO","golden signals"]}
auto_suggest	true

Observability — OpenTelemetry & Distributed Tracing

Instrumentation moderne avec OpenTelemetry pour métriques, traces et logs structurés.

Piliers de l'Observabilité

Pilier	Technologies	Métriques clés
Metrics	Prometheus, Grafana, Datadog	RED (Rate, Errors, Duration), USE (Utilization, Saturation, Errors)
Traces	OpenTelemetry, Jaeger, Tempo	P95 latency, span duration, error rate
Logs	Loki, ElasticSearch, Datadog	Structured JSON, correlation IDs

OpenTelemetry (OTel) Stack

// Node.js — Auto-instrumentation
const { NodeSDK } = require('@opentelemetry/sdk-node');
const { getNodeAutoInstrumentations } = require('@opentelemetry/auto-instrumentations-node');

const sdk = new NodeSDK({
  traceExporter: new OTLPTraceExporter(),
  instrumentations: [getNodeAutoInstrumentations()],
});

sdk.start();

Golden Signals (Google SRE)

Signal	Description	Seuil typique
Latency	P50, P95, P99 response time	P95 < 200ms
Traffic	Requests per second	Baseline + alerting
Errors	Error rate (5xx, exceptions)	< 0.1%
Saturation	CPU, Memory, Disk	< 80% sustained

Structured Logging (JSON)

{
  "timestamp": "2026-04-17T10:30:00Z",
  "level": "error",
  "message": "Payment processing failed",
  "trace_id": "4bf92f3577b34da6a3ce929d0e0e4736",
  "span_id": "00f067aa0ba902b7",
  "service.name": "payment-api",
  "error.type": "PaymentGatewayTimeout"
}

SLI / SLO / SLA

Concept	Exemple
SLI (Indicator)	99.5% requests < 200ms
SLO (Objective)	99.9% uptime mensuel
SLA (Agreement)	99.95% uptime + pénalités

Pour instrumentation détaillée par stack : invoquer @observability-engineer