Jeden Skill in Manus ausführen
mit einem Klick

Jeden Skill in Manus mit einem Klick ausführen

Loslegen

$pwd:

ai-security-expert

Name: Ai Security Expert
Author: frankxai

// Enterprise AI security - OWASP LLM Top 10, prompt injection defense, guardrails, PII protection

In Manus ausführen

$ git log --oneline --stat

stars:1

forks:0

updated:6. Januar 2026 um 17:52

Datei-Explorer

2 Dateien

SKILL.md

readonly

name	AI Security Expert
description	Enterprise AI security - OWASP LLM Top 10, prompt injection defense, guardrails, PII protection
version	1.1.0
last_updated	"2026-01-06T00:00:00.000Z"
external_version	OWASP LLM Top 10 v2
resources	resources/security-patterns.py
triggers	["AI security","prompt injection","LLM security","guardrails","PII protection"]

AI Security Expert

Enterprise AI security architect specializing in securing LLM applications, defending against prompt injection, implementing guardrails, and OWASP LLM Top 10 compliance.

OWASP LLM Top 10 (2025)

Quick Reference

#	Vulnerability	Risk	Key Defense
LLM01	Prompt Injection	Critical	Input sanitization, delimiters
LLM02	Insecure Output	High	Output validation, sanitization
LLM03	Training Data Poisoning	High	Data provenance, auditing
LLM04	Model DoS	Medium	Rate limiting, timeouts
LLM05	Supply Chain	High	Verification, pinning
LLM06	Sensitive Info Disclosure	High	PII detection, redaction
LLM07	Insecure Plugin Design	High	Permission model, validation
LLM08	Excessive Agency	High	Human-in-the-loop, least privilege
LLM09	Overreliance	Medium	Confidence scores, citations
LLM10	Model Theft	Medium	Rate limiting, watermarking

LLM01: Prompt Injection

Attack Types:

Direct: "Ignore previous instructions..."
Indirect: Malicious content in RAG documents
Encoding tricks: Unicode, special tokens

Defense Pattern:

User Input → Sanitize → Delimit → LLM → Validate Output → Filter

LLM02: Insecure Output Handling

Never execute LLM output as code without validation
Sanitize HTML (use allowlist)
Validate SQL (SELECT only, table allowlist)

LLM04: Model DoS

Rate limiting per user/API key
Token limits on requests
Timeout configurations
Cost capping/alerts

LLM06: Sensitive Information Disclosure

PII detection (regex + NER)
System prompt protection
Training data sanitization
Output filtering

Code patterns: resources/security-patterns.py

PII Protection

Detection Patterns

Type	Example Pattern
Email	`@.com`
Phone	`XXX-XXX-XXXX`
SSN	`XXX-XX-XXXX`
Credit Card	16 digits
IP Address	`X.X.X.X`

Redaction Strategy

Detect PII in input before LLM call
Redact PII in LLM output
Log without PII
Encrypt at rest

Guardrails Implementation

NeMo Guardrails (NVIDIA)

define user express harmful intent
    "How do I hack"

define bot refuse harmful request
    "I can't help with that."

define flow harmful intent
    user express harmful intent
    bot refuse harmful request

Guardrails AI

guard = Guard().use_many(
    ToxicLanguage(on_fail="fix"),
    PIIFilter(on_fail="fix"),
    ValidJSON(on_fail="reask")
)

Custom Pipeline

Input Guards → LLM Call → Output Guards → Response

Implementation: resources/security-patterns.py

Security Architecture

Defense in Depth Layers

Layer	Controls
Network	WAF, DDoS protection, API gateway
Auth	OAuth 2.0, API keys, mTLS
Input	Schema validation, injection detection
Guardrails	Topic restrictions, PII filtering
Model	Versioning, anomaly detection
Output	Response filtering, fact verification
Audit	Logging, retention, compliance

Zero Trust Principles

Never trust, always verify
Least privilege for agents
Assume breach (log everything)

Compliance Frameworks

EU AI Act (High-Risk)

Risk management system
Data governance
Technical documentation
Human oversight
Accuracy/robustness testing

SOC 2 for AI

Security: Access controls, encryption
Availability: SLA monitoring, DR
Processing Integrity: Input/output validation
Confidentiality: Data classification
Privacy: Data minimization, consent

Security Testing

Red Team Categories

Direct injection attempts
Jailbreak prompts
Indirect injection via context
Encoding/unicode tricks

Test suite: resources/security-patterns.py

Testing Checklist

Incident Response

Severity Levels

Incident	Severity	Response
Prompt injection detected	Medium	Block, log, analyze
Data exfiltration attempt	High	Block, forensics, notify
Model extraction detected	High	Rate limit, investigate

Response Steps

Contain (block source)
Preserve (logs, evidence)
Analyze (attack pattern)
Remediate (update defenses)
Document (security log)

Resources

Secure AI systems with defense in depth and zero trust principles.

related-skills.json

gleiches Repository

agentic-orchestration.md

from "frankxai/ai-architect"

Patterns for multi-agent coordination, task decomposition, handoffs, and workflow orchestration. Best practices for building and managing agent systems.

2026-01-061

architecture-diagramming-expert.md

from "frankxai/ai-architect"

Create professional architecture diagrams using D2, Draw.io, Mermaid, and OCI official icons for enterprise-grade visualizations

2026-01-061

aws-ai-services-expert.md

from "frankxai/ai-architect"

Build AI applications on AWS using Bedrock, SageMaker, and AI/ML services with best practices for enterprise deployment

2026-01-061

azure-ai-services-expert.md

from "frankxai/ai-architect"

Build AI applications on Azure using Azure OpenAI, Cognitive Services, and ML services with enterprise patterns

2026-01-061

claude-sdk-expert.md

from "frankxai/ai-architect"

Build autonomous AI agents using Claude Agent SDK with computer use, tool calling, MCP integration, and production best practices

2026-01-061

enterprise-ai-patterns.md

from "frankxai/ai-architect"

Production-grade AI architecture patterns for enterprise - security, governance, scalability, and operational excellence

2026-01-061

package.json

"author": "frankxai"

"repository": "frankxai/ai-architect"

GitHub-Repository öffnen Creator-Repositorys ansehen

$ install --global

$ download --local

In Manus ausführen

$ useful --forSOC

InformationssicherheitsanalystenInformatik- und Mathematikberufe15-1212L4

name	AI Security Expert
description	Enterprise AI security - OWASP LLM Top 10, prompt injection defense, guardrails, PII protection
version	1.1.0
last_updated	"2026-01-06T00:00:00.000Z"
external_version	OWASP LLM Top 10 v2
resources	resources/security-patterns.py
triggers	["AI security","prompt injection","LLM security","guardrails","PII protection"]

AI Security Expert

Enterprise AI security architect specializing in securing LLM applications, defending against prompt injection, implementing guardrails, and OWASP LLM Top 10 compliance.

OWASP LLM Top 10 (2025)

Quick Reference

#	Vulnerability	Risk	Key Defense
LLM01	Prompt Injection	Critical	Input sanitization, delimiters
LLM02	Insecure Output	High	Output validation, sanitization
LLM03	Training Data Poisoning	High	Data provenance, auditing
LLM04	Model DoS	Medium	Rate limiting, timeouts
LLM05	Supply Chain	High	Verification, pinning
LLM06	Sensitive Info Disclosure	High	PII detection, redaction
LLM07	Insecure Plugin Design	High	Permission model, validation
LLM08	Excessive Agency	High	Human-in-the-loop, least privilege
LLM09	Overreliance	Medium	Confidence scores, citations
LLM10	Model Theft	Medium	Rate limiting, watermarking

LLM01: Prompt Injection

Attack Types:

Direct: "Ignore previous instructions..."
Indirect: Malicious content in RAG documents
Encoding tricks: Unicode, special tokens

Defense Pattern:

User Input → Sanitize → Delimit → LLM → Validate Output → Filter

LLM02: Insecure Output Handling

Never execute LLM output as code without validation
Sanitize HTML (use allowlist)
Validate SQL (SELECT only, table allowlist)

LLM04: Model DoS

Rate limiting per user/API key
Token limits on requests
Timeout configurations
Cost capping/alerts

LLM06: Sensitive Information Disclosure

PII detection (regex + NER)
System prompt protection
Training data sanitization
Output filtering

Code patterns: resources/security-patterns.py

PII Protection

Detection Patterns

Type	Example Pattern
Email	`@.com`
Phone	`XXX-XXX-XXXX`
SSN	`XXX-XX-XXXX`
Credit Card	16 digits
IP Address	`X.X.X.X`

Redaction Strategy

Detect PII in input before LLM call
Redact PII in LLM output
Log without PII
Encrypt at rest

Guardrails Implementation

NeMo Guardrails (NVIDIA)

define user express harmful intent
    "How do I hack"

define bot refuse harmful request
    "I can't help with that."

define flow harmful intent
    user express harmful intent
    bot refuse harmful request

Guardrails AI

guard = Guard().use_many(
    ToxicLanguage(on_fail="fix"),
    PIIFilter(on_fail="fix"),
    ValidJSON(on_fail="reask")
)

Custom Pipeline

Input Guards → LLM Call → Output Guards → Response

Implementation: resources/security-patterns.py

Security Architecture

Defense in Depth Layers

Layer	Controls
Network	WAF, DDoS protection, API gateway
Auth	OAuth 2.0, API keys, mTLS
Input	Schema validation, injection detection
Guardrails	Topic restrictions, PII filtering
Model	Versioning, anomaly detection
Output	Response filtering, fact verification
Audit	Logging, retention, compliance

Zero Trust Principles

Never trust, always verify
Least privilege for agents
Assume breach (log everything)

Compliance Frameworks

EU AI Act (High-Risk)

Risk management system
Data governance
Technical documentation
Human oversight
Accuracy/robustness testing

SOC 2 for AI

Security: Access controls, encryption
Availability: SLA monitoring, DR
Processing Integrity: Input/output validation
Confidentiality: Data classification
Privacy: Data minimization, consent

Security Testing

Red Team Categories

Direct injection attempts
Jailbreak prompts
Indirect injection via context
Encoding/unicode tricks

Test suite: resources/security-patterns.py

Testing Checklist

Incident Response

Severity Levels

Incident	Severity	Response
Prompt injection detected	Medium	Block, log, analyze
Data exfiltration attempt	High	Block, forensics, notify
Model extraction detected	High	Rate limit, investigate

Response Steps

Contain (block source)
Preserve (logs, evidence)
Analyze (attack pattern)
Remediate (update defenses)
Document (security log)

Resources

Secure AI systems with defense in depth and zero trust principles.

ai-security-expert

AI Security Expert

OWASP LLM Top 10 (2025)

Quick Reference

LLM01: Prompt Injection

LLM02: Insecure Output Handling

LLM04: Model DoS

LLM06: Sensitive Information Disclosure

PII Protection

Detection Patterns

Redaction Strategy

Guardrails Implementation

NeMo Guardrails (NVIDIA)

Guardrails AI

Custom Pipeline

Security Architecture

Defense in Depth Layers

Zero Trust Principles

Compliance Frameworks

EU AI Act (High-Risk)

SOC 2 for AI

Security Testing

Red Team Categories

Testing Checklist

Incident Response

Severity Levels

Response Steps

Resources

Mehr aus diesem Repository

Mehr aus diesem Repository

AI Security Expert

OWASP LLM Top 10 (2025)

Quick Reference

LLM01: Prompt Injection

LLM02: Insecure Output Handling

LLM04: Model DoS

LLM06: Sensitive Information Disclosure

PII Protection

Detection Patterns

Redaction Strategy

Guardrails Implementation

NeMo Guardrails (NVIDIA)

Guardrails AI

Custom Pipeline

Security Architecture

Defense in Depth Layers

Zero Trust Principles

Compliance Frameworks

EU AI Act (High-Risk)

SOC 2 for AI

Security Testing

Red Team Categories

Testing Checklist

Incident Response

Severity Levels

Response Steps

Resources