一键导入
gemini-image-skill
Generate document and slide images with Google Gemini or Imagen models, including style selection, aspect ratios, and approval workflow guidance.
用 Codex 或 Claude 帮你安装 复制这段 Prompt,粘贴到 Codex、Claude 或其他助手里,让它检查 Skill 页面并帮你完成安装。
菜单
Generate document and slide images with Google Gemini or Imagen models, including style selection, aspect ratios, and approval workflow guidance.
用 Codex 或 Claude 帮你安装 复制这段 Prompt,粘贴到 Codex、Claude 或其他助手里,让它检查 Skill 页面并帮你完成安装。
基于 SOC 职业分类
Create interactive HTML road-trip guides for multi-day driving itineraries. Use when an AI agent is asked to plan a road trip, build a travel itinerary page, make a fullscreen route map, estimate trip cost/time, compare restaurant or lodging alternatives, add POIs with photos and Google Maps links, or produce a self-contained HTML guide for any road trip.
Set up a new AI4PKM vault from scratch or migrate an existing vault to the latest template version. Detects current state, generates a plan, and applies changes with full backup safety.
고비 데스크탑 3.0 대화형 음성 온보딩 가이드
Create animated GIF slideshows from structured content. Use when the user asks to create a GIF summary, animated slide recap, GIF presentation, or visual summary GIF for events, meetups, presentations, or any multi-point content. Supports Korean text, dark/light themes, custom colors, progress indicators, and quote boxes. Ideal for social media sharing (Gobi Brain Updates, Slack, etc).
Convert DOCX files into markdown while preserving headings, lists, tables, metadata, and extracted images.
Convert EPUB files into a single well-formatted markdown document with extracted metadata, table of contents, and images.
| name | gemini-image-skill |
| description | Generate document and slide images with Google Gemini or Imagen models, including style selection, aspect ratios, and approval workflow guidance. |
Google Gemini API를 사용한 이미지 생성 스킬. 슬라이드 및 문서용 이미지를 생성합니다.
Gemini 2.0 Flash 또는 Imagen 3 모델을 사용하여 문서/슬라이드에 필요한 이미지를 생성합니다. 해상도와 종횡비 선택을 지원하며, 사용자 승인 워크플로우를 포함합니다.
# 1. API 키 설정
export GEMINI_API_KEY="your-api-key"
# 2. 의존성 설치
pip install google-genai Pillow
스타일 옵션:
| # | 스타일 | 설명 | 적합한 용도 |
|---|---|---|---|
| 1 | Infographic (기본) | 레이블/텍스트 포함, dense | 문서, 발표 |
| 2 | Technical Diagram | 깔끔한 선, 플로우차트 | 기술 문서 |
| 3 | Vibrant Modern Cartoon | 밝은 그라데이션, 플랫 | 비즈니스, 교육 |
| 4 | Professional Minimalist | 절제된 색상, 기하학 | 공식 발표 |
| 5 | Bold Graphic | 고대비, 팝아트 | 마케팅 |
| 6 | Custom | 사용자 지정 | 자유 |
기본값: Infographic 스타일 (텍스트/레이블 포함)
모델 선택:
| 모델 | 비용 | 특징 |
|---|---|---|
| gemini-3-pro-image-preview | $0.06/장 | 기본값, 한글 완벽, 최고 품질 |
| gemini-2.5-flash-image | $0.039/장 | 종횡비 지원, 빠름 |
| gemini-2.0-flash-exp | 무료 | 빠름, 반복용 (한글 깨짐) |
| imagen-4.0-generate-001 | $0.03/장 | Imagen 4.0, 고품질 |
종횡비 옵션: 1:1, 9:16, 16:9, 3:4, 4:3, 3:2, 2:3, 21:9
슬라이드용:
--aspect-ratio 16:9(기본 모델이 gemini-3-pro-image-preview)
python3 "generate_gemini_image.py" \
"[상세 설명]" \
--output-path "[경로]" \
--style "[스타일]" \
--model "[모델]" \
--aspect-ratio "[종횡비]" \
--auto-approve
슬라이드:

문서:

| 스타일 | --style 값 |
|---|---|
| Infographic (기본) | "clean infographic with labeled sections, icons, and visual hierarchy" |
| Technical Diagram | "technical diagram with flowchart elements, arrows, and labeled components" |
| Vibrant Modern Cartoon | "vibrant modern minimalist cartoon illustration" |
| Professional Minimalist | "professional minimalist illustration with muted colors and clean geometric shapes" |
| Bold Graphic | "bold graphic illustration with high contrast colors and strong geometric shapes" |
프롬프트 작성 팁:
슬라이드: [slide-topic-slug].png
ai-changes-game.png, team-collaboration.png_files_/ 디렉토리문서: [section-number]-[topic-slug].png
01-introduction.png, 03-methodology.png생성 전 비용 안내:
| 에러 | 해결 방법 |
|---|---|
| API 키 없음 | GEMINI_API_KEY 환경변수 설정 |
| 안전 필터 차단 | 프롬프트 수정 후 재시도 |
| 모델 미지원 | 사용 가능한 모델로 변경 |
| 네트워크 오류 | 재시도 |
python3 generate_gemini_image.py "AI 지식 노동자가 책상에서 작업하는 모습" \
--output-path "_files_/knowledge-worker.png"
python3 generate_gemini_image.py "팀 협업 미팅" \
--output-path "_files_/team-meeting.png" \
--model "gemini-2.5-flash-image" \
--aspect-ratio "16:9" \
--style "professional minimalist illustration"
python3 generate_gemini_image.py "제품 쇼케이스" \
--output-path "_files_/product.png" \
--model "imagen-4.0-generate-001"
python3 generate_gemini_image.py "혁신 컨셉" \
--output-path "_files_/innovation.png" \
--auto-approve
⚠️ 피해야 할 것: 추상적인 일러스트 (예: 사람들이 연결된 모호한 그림) ✅ 선호: 다이어그램, 플로우차트, 레이블이 있는 인포그래픽
| 기능 | DALL-E | Gemini |
|---|---|---|
| 무료 티어 | X | O (Flash) |
| 종횡비 | 정사각형만 | 5가지 옵션 |
| 출력 포맷 | JPEG | PNG/JPEG |
| 비용 | $0.04 | $0~$0.03 |
선택 기준: