Exécutez n'importe quel Skill dans Manus
en un clic

Exécutez n'importe quel Skill dans Manus en un clic

$pwd:

gemini-3-pro-imagegen

Name: Gemini 3 Pro Imagegen
Author: revfactory

// Google Gemini 이미지 생성/편집 스킬. Nano Banana 2 (gemini-3.1-flash-image-preview), Nano Banana (gemini-3-pro-image-preview), 텍스트-이미지, 이미지 편집, 멀티턴 편집 수행. 사용 시점: AI 이미지 생성, 이미지 편집/수정, 인포그래픽 생성, 로고/스티커 디자인, 제품 목업, 만화/스토리보드, 고해상도(4K) 이미지 필요시. 나노바나나, Gemini 이미지, Google 검색 기반 이미지 생성에 사용.

Exécuter dans Manus

$ git log --oneline --stat

stars:61

forks:24

updated:12 avril 2026 à 04:07

Explorateur de fichiers

3 fichiers

SKILL.md

readonly

name

gemini-3-pro-imagegen

description

Google Gemini 이미지 생성/편집 스킬. Nano Banana 2 (gemini-3.1-flash-image-preview), Nano Banana (gemini-3-pro-image-preview), 텍스트-이미지, 이미지 편집, 멀티턴 편집 수행. 사용 시점: AI 이미지 생성, 이미지 편집/수정, 인포그래픽 생성, 로고/스티커 디자인, 제품 목업, 만화/스토리보드, 고해상도(4K) 이미지 필요시. 나노바나나, Gemini 이미지, Google 검색 기반 이미지 생성에 사용.

Gemini Image Generation

Google Gemini 이미지 생성 모델을 사용한 고품질 이미지 생성 및 편집. (2026-03 기준)

설치

pip install google-genai pillow --break-system-packages

모델 선택

모델	모델명	특징
Nano Banana Pro	`gemini-3-pro-image-preview`	고품질, 4K, 텍스트 렌더링, Thinking
Nano Banana 2	`gemini-3.1-flash-image-preview`	최신, Flash 속도 + Pro 품질, 이미지 검색 그라운딩

기본 추천: 일반 용도 gemini-3.1-flash-image-preview, 최고 품질 gemini-3-pro-image-preview

기본 사용법

텍스트 → 이미지 생성

from google import genai
from google.genai import types

client = genai.Client()

response = client.models.generate_content(
    model="gemini-3-pro-image-preview",
    contents="미니멀한 커피숍 로고, 'Morning Brew' 텍스트 포함",
    config=types.GenerateContentConfig(
        response_modalities=['TEXT', 'IMAGE'],
        image_config=types.ImageConfig(
            aspect_ratio="1:1",
            image_size="2K"
        ),
    )
)

for part in response.parts:
    if part.text:
        print(part.text)
    elif image := part.as_image():
        image.save("output.png")

이미지 편집

from PIL import Image

image_input = Image.open('input.png')
response = client.models.generate_content(
    model="gemini-3-pro-image-preview",
    contents=["이 이미지의 배경을 일몰로 바꿔줘", image_input],
    config=types.GenerateContentConfig(
        response_modalities=['TEXT', 'IMAGE'],
    )
)

멀티턴 편집 (채팅)

chat = client.chats.create(
    model="gemini-3-pro-image-preview",
    config=types.GenerateContentConfig(
        response_modalities=['TEXT', 'IMAGE'],
    )
)

response1 = chat.send_message("광합성을 설명하는 인포그래픽 만들어줘")
response2 = chat.send_message("이걸 스페인어로 번역해줘")

설정 옵션

비율 (aspect_ratio)

비율	용도
`1:1`	정사각형, 프로필, 로고
`16:9`	와이드스크린, 프레젠테이션
`9:16`	모바일, 스토리/릴스
`4:3`	클래식 사진
`3:4`	세로 인물
`21:9`	시네마틱

해상도 (image_size)

값	설명
`1K`	기본값
`2K`	고해상도
`4K`	최고 해상도 (Pro, Nano Banana 2 지원)

고급 기능

Google 검색 그라운딩

실시간 정보 기반 이미지 생성 (모든 모델 지원, Nano Banana 2는 이미지 검색도 지원):

response = client.models.generate_content(
    model="gemini-3.1-flash-image-preview",
    contents="오늘 서울 날씨를 시각화한 인포그래픽",
    config=types.GenerateContentConfig(
        response_modalities=['TEXT', 'IMAGE'],
        tools=[{"google_search": {}}]
    )
)

다중 참조 이미지 (최대 14장)

from PIL import Image

response = client.models.generate_content(
    model="gemini-3-pro-image-preview",
    contents=[
        "이 사람들의 단체 사진을 만들어줘",
        Image.open('person1.png'),
        Image.open('person2.png'),
        Image.open('person3.png'),
    ],
    config=types.GenerateContentConfig(
        response_modalities=['TEXT', 'IMAGE'],
        image_config=types.ImageConfig(
            aspect_ratio="5:4",
            image_size="2K"
        ),
    )
)

스크립트 사용

이미지 생성 스크립트 실행:

python scripts/generate_image.py "프롬프트" --ratio 16:9 --size 2K --output output.png

옵션:

--ratio: 비율 (기본: 1:1)
--size: 해상도 1K/2K/4K (기본: 1K)
--output: 출력 파일명
--search: Google 검색 그라운딩 활성화
--input: 편집할 입력 이미지

프롬프트 작성 팁

장면 묘사: 키워드 나열 대신 서술형 설명
스타일 명시: "수채화", "3D 렌더링", "미니멀리즘"
조명/구도: "골든아워 조명", "45도 각도에서"
텍스트 포함시: 정확한 문구를 따옴표로 감싸기

워크플로우

프롬프트 준비 → 구체적이고 상세한 설명
설정 선택 → 비율/해상도 결정
이미지 생성 → generate_content 호출
결과 저장 → 반드시 현재 작업 디렉토리(cwd)에 저장. /tmp 사용 금지
파일 공유 → present_files 도구로 전달

출력 경로 규칙 (필수)

--output 옵션에는 반드시 현재 작업 디렉토리 기준 상대경로 또는 현재 작업 디렉토리의 절대경로를 사용할 것
/tmp, /var/tmp 등 임시 디렉토리에 저장하지 말 것
예시: --output ./generated_image.png 또는 --output cat_infographic.png

참고 자료

API 상세 정보: references/api_reference.md 참조

related-skills.json

même dépôt

codex-cli.md

from "revfactory/skills"

OpenAI Codex CLI(`codex`) 사용 스킬. 터미널에서 OpenAI 코딩 에이전트를 호출해 비대화형 작업(`codex exec`), 코드 리뷰(`codex review`), 세션 재개(`codex resume`), MCP 서버 등록(`codex mcp`)을 수행한다. 사용 시점: 사용자가 'codex', 'codex cli', 'codex exec', 'OpenAI 코덱스', 'GPT 로 한 번 더', 'codex 로 두 번째 의견', 'codex 로 리뷰', 'codex 로 패치', 'OpenAI 모델로 코딩 시켜', 'codex 백그라운드 실행', 'codex JSON 출력', 'codex 샌드박스', 'codex MCP 등록' 등을 언급할 때. Claude Code 자체 작업에 OpenAI 의 두 번째 시각을 더하거나, 별도 모델로 동일 작업을 비교할 때 반드시 이 스킬을 사용한다. 단, ChatGPT 웹/앱·OpenAI Responses API 직접 호출·gpt-image-2 이미지 생성은 이 스킬의 범위가 아니다.

2026-05-0561

codex-image.md

from "revfactory/skills"

OpenAI Codex CLI(`codex exec`)의 내장 `image_generation` 툴로 이미지를 생성하는 스킬. 단일/배치/병렬 생성 지원. 핵심 강점은 **최대 5장 동시 병렬 생성** (실측 직렬 대비 2.4~2.85배 속도). ChatGPT OAuth 로 인증되어 별도 OPENAI_API_KEY 호출 코드가 필요 없다. 사용 시점: 사용자가 'codex 로 이미지', 'codex imagegen', 'codex 이미지 생성', '병렬 이미지 생성', '여러 장 이미지 동시', '이미지 N장 한번에', '배치 이미지 생성', 'imagegen 병렬', 'codex 그림' 등을 언급할 때, 또는 동시에 3장 이상을 빠르게 만들어야 하는 모든 경우. 단, 단순 단일 이미지·고해상도(2K+)·정밀 마스킹 편집·멀티 레퍼런스 합성은 `gpt-image2` 또는 `gemini-3-pro-imagegen` 스킬이 더 적합. ChatGPT 웹/앱이나 직접 OpenAI API 호출은 이 스킬의 범위가 아니다.

2026-05-0561

project-spec-writer.md

from "revfactory/skills"

Write comprehensive XML-structured project specifications for software projects. Use when a user wants to create a build plan, project spec, technical specification, or detailed requirements document for an application they want built. Triggers include requests like "write a project spec", "create a build plan", "make a technical specification", "spec out this app idea", "write requirements for my project", or any request to produce a structured document describing what to build. Also use when refining or expanding an existing spec. The output is an XML-formatted .md file optimized for consumption by AI coding agents (e.g., Claude Code, Cursor, Copilot Workspace) or human developers.

2026-04-3061

gpt-image2.md

from "revfactory/skills"

OpenAI GPT Image 2 이미지 생성/편집 스킬. 모델은 gpt-image-2로 고정. 텍스트→이미지, 이미지 편집(마스킹), 멀티 이미지 합성, Responses API 멀티턴 편집, 스트리밍 부분 이미지를 수행. 사용 시점: OpenAI/ChatGPT 이미지 생성, AI 이미지 생성(특히 텍스트 렌더링 품질이 중요하거나 2K 이상 해상도·사실적 사진·인포그래픽·로고·제품 목업·마스킹 편집·멀티 레퍼런스 합성이 필요할 때), GPT Image, DALL-E 후속 모델, ChatGPT Images 2.0 언급 시. Gemini·Nano Banana 요청은 gemini-3-pro-imagegen 스킬이 담당.

2026-04-2761

a4-print-design.md

from "revfactory/skills"

Create black and white A4 printable documents (흑백 A4 인쇄물) following professional design guidelines optimized for grayscale printing. Use when creating workshop handouts, educational materials, worksheets, checklists, meeting documents, or any A4 printable materials (워크샵 핸드아웃, 교육 자료, 워크시트, 체크리스트). Automatically applies consistent typography, layout patterns, and print-friendly styling.

2026-04-1261

agent-1on1.md

from "revfactory/skills"

에이전트 개선을 위한 1:1 대화 스킬. `.claude/agents/` 의 에이전트 목록을 표시하고, 사용자가 선택한 에이전트로 Claude가 1인칭 몰입(roleplay)하여 역할·원칙·프로토콜을 대화로 점검하며, 도출된 개선점을 에이전트 정의 파일에 반영한다. 트리거 표현: "에이전트랑 1on1", "에이전트랑 얘기하고 싶어", "{에이전트명} 개선", "{에이전트명} 코칭", "에이전트 인터뷰", "에이전트 피드백 반영", "에이전트 정의 업데이트", "에이전트 회고", "에이전트 원포인트" 등 에이전트 자체를 대화로 점검·개선하려는 요청 시 반드시 이 스킬을 사용. 단, 에이전트 신규 생성·삭제·구조 재설계는 `/harness:harness` 로 안내할 것.

2026-04-1261

package.json

"author": "revfactory"

"repository": "revfactory/skills"

Ouvrir le dépôt GitHub Voir les dépôts du créateur

$ install --global

$ download --local

Exécuter dans Manus

$ useful --forSOC

Développeurs de logicielsProfessions informatiques et mathématiques15-1252L4

name

gemini-3-pro-imagegen

description

Gemini Image Generation

Google Gemini 이미지 생성 모델을 사용한 고품질 이미지 생성 및 편집. (2026-03 기준)

설치

pip install google-genai pillow --break-system-packages

모델 선택

모델	모델명	특징
Nano Banana Pro	`gemini-3-pro-image-preview`	고품질, 4K, 텍스트 렌더링, Thinking
Nano Banana 2	`gemini-3.1-flash-image-preview`	최신, Flash 속도 + Pro 품질, 이미지 검색 그라운딩

기본 추천: 일반 용도 gemini-3.1-flash-image-preview, 최고 품질 gemini-3-pro-image-preview

기본 사용법

텍스트 → 이미지 생성

from google import genai
from google.genai import types

client = genai.Client()

response = client.models.generate_content(
    model="gemini-3-pro-image-preview",
    contents="미니멀한 커피숍 로고, 'Morning Brew' 텍스트 포함",
    config=types.GenerateContentConfig(
        response_modalities=['TEXT', 'IMAGE'],
        image_config=types.ImageConfig(
            aspect_ratio="1:1",
            image_size="2K"
        ),
    )
)

for part in response.parts:
    if part.text:
        print(part.text)
    elif image := part.as_image():
        image.save("output.png")

이미지 편집

from PIL import Image

image_input = Image.open('input.png')
response = client.models.generate_content(
    model="gemini-3-pro-image-preview",
    contents=["이 이미지의 배경을 일몰로 바꿔줘", image_input],
    config=types.GenerateContentConfig(
        response_modalities=['TEXT', 'IMAGE'],
    )
)

멀티턴 편집 (채팅)

chat = client.chats.create(
    model="gemini-3-pro-image-preview",
    config=types.GenerateContentConfig(
        response_modalities=['TEXT', 'IMAGE'],
    )
)

response1 = chat.send_message("광합성을 설명하는 인포그래픽 만들어줘")
response2 = chat.send_message("이걸 스페인어로 번역해줘")

설정 옵션

비율 (aspect_ratio)

비율	용도
`1:1`	정사각형, 프로필, 로고
`16:9`	와이드스크린, 프레젠테이션
`9:16`	모바일, 스토리/릴스
`4:3`	클래식 사진
`3:4`	세로 인물
`21:9`	시네마틱

해상도 (image_size)

값	설명
`1K`	기본값
`2K`	고해상도
`4K`	최고 해상도 (Pro, Nano Banana 2 지원)

고급 기능

Google 검색 그라운딩

실시간 정보 기반 이미지 생성 (모든 모델 지원, Nano Banana 2는 이미지 검색도 지원):

response = client.models.generate_content(
    model="gemini-3.1-flash-image-preview",
    contents="오늘 서울 날씨를 시각화한 인포그래픽",
    config=types.GenerateContentConfig(
        response_modalities=['TEXT', 'IMAGE'],
        tools=[{"google_search": {}}]
    )
)

다중 참조 이미지 (최대 14장)

from PIL import Image

response = client.models.generate_content(
    model="gemini-3-pro-image-preview",
    contents=[
        "이 사람들의 단체 사진을 만들어줘",
        Image.open('person1.png'),
        Image.open('person2.png'),
        Image.open('person3.png'),
    ],
    config=types.GenerateContentConfig(
        response_modalities=['TEXT', 'IMAGE'],
        image_config=types.ImageConfig(
            aspect_ratio="5:4",
            image_size="2K"
        ),
    )
)

스크립트 사용

이미지 생성 스크립트 실행:

python scripts/generate_image.py "프롬프트" --ratio 16:9 --size 2K --output output.png

옵션:

--ratio: 비율 (기본: 1:1)
--size: 해상도 1K/2K/4K (기본: 1K)
--output: 출력 파일명
--search: Google 검색 그라운딩 활성화
--input: 편집할 입력 이미지

프롬프트 작성 팁

장면 묘사: 키워드 나열 대신 서술형 설명
스타일 명시: "수채화", "3D 렌더링", "미니멀리즘"
조명/구도: "골든아워 조명", "45도 각도에서"
텍스트 포함시: 정확한 문구를 따옴표로 감싸기

워크플로우

프롬프트 준비 → 구체적이고 상세한 설명
설정 선택 → 비율/해상도 결정
이미지 생성 → generate_content 호출
결과 저장 → 반드시 현재 작업 디렉토리(cwd)에 저장. /tmp 사용 금지
파일 공유 → present_files 도구로 전달

출력 경로 규칙 (필수)

--output 옵션에는 반드시 현재 작업 디렉토리 기준 상대경로 또는 현재 작업 디렉토리의 절대경로를 사용할 것
/tmp, /var/tmp 등 임시 디렉토리에 저장하지 말 것
예시: --output ./generated_image.png 또는 --output cat_infographic.png

참고 자료

API 상세 정보: references/api_reference.md 참조

gemini-3-pro-imagegen

Gemini Image Generation

설치

모델 선택

기본 사용법

텍스트 → 이미지 생성

이미지 편집

멀티턴 편집 (채팅)

설정 옵션

비율 (aspect_ratio)

해상도 (image_size)

고급 기능

Google 검색 그라운딩

다중 참조 이미지 (최대 14장)

스크립트 사용

프롬프트 작성 팁

워크플로우

출력 경로 규칙 (필수)

참고 자료

Plus depuis ce dépôt

Plus depuis ce dépôt

Gemini Image Generation

설치

모델 선택

기본 사용법

텍스트 → 이미지 생성

이미지 편집

멀티턴 편집 (채팅)

설정 옵션

비율 (aspect_ratio)

해상도 (image_size)

고급 기능

Google 검색 그라운딩

다중 참조 이미지 (최대 14장)

스크립트 사용

프롬프트 작성 팁

워크플로우

출력 경로 규칙 (필수)

참고 자료