| name | generate-tts |
| description | Gemini TTS Pro로 깊고 진지한 나레이션을 생성합니다. 한국어 명언이나 철학적 텍스트를 오디오로 변환할 때 사용하세요. |
| allowed-tools | ["Bash","Read","Write"] |
Generate TTS
Gemini 2.5 Pro TTS를 사용하여 깊고 낮은 톤의 나레이션 오디오를 생성합니다.
Instructions
- 한국어 텍스트 준비
TTSGenerator 클래스 인스턴스 생성
generate() 메서드로 TTS 오디오 생성
- WAV 파일로 저장
Usage
from src.quote_video.tts_generator import TTSGenerator
generator = TTSGenerator()
generator.generate(
text="인생은 고통과 권태 사이를 왕복하는 진자운동이다.",
output_path="output/narration_001.wav"
)
Config
| 항목 | 값 |
|---|
| 모델 | gemini-2.5-pro-preview-tts |
| 보이스 | Enceladus (또는 Charon) |
| 톤 | Deep, low-pitched, serious |
| 출력 포맷 | WAV |
| 샘플레이트 | 24000 Hz |
| 비트뎁스 | 16-bit |
| 채널 | Mono |
Features
- 저음 나레이션: 수면/명상 콘텐츠에 적합한 깊은 톤
- 자연스러운 억양: Gemini TTS의 고품질 한국어 발음
- 일관된 음성: 모든 씬에서 동일한 보이스 유지
- 고품질 오디오: 24kHz 샘플링으로 명확한 음질