generate-subtitle

スター1

フォーク0

更新日2026年2月12日 12:00

Whisper large-v3로 오디오의 타임스탬프를 추출하고 SRT 자막을 생성합니다. TTS 오디오에 정확한 자막이 필요할 때 사용하세요.

インストール

Codex または Claude でインストールこの Prompt をコピーして Codex、Claude、または他のアシスタントに貼り付けると、Skill ページを確認してインストールできます。

Manusで実行

ソース

sung-ho-oh

sung-ho-oh/youtube_longform_agent

GitHub リポジトリを開く Creator のリポジトリを見る

ダウンロード

Manusで実行

Generate Subtitle

Whisper large-v3 모델을 사용하여 오디오 파일에서 정확한 타임스탬프를 추출하고 SRT 자막 파일을 생성합니다.

Instructions

TTS로 생성된 오디오 파일 준비
SubtitleSync 클래스 인스턴스 생성
generate_srt() 메서드로 자막 생성
SRT 파일로 저장

Usage

from src.quote_video.subtitle_sync import SubtitleSync

sync = SubtitleSync()
sync.generate_srt(
    audio_path="output/narration_001.wav",
    text="인생은 고통과 권태 사이를 왕복하는 진자운동이다.",
    output_path="output/subtitle_001.srt"
)

Config

항목	값
모델	`whisper-large-v3`
언어	Korean (ko)
Task	Transcribe
정확도	단어 단위 타임스탬프

Features

한국어 최적화: Whisper large-v3의 뛰어난 한국어 인식
정확한 타이밍: 단어 단위 타임스탬프로 정밀한 싱크
SRT 포맷: FFmpeg과 호환되는 표준 자막 형식
자동 분할: 긴 문장을 자동으로 적절히 분할

このリポジトリの他の Skills

同じリポジトリ

compose-video

sung-ho-oh/youtube_longform_agent

FFmpeg로 이미지, 오디오, 자막, BGM을 합성하여 최종 영상을 만듭니다. 모든 소스가 준비되었을 때 영상 합성이 필요할 때 사용하세요.

2026-02-121

generate-image

sung-ho-oh/youtube_longform_agent

Gemini 3 Pro로 연필 스케치 스타일 이미지를 생성합니다. 명언 영상의 배경 이미지가 필요할 때, 철학적/예술적 스케치 이미지를 만들 때 사용하세요.

2026-02-121

generate-tts

sung-ho-oh/youtube_longform_agent

Gemini TTS Pro로 깊고 진지한 나레이션을 생성합니다. 한국어 명언이나 철학적 텍스트를 오디오로 변환할 때 사용하세요.

2026-02-121

name	generate-subtitle
description	Whisper large-v3로 오디오의 타임스탬프를 추출하고 SRT 자막을 생성합니다. TTS 오디오에 정확한 자막이 필요할 때 사용하세요.
allowed-tools	["Bash","Read","Write"]

Generate Subtitle

Whisper large-v3 모델을 사용하여 오디오 파일에서 정확한 타임스탬프를 추출하고 SRT 자막 파일을 생성합니다.

Instructions

TTS로 생성된 오디오 파일 준비
SubtitleSync 클래스 인스턴스 생성
generate_srt() 메서드로 자막 생성
SRT 파일로 저장

Usage

from src.quote_video.subtitle_sync import SubtitleSync

sync = SubtitleSync()
sync.generate_srt(
    audio_path="output/narration_001.wav",
    text="인생은 고통과 권태 사이를 왕복하는 진자운동이다.",
    output_path="output/subtitle_001.srt"
)

Config

항목	값
모델	`whisper-large-v3`
언어	Korean (ko)
Task	Transcribe
정확도	단어 단위 타임스탬프

Features

한국어 최적화: Whisper large-v3의 뛰어난 한국어 인식
정확한 타이밍: 단어 단위 타임스탬프로 정밀한 싱크
SRT 포맷: FFmpeg과 호환되는 표준 자막 형식
자동 분할: 긴 문장을 자동으로 적절히 분할