google-stt

Transcribe audio files using Google Gemini 1.5 Flash model. Supports batch transcription of multiple audio files.

Manusで実行

概要

Transcribe audio files using Google Gemini 1.5 Flash model. Supports batch transcription of multiple audio files.

インストールコマンド

npx skills add https://github.com/palladius/gemini-cli-palladius-public-goodies --skill google-stt

このコマンドをClaude Codeにコピー＆ペーストしてスキルをインストール

ソース

palladius/gemini-cli-palladius-public-goodies

スター0

フォーク0

更新日2026年5月17日 01:50

ファイルエクスプローラー

3 ファイル

SKILL.md

readonly

name	google-stt
description	Transcribe audio files using Google Gemini 1.5 Flash model. Supports batch transcription of multiple audio files.
compatibility	Gemini CLI
metadata	{"version":"0.1.0"}

Google STT

Overview

This skill provides the capability to transcribe audio files into text using Google's Gemini 1.5 Flash model. It is designed for quick and efficient transcription of voice notes, recordings, or any supported audio content.

Workflow

Provide one or more paths to audio files (e.g., MP3, WAV).
The skill uses the transcribe.py script to upload the audio to Gemini and generate a transcription.
The transcription is printed to the console.

Requirements

A Gemini API key must be configured in ~/.openclaw/settings.json under apiKeys.google.gemini.
The google-generativeai Python library must be installed.

このリポジトリの他の Skills

同じリポジトリ

git-repo-documenter

palladius/gemini-cli-palladius-public-goodies

(💛) Auto-documents any Git repository: creates ABOUT.md, generates project hero images via nanobanana, and builds deep diagrams (Mermaid E/R or Class diagrams).

2026-05-300

zurich-badi-info

palladius/gemini-cli-palladius-public-goodies

(💛) Real-time water temperatures, open status of Zurich badis (lakes, river/Letten, pools), outside weather recommendations for family trips, and Limmat canotto/dinghy flow safety alerts.

2026-05-300

carlessian-gog

palladius/gemini-cli-palladius-public-goodies

Google Workspace CLI managed the Carlesso way—featuring isolated configurations, selective read-only security, and standard workflows.

2026-05-290

lyria2-music-generation

palladius/gemini-cli-palladius-public-goodies

Generate music using Google's Lyria (v2) model via Vertex AI. Use when the user wants to create audio clips, background music, or experiment with AI music generation.

2026-05-180

tmux-renamer

palladius/gemini-cli-palladius-public-goodies

Audits and renames tmux sessions based on their active content. Use when the user wants to organize their tmux workspace, identify what's running in each session, or apply a consistent naming convention (giancarlo-YYYYMMDD-SYNOPSIS) to all active sessions.

2026-05-180

learn-german-hummerli

palladius/gemini-cli-palladius-public-goodies

(🦞) Your personal Swiss Citizenship (Zürich) tutor. Speaks easy B1 German and helps you prep for the exam.

2026-05-160

ソース