with one click
music-audio-analysis
// Gemini 3.5 Flashで音楽・歌・音声ファイルを解析し、曲調、構成、聞き取れる歌詞の要旨、感情、タイムスタンプつき特徴を日本語でまとめる。
// Gemini 3.5 Flashで音楽・歌・音声ファイルを解析し、曲調、構成、聞き取れる歌詞の要旨、感情、タイムスタンプつき特徴を日本語でまとめる。
Discordで本人が『私を〇〇と呼んで』と明示したとき、現在の発言者本人のSupabase users.nicknameを安全に更新する。第三者の呼称変更やマスター/admin等の紛らわしい呼称は拒否する。
管理者が共有した謝罪内容をもとに、Discord timeout凍結の恩赦を判定し、短縮または解除する。管理者権限がある投稿者だけ実行可能。
Discord timeout/freezingの内部仕様。Discord上の自然文依頼では実行しない。実行経路はcronのdiscord-autofreezeのみ。
Discordメッセージ履歴をチャンネル/期間/キーワードで検索し、timestamp、author、jump URLつきで返す。
公開Discordから安全に固定文リマインダーを登録する。通常チャットにはcron/file/terminal権限を開放しない。
Discordチャンネル/スレッドの直近または指定期間の会話を、依頼意図に合わせて自然に要約する。
| name | music-audio-analysis |
| description | Gemini 3.5 Flashで音楽・歌・音声ファイルを解析し、曲調、構成、聞き取れる歌詞の要旨、感情、タイムスタンプつき特徴を日本語でまとめる。 |
| platforms | ["macos","linux"] |
| metadata | {"hermes":{"tags":["audio","music","gemini","transcription","lyrics"],"category":"media"}} |
Gemini 3.5 Flashのaudio understandingを使って、音楽・歌・音声ファイルを解析する。 音声入力からテキスト応答を生成し、音楽の雰囲気、ジャンル、構成、楽器、ボーカル、聞き取れる歌詞の要旨、話者/歌唱の感情、重要な時間帯を説明する。
Use this skill when the user asks about audio or music analysis, including:
この曲を解析してこの音声の内容をまとめて歌詞を聞き取って意味を教えて曲調・ジャンル・構成を分析してこのMP3/WAV/M4A/MP4のボーカルや感情を見て音楽・音声解析ツールを使ってPrefer a local audio/video file path if Hermes provides one for an uploaded Discord attachment. Supported practical inputs are common audio/video files such as MP3, WAV, M4A, FLAC, OGG, AAC, and MP4.
If the user provides a Discord attachment URL, Suno共有URL, or other direct media URL, download it to a temporary file first, then analyze that file.
The managed helper can resolve public https://suno.com/song/... pages by extracting the embedded audio_url.
Do not fetch arbitrary webpages looking for media unless the user explicitly asks and the URL is Suno or a clearly direct media source.
Use the managed helper:
/Users/nikenike/.hermes/profiles/nikechan-discord-public/bin/gemini-audio-analyze analyze --file AUDIO_PATH --mode music
For speech-heavy audio:
/Users/nikenike/.hermes/profiles/nikechan-discord-public/bin/gemini-audio-analyze analyze --file AUDIO_PATH --mode speech
For a Suno共有URL or direct media URL:
/Users/nikenike/.hermes/profiles/nikechan-discord-public/bin/gemini-audio-analyze analyze --url MEDIA_URL --mode music
Optional custom prompt:
/Users/nikenike/.hermes/profiles/nikechan-discord-public/bin/gemini-audio-analyze analyze --file AUDIO_PATH --mode music --prompt "重点的にリズムと歌詞テーマを見て"
The helper reads GEMINI_API_KEY or GOOGLE_API_KEY from the environment/profile .env and uses gemini-3.5-flash by default.
Reply in Japanese unless the user asks otherwise. Keep the result practical and compact by default:
For casual requests, 5-10 bullets are enough. For detailed analysis, use headings.
Do not output full song lyrics. For lyrics, summarize themes and meaning in your own words. If quoting lyrics is necessary, keep verbatim lyric excerpts extremely short and under the platform limit. Prefer no direct lyric quotes.
GEMINI_API_KEY / GOOGLE_API_KEY is missing, tell the operator that the Gemini API key must be configured in the profile .env.