ワンクリックで
music-audio-analysis
// Gemini 3.5 Flashで音楽・歌・音声ファイルを解析し、曲調、構成、聞き取れる歌詞の要旨、感情、タイムスタンプつき特徴を日本語でまとめる。
// Gemini 3.5 Flashで音楽・歌・音声ファイルを解析し、曲調、構成、聞き取れる歌詞の要旨、感情、タイムスタンプつき特徴を日本語でまとめる。
| name | music-audio-analysis |
| description | Gemini 3.5 Flashで音楽・歌・音声ファイルを解析し、曲調、構成、聞き取れる歌詞の要旨、感情、タイムスタンプつき特徴を日本語でまとめる。 |
| platforms | ["macos","linux"] |
| metadata | {"hermes":{"tags":["audio","music","gemini","transcription","lyrics"],"category":"media"}} |
Gemini 3.5 Flashのaudio understandingを使って、音楽・歌・音声ファイルを解析する。 音声入力からテキスト応答を生成し、音楽の雰囲気、ジャンル、構成、楽器、ボーカル、聞き取れる歌詞の要旨、話者/歌唱の感情、重要な時間帯を説明する。
Use this skill when the user asks about audio or music analysis, including:
この曲を解析してこの音声の内容をまとめて歌詞を聞き取って意味を教えて曲調・ジャンル・構成を分析してこのMP3/WAV/M4A/MP4のボーカルや感情を見て音楽・音声解析ツールを使ってPrefer a local audio/video file path if Hermes provides one for an uploaded Discord attachment. Supported practical inputs are common audio/video files such as MP3, WAV, M4A, FLAC, OGG, AAC, and MP4.
If the user provides a Discord attachment URL, Suno共有URL, or other direct media URL, download it to a temporary file first, then analyze that file.
The managed helper can resolve public https://suno.com/song/... pages by extracting the embedded audio_url.
Do not fetch arbitrary webpages looking for media unless the user explicitly asks and the URL is Suno or a clearly direct media source.
Use the managed helper:
/Users/nikenike/.hermes/bin/gemini-audio-analyze analyze --file AUDIO_PATH --mode music
For speech-heavy audio:
/Users/nikenike/.hermes/bin/gemini-audio-analyze analyze --file AUDIO_PATH --mode speech
For a Suno共有URL or direct media URL:
/Users/nikenike/.hermes/bin/gemini-audio-analyze analyze --url MEDIA_URL --mode music
Optional custom prompt:
/Users/nikenike/.hermes/bin/gemini-audio-analyze analyze --file AUDIO_PATH --mode music --prompt "重点的にリズムと歌詞テーマを見て"
The helper reads GEMINI_API_KEY or GOOGLE_API_KEY from the environment/profile .env and uses gemini-3.5-flash by default.
Reply in Japanese unless the user asks otherwise. Keep the result practical and compact by default:
For casual requests, 5-10 bullets are enough. For detailed analysis, use headings.
Do not output full song lyrics. For lyrics, summarize themes and meaning in your own words. If quoting lyrics is necessary, keep verbatim lyric excerpts extremely short and under the platform limit. Prefer no direct lyric quotes.
GEMINI_API_KEY / GOOGLE_API_KEY is missing, tell the operator that the Gemini API key must be configured in the profile .env.Discordで上がった要望・改善案・作業依頼を、ニケちゃんのSupabase local_tasksにtodoとして追加する。
管理者が共有した謝罪内容をもとに、Discord timeout凍結の恩赦を判定し、短縮または解除する。管理者権限がある投稿者だけ実行可能。
Discordメッセージ履歴をチャンネル/期間/キーワードで検索し、timestamp、author、jump URLつきで返す。
Discordチャンネル/スレッドの直近または指定期間の会話を、依頼意図に合わせて自然に要約する。
Discordメッセージ履歴をチャンネル/期間/キーワードで検索し、timestamp、author、jump URLつきで返す。
Discordチャンネル/スレッドの直近または指定期間の会話を、依頼意図に合わせて自然に要約する。