Run any Skill in Manus with one click

Get Started

minimax-tts

使用 MiniMax 语音合成 API（TTS）将文本转语音，支持多音色、语速/音量/音高、情绪、输出格式控制。用户提到“语音合成/TTS/配音/朗读/旁白/角色音色/MiniMax 声音”时必须触发本 skill。

Run Skill in Manus

Overview

Install command

npx skills add https://github.com/agentrix-ai/skills --skill minimax-tts

Copy and paste this command into Claude Code to install the skill

Source

agentrix-ai/skills

Stars1

Forks0

UpdatedMarch 19, 2026 at 03:07

File Explorer

2 files

SKILL.md

readonly

name	minimax-tts
description	使用 MiniMax 语音合成 API（TTS）将文本转语音，支持多音色、语速/音量/音高、情绪、输出格式控制。用户提到“语音合成/TTS/配音/朗读/旁白/角色音色/MiniMax 声音”时必须触发本 skill。

MiniMax 语音合成 Skill

用于把文本快速合成为可下载音频，适合：

搞笑段子配音
视频旁白
角色台词
通知播报

环境变量

MINIMAX_VOICE_API_KEY="你的 MiniMax Key"

兼容：

若未配置 MINIMAX_VOICE_API_KEY，可回退 MINIMAX_API_KEY
可选：MINIMAX_API_BASE（默认 https://api.minimaxi.com/v1）

接口

Endpoint：POST https://api.minimaxi.com/v1/t2a_v2
推荐模型：speech-2.8-hd

工作流程

Step 1: 明确语音需求

至少确认：

文本内容（长度、语种、断句）
角色风格（正式/搞笑/温柔/新闻播报）
输出格式（mp3/wav）

Step 2: 选音色 + 参数

常用字段：

voice_setting.voice_id
voice_setting.speed（0.5~2.0）
voice_setting.vol（0.1~10）
voice_setting.pitch（-12~12）
voice_setting.emotion（happy/sad/angry/calm/...）

audio_setting：

sample_rate（常见 16000/24000/32000）
bitrate
format（mp3/wav/flac/pcm）
channel（1/2）

Step 3: 调用接口

curl -sS -X POST "https://api.minimaxi.com/v1/t2a_v2" \
  -H "Authorization: Bearer $MINIMAX_VOICE_API_KEY" \
  -H "Content-Type: application/json" \
  -d '{
    "model": "speech-2.8-hd",
    "text": "各位朋友，今天教大家如何优雅地摸鱼。",
    "stream": false,
    "voice_setting": {
      "voice_id": "cartoon_pig",
      "speed": 1.05,
      "vol": 1.2,
      "pitch": 3,
      "emotion": "happy"
    },
    "audio_setting": {
      "sample_rate": 32000,
      "bitrate": 128000,
      "format": "mp3",
      "channel": 1
    },
    "output_format": "url"
  }'

Step 4: 保存音频

output_format=url：下载 URL 到本地 *.mp3
output_format=hex：hex 解码写文件

常用中文音色（示例）

cartoon_pig（卡通猪小琪）
Chinese (Mandarin)_Humorous_Elder（搞笑大爷）
Chinese (Mandarin)_Cute_Spirit（憨憨萌兽）
female-shaonv（少女）
male-qn-qingse（青涩青年）
Chinese (Mandarin)_News_Anchor（新闻女声）

详见：references/voice_catalog_quick.md

质量和合规约束

不承诺“精准复刻某位真人声音”。
可以描述“某类风格气质”，但避免冒充真人身份。
如果用户指定具体真人，改写为“相近风格”并明确说明。

输出格式（给用户）

统一格式：

模型: <speech-2.8-hd>
音色: <voice_id>
文本长度: <N 字>
输出文件: <path>
状态: <成功/失败>

More from this repository

same repository

uno

agentrix-ai/skills

通过 curl 调用 2000+ tools，零安装。支持 tool 级别语义搜索，一步拿到完整 inputSchema 直接调用。覆盖：搜索、开发、文档、金融、地图、出行、AI媒体、社交、办公、企业等领域。

2026-03-291

minimax-music

agentrix-ai/skills

使用 MiniMax 音乐生成 API（music-2.5 / music-2.5+）创作歌曲、纯音乐和自动歌词作品。用户提到“生成音乐/写歌/BGM/纯音乐/哼唱/歌词自动生成/MiniMax 音乐”时都应使用本 skill，即使用户只说“做一首歌”也应触发。

2026-03-191

doubao-music

agentrix-ai/skills

AI music generation using Volcengine Doubao (豆包) Music API — generate vocal songs, instrumental BGM, and lyrics. Use when users want to create music, generate songs, compose BGM/background music, write lyrics, or anything related to AI music creation with Doubao/豆包/火山引擎.

2026-03-171

doubao-asr

agentrix-ai/skills

Transcribe audio files to text using Volcengine Doubao (豆包) Big-Model ASR 2.0 with word-level timestamps

2026-03-171

doubao-voice-clone

agentrix-ai/skills

Clone voices using Volcengine Doubao (豆包) Voice Cloning API — upload audio, train, check status, then synthesize with cloned voice

2026-03-171

doubao-tts

agentrix-ai/skills

Text-to-Speech synthesis using Volcengine Doubao (豆包) Speech API with 2.0 voice instruction support

2026-03-171

Source

agentrix-ai

agentrix-ai/skills

View GitHub Repository View Creator Repositories

Install command

Download

Run Skill in Manus

Useful forSOC

Software DevelopersComputer and Mathematical Occupations15-1252L4

name	minimax-tts
description	使用 MiniMax 语音合成 API（TTS）将文本转语音，支持多音色、语速/音量/音高、情绪、输出格式控制。用户提到“语音合成/TTS/配音/朗读/旁白/角色音色/MiniMax 声音”时必须触发本 skill。

MiniMax 语音合成 Skill

用于把文本快速合成为可下载音频，适合：

搞笑段子配音
视频旁白
角色台词
通知播报

环境变量

MINIMAX_VOICE_API_KEY="你的 MiniMax Key"

兼容：

若未配置 MINIMAX_VOICE_API_KEY，可回退 MINIMAX_API_KEY
可选：MINIMAX_API_BASE（默认 https://api.minimaxi.com/v1）

接口

Endpoint：POST https://api.minimaxi.com/v1/t2a_v2
推荐模型：speech-2.8-hd

工作流程

Step 1: 明确语音需求

至少确认：

文本内容（长度、语种、断句）
角色风格（正式/搞笑/温柔/新闻播报）
输出格式（mp3/wav）

Step 2: 选音色 + 参数

常用字段：

voice_setting.voice_id
voice_setting.speed（0.5~2.0）
voice_setting.vol（0.1~10）
voice_setting.pitch（-12~12）
voice_setting.emotion（happy/sad/angry/calm/...）

audio_setting：

sample_rate（常见 16000/24000/32000）
bitrate
format（mp3/wav/flac/pcm）
channel（1/2）

Step 3: 调用接口

curl -sS -X POST "https://api.minimaxi.com/v1/t2a_v2" \
  -H "Authorization: Bearer $MINIMAX_VOICE_API_KEY" \
  -H "Content-Type: application/json" \
  -d '{
    "model": "speech-2.8-hd",
    "text": "各位朋友，今天教大家如何优雅地摸鱼。",
    "stream": false,
    "voice_setting": {
      "voice_id": "cartoon_pig",
      "speed": 1.05,
      "vol": 1.2,
      "pitch": 3,
      "emotion": "happy"
    },
    "audio_setting": {
      "sample_rate": 32000,
      "bitrate": 128000,
      "format": "mp3",
      "channel": 1
    },
    "output_format": "url"
  }'

Step 4: 保存音频

output_format=url：下载 URL 到本地 *.mp3
output_format=hex：hex 解码写文件

常用中文音色（示例）

cartoon_pig（卡通猪小琪）
Chinese (Mandarin)_Humorous_Elder（搞笑大爷）
Chinese (Mandarin)_Cute_Spirit（憨憨萌兽）
female-shaonv（少女）
male-qn-qingse（青涩青年）
Chinese (Mandarin)_News_Anchor（新闻女声）

详见：references/voice_catalog_quick.md

质量和合规约束

不承诺“精准复刻某位真人声音”。
可以描述“某类风格气质”，但避免冒充真人身份。
如果用户指定具体真人，改写为“相近风格”并明确说明。

输出格式（给用户）

统一格式：

模型: <speech-2.8-hd>
音色: <voice_id>
文本长度: <N 字>
输出文件: <path>
状态: <成功/失败>