如何自定义AI配音音色,MiniMax语音“音色设计”一句话生成

最近我发现了一个给视频配音的邪修思路。用 AI 就能生成真人感满满的声音。

事情是这样的——前几天我终于有时间,抽空剪了第一条视频,信心满满地发给朋友帮我把把关。

他看完沉默半天,只回了两句:很牛逼!就是普通话…差点意思。

谁懂啊!作为一个从小到大N、L不分、平翘舌不分的湖北人,我已经反复练过几遍,还特地放慢了语速,结果听起来还是不对。

俺是真没招了。

就在这时,我想到了一个邪修思路——既然真人发音练不明白,那就干脆交给 AI 吧。

笑死,用 MiniMax语音配完音之后,朋友居然完全没听出来这是 AI 的声音。

普通的 AI 配音人机味太重!MiniMax语音发音的抑扬顿挫、情绪就拿捏得很到位,听起来就像是真人在说话。

今天就跟大家分享一些我自己摸索出来的邪修配音小技巧~无论是自己录视频、博客,语音相关的内容,都能派上用场。

 

01. 一句话捏一个专属声音

 

月初的时候,MiniMax发布了他们最新的语音生成模型Speech 2.5,主要升级了2个点:语言表现力更强,多语种能力更全面。

用法很简单,我们打开MiniMax语音首页,直接输入文本,几秒钟就可以生成一段非常逼真的音频。

MiniMax语音内置了300多种预设音色,各种语种、口音、性别、年龄几乎全覆盖。从广告旁白到儿童动画,都能找到合适的声音。

但真正吸引我的,是它的音色设计功能。

只需要一句话描述,就能生成一个有情绪、有特点的 AI 声音,开口就是满满的真人感。

关于音色设计提示词,有一个万能公式:[角色身份] + [声音质感] + [语速/节奏] + [情绪状态] + [场景/用途]

比如输入:

提示词:儿童动画片中的活泼小朋友,声音清脆稚嫩,语速轻快跳跃,充满好奇与快乐,用于演绎卡通冒险故事。

一个适合儿童动画角色的声音就生成好啦。

儿童故事

声音清脆稚嫩,语速轻快,短短一句话里,就把惊讶、开心、兴奋的情绪变化自然串联起来,让角色听起来生动有趣,充满感染力。

我们经常刷到的yxh视频、影视解说配音,其实都可以直接用 MiniMax 语音生成。生成的声音情绪很饱,不会有那种死气沉沉的人机味。

如果不想自己写提示词,也可以直接点击首页导航栏的对话,让 MiniMax M1 帮我们生成提示词。

提示词:我要设计一个用于解说古装大女主剧的音色,女声,请根据这个提示词生成公式,为我生成一句话提示词:[角色身份] + [声音质感] + [语速/节奏] + [情绪状态] + [场景/用途]。

比如,市井集市中热情吆喝的小贩,声音响亮,带地方口音,充满生活气息。

从 MiniMax M1 生成的提示词中,挑选一个觉得比较合适的,就可以直接用于生成音色。

提示词:宫廷贵妃雍容华贵的独白,声音华丽而富有磁性,带有轻微的回音效果,语速缓慢而优雅,节奏舒缓,富有韵律感,情绪高贵而从容,带有淡淡的忧伤和沉思,用于角色内心独白或回忆往昔。

每次它会生成3种音色供我们选择,我们可以分别试听,如果对3种音色都不满意,可以选择重新生成,直到我们满意为止。这个过程是完全不消耗积分的哦!

我用这个声音做一个热播剧的解说视频,一起试听一下音色效果:

确认选择一种音色之后,我们给音色命名,打上标签。

之后每次使用文本转语音功能,都可以选择用这款音色生成配音。音色一致性的问题就这么轻松搞定~

相当于每个人都可以拥有随时在线、能模拟各种人声音色的声优伙伴!

不管是做自媒体视频,还是广告配音、广播播音…这都是实打实的降本增效。

配音时,打开长文模式,单次最多能生成200000字符的音频,相当于可以把《三体·地球往事》这样一部长篇小说,一次性转为有声读物。

我就很喜欢一边干活一边听悬疑故事,感觉比刷短视频还上头。

悬疑故事

 

 02. 让声音更自然的小技巧

 

MiniMax语音有一个调试台,同样的音色,我们可以通过调试台做出不同的声音效果,让音频与使用场景更贴合。

语速、声调、音量这些算是最基础的调整了,我也摸索出一些小经验~

比如,年轻人的声音语速可以稍微加快一些,听起来更贴近现实,也比较适合当下短视频这样快节奏的内容。

老人说话语速可以放慢一些,娓娓道来,更有故事感。

更牛的是,MiniMax语音能让声音拥有情绪,即使是同一个音色,也能表达出开心或悲伤;

提示词:

开心: 哇塞,这也太棒了吧!我等这一刻等好久了!

难过: 唉,咋会这样啊,我真有点撑不住了……

生气: 你到底要我说几遍?别再这样了!

害怕: 刚刚那扇门自己动了一下,我觉得背后凉飕飕的……

厌恶: 哎呀,这味儿太冲了,我闻着都想吐。

惊讶: 啊?你开什么玩笑?这事居然是真的?

我们还可以对声音做更细微的调节,比如让声音更低沉,或者更柔和;还可以配合各种场景特效,电音、空旷回声等。

MiniMax语音不光能说普通话,还能切换粤语,甚至四十多种语言。

一个音色,可以演绎完全不同的“表演效果”。

顺带提一句,MiniMax 的积分还挺耐用的。现在注册就可以白嫖 1w 积分,我跑这么多 case 也才花几百积分。

不过要注意,商用许可是需要会员才能解锁的,如果打算把作品对外发布或者生成商业内容,这一步是必须的。

会员价格也不高,差不多一顿外卖的钱,就能解锁全部功能,还是挺划算的。

 

03.一些分享

 

MiniMax 语音 让声音也能可控可设计,降低了创作门槛,同时也在重塑声优的职业边界。

未来,声音也会成为创作者经济的重要组成部分。

就像做海报需要设计师,拍视频需要导演,配音也不再是附属品,而是作品里独立、核心的表达维度。

MiniMax 语音在做的,不只是一个会读稿的AI机器,而是一个声音调音台。创作者可以随心所欲地捏音色、调情绪,就像调色、剪辑一样,把声音当作创作素材。

声音的可控化,意味着未来播客、小说、虚拟人,甚至音乐创作,都会有一套全新的玩法。

声音,正在从工具变成内容本身。

原文链接:苦练普通话,不如用AI配音邪修