最近我发现了一个给视频配音的邪修思路。用 AI 就能生成真人感满满的声音。
事情是这样的——前几天我终于有时间,抽空剪了第一条视频,信心满满地发给朋友帮我把把关。
他看完沉默半天,只回了两句:很牛逼!就是普通话…差点意思。
谁懂啊!作为一个从小到大N、L不分、平翘舌不分的湖北人,我已经反复练过几遍,还特地放慢了语速,结果听起来还是不对。
俺是真没招了。
就在这时,我想到了一个邪修思路——既然真人发音练不明白,那就干脆交给 AI 吧。
笑死,用 MiniMax语音配完音之后,朋友居然完全没听出来这是 AI 的声音。
普通的 AI 配音人机味太重!MiniMax语音发音的抑扬顿挫、情绪就拿捏得很到位,听起来就像是真人在说话。
今天就跟大家分享一些我自己摸索出来的邪修配音小技巧~无论是自己录视频、博客,语音相关的内容,都能派上用场。
01. 一句话捏一个专属声音
月初的时候,MiniMax发布了他们最新的语音生成模型Speech 2.5,主要升级了2个点:语言表现力更强,多语种能力更全面。
用法很简单,我们打开MiniMax语音首页,直接输入文本,几秒钟就可以生成一段非常逼真的音频。
MiniMax语音内置了300多种预设音色,各种语种、口音、性别、年龄几乎全覆盖。从广告旁白到儿童动画,都能找到合适的声音。
但真正吸引我的,是它的音色设计功能。
只需要一句话描述,就能生成一个有情绪、有特点的 AI 声音,开口就是满满的真人感。
关于音色设计提示词,有一个万能公式:[角色身份] + [声音质感] + [语速/节奏] + [情绪状态] + [场景/用途]
比如输入:
提示词:儿童动画片中的活泼小朋友,声音清脆稚嫩,语速轻快跳跃,充满好奇与快乐,用于演绎卡通冒险故事。
一个适合儿童动画角色的声音就生成好啦。
声音清脆稚嫩,语速轻快,短短一句话里,就把惊讶、开心、兴奋的情绪变化自然串联起来,让角色听起来生动有趣,充满感染力。
我们经常刷到的yxh视频、影视解说配音,其实都可以直接用 MiniMax 语音生成。生成的声音情绪很饱满,不会有那种死气沉沉的人机味。
如果不想自己写提示词,也可以直接点击首页导航栏的对话,让 MiniMax M1 帮我们生成提示词。
提示词:我要设计一个用于解说古装大女主剧的音色,女声,请根据这个提示词生成公式,为我生成一句话提示词:[角色身份] + [声音质感] + [语速/节奏] + [情绪状态] + [场景/用途]。
比如,市井集市中热情吆喝的小贩,声音响亮,带地方口音,充满生活气息。
从 MiniMax M1 生成的提示词中,挑选一个觉得比较合适的,就可以直接用于生成音色。
提示词:宫廷贵妃雍容华贵的独白,声音华丽而富有磁性,带有轻微的回音效果,语速缓慢而优雅,节奏舒缓,富有韵律感,情绪高贵而从容,带有淡淡的忧伤和沉思,用于角色内心独白或回忆往昔。
每次它会生成3种音色供我们选择,我们可以分别试听,如果对3种音色都不满意,可以选择重新生成,直到我们满意为止。这个过程是完全不消耗积分的哦!
我用这个声音做一个热播剧的解说视频,一起试听一下音色效果:
确认选择一种音色之后,我们给音色命名,打上标签。
之后每次使用文本转语音功能,都可以选择用这款音色生成配音。音色一致性的问题就这么轻松搞定~
相当于每个人都可以拥有随时在线、能模拟各种人声音色的声优伙伴!
不管是做自媒体视频,还是广告配音、广播播音…这都是实打实的降本增效。
配音时,打开长文模式,单次最多能生成200000字符的音频,相当于可以把《三体·地球往事》这样一部长篇小说,一次性转为有声读物。
我就很喜欢一边干活一边听悬疑故事,感觉比刷短视频还上头。
02. 让声音更自然的小技巧
MiniMax语音有一个调试台,同样的音色,我们可以通过调试台做出不同的声音效果,让音频与使用场景更贴合。
语速、声调、音量这些算是最基础的调整了,我也摸索出一些小经验~
比如,年轻人的声音语速可以稍微加快一些,听起来更贴近现实,也比较适合当下短视频这样快节奏的内容。
老人说话语速可以放慢一些,娓娓道来,更有故事感。
更牛的是,MiniMax语音能让声音拥有情绪,即使是同一个音色,也能表达出开心或悲伤;
提示词:
开心: 哇塞,这也太棒了吧!我等这一刻等好久了!
难过: 唉,咋会这样啊,我真有点撑不住了……
生气: 你到底要我说几遍?别再这样了!
害怕: 刚刚那扇门自己动了一下,我觉得背后凉飕飕的……
厌恶: 哎呀,这味儿太冲了,我闻着都想吐。
惊讶: 啊?你开什么玩笑?这事居然是真的?
我们还可以对声音做更细微的调节,比如让声音更低沉,或者更柔和;还可以配合各种场景特效,电音、空旷回声等。
MiniMax语音不光能说普通话,还能切换粤语,甚至四十多种语言。
一个音色,可以演绎完全不同的“表演效果”。
顺带提一句,MiniMax 的积分还挺耐用的。现在注册就可以白嫖 1w 积分,我跑这么多 case 也才花几百积分。
不过要注意,商用许可是需要会员才能解锁的,如果打算把作品对外发布或者生成商业内容,这一步是必须的。
会员价格也不高,差不多一顿外卖的钱,就能解锁全部功能,还是挺划算的。
03.一些分享
MiniMax 语音 让声音也能可控可设计,降低了创作门槛,同时也在重塑声优的职业边界。
未来,声音也会成为创作者经济的重要组成部分。
就像做海报需要设计师,拍视频需要导演,配音也不再是附属品,而是作品里独立、核心的表达维度。
MiniMax 语音在做的,不只是一个会读稿的AI机器,而是一个声音调音台。创作者可以随心所欲地捏音色、调情绪,就像调色、剪辑一样,把声音当作创作素材。
声音的可控化,意味着未来播客、小说、虚拟人,甚至音乐创作,都会有一套全新的玩法。
声音,正在从工具变成内容本身。
原文链接:苦练普通话,不如用AI配音邪修