经过不停的加班加点,精修了1个多小时的音频,3060耗时20小时训练了1389 epoch的第二版蓝月小姐姐终于出炉了!!
这一版模型在歌唱的咬字能力,噪声控制,音色相似性均优于第一版蓝月,更接近于蓝月本月了
但是依旧,模仿的再像,也改变不了这是没有感情的机器的事实,
真正的蓝月小姐姐唱的歌会带有一丝ai所不具备的灵动感(怎么形容呢,就是一种情绪高涨,欢快跳跃的节奏感),且能做到过程中的变调和声线变换
而这也是人类歌姬所拥有的最大优势
对比看看就知道了:【选曲为富婆妹ost常磐华乃的happy palette♪】
原版的真蓝月 和
经过au自带的伸缩变调器(手动给ai挖了个大坑)处理完后再由ai模仿的假蓝月
[ps.我也不知道这种对比是否可靠or有意义]
链接:https://pan.baidu.com/s/16OJRxcDDOzdA9AU3jFQZmQ?pwd=snkr 提取码:snkr
很显然,只是单纯的声线模仿,没有感情。。。。且在我挖了坑后,模型不出意外的出意外了,咬字能力大幅降低,声线不稳
并且链接里面有原版的歌曲,网易云也有,很好听,建议看帖的每个人都给我听100遍
在老曲子 锦亚澄的[トキラキメキ]测试中,这个模型表现还挺不错的,基本没有出错和糟糕的地方
上链接:https://pan.baidu.com/s/1UNYFKs4wNJDncw-jByJOsA?pwd=snkr 提取码:snkr
请欣赏。
[ps。]
不得不说,写帖子全部重新试听的时候才发现原来bgm也能掩盖掉不少演唱中的不良成分啊。。。。。
带bgm的版本基本听不出任何瑕疵(也有可能是我木耳)
其他的测试比如让它唱华语的爱情转移 欧美的什么就不放上去了,能唱,没出问题,就是心里感觉怪怪的(不应该用蓝月的声线唱)
但是这一版在测试中也暴露出来一个问题:
本人评判一个模型的方法是采用不同语言的朗读+歌唱,这一版在英语朗读这方面表现极其糟糕
看来拿它做有声朗读是没戏了。。。。。
想想办法吧,要换方案(比如whisper-vits)?
另外,在群里得知富婆妹要被动画化了【我尚且不清楚是全年龄动画还是里番】
我却还没有玩到富婆妹fd的汉化。。。。。。
怎么说??
祝动画化好运??
我可不想再看到下一个苍彼式动画化了