究极大水怪又来了_新的sovits版蓝月小姐姐又炼出来啦

kotolizili

经过不停的加班加点，精修了1个多小时的音频，3060耗时20小时训练了1389 epoch的第二版蓝月小姐姐终于出炉了！！
这一版模型在歌唱的咬字能力，噪声控制，音色相似性均优于第一版蓝月，更接近于蓝月本月了
但是依旧，模仿的再像，也改变不了这是没有感情的机器的事实，
真正的蓝月小姐姐唱的歌会带有一丝ai所不具备的灵动感（怎么形容呢，就是一种情绪高涨，欢快跳跃的节奏感），且能做到过程中的变调和声线变换
而这也是人类歌姬所拥有的最大优势

对比看看就知道了：【选曲为富婆妹ost常磐华乃的happy palette♪】
原版的真蓝月和
经过au自带的伸缩变调器（手动给ai挖了个大坑）处理完后再由ai模仿的假蓝月
[ps.我也不知道这种对比是否可靠or有意义]
链接：https://pan.baidu.com/s/16OJRxcDDOzdA9AU3jFQZmQ?pwd=snkr 提取码：snkr
很显然，只是单纯的声线模仿，没有感情。。。。且在我挖了坑后，模型不出意外的出意外了，咬字能力大幅降低，声线不稳
并且链接里面有原版的歌曲，网易云也有，很好听，建议看帖的每个人都给我听100遍

在老曲子锦亚澄的[トキラキメキ]测试中，这个模型表现还挺不错的，基本没有出错和糟糕的地方
上链接：https://pan.baidu.com/s/1UNYFKs4wNJDncw-jByJOsA?pwd=snkr 提取码：snkr
请欣赏。

[ps。]
不得不说，写帖子全部重新试听的时候才发现原来bgm也能掩盖掉不少演唱中的不良成分啊。。。。。
带bgm的版本基本听不出任何瑕疵（也有可能是我木耳）
其他的测试比如让它唱华语的爱情转移欧美的什么就不放上去了，能唱，没出问题，就是心里感觉怪怪的（不应该用蓝月的声线唱）

但是这一版在测试中也暴露出来一个问题：
本人评判一个模型的方法是采用不同语言的朗读+歌唱，这一版在英语朗读这方面表现极其糟糕
看来拿它做有声朗读是没戏了。。。。。
想想办法吧，要换方案（比如whisper-vits)？

另外，在群里得知富婆妹要被动画化了【我尚且不清楚是全年龄动画还是里番】
我却还没有玩到富婆妹fd的汉化。。。。。。
怎么说？？
祝动画化好运？？
我可不想再看到下一个苍彼式动画化了

kotolizili

快递来了，这是模型本体：
链接：https://pan.baidu.com/s/1NDknk1LItnrixcBjBwZnnQ?pwd=snkr
提取码：snkr

kotolizili

包体密码就是站点通用的密码

Q-Q

kotolizili 好好好，没电脑怎么办

kotolizili

La Soleli(有事请@)
没电脑还没钱买电脑，这还不简单

上网吧啊
上网吧啊
上网吧啊，网吧的3060还是12GB显存的，能开更大的batch，上限更高
不像我的6G显存扣扣嗖嗖的，还得想尽办法节约

刚刚体测完回来，好累，一怒之下又用蓝月小姐姐合成了个枯花的op
永远绽放之花祝你拥有美好的一天：
https://pan.baidu.com/s/1Yotb-xnZf5plol7m5hCXAg?pwd=snkr

kotolizili

卧槽我把au设置错了把有问题的那版发出去了。。。
现已修正

shirohana

没电脑还没钱买电脑还不能竖尾巴怎么办(｡・`ω´･)

Q-Q

shirohana 那就艾草

shirohana

La Soleli(有事请@) 达咩！！

kotolizili

现在是7月2日22：12，这次暑假大家伙应该都回来了，社区也开始热闹了
那么kotolizili这次也带来了一份小礼物，Candy A Mine，糖调的OP曲，三个小萝莉的冬季体验
即使是炎热的夏天，也可以试着把空调温度拉低，蜷缩在被窝里，用krkr来体会那份温暖的美好
毕竟，谁不喜欢在冬天手捧装着热可可的马克杯，和萝莉肩并肩靠坐在一起，盖着同一条毯子呢
平淡而又温馨，二次元的美好不过如此

本次曲目人声部由二代目蓝月模型完成，人肉调校、混响，发音根据网易云的歌词逐字校对
Inst.部由UVR5 AI直接搭配VRA-5_Karaoke模型硬扒，表现挺不错，因为原曲CD并没有提供任何Inst版本
曲绘由本人完成，活人人肉手绘，画到吐血，不接受诸如画的不如AI的批评
歌曲部分在6月26日下午2点正式开工，27日晚上11点完结
曲绘部分在6月29日下午3点正式开工，7月2日下午4点完结
时长一周的小长线作战宣告胜利结束
在此奉上礼物本身：链接：https://pan.baidu.com/s/1GmaKbcebC_G5nJ0woikYkA?pwd=snkr

AI的训练本身就是一个玄学，里面就是一个黑盒，因此每次训练我都会拜三拜
二代蓝月模型作为我的幸运之作，其本身也是各种巧合拼接而成
音域广不广啦，底噪大不大啦，训练有没有欠拟合/过拟合啦，相似度好不好啦这些的
我能控制到的因素也只有训练时长、素材处理、参数控制这几个，成品如何我也不敢想
每个模型的制作和训练要花费数天的时间和精力，在经手了十几个不同的模型之后
很幸运，虽然不是最新的，但它是我遇到过最好、最平衡的模型
这对我来说就是一个奇迹。
祝福各位在接下来的暑期生活中，也能遇见属于自己的奇迹
或者说，创造自己或他人的奇迹

无需在意奇迹为何发生，只要享受奇迹当下便好
榊伞哥哥说的(bushi)

Q-Q

kotolizili 我测你来真的啊？

kotolizili

曲绘部分这里有提供了原始的psd文件，如果觉得哪里有点怪怪的，可以在这里挑个刺
有能力的巨巨也欢迎直接上手改了它
欢迎各路大佬特供的任何建议，无论是模型本身、人声合成还是曲绘，感激不尽
晚安

shirohana

什么？糖调？我永远喜欢圣代桥冰织(｡・`ω´･)