如何練出自己的ai？

2023-08-18 07:36:55 來源：嗶哩嗶哩

(資料圖片)

自從上期視頻發了后，不少人找我來要軟件，也有問怎么做ai的，所以單獨出一期視頻來講講關于ai翻唱，開始前先疊個甲

（本專欄僅為個人觀點，為面向0基礎新手的ai創作教學，可能會有講的不對的地方，歡迎大佬來友好指正，）

目前b站上的確是有不少教做ai的視頻，但是大家可能會因為接觸少，認知不夠，加上一些復雜的軟件被勸退，直接倒在起點線上，所以這期視頻主要是讓沒接觸過的新手對ai能有一個初步了解，本視頻也是提供思路，涉及到一些軟件的操作需要去稍微學一學，當然也是非常簡單的，那現在開始吧

就剛才講的那些來說，ai新手比較難上手的點就是繁多的步驟，這里先來捋一下，收集數據集—訓練ai模型—推理ai模型，還是很抽象的，舉鸚鵡的例子，人需要給鸚鵡講話，然后鸚鵡的大腦需要去學習，最后才能自己講出來，這里人講的話就是“數據集”，也就是你訓練的角色的語音，學習人的部分就是訓練，推理便是鸚鵡自己去講話。怎么樣，還是很清楚的，但是講起來簡單，一上手就容易廢。

1.數據集部分，先來看一下“收集數據集”的部分，首先你需要將你要訓練的角色的聲音或歌聲收集起來，簡單的方法就是錄屏，然后上傳到文件轉換器（/zh/），就能得到音頻文件了，一般來說總時長2個小時左右就夠了，但是我們都知道，鸚鵡可以模仿人的聲音，也能模仿很多其他聲音，之前我就看過一個模仿開燈聲音的鸚鵡，扯遠了，ai也是這樣，如果你的音頻文件不干凈，他也會模仿進去，所以這時候就需要一個去除雜聲的軟件了，UVR，軟件非常簡單且人性化，參數直接抄作業就可以了，對新手來說夠用了，提出來干聲后，用切片軟件切一下，鸚鵡也不能學出來2個多小時的話吧，把每個文件切到6mb一下，然后打包到一個文件夾里，第一項工作就做好了

2.訓練部分訓練這一步還是挺簡單的，這里拿so-vits-svc舉例，把數據集放進正確的位置，然后識別一下，下面的參數需要按照文檔上調整，要不然你的爐子就爆炸了，不過要調的也不多，重要的就是這個，如果顯存少，這個一定需要好好調整，不然就會爆，最后寫入配置文件就可以開始訓練了，有人可能會問訓練多久算好，這個我只能說去自己感受，你覺得好了就是好了。

3.推理部分推理算是最簡單的了，還是用so-vits-svc，訓練左邊就是推理，模型都是你剛剛訓練好的，選一下配置文件，然后就可以加載模型了，下面這些參數主要是這兩個，預測器最好是用rmvpe，變調主要是不同性別的音高轉變，比如我之前帝皇唱海闊天空，女聲唱男聲，就需要高一點的調子，我一般都調到6，這個還是需要你的耳朵去分辨調到多少更好，然后導入音頻干聲，轉換一下音頻就完成了，整體下來還是比較簡單的。

我的教學就到這里了，雖然沒有一些軟件深入的操作教學，但是我相信看完后一定有一個初步的認知了，這時候再去學一學操作的步驟，搓個模型出來豈不是易如反掌？如果有講的不對的地方或者不清楚的地方，歡迎提出來，感謝各位的支持，

關鍵詞：