如何練出自己的ai?
(資料圖片)
自從上期視頻發了后,不少人找我來要軟件,也有問怎么做ai的,所以單獨出一期視頻來講講關于ai翻唱,開始前先疊個甲
(本專欄僅為個人觀點,為面向0基礎新手的ai創作教學,可能會有講的不對的地方,歡迎大佬來友好指正,)
目前b站上的確是有不少教做ai的視頻,但是大家可能會因為接觸少,認知不夠,加上一些復雜的軟件被勸退,直接倒在起點線上,所以這期視頻主要是讓沒接觸過的新手對ai能有一個初步了解,本視頻也是提供思路,涉及到一些軟件的操作需要去稍微學一學,當然也是非常簡單的,那現在開始吧
就剛才講的那些來說,ai新手比較難上手的點就是繁多的步驟,這里先來捋一下,收集數據集—訓練ai模型—推理ai模型,還是很抽象的,舉鸚鵡的例子,人需要給鸚鵡講話,然后鸚鵡的大腦需要去學習,最后才能自己講出來,這里人講的話就是“數據集”,也就是你訓練的角色的語音,學習人的部分就是訓練,推理便是鸚鵡自己去講話。怎么樣,還是很清楚的,但是講起來簡單,一上手就容易廢。
1.數據集部分,先來看一下“收集數據集”的部分,首先你需要將你要訓練的角色的聲音或歌聲收集起來,簡單的方法就是錄屏,然后上傳到文件轉換器(/zh/),就能得到音頻文件了,一般來說總時長2個小時左右就夠了,但是我們都知道,鸚鵡可以模仿人的聲音,也能模仿很多其他聲音,之前我就看過一個模仿開燈聲音的鸚鵡,扯遠了,ai也是這樣,如果你的音頻文件不干凈,他也會模仿進去,所以這時候就需要一個去除雜聲的軟件了,UVR,軟件非常簡單且人性化,參數直接抄作業就可以了,對新手來說夠用了,提出來干聲后,用切片軟件切一下,鸚鵡也不能學出來2個多小時的話吧,把每個文件切到6mb一下,然后打包到一個文件夾里,第一項工作就做好了
2.訓練部分訓練這一步還是挺簡單的,這里拿so-vits-svc舉例,把數據集放進正確的位置,然后識別一下,下面的參數需要按照文檔上調整,要不然你的爐子就爆炸了,不過要調的也不多,重要的就是這個,如果顯存少,這個一定需要好好調整,不然就會爆,最后寫入配置文件就可以開始訓練了,有人可能會問訓練多久算好,這個我只能說去自己感受,你覺得好了就是好了。
3.推理部分推理算是最簡單的了,還是用so-vits-svc,訓練左邊就是推理,模型都是你剛剛訓練好的,選一下配置文件,然后就可以加載模型了,下面這些參數主要是這兩個,預測器最好是用rmvpe,變調主要是不同性別的音高轉變,比如我之前帝皇唱海闊天空,女聲唱男聲,就需要高一點的調子,我一般都調到6,這個還是需要你的耳朵去分辨調到多少更好,然后導入音頻干聲,轉換一下音頻就完成了,整體下來還是比較簡單的。
我的教學就到這里了,雖然沒有一些軟件深入的操作教學,但是我相信看完后一定有一個初步的認知了,這時候再去學一學操作的步驟,搓個模型出來豈不是易如反掌?如果有講的不對的地方或者不清楚的地方,歡迎提出來,感謝各位的支持,
關鍵詞: