當心陷入深度偽造語音陷阱
(相關資料圖)
如今,人工智能(AI)合成語音經常出現在抖音短視頻或有聲讀物中,大部分讓人感覺“一耳假”。
但是,近日一項發表于《公共科學圖書館-綜合》的研究指出,面對AI深度偽造的語音,即使知道可能在聽AI生成語音,講英語和普通話的人仍然很難準確地辨識出來。這意味著,使用世界上最常用語言的數十億人,正面臨深度偽造語音騙局或接收到錯誤信息的風險。
在該研究中,英國倫敦大學學院的Kimberly Mai和同事讓500多名參與者,挑戰在多個音頻片段中識別出AI深度偽造的語音。其中一些片段為女性講英語或普通話通用句的真實聲音,而另一些片段是利用女性聲音訓練的AI創建的深度偽造語音。
研究參與者被隨機分配到兩個實驗組中。其中一組聽20個母語語音樣本,并判斷真假,參與者分辨出人聲和AI合成語音的準確率約為70%。這表明,人類在現實生活中對深度偽造語音的辨識能力可能會更糟一些,因為大多數人不一定事先知道他們可能在聽AI生成的語音。
另一組參與者聽20對隨機選擇的音頻。每一對音頻所述內容一致,不過分別是真實人聲和AI偽造的語音錄制的,參與者需要辨識出偽造的那一個。這次,準確率提高到了85%以上。不過研究團隊表示,這種情況下的測試,給聽者帶來了實際生活中不存在的優勢。
“這種實驗設置的場景不能完全代表現實生活中的場景。”Mai說,因為現實生活中聽眾不會被事先告知他們所聽的內容可能是AI偽造的。此外,說話者的性別、年齡等因素可能也會對真偽的識別產生影響。
美國加利福尼亞大學伯克利分校的Hany Farid說,在現實生活中,識別特定聲音厄真實性很重要,因為騙子可能通過模仿領導的聲音誘騙員工轉賬,或者將深度偽造的知名政客語音在社交媒體傳播錯誤信息等。該研究為深度偽造語音自動檢測系統的構建設立了一個有用的基線。
關鍵詞:
相關文章
精彩推送
遠興能源(000683.SZ):阿拉善天然堿項目一期第一條生產線正進行裝置的聯調聯試并產出少量試產品
格隆匯8月2日丨有投資者向遠興能源(000683)(000683 SZ)提問,“可否向
Dorchester Minerals(DMLP.US):2023年Q2財報實現營收3061.9萬美元
DorchesterMinerals(DMLP US):2023年Q2財報實現營收3061 9萬美元,前