國內首創AI播客 《大俗小雅》穿越電流訴說文人理想與赤誠真心
用AI做一期播客節目,有什么不同?——只需要30秒的語音素材,就能在ChatGPT的幫助下制作出一期和主播聲音一模一樣的節目,曾經科幻電影中的情節,已經在“aigc元年”的今年實現了。就在上個月,網易云內的播客節目《大俗小雅》發布了《139AI播客:最長情的陪伴無需告白》,這是一期完全由AI生成故事情節和語言的播客,在一周內收獲了幾萬播放量卻幾乎沒有被任何聽眾發現,節目中由GPT書寫的真情實感的故事收獲了非常多聽眾的留言和分享。
我們和這期節目的制作者以及大俗小雅的主理人秧子和小希聊了聊她們的這次新嘗試。
01如果讓ai替代制作人做一期節目,還能有聽眾和它共情嗎?小希、秧子與阿陀是共同就讀于南加州大學,作為大學同學,三個人在一間公寓同住了三年。他們會在趕due的夜晚一起散步,結伴壯膽穿過洛杉磯市中心治安堪憂的街區,去校園里24小時營業的星巴克買上一杯咖啡,美其名曰熬夜學習,實則為拖延復習找借口;也會一起窩在公寓的小房間里邊畫圖、寫論文,電腦上放著《快樂大本營》和《一年級》作為背景音,或是約定在期末前到離校園車程五分鐘的韓國城吃參雞湯。2020年因為居家時間變多,那時小希在紐約建筑師事務所工作,阿陀是剛剛入職舊金山大廠的碼農,秧子就在德國小城海德堡繼續著自己的博士學業,三位老友都處在異鄉宅家的困頓和孤獨之中,于是便相約遠程視頻,那是他們三個人兩月進行一次的傳統項目(但經常鴿掉對方)。
【資料圖】
這個小小嘗試居然逐漸在之后的日子里延續下來并成為了一檔受聽眾歡迎的陪伴型藝術生活方式播客,每周三在各大音頻平臺穩定更新,收獲了超過1800萬的收聽,陪伴大家走過了150個小時。在這個節目即將來到三周年的時間點,秧子和小希逐漸想探索一些播客這個媒介新鮮的可能性。他們在自己的欄目里發布了一期由AI生成的播客,一周內就收獲了兩萬多播放量,沒有被大家發現是由AI制作,還得到了很多溫暖的陪伴故事評論互動。
許多聽友在收聽完這期由AI生成的節目對里面的故事產生了強烈的共情,很多朋友聽到主播們的聲音會有一點點不自然,擔心小希與秧子最近是否遭遇了一些日常生活中的不如意,希望主播們不要太辛苦。
也有小伙伴分享自己在異鄉的經歷,感謝《大俗小雅》一路以來的陪伴。
在接下來第二周的節目中,小希和秧子詳細介紹了整個AI播客制作的過程和不同模型的效果對比。她們希望通過這個互動實踐探索AI生成的內容是否能激起人類真實的共情以及AI與聽眾產生真實情感交流的可能性,而《大俗小雅》也收獲了很多溫暖療愈的留言。正如其中一個小伙伴所說:“AI永遠無法徹底取代人類,感情是用心陪伴滋養出來的”……
02再也不用錄節目,靠ai創造就能變現,真的如此簡單嗎?隨著《大俗小雅》逐漸變成一個體量較大的播客,她們的商業化也逐漸越來越成功。曾獲得加拿大旅游局、喜馬拉雅與天貓“雙11”、多鄰國、佩槍朱麗葉等多個品牌與機構的合作。AI制作節目的工作方式在她們一開始的設想里,是一次大膽的藝術嘗試,利用AI生成播客也會是一件令她們提高節目制作效率的方式。
隨著錄制的節目越來越多,以及每周需要一期的穩定更新,秧子和小希也逐漸發現自己的生活已經陷入了素材瓶頸和精力局限,AI也能幫助她們實現源源不斷的制作靈感。那么讓AI實現創作變現真的有這么簡單嗎?
秧子認為“制作一期由AI生成的播客節目需要兩個方面的結合:由chatgpt生成的文稿結合聲音克隆的模型將文本轉化為語音節目。我們將往期陪伴或感情節目的大綱及逐字稿投喂給AI,比如《043見習愛情一無所知的每問必答》、《091七夕回訪特輯:智者不墜愛河》等等,計劃生成一期城市漫游與戀愛結合的故事。”
小希和秧子首先輸入了《121獨自生活十一年:享受孤獨賦予的滿足與力量》給chatgpt。這期節目主要講述了小希、秧子、桃醬輾轉在不同城市獨居生活的故事, AI很快就給她們生成了更多流轉在不同城市生活的細節。比如小希在巴塞羅那的故事,chatgpt通過一些資料分析出小希是從洛杉磯搬去巴塞羅那。AI如是描寫道: “……住在一個有點老租的小公寓,雖然是二手的,也有點舊,但坐在窗邊一看,滿眼的城市風光,古老的教堂塔尖矗立在藍天下……”這些描述與小希的經歷有80%相似,但是又增添了幾分浪漫的想象,這讓小希和秧子第一次意識到AI的理解和表達能力是超乎想象的。除卻文稿創作,在語音錄制上,我們嘗試了AIGC和SoVIT等人工智能系統語音生成模型。AIGC "AI Generated Content"(人工智能生成的內容)指的是由人工智能系統或模型生成的各種類型的內容。這些內容可以包括文本、圖像、視頻、音樂、語音等。SoVITS“So Vits Svc”是一個是基于VITS用來模擬人聲的開源項目,可以將訓練好的聲音模型,用于生成歌曲音色改變或類似文字轉語音等效果。VITS(Variational Inference with adversarial learning for end-to-end Text-to-Speech)是一種結合變分推理(variational inference)、標準化流(normalizing flows)和對抗訓練的高表現力語音合成模型。VITS通過隱變量而非頻譜串聯起來語音合成中的聲學模型和聲碼器,在隱變量上進行隨機建模并利用隨機時長預測器,提高了合成語音的多樣性,輸入同樣的文本,能夠合成不同聲調和韻律的語音。
最終AI制作完成了一期由四段在不同城市的戀愛故事組成的節目,AI甚至編寫了四個華麗動人的故事子標題:《東京夏日緋戀:彼女與彼女》、《威尼斯夏瀾:水城光影下的細語戀曲》、《巴塞羅那初夏:彩色輪廓與古老鵝卵石的秘語》、《紐約雨色:地下迷城的街頭旋律》。
不過這個由AI編寫的故事最終在主播們給父母的試聽環節就被否決了,那時planet money正好發布了一期大概5分鐘的AI對話內容。Planet money傾注了很多資金,也運用了最頂尖的技術團隊,畢竟它是背靠NPR,股東是Google和Apple的頭部播客,那個時候小希和秧子就挺氣餒的,覺得憑她們兩個外行不可能做出來這個AI節目了。
不過,在經歷了短暫的消沉之后,兩位主播又重振旗鼓,打算采用一種更符合AI特點的方式完成這期節目的制作。
03用ai寫自己的故事,模仿自己的聲音AI像朋友一樣提供非常穩定的陪伴支持,于是,在最后階段《大俗小雅》選用了關于陪伴的命題。因為秧子和AI平時的互動很像書信對話,她會讓gpt每天寫一條早安信息,為開啟活力一天加油打氣。書信的形式也與兩位主播平時和聽友們在小宇宙留言區的交流形式很相似,于是《大俗小雅》最終選用了“聽友來信”的方式創作一期AI節目。
《大俗小雅》選用GPT4.0進行文本創作,模仿聽友的語氣撰寫了三封從小貓、播客和AI三個方面關于 “陪伴”這一主題的來信。GPT4.0GPT是“生成預訓練式變換器”(Generative Pre-trained Transformer)的縮寫,這是一種大規模的語言模型,用于處理各種語言理解和生成任務。每個新版本的GPT模型都在前一個版本的基礎上進行改進和擴展。最新內測的版本為GPT4.0版本
語音生成方面《大俗小雅》獲得了來自MINIMAX開放平臺的技術支持。
(MINIMAX新一代通用大模型所提供的語音大模型區別于傳統TTS合成技術,可以通過對文本語義語境的理解,可以直接生成有聲小說、有聲漫畫等,達成高質量的文本理解及語音合成能力。)
04倫理爭議AI生成的內容以及在社交媒體的運用一直以來都有爭議性。例如播客最大的平臺喜馬拉雅就明確規定純AI生成的內容需要加以標注說明。
此外,這期節目雖然收到了大家的很多好評,有聽友評價道,這是“最有創意的節目”,但同時也受到了一些倫理方面的爭議,比如有聽眾留言,兩位主播利用了大家的感情。
而這次播客界的AI藝術互動實驗項目也借鑒了瑪麗Marina Abramovi?的《藝術家在現場》(Artist is Present)以及Amalia Ulman的《優秀&完美》(Excellences & Perfections)等藝術家的女性主義與行為藝術理論與概念,利用AI創造了在虛擬平行世界里錄制節目,扮演著雙重角色的秧子和小希。
05真實的情感交流,是一切播客的意義秧子和小希表示,每一次和聽友們的真誠交流都使她們更加珍惜播客讓互不認識的人們穿越電波,產生心靈的共振與聯結。無論是在早高峰的通勤路上還是睡前的獨處時間,聲音這一神奇的媒介總能給予人們特別的治愈力與陪伴感。
從2020年11月開始,默默無聞沉寂了3個月后,《重返20歲–Lan La Land的美食地圖》登上小宇宙新星榜,再之后《紐約客們的師生誼與斷背情–木心 陳丹青 白先勇 李安》 等數期節目登上小宇宙首頁,直到最近的《櫻花滿天的日子–繪畫少年的出走與回歸》,小宇宙首頁在蔡國強工作室Instagram的跨次元相遇……
06跨越無數,在電波的盡頭和真心相遇從三人節目到阿陀退出,小希和秧子每周請不同的嘉賓錄制節目;再到今年,小希和秧子雙雙成為都市打工人,下了班努力,“把對?件事的拖延化作對另?件事的動力”……她們至今已經完成《城市漫游:旅居在別處》系列在內,一周不落的140余期節目。一直和熱愛的事物和有愛的一群聽友們在一起,小希和秧子是抓住播客井噴元年的幸運兒。
她們說:“立言是傳統文人的理想。除了灌輸思想之外,便是表達情感吧。感謝網絡,讓世界的每一個角落都可能聯結;感謝一個個角落里那些心弦共振的人,讓遠隔萬里的人不那么孤獨 ……讓數以萬計的人傾聽和共情的我們是幸運的。那么,就請這樣一直陪伴彼此走下去吧……”
創始人及本文作者秧子
關鍵詞: