百圖生科CEO劉維:生命科學(xué)AI大模型,開啟創(chuàng)新藥物研發(fā)新范式
作者|閆妍
(資料圖)
出品|網(wǎng)易科技《潮頭》欄目
生命科學(xué)領(lǐng)域正在迎來新故事。
就像ChatGPT打開了人機(jī)對(duì)話的窗口,一批生命科學(xué)AI大模型也在開發(fā)的路上,甚至已經(jīng)有人打響了落地第一槍,或?qū)樾袠I(yè)帶來革命性的變化。
“我們?cè)谕ㄟ^大模型盡量地學(xué)習(xí)生物進(jìn)化規(guī)律,有點(diǎn)像在數(shù)字世界不斷重啟地球,希望從中找到對(duì)人類有益的新東西,填補(bǔ)復(fù)雜行業(yè)問題與前沿算法之間的關(guān)鍵空白地帶,為科研、環(huán)保、材料、消費(fèi)等領(lǐng)域提供解決方案。”百圖生科CEO劉維告訴網(wǎng)易科技《潮頭》欄目。
簡單來說,他們?cè)诖蛟煲粋€(gè)能生成蛋白質(zhì)的ChatGPT,探索人類進(jìn)化過程中蛋白質(zhì)組合的各種可能性,根據(jù)用戶給定的參數(shù)和功能,以生成的方式,設(shè)計(jì)創(chuàng)新的蛋白質(zhì)(抗體、酶等)、細(xì)胞等設(shè)計(jì)方案,來回答各種生命科學(xué)問題。
2020年,百度集團(tuán)創(chuàng)始人李彥宏和時(shí)任百度風(fēng)投CEO的劉維,決定聯(lián)合創(chuàng)辦百圖生科。2021年,百圖生科構(gòu)建了世界最大規(guī)模的免疫圖譜,并做出了千億參數(shù)規(guī)模的大模型“xTrimo”,這是全球首個(gè)、也是目前最大的生命科學(xué)領(lǐng)域的“超大規(guī)模多模態(tài)模型體系”。后來,基于該模型研發(fā)了用戶交互窗口AIGP平臺(tái)(AI Generated Protein,AI生成蛋白質(zhì)平臺(tái)),AIGP在2022年開始內(nèi)部使用,2023年宣布擴(kuò)大內(nèi)測(cè)范圍,目前合作伙伴已超20家,今年有望擴(kuò)展到50家左右。
在劉維看來,尤其在承擔(dān)著人類生命健康使命的新藥研發(fā)行業(yè)中,大模型的社會(huì)價(jià)值和行業(yè)價(jià)值極高。
核心點(diǎn)在于,它能夠幫助研究者節(jié)約大量的實(shí)驗(yàn)時(shí)間和實(shí)驗(yàn)費(fèi)用。“全球范圍每年要花費(fèi)幾千億美金在臨床試驗(yàn)上,僅一輪動(dòng)物實(shí)驗(yàn)就要花費(fèi)幾月時(shí)間、幾百萬成本,有的企業(yè)花費(fèi)幾年時(shí)間圍繞著一個(gè)靶點(diǎn)來研發(fā)一款藥物,但到最后關(guān)頭前功盡棄,這種行業(yè)格局使得大家都在苦行僧之路上長期前行。”劉維講。
在他看來,大部分的藥物研發(fā)往往只夠針對(duì)單個(gè)靶點(diǎn),這是整個(gè)行業(yè)低效的源頭問題。“有很多失敗是一開始就埋下的,前期參數(shù)就存在了問題,未來在foundation model驅(qū)動(dòng)下,很快就能根據(jù)已有參數(shù)涌現(xiàn)出答案,這對(duì)于從0到1的創(chuàng)新發(fā)現(xiàn),可能提高的是很多年的效率。”
劉維告訴《潮頭》欄目,AI技術(shù)應(yīng)用在生命科學(xué)領(lǐng)域的最終價(jià)值,是幫助解碼、治愈所有的疾病,解決當(dāng)下難以應(yīng)對(duì)的全球公共健康問題。
奇點(diǎn)將至
生物計(jì)算加速“進(jìn)化樹”
《潮頭》:兩年前,百圖生科開始布局大模型“xTrimo",當(dāng)時(shí)決定要做這件事的契機(jī)是什么?
劉維:其實(shí)BioMap這個(gè)公司名字也跟大模型很有關(guān)系,當(dāng)然它沒有叫“Bio大模型”,而是叫了“Map”這個(gè)名字,實(shí)際上公司創(chuàng)立之初就希望,圍繞著難成藥靶點(diǎn)全新蛋白等實(shí)驗(yàn)篩選手段篩不出來的領(lǐng)域,利用大模型對(duì)于弱關(guān)聯(lián)語料的處理能力,從海量的生物數(shù)據(jù)里面提取對(duì)科研人員有意義的規(guī)律,為行業(yè)提供更好的生物地圖(BioMap)。
2020年底,我和Robin為什么決定要做這家公司?其一個(gè)核心判斷就是看到OpenAI開發(fā)了GPT-3,人類的第一個(gè)千億參數(shù)大模型出現(xiàn),這種技術(shù)的躍升,讓我們看到了做垂類大模型更大的潛力,這也是我們決定要成立這家公司的原因之一。公司最早的時(shí)候有張計(jì)劃圖,左邊寫的就是預(yù)訓(xùn)練大模型,右邊寫的是若干個(gè)任務(wù)模型。
《潮頭》:大模型可以切入的方向有很多,你們?yōu)槭裁催x擇了生命科學(xué)這個(gè)場(chǎng)景?
劉維:我認(rèn)為大模型的核心優(yōu)勢(shì),可以從它的入口和出口去判斷,它的入口需要比較大量的弱關(guān)聯(lián)數(shù)據(jù),出口需要找到適合大模型去做缺乏任務(wù)數(shù)據(jù)的場(chǎng)景。滿足入口、出口這兩個(gè)約束條件之后,大模型就在這個(gè)應(yīng)用場(chǎng)景內(nèi)變得更有用武之地。否則,如果沒有大量前端的弱關(guān)聯(lián)數(shù)據(jù),大模型無從訓(xùn)起。或者相反,如果任務(wù)數(shù)據(jù)已經(jīng)比較豐富了,實(shí)際上也不需要大模型,用傳統(tǒng)的AI模型也能做。
我們?nèi)プ鲞@家公司,恰好配合了這么一個(gè)時(shí)間點(diǎn),海量的生物數(shù)據(jù)開始出現(xiàn),但是它還沒有被整理好,不夠高質(zhì)量,也不夠任務(wù)相關(guān),這個(gè)時(shí)候如果誰能夠先用一種新技術(shù)把它們利用起來,誰能用一個(gè)技術(shù)平臺(tái)把它們匯聚起來,在海量的數(shù)據(jù)里找出規(guī)律,用來解決缺乏數(shù)據(jù)的特定問題,我們覺得就能夠批量化地解決很多創(chuàng)新藥物或者生命科學(xué)項(xiàng)目研發(fā)的挑戰(zhàn)。
《潮頭》:當(dāng)時(shí)希望“xTrimo"具備怎樣的能力?目前又實(shí)現(xiàn)了多少?
劉維:大模型的核心就是生成、涌現(xiàn),而且這種涌現(xiàn)是低成本、高泛化能力、高場(chǎng)景適應(yīng)性的。我們當(dāng)時(shí)寫下的第一個(gè)任務(wù),是希望解決免疫領(lǐng)域中復(fù)雜規(guī)律的一系列小任務(wù)。但這兩年,我們發(fā)現(xiàn)大模型在泛化的蛋白和細(xì)胞任務(wù)上的表現(xiàn)比想象中更好。從免疫高性能抗體起步,到其他非免疫領(lǐng)域的高性能抗體,再到藥物領(lǐng)域中用到的其他蛋白質(zhì),大模型對(duì)這些問題的預(yù)測(cè)、生成是有泛化能力的,已經(jīng)可以通過技術(shù)去摘取一些“果實(shí)”。
今年,我們還有一個(gè)很大的發(fā)現(xiàn),酶作為一類蛋白質(zhì),大模型對(duì)它們的能力也很突出,所以我們正在研究跟石油有關(guān)的酶,跟環(huán)保有關(guān)的酶等等。背后意義在于,油井里的酶可以促進(jìn)有機(jī)物更好地凝固,環(huán)保場(chǎng)景下酶可以促進(jìn)塑料更快降解,以及工業(yè)催化、釀酒等行業(yè)都需要各種各樣更好的酶,但這些酶在傳統(tǒng)自然界中還沒有進(jìn)化出來,小改進(jìn)也改不出來,沒有生成能力就很難做出全新的設(shè)計(jì)。
我們希望通過大模型設(shè)計(jì)全新的蛋白質(zhì)藥物、全新的酶,有點(diǎn)像是在加速“進(jìn)化樹”,以前生物學(xué)的發(fā)現(xiàn)大多是靠在自然界去“撈”,現(xiàn)在更像是將潛在的蛋白質(zhì)構(gòu)成視作一個(gè)巨大的模型,可以在數(shù)萬億倍的增量空間去探索人類進(jìn)化過程中,蛋白質(zhì)組合的各種可能性,釋放更多未知領(lǐng)域的潛力。
《潮頭》:AI大模型需要計(jì)算資源,數(shù)據(jù)集深度學(xué)習(xí)框架,語料庫等多項(xiàng)能力的支撐。
但很多醫(yī)藥企業(yè)對(duì)于數(shù)據(jù)保護(hù)格外慎重,生物數(shù)據(jù)的缺乏,是否對(duì)大模型的訓(xùn)練帶來挑戰(zhàn)?
劉維:如果我們只看強(qiáng)關(guān)聯(lián)數(shù)據(jù),它一定是稀缺的。不僅是我們這樣的公司缺,大的藥企也缺。我們今天跟很多大藥企去合作,會(huì)發(fā)現(xiàn)其實(shí)數(shù)據(jù)沒有想象中的那么多。
背后原因很簡單,一是生物實(shí)驗(yàn)的方法,本身能產(chǎn)生的數(shù)據(jù)就很有限;二是以往的藥物發(fā)現(xiàn)大多以真實(shí)物理世界篩選為主,以動(dòng)物實(shí)驗(yàn)作為驗(yàn)證主體,實(shí)驗(yàn)中常見的是只去記錄好的、良性結(jié)果的數(shù)據(jù),而被篩出去的不成功產(chǎn)物,這些數(shù)據(jù)則沒有被記錄,不成功不一定意義等于0,可能是0.2、0.3、0.4,但很多高質(zhì)量的數(shù)據(jù)其實(shí)被丟掉了;三是藥企可能產(chǎn)生過很多數(shù)據(jù),但是他們又積累了多少呢?因?yàn)檫@些數(shù)據(jù)的存儲(chǔ)、整理都是很高的成本。所以,藥企并沒有想象中的那么多數(shù)據(jù),就算有一些,也遠(yuǎn)遠(yuǎn)不足以做大模型。
《潮頭》:那么在數(shù)據(jù)缺口問題上,你的解決辦法是什么?
劉維:我們最后在北京、蘇州兩地,各建了上萬平的高通量實(shí)驗(yàn)室,原因其實(shí)就是很多行業(yè)的數(shù)據(jù)采集技術(shù)和標(biāo)準(zhǔn),并不符合AI需求。我們自己建立實(shí)驗(yàn)室,目標(biāo)就是要去重新塑造這樣的流程和技術(shù)標(biāo)準(zhǔn),并且把它反推給行業(yè)。
但是我們更核心的解決方案是更AI化的,我們希望聚合公開數(shù)據(jù)實(shí)現(xiàn)海量的語料為大模型所用。在數(shù)據(jù)話題上,其實(shí)生命科學(xué)比起其他行業(yè)有個(gè)優(yōu)勢(shì),出于行業(yè)監(jiān)管的原因,這個(gè)領(lǐng)域有極為大量的科學(xué)研究數(shù)據(jù)必須公布,比如臨床數(shù)據(jù)、藥物實(shí)驗(yàn)結(jié)果等等,科學(xué)論文更是非常活躍。我們現(xiàn)在已經(jīng)構(gòu)建了世界最大的一個(gè)生命科學(xué)數(shù)據(jù)集,萬億規(guī)模的數(shù)據(jù)圖譜,這也是兩年多來做出的一個(gè)比較大的投入,里面納入了來自2億篇論文,超1億篇專利,幾百萬篇類似于FDA報(bào)告的專業(yè)文檔,以及幾千個(gè)不同的數(shù)據(jù)庫的數(shù)據(jù),這種體量的行業(yè)數(shù)據(jù)是任何一家企業(yè)遠(yuǎn)遠(yuǎn)無法積累到的,而這些數(shù)據(jù)的獲取,處理,數(shù)據(jù)工程又構(gòu)成了非常深的護(hù)城河。
《潮頭》:在你看來,生命科學(xué)AI大模型將如何幫助行業(yè)降本增效?
劉維:一個(gè)在于降本,以往的藥物發(fā)現(xiàn)大多以動(dòng)物實(shí)驗(yàn)作為驗(yàn)證主體,一輪動(dòng)物實(shí)驗(yàn)要花費(fèi)幾個(gè)月的時(shí)間、幾百萬的成本,現(xiàn)在可以直接通過大模型生成預(yù)測(cè),前面的實(shí)驗(yàn)環(huán)節(jié)會(huì)大大節(jié)約(成本)。
還有一個(gè)在于提效,全球范圍每年可能要花費(fèi)幾千億美金在臨床試驗(yàn)里,但其實(shí)很多都是在浪費(fèi),因?yàn)楹竺娴氖「怕屎芨摺1热纾泻芏嗍∈且婚_始就埋下的,前期參數(shù)就存在問題,越拖到后面造成的成本損耗越大。未來,在foundation model驅(qū)動(dòng)下,后面明知會(huì)失敗的事情,前面這些環(huán)節(jié)就不要做了。這對(duì)于從0到1的創(chuàng)新發(fā)現(xiàn),可能提高的是很多年的效率。
聚焦人才
組建一支真正與國際接軌的團(tuán)隊(duì)
《潮頭》:中國的通用大模型整體發(fā)展落后于美國,但令人意外的是,百圖生科做出了生命科學(xué)領(lǐng)域最大的模型,而且是最領(lǐng)先的,這是為什么?
劉維:我們做得夠早,從2020年開始做這個(gè)事,在整個(gè)行業(yè)里,無論是做生命科學(xué)的foundation model,還是作為一家獨(dú)立公司做foundation model,2020年都是很早的。其次,我們還很快,這個(gè)“快”體現(xiàn)在萬億規(guī)模的數(shù)據(jù)圖譜構(gòu)建,我們利用了中國非常好的工程優(yōu)勢(shì),我覺得在中國可能比美國要快10倍。
《潮頭》:怎么講?為什么能比美國快10倍?
劉維:在數(shù)據(jù)圖譜的構(gòu)建過程中,其實(shí)有大量的數(shù)據(jù)工程工作,大量的工具開發(fā)工作,背后都回歸到了人的努力程度,跟人員的成本和工程的組織效率息息相關(guān)。例如,數(shù)據(jù)標(biāo)記工作,我們高峰期大概有上百人的專業(yè)團(tuán)隊(duì)專門在做,還有幾百人的兼職。
同樣是疫情造成進(jìn)出辦公室不便,我們?cè)趪鴥?nèi)很多同事仍然堅(jiān)持在實(shí)驗(yàn)室里,而美國有的公司長期work from home直到現(xiàn)在還沒有恢復(fù)。當(dāng)然,美國有它的創(chuàng)意、創(chuàng)新優(yōu)勢(shì),但涉及到大的系統(tǒng)工程的執(zhí)行問題,這就是我們見長的方向了。這也是我們一直希望能夠發(fā)揮全球化的優(yōu)勢(shì),即便前兩年疫情的原因,地緣政治的原因,都帶來很多的挑戰(zhàn)和代價(jià),但我們還是堅(jiān)持這么做,原因很簡單,我還是相信在前沿科技領(lǐng)域大家需要全球化合作,也只有合作才能把市場(chǎng)上各種有效要素組織起來,去做一個(gè)前沿突破型的公司。
《潮頭》:在生命科學(xué)這個(gè)領(lǐng)域里,國內(nèi)不管是科研能力還是論文數(shù)量,距離世界頂級(jí)水平都還存在差距。這種背景下,要如何保持技術(shù)先進(jìn)性和高水平的研究能力,做到與國際頂級(jí)水平接軌?
劉維:我認(rèn)為這點(diǎn)恰恰是我們比較有優(yōu)勢(shì)的。在公司創(chuàng)立之初,我們就希望這是一家真正國際化的企業(yè),一開始就在硅谷和中國兩地設(shè)立了團(tuán)隊(duì)進(jìn)行運(yùn)營。從人的角度來講,我們創(chuàng)始團(tuán)隊(duì)一直真正在全球領(lǐng)域去做前沿投資,無論是在AI領(lǐng)域,還是在生物領(lǐng)域,我們?cè)诿绹读朔浅6嘀髁鞯腁I和生命科學(xué)項(xiàng)目,使得我們有人脈,能夠組建這樣一支真正與國際接軌的團(tuán)隊(duì)。
正因此,我們當(dāng)年開始做這家公司的時(shí)候,就找來了一些足夠全球影響力的團(tuán)隊(duì)成員,和更多的像Robert·Gentleman這樣的核心科學(xué)顧問,他是R語言的發(fā)明人,現(xiàn)任哈佛醫(yī)學(xué)院計(jì)算生物醫(yī)學(xué)中心創(chuàng)始主任,這種global背景人才的團(tuán)隊(duì)組合,使得我們能夠設(shè)計(jì)面向未來的架構(gòu),構(gòu)建起這樣大規(guī)模的數(shù)據(jù)。
《潮頭》:2020年,你已經(jīng)在硅谷看到了OpenAI這樣公司的出現(xiàn),但不管是大模型還是ChatGPT,這些信息傳導(dǎo)到中國好像慢了很大一拍,今年初不少投資人面臨大模型熱還有些措手不及。為什么會(huì)出現(xiàn)這種狀況?
劉維:我覺得這幾年慢是很明顯的,以前非常頻繁的交流和人才回流,這些年基本停下來了。以前我們做投資的時(shí)候,會(huì)發(fā)現(xiàn)很多華人在美國做到一定位置之后,他可能想要?jiǎng)?chuàng)業(yè),不少人愿意回到中國看機(jī)會(huì),自然就帶回了很多比較新的東西。
但這幾年,各種變化糾纏在一起,這種力量在減弱。現(xiàn)在美國大模型也很熱,但不是今年才開始熱,而是過去幾年一直有熱度。今天,美國更關(guān)注的是做專業(yè)垂類的foundation model,不是在垂類里用GPT寫小作文,而是垂類里頭的foundation model或者next generation foundation model。但在中國,很多人還是在“卷”GPT的copy cat。
《潮頭》:現(xiàn)在有一股大模型扎堆創(chuàng)業(yè)的熱潮,不斷有新的挑戰(zhàn)者入局,每個(gè)大廠似乎都要去做一個(gè)自己的大模型,你怎樣看待這波創(chuàng)業(yè)潮?什么樣的團(tuán)隊(duì)或產(chǎn)品才能走到最后?
劉維:首先說做foundation model這個(gè)角度,第一個(gè)活下去的要素是,你真的在做foundation model。我個(gè)人覺得,今天市場(chǎng)上還很多是在蹭熱點(diǎn),有人說我在做大模型,但人家沒說是做千億參數(shù)的大模型,沒說是自己架構(gòu)的基礎(chǔ)模型,只是一個(gè)“大”的標(biāo)簽,可能還是原來的AI。說實(shí)話,去做大模型,搞大模型訓(xùn)練,是很高的門檻。一個(gè)真正千億參數(shù)的大模型,至少得有幾千塊卡的資源和算法工程能力,要有萬億token的獨(dú)特語料,不然就不能訓(xùn)練大模型。把各種泡沫都撇掉之后,誰是真實(shí)去做這個(gè)東西的,大家心里有數(shù)。
第二個(gè)問題是,在戰(zhàn)略上有沒有合理路徑,能付得起大模型的成本。互聯(lián)網(wǎng)大廠去做大模型,在算力、數(shù)據(jù)、應(yīng)用場(chǎng)景上,有先天的優(yōu)勢(shì)。初創(chuàng)公司做這件事,如果你做的這個(gè)領(lǐng)域并不稀缺,或者說已經(jīng)有很多競(jìng)爭(zhēng)了,那么你還能不能得到合作的機(jī)會(huì)?
第三個(gè),能不能構(gòu)建一個(gè)多元化的人才戰(zhàn)略。我覺得大模型真正的競(jìng)爭(zhēng)門檻在于多元化人才,這是個(gè)很系統(tǒng)的工程,是跨模態(tài)的。比如我們有的人要懂蛋白,有的人要懂細(xì)胞,有的人要懂算法工程,有人要懂如何拿大模型的輸出去真的做藥而不只是發(fā)個(gè)論文,在這么復(fù)雜的機(jī)理里面,每一層都要找到合適的人才,能不能吸引這么一個(gè)多元化的團(tuán)隊(duì)愿意一起干,這個(gè)也很重要。
商業(yè)化提速
專注“Model as a Service”
《潮頭》:目前公司的主要合作伙伴有哪些?
劉維:合作伙伴基本上兩類,但是大家目的都是一樣的,都是想做成創(chuàng)新的項(xiàng)目。一類是大型的藥企、大型的石油公司、大型的工業(yè)公司,這部分可能短期的付費(fèi)能力更強(qiáng),他們可能上來就愿意出錢,能付成百上千萬美金的費(fèi)用,來調(diào)用我們的任務(wù)模型或者大模型。
另一類是研究中心、中小型公司以及高校著名的實(shí)驗(yàn)室,這部分可能不涉及短期給我們付費(fèi),但大家可以共同投入,分享未來收益,這些伙伴的魅力在于,他們有非常多的前沿研究和數(shù)據(jù)。這都是我們需要的,今天任何一個(gè)合作伙伴的數(shù)據(jù)都不夠多,但數(shù)據(jù)飛輪把越來越多伙伴聯(lián)合起來,可以創(chuàng)造顯著的數(shù)據(jù)價(jià)值。
《潮頭》:在商業(yè)模式上,你們的定位是和大模型公司一樣,還是有一天也會(huì)去做垂直應(yīng)用?
劉維:我們和其他大模型公司的邏輯是一樣的,我們覺得是“Model as a Service”(MaaS,模型即服務(wù))。我們當(dāng)然自己也有能力把一些項(xiàng)目往后推,甚至直接去做臨床等等,但是總要做一個(gè)選擇,是把所有的精力放在去做一個(gè)具體的創(chuàng)新藥上,還是這個(gè)平臺(tái)圍繞多個(gè)項(xiàng)目都能做出貢獻(xiàn),我們選擇了后者。
原因也很簡單,每一個(gè)創(chuàng)新項(xiàng)目往后走,行業(yè)縱深其實(shí)都很深,而在這些行業(yè)縱深里,一定都有些公司已經(jīng)很有優(yōu)勢(shì)了,你為什么要重復(fù)他們的工作呢?從立場(chǎng)來看,又當(dāng)裁判又當(dāng)運(yùn)動(dòng)員,反而會(huì)錯(cuò)失更多優(yōu)質(zhì)合作。我們會(huì)利用大模型和任務(wù)模型設(shè)計(jì)很多具體的分子,但是會(huì)依靠不同伙伴來推動(dòng)到后期階段。
《潮頭》:大模型的調(diào)用方法有哪些?
劉維:一個(gè)是合作伙伴來調(diào)用已有的任務(wù)模型做項(xiàng)目,這個(gè)過程中,合作伙伴或者給數(shù)據(jù)、或者給錢、或者給到項(xiàng)目權(quán)益。大家共同投入,也在幫我們迭代模型。
還有一類客戶,他們有更創(chuàng)新的題目,已有任務(wù)模型無法滿足,他們可以直接調(diào)用大模型,基于xTrimo開發(fā)和調(diào)優(yōu)新的任務(wù)模型,這部分現(xiàn)在也是快速增長的需求,我們今年有幾個(gè)大型交易,都跟這個(gè)方向有關(guān)。
《潮頭》:過去很多云廠商想要撬動(dòng)央國企,但發(fā)現(xiàn)想要讓這些企業(yè)數(shù)據(jù)上云并不是件容易的事情,大家都很擔(dān)心數(shù)據(jù)的安全性。國內(nèi)這些大型藥企會(huì)愿意把數(shù)據(jù)喂到你的大模型里嗎?
劉維:這是挺好的話題,我覺得這里面核心有幾層,一是生命科學(xué)行業(yè)整體上的開放程度要高得多,尤其在discovery(創(chuàng)新)階段,因?yàn)檫@個(gè)階段其實(shí)絕大部分?jǐn)?shù)據(jù)來自于自然觀測(cè),他不是把成功的、值錢的數(shù)據(jù)給到我,而是把他們歷史上不夠成功的數(shù)據(jù)給我,但這些數(shù)據(jù)也很有價(jià)值,這些不夠成功的數(shù)據(jù)留在他們自己手里,其實(shí)也做不出來什么,就沒有價(jià)值了,所以整體上大家愿意做研發(fā)合作。你也要有實(shí)力去證明,能夠利用他們這些有價(jià)值但不夠完美的數(shù)據(jù),真的把東西做出來。
其次,要感謝我們的技術(shù)實(shí)力,從技術(shù)角度講,很多企業(yè)基于我們的大模型做的任務(wù)模型,不一定要把數(shù)據(jù)給到我,實(shí)際可以把數(shù)據(jù)放在他們自己的隔離域里,我們也提供了這樣一種方案,方便他們調(diào)動(dòng)大模型。因?yàn)檫@樣的技術(shù)可行性,也使得他們并不是一定要把數(shù)據(jù)的所有權(quán)轉(zhuǎn)移給我,但是我的模型也能得到這些數(shù)據(jù)的幫助。
《潮頭》:比如電商平臺(tái)判斷產(chǎn)品成不成功,可以看GMV、營收、用戶數(shù)據(jù)等都很直觀。但大模型產(chǎn)業(yè)目前還處在非常早期的階段,你對(duì)所推出的產(chǎn)品和服務(wù),成與不成的判斷標(biāo)準(zhǔn)是什么?
劉維:我們現(xiàn)在整體架構(gòu)大概分為四層,第一層基座是AI大模型“xTrimo”;第二層是任務(wù)模型,我們基于大模型研發(fā)的多種任務(wù)模型構(gòu)成的AIGP平臺(tái);第三層是利用任務(wù)模型針對(duì)行業(yè)/領(lǐng)域不同的項(xiàng)目,調(diào)用模型進(jìn)行的分子設(shè)計(jì)項(xiàng)目,也就是真正的商業(yè)化;此外在大模型下其實(shí)還有一層是數(shù)據(jù)圖譜,這四層是一個(gè)嵌套的關(guān)系,設(shè)計(jì)項(xiàng)目對(duì)任務(wù)模型,任務(wù)模型對(duì)大模型,大模型對(duì)數(shù)據(jù),一層層的反饋和牽引提升。
這其實(shí)是一套工程體系,每一層環(huán)節(jié)我們都會(huì)定義不同的評(píng)測(cè)指標(biāo),企業(yè)的判斷標(biāo)準(zhǔn)也隨著發(fā)展階段在變。兩年前我們會(huì)在意數(shù)據(jù)圖譜的規(guī)模指標(biāo),一年前是大模型的參數(shù)和性能,半年前任務(wù)模型的多個(gè)指標(biāo)是沖刺目標(biāo),現(xiàn)在對(duì)于項(xiàng)目的完成度和商業(yè)化的總用戶數(shù)、總收入和項(xiàng)目價(jià)值開始爬坡,一步步向前迭代。
《潮頭》:兩年前采訪時(shí),你講到商業(yè)化并不是百圖生科現(xiàn)階段最核心的任務(wù),主要還是專注于技術(shù)突破。現(xiàn)在再聊這個(gè)話題,今年你給公司制定商業(yè)化的目標(biāo)了嗎?
劉維:兩年前我說先把數(shù)據(jù)做了,一年半前我們?cè)诮鉀Q大模型的技術(shù)突破,半年前我們?cè)诖_保一些項(xiàng)目能夠基于任務(wù)模型有一些進(jìn)展,這個(gè)塔逐漸地往上,一層一層嵌套走到今天,今年我們開始爬這個(gè)塔尖,也就是商業(yè)化。
今年,我們提出了AIGP概念,也是吹響了商業(yè)化元年的號(hào)角。在此之前,我們其實(shí)有少量幾家試驗(yàn)型的客戶,現(xiàn)在則開始正式進(jìn)入到客戶拓展的周期。今年,我們實(shí)際上給自己有一個(gè)商業(yè)化的目標(biāo),但并不是絕對(duì)以收入為核心,它永遠(yuǎn)是一個(gè)平衡的事情,收入,項(xiàng)目價(jià)值,用戶數(shù)量,領(lǐng)域分布,這個(gè)綜合指標(biāo)背后映射著當(dāng)前的市場(chǎng)認(rèn)可和未來的想象空間,對(duì)于一家大模型公司而言都必不可少。
關(guān)鍵詞:
相關(guān)文章
百圖生科CEO劉維:生命科學(xué)AI大模型,開啟創(chuàng)新藥物研發(fā)新范式
百圖生科CEO劉維:生命科學(xué)AI大模型,開啟創(chuàng)新藥物研發(fā)新范式,劉維,大
葛衛(wèi)東近2個(gè)億加倉兆易創(chuàng)新 新進(jìn)中科曙光近6個(gè)億
私募大佬葛衛(wèi)東最新持倉情況浮出水面。葛衛(wèi)東二季度逆勢(shì)加倉兆易創(chuàng)新約
汽車下鄉(xiāng)股票龍頭有哪些?汽車下鄉(xiāng)股票一覽(2023/8/26)
汽車下鄉(xiāng)股票龍頭有哪些?汽車下鄉(xiāng)股票一覽(2023 8 26),汽車下鄉(xiāng)股票
證監(jiān)會(huì)同意燒堿、對(duì)二甲苯期貨及期權(quán)注冊(cè)
證券時(shí)報(bào)網(wǎng)訊,近日,證監(jiān)會(huì)同意鄭州商品交易所燒堿、對(duì)二甲苯期貨及期
精彩推送
總投資300余萬!長子縣城東農(nóng)貿(mào)市場(chǎng)亮出文明新“顏值”
黃河新聞網(wǎng)長治訊:農(nóng)貿(mào)市場(chǎng)承載著城市的煙火氣,是展示城市文明形象、
I really like you歌詞免費(fèi)下載
0471房產(chǎn)來為大家解答以上的問題。Ireallylikeyou歌詞免費(fèi)下載這個(gè)很多
贛州公布中心城區(qū)公辦托育機(jī)構(gòu)收費(fèi)標(biāo)準(zhǔn)
近日,贛州市發(fā)展改革委、市衛(wèi)健委、市財(cái)政局、市教育局四部門聯(lián)合印發(fā)
耳鳴不僅有滋滋電流聲,還有蟬鳴聲?老中醫(yī)教你一招,耳朵內(nèi)立馬清凈!
大家是否有過耳鳴的困擾?除了滋滋電流聲外,有時(shí)候還會(huì)伴隨著蟬鳴
北向資金昨日凈買入32.33億元,凈買入工業(yè)富聯(lián)3.85億元(名單)
北向資金昨日凈買入32 33億元,凈買入工業(yè)富聯(lián)3 85億元(名單),個(gè)股,
注意!敏芯股份將于9月11日召開股東大會(huì)
每經(jīng)AI快訊,敏芯股份(SH688286,收盤價(jià):46 19元)8月25日發(fā)布公告稱
湖北文旅被要求對(duì)債券注冊(cè)文件進(jìn)行信息補(bǔ)充 涉及在建項(xiàng)目等
注冊(cè)文件涉及《湖北文化旅游集團(tuán)有限公司關(guān)于2023年度第二期短期融資券
愛奇藝第二季度財(cái)報(bào):實(shí)現(xiàn)扭虧 營收78億元
8月22日,愛奇藝公布了截至2023年6月30日的第二季度財(cái)報(bào)。報(bào)告顯示,該
蜆殼電業(yè)(02381.HK)中期溢利為1300萬港元 同比減少約47.3%
格隆匯8月25日丨蜆殼電業(yè)(02381 HK)發(fā)布公告,截至2023年6月30日止六個(gè)
擠爆了!杭州開市客首店開業(yè),愛馬仕、茅臺(tái)秒沒,全天客流預(yù)計(jì)3萬人次
潮新聞客戶端記者王景平張?chǎng)温房诮煌ǘ氯⑼\嚺抨?duì)、進(jìn)店排隊(duì)1小時(shí)…
交通運(yùn)輸部:各主要網(wǎng)約車平臺(tái)下調(diào)抽成比例1到3個(gè)百分點(diǎn)
8月25日消息,昨日,交通運(yùn)輸部舉行新聞發(fā)布會(huì)。相關(guān)負(fù)責(zé)人介紹了交通
陳夢(mèng)遭遇熱身賽首敗,孫穎莎王藝迪漸入佳境,形勢(shì)對(duì)王曼昱很不利
陳夢(mèng)遭遇熱身賽首敗,孫穎莎王藝迪漸入佳境,形勢(shì)對(duì)王曼昱很不利,陳夢(mèng),
廣汽集團(tuán)上半年產(chǎn)銷與產(chǎn)值均正增長,自主品牌正逐步成為新主導(dǎo)
據(jù)悉,廣汽集團(tuán)自主品牌板塊持續(xù)向好。廣汽傳祺自2022年實(shí)現(xiàn)盈利以來,
百圖生科CEO劉維:生命科學(xué)AI大模型,開啟創(chuàng)新藥物研發(fā)新范式
百圖生科CEO劉維:生命科學(xué)AI大模型,開啟創(chuàng)新藥物研發(fā)新范式,劉維,大
普楓迄今規(guī)模最大分布式光伏集群項(xiàng)目投產(chǎn)
近日,普洛斯淮安地區(qū)分布式光伏集群項(xiàng)目并網(wǎng)儀式順利舉行。這是普洛斯
股票行情快報(bào):長海股份(300196)8月25日主力資金凈買入9.20萬元
截至2023年8月25日收盤,長海股份(300196)報(bào)收于13 19元,下跌1 35%,
寧波忠應(yīng)廟(關(guān)于寧波忠應(yīng)廟簡述)
,你們好,今天0471房產(chǎn)來聊聊一篇波忠應(yīng)廟,波忠應(yīng)廟簡述的文章,網(wǎng)友
金徽酒上半年業(yè)績亮眼,下半年或迎更好表現(xiàn),投資者需警惕哪些風(fēng)險(xiǎn)?|產(chǎn)業(yè)鏈情報(bào)站
金徽酒股份有限公司舉辦2023半年度業(yè)績說明會(huì),這對(duì)二級(jí)市場(chǎng)投資者來說
福島核污染水排放一天后:日本鮑魚降價(jià)30%,金槍魚價(jià)一夜暴跌24%
8月26日,據(jù)央視財(cái)經(jīng):根據(jù)東京電力公司昨天(25日)下午發(fā)布的數(shù)據(jù),2
“和平方舟”上再誕生1名和平寶寶 取名“和平”
當(dāng)?shù)貢r(shí)間8月23日下午,正在執(zhí)行“和諧使命-2023”任務(wù)的中國海軍“和平
金頂比武!第九屆世界傳統(tǒng)武術(shù)錦標(biāo)賽開幕
本屆比賽以慧定峨眉武動(dòng)世界為主題,邀請(qǐng)了53個(gè)國家和地區(qū)的6649名運(yùn)動(dòng)
股票行情快報(bào):*ST和科(002816)8月25日主力資金凈賣出155.80萬元
截至2023年8月25日收盤,*ST和科(002816)報(bào)收于11 33元,下跌0 87%,換
2023成都車展丨奇瑞汽車四品牌聯(lián)合登場(chǎng) 宏大產(chǎn)品陣容強(qiáng)勢(shì)亮相
8月25日,2023成都車展順利召開,在本次車展中,奇瑞汽車舉辦了一場(chǎng)聯(lián)
TechInsights:二季度全球折疊屏手機(jī)出貨量同比增長24%
智通財(cái)經(jīng)APP獲悉據(jù)TechInsights最新發(fā)布的研究報(bào)告顯示2023年Q2全球折
眼鏡片刮花了教你怎樣修復(fù)_眼鏡片花了教你怎樣修復(fù)
你們好,最近小活發(fā)現(xiàn)有諸多的小伙伴們對(duì)于眼鏡片刮花了教你怎樣修復(fù),
8月24日基金凈值:廣發(fā)雙擎升級(jí)混合A最新凈值1.8867,漲2.68%
8月24日,廣發(fā)雙擎升級(jí)混合A最新單位凈值為1 8867元,累計(jì)凈值為2 0196
風(fēng)口下的人形機(jī)器人產(chǎn)業(yè) :產(chǎn)品“前赴后繼” 落地“裹足不前”
風(fēng)口下的人形機(jī)器人產(chǎn)業(yè):產(chǎn)品“前赴后繼”落地“裹足不前”
【石榴花開 籽籽同心】看,荒山禿嶺已變沃野良田
中國經(jīng)濟(jì)網(wǎng)赤峰8月22日訊內(nèi)蒙古赤峰敖漢旗三十二連山因在生態(tài)建設(shè)時(shí)治
中山金強(qiáng)食品公司1批次如意臘腸檢出禁用藥物氯霉素
新京報(bào)訊8月25日,海南省市場(chǎng)監(jiān)管局發(fā)布關(guān)于14批次不合格食品情況的通
李東風(fēng)(對(duì)于李東風(fēng)簡單介紹)
聊聊一篇東風(fēng),對(duì)于李東風(fēng)簡單介紹的文章,網(wǎng)友們對(duì)這件事情都比較關(guān)注
8月24日基金凈值:銀河創(chuàng)新成長混合A最新凈值4.4851,漲1.36%
8月24日,銀河創(chuàng)新成長混合A最新單位凈值為4 4851元,累計(jì)凈值為4 4851
新一代電動(dòng)方程式E使用新電池可將行駛距離增加一倍
自從2013年Spark被國際汽聯(lián)指定生產(chǎn)車隊(duì)使用的賽車底盤以來,在2016年
重組帶狀皰疹疫苗對(duì)中國人群保護(hù)效力如何?首個(gè)研究結(jié)果公布
截至目前,中國已上市了兩款帶狀皰疹疫苗,其中一款是葛蘭素史克(GSK
女人夢(mèng)見很多烏龜什么意思(女人夢(mèng)見很多烏龜什么意思周公解夢(mèng))
不同身份的女人夢(mèng)見好多烏龜?shù)膲?mèng)境解析。1、戀愛中的女人夢(mèng)見好多烏龜
儲(chǔ)存卡損壞怎么修復(fù) 這個(gè)方法最是常用)
hello大家好,我是城鄉(xiāng)經(jīng)濟(jì)網(wǎng)小晟來為大家解答以上問題,儲(chǔ)存卡損壞怎
葛衛(wèi)東近2個(gè)億加倉兆易創(chuàng)新 新進(jìn)中科曙光近6個(gè)億
私募大佬葛衛(wèi)東最新持倉情況浮出水面。葛衛(wèi)東二季度逆勢(shì)加倉兆易創(chuàng)新約
降雨凌晨來!西安發(fā)布暴雨藍(lán)色預(yù)警
西安市氣象臺(tái)2023年08月25日18時(shí)00分發(fā)布暴雨藍(lán)色預(yù)警:受高原槽和西南
南豐集團(tuán)董事長、香港特區(qū)政府財(cái)政司原司長梁錦松:香港在多個(gè)領(lǐng)域可與內(nèi)地合作
“以前,節(jié)假日有很多內(nèi)地人來香港消費(fèi),近期,香港的反向消費(fèi)愈加明顯
謝展寰:會(huì)視乎輻射數(shù)據(jù)考慮是否擴(kuò)大日本食品管制
香港環(huán)境及生態(tài)局局長謝展寰表示,會(huì)視乎輻射數(shù)據(jù),考慮是否擴(kuò)大日本食
將與拉爾薩結(jié)婚!馬庫斯戀情再升級(jí)!看演唱會(huì)很甜蜜,喬丹沒法棒打鴛鴦
拉爾薩與馬庫斯的戀情如同一部溫馨的電影,讓人們不禁為之動(dòng)容。當(dāng)拉爾
開學(xué)在即,城陽車管所組織進(jìn)行校車檢查,為學(xué)生安全護(hù)航
青島新聞網(wǎng)8月25日訊(記者張曉楠通訊員劉瑞瓊王奧蕾)為進(jìn)一步加強(qiáng)校
菏澤五星足球隊(duì)(關(guān)于菏澤五星足球隊(duì)簡述)
,你們好,今天0471房產(chǎn)來聊聊一篇澤五星足球隊(duì),澤五星足球隊(duì)簡述的文
中梁控股:有息負(fù)債降至231億,財(cái)務(wù)安全有信心穿越周期
報(bào)告期內(nèi),中梁實(shí)現(xiàn)收入289億元,同比增加29 1%,擁有人應(yīng)占凈利潤為18
泖港鎮(zhèn)田黃村:黨建引領(lǐng)賦能鄉(xiāng)村振興 先進(jìn)項(xiàng)目帶動(dòng)村企協(xié)同發(fā)展
田黃村位于上海市松江區(qū)泖港鎮(zhèn)中部,自然風(fēng)景優(yōu)美,擁有萬畝良田、成片
街機(jī)經(jīng)典懷舊游戲大全(經(jīng)典街機(jī)電玩重現(xiàn)童年回憶
hello大家好,我是城鄉(xiāng)經(jīng)濟(jì)網(wǎng)小晟來為大家解答以上問題,街機(jī)經(jīng)典懷舊
寧波電視臺(tái)1套節(jié)目表 寧波電視臺(tái)
0471房產(chǎn)來為大家解答以上的問題。寧波電視臺(tái)1套節(jié)目表,寧波電視臺(tái)這
廣西財(cái)經(jīng)學(xué)院原黨委常委、副院長廖文龍被依法決定逮捕
廣西財(cái)經(jīng)學(xué)院原黨委常委、副院長廖文龍被依法決定逮捕---廣西壯族自治
福島核污染水排放一天后:日本鮑魚降價(jià)30%,金槍魚價(jià)一夜暴跌24%
8月26日,據(jù)央視財(cái)經(jīng):根據(jù)東京電力公司昨天(25日)下午發(fā)布的數(shù)據(jù),2
中國外運(yùn)(00598)公布中期業(yè)績 歸母凈利為21.72億元 同比減少6.73% 每股派0.145元
智通財(cái)經(jīng)APP訊中國外運(yùn)00598公布2023年中期業(yè)績收入為人民幣47837億元
四川阿壩州現(xiàn)山大王,攔路收取游客500元過路費(fèi):發(fā)紅包求刪視頻
有網(wǎng)友說:不明不白收過路費(fèi),既拿不出景區(qū)門票,又不給開票,也拿不出
南航通報(bào)“乘務(wù)員從4米高位置摔落”
8月24日,在江蘇常州奔牛國際機(jī)場(chǎng)內(nèi),由南方航空?qǐng)?zhí)飛的CZ3352(常州-深
國家糧食和物資儲(chǔ)備局:加強(qiáng)受災(zāi)地區(qū)糧情跟蹤調(diào)度
日前,國家糧食和物資儲(chǔ)備局專門印發(fā)通知,部署全系統(tǒng)防汛救災(zāi)和災(zāi)后恢
南航回應(yīng)“空乘跌落”:傷者情況穩(wěn)定,具體原因正在調(diào)查
南航回應(yīng)“空乘跌落”:傷者目前情況穩(wěn)定,具體原因正在調(diào)查。說明全文
汽車下鄉(xiāng)股票龍頭有哪些?汽車下鄉(xiāng)股票一覽(2023/8/26)
汽車下鄉(xiāng)股票龍頭有哪些?汽車下鄉(xiāng)股票一覽(2023 8 26),汽車下鄉(xiāng)股票
蘇州旅游必去十大景點(diǎn)推薦(蘇州旅游必去十大景點(diǎn))
推薦你看:【南寧旅游必去十大景點(diǎn)推薦】【石家莊旅游必去十大景點(diǎn)推薦
高考志愿:補(bǔ)錄大概能降多少分?被錄取幾率大嗎?實(shí)現(xiàn)你的大學(xué)夢(mèng)
很多人補(bǔ)錄不成功,也是跟自己在錯(cuò)估自己的分?jǐn)?shù)線,報(bào)高了,所以就會(huì)