對話愛莫科技楊恒:15年數據仿真研發遇上大模型浪潮
作者:孫溥茜
編輯:陳彩嫻
【資料圖】
受訪人:楊恒
現任深圳愛莫科技有限公司創始人&CEO
劍橋?學博?后、倫敦?學博士、國防科大本碩
復旦大學、西電、深圳大學兼職教授、校外碩士生/博士生導師
深圳市海外高層次人次(孔雀人才)、深圳市南山區第六屆政協委員、深圳市十佳創業英才、深圳人工智能產業協會行業專家、深圳軟件行業協會 AI 領域專家
曾作為負責人深度參與多項 AI 領域的國家863 / 國際重點項目研發
在 AI 頂級會議期刊(例如CVPR/ICCV/NeurIPS/ICML/IEEE Trans等)發表論文 30 余篇,已獲授權發明專利 40 余項
“數據稀缺”、“研究源告急”、“大模型耗盡宇宙文本”......這段時間關于大模型缺少訓練數據的話題層出不窮。相應地,“ AI 訓練 AI” ,“合成數據”,所謂用魔法打敗魔法的聲量也此起彼伏。
Open AI 的 CEO Sam Altman 今年上半年在一個訪談里提到“未來所有數據都將變成合成數據”, AI 科技評論也在和不同的訪談者交流中發現, AI 訓練 AI 的方式已經在大模型落地部署的過程中悄然流行。
業界對于合成數據觀點不一。Transformer 的作者之一 Aidan Gomez 認為:合成數據可能加速通往“超級智能”AI 系統的道路。但也有人持反面意見:認為“合成數據存在偏差”,“使用合成數據訓練,會讓模型出現不可逆轉的缺陷。”更甚有網友調侃,合成數據聽起來就好像 AI 在近親繁殖。
不過,網絡上的討論聲音距離應用落地的第一線還是差了十萬八千里。
成立于 2018 年的愛莫科技( 英文名稱:AiMall )是一家利用人工智能技術為線下消費零售提供數字化解決方案的公司。創始人楊恒博士在數據仿真、計算機視覺領域已經有超過十五年的研究經驗,他本科碩士期間攻讀的是“模式識別與智能系統”專業,為了能深入人工智能研究,楊恒又前往英國倫敦大學攻讀博士學位,聚焦人臉識別的研究方向,而后繼續到劍橋大學做博士后研究。訪談中,他為我們介紹了屬于愛莫科技的數據仿真式訓練模型方法,以及如何實現應用落地的。
以下是 AI 科技評論與愛莫科技創始人楊恒的對話:
當大模型遇上數據仿真AI 科技評論:我們了解到愛莫科技今年4月發布了大零售模型,貴司一直以計算機視覺為所長,進入大模型領域作何考慮?
楊恒:這是個很好的問題。我個人之前有過十多年的學術研究經歷,對于學術界來說,需要在一條技術路徑深耕下去。但產業界恰好相反,企業思考的模式更多要從客戶需求出發,愛莫科技過去四、五年主要聚焦在視覺 AI 的產業化落地,但服務要對客戶需求量體裁衣。客戶不會關心你具體用什么技術干了這件事,他們只關心自己的問題有沒有解決。在這個過程中我們發現,解決客戶的問題光靠計算機視覺不夠,也需要今天家喻戶曉的大模型,本質上企業對這些解決方法都有需求。
我們在計算機視覺方向研究時間比較久,但其實在大模型這個概念爆火之前,2020 年我們已經開始了類似的研發,2021 年推出了第一個類似產品,叫“一問即得”。
“一問即得”不是一個純視覺的產品,它也有語言模型,語言與視覺的結合可以豐富 AI 產品對環境的感知。客戶可以通過對話的方式快速得到自己想要的答案,這個產品和 ChatGPT 的邏輯非常相似。
愛莫科技2020-2022年間基于大模型的系列產品
以線下消費零售為例,企業需要處理大量的圖片、視頻、文本、服務 C 端的消費者數據。如果一個模型只有單一模態能力,就沒有辦法把客戶的需求系統化解決。現在有了大模型這個工具,愛莫科技將識別能力、語言理解能力,以及對業務內部流程理解能力綜合起來打造的模型,才是在垂直場景有價值的大模型。所以現在我們更好的定位是,以垂直場景具有多模態能力的大模型為驅動,持續滿足客戶需求。
AI 科技評論:有句形容 AI 與大模型弊病的話,“有門檻、沒壁壘”,您怎么看?您覺得愛莫科技這次入局大模型的優勢在哪里?
楊恒:對 AI 公司來說,技術是一個基本門檻,如果沒有技術能力,就無法進入這個行業。但確實現在支持調用各種大模型接口,或者開源大模型,都在將 AI 科技創業的門檻慢慢降低。其實無論是大模型還是所謂的小模型,亦或傳統的機器學習也好,模型本身并沒有價值,有了對業務的理解,模型才可以再去賦能。
我認為我們入局最大的優勢在兩方面:有對業務的理解,以及有行業的數據。
過去幾年,我們與很多客戶建立長久合作,針對場景 know-how 打造業務高價值產品,在目前落地的細分賽道都建立了標桿應用。
從數據優勢來看,我們聚焦線下消費零售數字化應用的研發,但線下的數據非常稀缺。所有的大模型訓練都需要數據,像 OpenAI 這類公司主要通過爬取互聯網數據的方式,但對于垂直場景仍然不夠。比如線下每一家門店的經營表現情況、成立情況等細粒度數據,是無法像在線上一樣通過爬蟲獲取的。過去五年,愛莫科技積累了大量的線下消費零售數據,形成了自己的零售數據平臺,這是支撐我們打造垂類零售場景大模型的關鍵燃料。
AI 科技評論:您剛剛提到數據對模型訓練的重要性,愛莫科技是如何應對這一數據難題的?
楊恒:剛剛也提到無論大模型還是小模型,對于產業有價值的都是基于監督學習的方法,而監督學習最基礎的邏輯就是要對數據進行很好的人工標注,然后再進行訓練,最后形成一個可使用的模型,這基本上是所有的 pipeline。
但人工標注有兩大問題。第一是成本較高,無論是采集數據或者找人工標注,都需要成本;但這不是主要瓶頸,我認為最大的問題在于:人有標注能力的上限,而人的標注能力上限就決定了模型的上限,如果人學不了,機器也就學不到了。
這就是我們公司一直在打造基于仿真系統的知識驅動人工智能(Knowledge-driven Intelligence based on Simulation System,以下簡稱“K.I.S.S”)的原因所在。仿真系統的核心要解決的就是兩個問題:如何降低標注成本?如何突破人工的標注極限?
愛莫科技的 K.I.S.S
這里可以舉兩個例子。
第一個是關于“人”的識別。以大家較為熟悉的人臉為例,人臉識別一直都是 AI 公司競爭非常激烈的一個場景,但我們公司在 2019 年仍然能以非常高的價格將人臉識別算法授權給大公司,這就得益于我們這套基于仿真系統的人臉識別算法訓練方式。通常情況下,大家都采用正臉數據進行模型訓練,正臉光照好、人工容易標注,很多公司都能做得非常好。但一些角度非常大、特別模糊、光照特別不好、人看不清的畫面就超過了人的標注極限,這種時候人類沒辦法準確標注,也可能導致這個模型根本沒有學到此類場景。
這時候我們用自己的 K.I.S.S 仿真系統,只需要客戶提供一張正臉圖片,就可以根據 2D 圖片生成 3D 人臉模型,仿真出很多復雜場景的人臉數據樣本去訓練模型,提高識別準確率,所以哪怕在愛莫科技的最早期,也能夠與市面所有大公司正面 PK。
第二個例子是關于“物”的識別。我們在做的線下消費零售場景,對商品陳列的精準識別是占比很大的需求,而精準就需要模型做到非常細顆粒度的識別,比如客戶想要識別冰柜里的冰淇淋,品牌是夢龍還是和路雪,口味是巧克力還是香草,陳列露出占比又是多少。但實際應用中,商品規格多且相似度高,擺放凌亂遮擋嚴重,依賴人工很難做到快速又細致準確地標注和統計。
愛莫科技基于 K.I.S.S 的冰淇淋陳列 3D 仿真數據
對于這種零售商品的識別模型訓練,我們也用仿真方式產生大量自帶標注的數據樣本,模型的精度、成熟度、穩定性得到了市場應用驗證,從訓練成本到精度都具備明顯優勢,這是我們技術路線底層的核心邏輯。
AI 科技評論:您如何看待數據仿真這條技術路線未來對大模型訓練的應用價值?
楊恒:最近我看了 OpenAI 的 CEO Sam 的采訪,今年上半年他就說,如果 OpenAI 現在的大模型想繼續提升能力,當下唯一的解決方案就是更好地去合成數據,其實就是我們說的數據仿真的方式。
通過仿真技術,我們可以模擬不同的業務場景,生成大量的數據來訓練模型,比如不同的光照、角度、表情、各種遮擋,這樣才更符合攝像頭可能拍到的實際情況。但仿真技術的意義不止是數量的增加,更大的價值在于讓數據分布更多元。模型在訓練時見過各種場景數據,它的實際應用效果才會更好。這樣一來,我們可以不斷根據需求更準確地模擬實際場景數據,以此提高模型精度和性能。同時,仿真數據自帶標注,不再需要大量人工,成本、效果都得到提高。
每個公司都有自己的技術路徑,拿業務場景來說,我們和其他技術提供商是在同一市場,但每家公司都有自己認可的技術路線,這也是 AI 公司之間最本質的一個區別。
我們選擇基于仿真系統的方式,可能主要跟我自身背景有關,我從本科開始就一直研究計算機仿真,我認為這件事情是有價值的,所以從公司成立到現在以及未來,愛莫科技都會堅定這條路線。
現在:量體裁衣式 AI,賦能線下零售AI 科技評論:愛莫科技從創立起就聚焦線下零售的 AI 應用,原因是什么?目前主推的人工智能解決方案有哪些?
楊恒:愛莫科技 2018 年成立,那個時間也算得上是人工智能的又一次低谷期,但也正是這樣,讓大家可以回歸商業本質思考如何實現產業落地。我自己也在思考有哪些大的線下場景適合 AI 落地,經過市場調研,再結合團隊優勢,我們最終決定將 AI 落到零售這個市場足夠大、最接近消費大眾的場景,“愛莫”就是 AI 觸達末端的含義。
我們的應用是從線下場景的剛需切入,打造的第一個主推產品叫「一拍即核」,主要是幫助品牌實現面向線下營銷活動的高效開展及效果評估,用 AI 提高品牌的渠道力。以前,因為店鋪數量多又分散,品牌面向線下零售小店的營銷活動執行與效果評估都很困難,「一拍即核」不僅能實現商品及物料的線下陳列營銷智能核查,即拍即核,實時反饋,還能為品牌的營銷活動提供更豐富多樣的玩法,現在已經應用在酒水飲料、奶制品、食品、藥品等細分行業,像聯合利華、東鵬飲料都是我們的客戶。
愛莫科技賦能實體零售的還有另一主打產品「虛擬店長」,主要通過識別和分析門店客流、消費氛圍、員工作業、安全衛生情況等一些場景數據,幫助店主實時把握運營情況,不僅可以實時調整門店氛圍,還能精準提升服務質量,比如,消費者落座一分鐘之內,就有服務員熱情地接待,消費者離席兩分鐘之內,清潔工會及時清理餐具,給消費者帶去更好的體驗感受,也為店家節省人工成本,實現門店全場景數字化精細管理。
愛莫科技「虛擬店長」核心功能
AI 科技評論: AI 公司一般都很難盈利,愛莫科技這幾年實現持續盈利是如何做到的?
楊恒:很多方面的原因吧。從企業經營策略上來說,如果用一句話概括就是:一定要做真正屬于 AI 公司自己的業務。
大部分 AI 公司虧損比較嚴重,原因在于還沒有找到真正需要 AI 的商業場景時,為了許多偽需求場景投入過多研發,最后無法產生客戶價值,或者產生了很多營收但并不屬于真正 AI 業務,比如做了安裝集成的項目,看起來收入高了,但只是在用高成本做一件低毛利的事,所以是不可能盈利的。
我們思考的就是 Product-market fit(PMF),也就是產品 - 市場匹配,這非常重要。愛莫科技與標桿客戶深度合作,在零售、餐飲、物流等領域從實際場景挖掘業務的 AI 需求,幫助客戶解決實際問題,為客戶創造或者提升商業價值,從而體現我們的價值。創業五年疫情三年,我們能一直處于小盈利的狀態,就是在產品和市場匹配上抓的比較好。當然成功的道路不止一條,只是這條路比較符合愛莫科技。
其次,團隊協作也很重要。我們的聯合創始團隊能力非常互補,有人擅長算法,有人擅長架構。比如我的一位聯合創始人有在世界 500 強消費零售公司十多年的工作經驗,她對消費場景的理解非常深入。而我做技術出身,如果沒有她,我會花很多時間去調研零售行業 Know-how,比如為什么會有品牌商,為什么會有零售商,不太了解如何運作品牌方,不了解市場,但通過她十多年的行業經驗,整個團隊就可以根據對場景的理解,思考如何更快更好地打造產品。
未來:WPA,智能力+知識力+執行力AI 科技評論: 未來愛莫科技的發展規劃如何?看你們提出了一個叫 WPA 的概念,和 RPA 有什么區別,和你們的發展有什么關聯?
楊恒:AI 是一個非常大的行業,我們把 AI 細分看,比如提到 RPA,深入大家腦海的是 UiPath,提到 CRM,首先會想到 Salesforce,現在提到 ChatGPT,大家第一個會想到 OpenAI。所以我們對未來的規劃是:做作業流程自動化(Workflow Process Automation,WPA)。WPA 這個概念是我們首先提出來的,沒有太多競爭對手,希望未來提到 WPA,行業就會想到愛莫科技的名字。
再說回如何解釋 WPA,其實用 AI 為企業數字化賦能,本質來說就是在實現企業作業流程的自動化。比如現在給 ChatGPT 一個目標,讓它為我寫一個文檔、一段代碼,發出指令后它馬上幫我自動化完成,無論這個東西是否叫 AI,最終實現這個目標的產品本質就是作業流程的自動化。
但現在還有很多作業流程,例如營銷方案的設計、營銷效果的審核判定等,不是簡單的規則性工作,需要更高階的「智能」作為基礎能力才能推動作業流的自動化執行。更高階的「智能」不僅包括跟人類一樣的 intelligence,還需要有對具體工作的 knowledge,然后實時執行決策、優化和調整,才能實現真正的作業流程自動化,即 WPA,這就是愛莫科技未來要做的。
MPA、RPA、WPA 的進化過程
AI 科技評論: 面對行業白熱化的競爭,您會采取什么策略來保持愛莫科技的競爭優勢?
楊恒:在泛 AI 行業里我們確實有非常多的競爭對手,但就像剛才我提到的,每家公司的技術路線不同,在數據仿真這條路上我們已經走了 5 年,已經有了大量的行業客戶背書,競爭一直存在,每一個維度都有競爭,但如果從整體維度看,我依然非常看好愛莫科技未來的發展。
AI 科技評論:作為十多年人工智能從業者,您個人如何看待 AI 的未來?
楊恒:我認為現在的人工智能行業充滿了機遇和挑戰。機遇在于各種創新技術不斷涌現,吸引了更多的人才和資金進入。但同時也面臨著過度炒作和不理性發展的風險,所以需要行業內的從業者們保持冷靜和理性,確保人工智能的健康發展。
比如過度承諾夸大宣傳,可能讓需求方對人工智能的預期過高,導致實際應用效果與預期不符。另一方面,過度承諾也可能吸引一些不太理性的人才進入行業,可能會誤導行業的發展方向。
包括關于 AI 是否會淘汰人類也一直是個爭議很大的話題。前段時間 StabilityAI 的 CEO 在采訪時也談到五年內人類程序員會失業,但其實反過來思考,人類可以借助 AI 工具完成很多事情了,人工智能生產力的極大提升會讓生產關系發生變化,過往完全由人類控制的 AI 機器會逐漸過渡到能與人協作,人與 AI 能達到共榮共生的狀態,愛莫科技也正在朝這個方向前進著。
雷峰網雷峰網(公眾號:雷峰網)
雷峰網原創文章,未經授權禁止轉載。詳情見轉載須知。
關鍵詞:
相關文章
精彩推送
新城發展(01030)發布新城控股(601155.SH)中期業績,歸母凈利潤22.79億元,同比減少24.28%
智通財經APP訊新城發展01030發布新城控股601155集團股份有限公司601155
索通發展:擬補充完善年產20萬噸鋰離子電池負極材料一體化項目首期5萬噸項目生產線并投資建設二期5萬噸項目,項目總投資約24.75億元
索通發展(603612)計劃補充和完善其年產20萬噸鋰離子電池負極材料一體化