科大訊飛星火大模型：今年超越ChatGPT，明年對標GPT-4

2023-08-17 16:46:22 來源：IT時報

首發百天后，星火大模型的三場升級戰

(資料圖片僅供參考)

作者／ IT時報記者孫妍

編輯／孫妍

8月15日，正值訊飛星火認知大模型首發100天，科大訊飛發布訊飛星火認知大模型V2.0，突破代碼和多模態兩大技術能力，一口氣推出眾多應用，并聯合華為發布訊飛星火一體機。

“今年10月24日，訊飛星火將全面對標ChatGPT，中文超越、英文相當，明年對標GPT-4。”科大訊飛董事長劉慶峰自信地預告訊飛星火大模型的未來目標。

8月15日也是生成式人工智能的重要節點，由國家網信辦等七部委發布的《生成式人工智能服務管理暫行辦法》正式施行。這標志著中國生成式人工智能邁入了發展與安全并重、創新和依法治理結合的道路。

“百模大戰”正在解放生產力、釋放想象力，大力出奇跡之下，大模型這一算力“吞噬者”導致高性能GPU遭瘋搶，而算力“壟斷者”的凸顯，讓中國人工智能企業達成共識，實現算力國產化解決卡脖子困境。

百天升級戰

今年超越ChatGPT

距離首發100天，訊飛星火認知大模型V2.0如期而至，重點在代碼和多模態上實現技術突破，并將這兩大能力落地到應用和產品：會生成代碼或改Bug的智能編程助手iFlyCode1.0，視頻創作能力升級的訊飛智作2.0，幫助教師一鍵生成課件的星火教師助手，學生口語練習“搭子”星火語伴2.0，新增AI編程空間和AI創意畫板的訊飛AI學習機。

在科大訊飛的計劃中，訊飛星火代碼各維度的能力將在今年10月24日超越ChatGPT，明年上半年對標GPT-4。劉慶峰介紹，根據OpenAI構建的代碼能力公開測試集HumanEval，星火V1.5 Python語言的效果只有41分，V2.0已經到了61分，接近ChatGPT。根據認知智能國家重點實驗室構建的代碼的真實的場景使用的測試集，訊飛星火代碼生成和補齊維度上已經超過了ChatGPT。

“代碼能力是大模型聰明程度的重要標志。”在劉慶峰看來，代碼是大模型硬碰硬的實力，可以大大降低數字經濟的創業門檻和成本，不用人人都是編程高手，只要發揮想象力。

用Python畫紅色的心形線，畫出馬鞍面方程三維立體圖并設置漸變色，用代碼生成貪吃蛇小游戲，用小視頻生成gif表情包……在現場演示中，訊飛星火2.0完成了所有初級考驗，科大訊飛研究院院長劉聰幾分鐘就完成了兩個手指捏合就能寫字的“凌空手寫”功能開發，全程沒寫一行代碼，全部交給智能編程助手iFlyCode1.0，以往有經驗的程序員，也要半天到一天才能完成。

為了降低“小白”寫代碼的門檻，訊飛星火2.0在代碼生成、代碼補齊、代碼糾錯、代碼解釋、單元測試生成這5個維度進行升級。

現在，“零編程基礎”的老師也能用其代碼能力開發學校管理數字化應用，數字教育基座這一行業應用已在上海、湖北等地的學校試點，教育應用開發周期從17天縮短到1天，投資成本從15萬元降低至1.5萬元。

多模態長期戰

每個人的AI助手

拍了美圖想“秒速”發一個圖文并茂的朋友圈？張嘴就想畫出腦海里突發奇想的圖畫？只要輸入一段文字，一鍵就想生成聲情并茂的短視頻？

在發布會現場，訊飛星火2.0在現場演示了它在圖像描述、圖像問答、識圖創作、文圖生成、虛擬人合成等方面的能力。

“創作一篇立秋抒情散文，并用一個短發民國風的女生形象生成視頻”，劉聰話音剛落，一個身穿民國風格的女主播站在不斷切換的秋天美景前娓娓道來。

AI視頻生成對品牌宣傳、新聞媒體等行業來說，是能帶來巨大變革的生產力工具，但目前大模型生成的視頻，模板較為單一，比起其它大模型廠商，科大訊飛的優勢主要還是文轉音、中英互譯等。

教育是訊飛星火最先切入的行業，星火教師助手可以幫老師一鍵生成教學課件，至今已服務全國超過2.5萬所學校、超1200萬名師生；星火語伴可以成為學生、商務老師的口語陪練老師，2.0版本上線CET、雅思、托福等口語模考，用AI實現如真人般的陪練；訊飛AI學習機新增AI編程空間和AI創意畫板，這也是學習機行業首款AI一對一智能編程助手；AI口語功能已上線訊飛翻譯機，支持73個不同場景。

由此可見，科大訊飛在自有終端和行業市場多年的深耕，是訊飛星火認知大模型能真正落地的基礎，下一步，它還將切入汽車行業，首款搭載訊飛星火的奇瑞汽車也將發布。

“多模態是通用人工智能的必經之路，也是科大訊飛既定的人工智能技術長期戰略。”劉慶峰表示，2022年初，ChatGPT還未引爆之時，訊飛就已發布具備多模感知、深度理解、多維表達、運動智能等能力的“訊飛超腦2030計劃”，而科大訊飛的長期戰略是打造每個人的AI助手。

安全可控戰

國產大模型算力底座

當天，訊飛星火和昇騰AI聯合推出星火一體機，其底層算力、AI框架、訓練算法、推理能力、應用成效等全棧AI能力“開箱即用”，每一家企業或機構都能在這一國產大模型底座上構建自家的專屬大模型。

今年7月6日的世界人工智能大會上，訊飛和華為就已官宣，正在打造中國自主創新的通用智能新底座。昇騰AI是國內唯一一個完成千億參數大模型訓練并商用的系統，已有一半的國產大模型是由它的算力驅動，華為昇騰計算業務總裁張迪煊表示，昇騰只做好算力，不做大模型。

星火一體機由華為保障算力，由訊飛保障內容，給自主可控的專屬大模型上了“雙保險”。

污語料和幻覺問題是大模型的兩大安全挑戰，基于訊飛星火認知大模型，星火一體機形成了內容安全機制，具備了清洗互聯網語料的能力，語料經過語句判別器、質量判別器、隱私判別器、安全判別器等關卡，就能被清洗成高質量文本“喂”給大模型；針對大模型一本正經胡說八道的“幻覺問題”，科大訊飛構建專業知識庫，以類搜索插件技術實現知識獲取，大模型理解后概括摘要輸出答案。

星火一體機是國產軟硬件一體的專屬大模型解決方案，企業可以在這一底座上定制問答系統、對話生成、知識圖譜構建、智能推薦等多個應用，大大降低了企業定制專屬大模型的門檻和成本。科大訊飛在政務、電力、教育、醫療等行業深耕多年，落地經驗濃縮成星火一體機內的10多個場景包，涵蓋辦公、代碼、運維、客服、營銷、采購等。

訊飛星火認知大模型的定位是“國家隊”大模型。“ 我們正在跟華為打造面向超大規模大模型的訓練國產算力的集群，形成集群化優勢。 ”劉慶峰表示，要讓每個企業都有專屬大模型，安全可控、場景驅動、專屬模型是關鍵三要素，而實現大模型的安全可控，要解決算力安全和內容安全兩大難題。

排版／季嘉穎

圖片／科大訊飛

來源／《IT時報》公眾號vittimes

E N D

請加「星標」不錯過我們

關鍵詞：