大模型應用7項第一!10月24日,第七屆世界聲博會暨2024科大訊飛全球1024開發者節開幕式上,科大訊飛董事長劉慶峰公布訊飛星火大模型應用成績單,并發布訊飛星火4.0 Turbo:七大核心能力全面超過GPT-4 Turbo,數學和代碼能力超越GPT-4o,國內外中英文14項主流測試集中訊飛星火4.0 Turbo實現9項第一。與此同時,國產超大規模智算平臺“飛星二號”正式啟動。

20241025115715975-81-3d115.png_scale.png

會上,科大訊飛首發10項基于訊飛星火底座能力的硬核產品與創新應用:定義多模AIUI標準,發布超擬人數字人;發布星火多語言大模型、訊飛星火醫學影像大模型、汽車端側星火大模型;發布首個基于“問題鏈”的高中數學智能教師系統、星火智慧黑板2.0、AI作業過濾器等;發布星火智辦一體機、智能座艙人機交互效果評測機器人VIAS以及科大訊飛多語種 AI 翻譯透明屏。

訊飛星火4.0 Turbo:國際14項主流測試集9項超越,提效50%

訊飛星火大模型4.0 Turbo正式發布,在數學能力、代碼能力上超過了GPT-4o。由艾倫人工智能研究所、OpenAI等國內外權威單位發布,涵蓋理解和推理、綜合考試、數學和科學、代碼等不同任務類型的14項主流測試集中,訊飛星火4.0-Turbo在其中9項測試集中實現超越,效率相對提升50%。

20241025120104834-69-2f910.png_scale.png

根據實用數學任務構建測試集CAppliedMath-1.0,訊飛星火4.0 Turbo在計算、財務、金融、度量等多個維度的任務中均超過GPT-4o水平,已完成超長思維鏈、樹搜索和自我反思評價等算法驗證,預計今年底可實現類“o1”的高難度數學能力顯著提升。

根據代碼生成HumanEval測試集上的效果對比,訊飛星火4.0 Turbo在Python、Java、JavaScript等任務上和GPT-4o的差距微弱,在C++能力上超過GPT-4o。在真實應用場景,基于認知智能全國重點實驗室構建的iFLYCode-Eval-2.0代碼實用場景測試集,訊飛星火4.0 Turbo在代碼生成、代碼檢錯、單元測試等任務上都超過了GPT-4o。同時推出星火代碼7B版本,滿足代碼生成、代碼補全等極速響應型任務,效果業界最優。

首發語音視覺虛擬人交互“三合一”

發布會上,科大訊飛重新定義萬物智聯時代的多模AIUI交互標準,在原有的遠場高噪、全雙工、多語種多方言能力上,升級了多模態能力,新增了超擬人和個性化能力。

20241025120104908-30-9994a.png_scale.png

超擬人數字人首次亮相,多模態的交互從超擬人的語音變成超擬人的數字人,實現語音、視頻、圖文的全部聯動的多模態交互??拼笥嶏w研究院院長劉聰現場和超擬人數字人玩了個“角色扮演”游戲,無論是扮演孫悟空還是小豬佩奇,數字人反應都惟妙惟肖。

20241025120105155-58-3c440.png_scale.png

劉聰還演示了更實用的旅游購物場景,當攝像頭轉向印有外文的化妝品及酒類產品時,超擬人數字人能對畫面中產品的品牌、功能等信息進行“秒回”,超擬人數字人已成為“跨語言”購物的好幫手。

“目前,訊飛星火支持用戶創建自己的個性化數字人,打造每個人的數字分身?!眲⒙敩F場演示了一個自己的“數字分身”,只需在后臺進行簡單的編輯、定義,就可快速生成自己的卡通形象,更能一句話復刻自己的聲音作為發音人,隨時隨地與自己對話。目前,已支持1300+種人設打造。

20241025121155242-89-d1c8a.png_scale.png

硬件產品端,內嵌了星火多模AIUI能力的訊飛AI學習機閱讀伙伴即將上線,孩子們“指哪讀哪”,書中的故事可以馬上“擬人化”啟發孩子思考和提問。

首發星火多語言大模型,為世界提供第二種選擇

在語音識別領域,科大訊飛的遠場高噪場景語音識別領先優勢進一步擴大。

在多語言能力上,首次實現全國地級市方言全覆蓋,含全國288個地市、202種方言,訊飛輸入法14.0即將支持202種方言免切換自由說。

在多語種能力上,首次發布星火多語言大模型,除中英文外,可支持俄、日、阿、法等8個語種。根據實用任務場景構建測試集MMT-Eval-1.0,訊飛星火在汽車、家電、辦公、翻譯等行業的任務場景應用效果超過了GPT-4o。

20241025130023533-10-db9d2.png_scale.png

“訊飛作為中國唯一的認知智能全國重點實驗室承建單位,我們有使命有責任要做多語言大模型”,劉慶峰表示,訊飛星火底座能力要不斷提升,對標全球最好水平,同時還要針對真實應用場景做到全球最好,不斷擴大多語種范圍,“我們一定要代表中國給世界第二種選擇?!?/p>

大模型賦能民生剛需:發布教育、醫療、司法、政務等領域AI助手

“用人工智能技術解決社會剛需”,是科大訊飛一直以來的出發點之一。此次1024科大訊飛全球開發者節上,科大訊飛面向教育、醫療、司法、政務服務、企業辦公等多個行業場景發布了最新的產品應用。

20241025130116577-16-a8d64.png_scale.png

在教育行業,首次發布基于“問題鏈”的高中數學智能教師系統。

今年1月份,中國教育科學研究院與科大訊飛、華為開展深度合作,在訊飛星火教育大模型的基礎上開展“基于生成式人工智能的中小學智能教師示范研究”。此次發布的高中數學智能教師系統,是眾多高中數學學科優秀教師集體智慧和AI大模型的機器智能雙向賦能,實現“人機共育”。它可以智能生成教學問題鏈,以循序漸進的方式輔助教師啟發學生思考并逐步解決問題,同時基于精準學情定位學生薄弱點、融合最近發展區規劃路徑、鼓勵學生基于真實世界的主動提問、探究式學習,幫助學生實現知識、到能力、再到素養的綜合培養。該高中數學智能教師系統是中國教科院牽頭、北京、上海、重慶、深圳、合肥、成都、大連、廣州、哈爾濱等12個區域50多位數學教研員、400多位優秀教師與訊飛星火大模型人機共創的智慧成果。

20241025130116821-17-105ef.png_scale.png

搭載了高中數學智能教師系統的星火智慧黑板2.0也將于10月25日在第84屆教育裝備展上正式發布,從AI均衡視聽更公平、AI教學工具更高效、AI教師助手更智慧、全國產化算力更安全等四個方面推動黑板從板書工具躍遷為教學AI助手。

20241025130333292-23-f1ba4.png_scale.png

此外,訊飛AI學習機中首發AI作業過濾器。學習機通過OCR能力識別出紙質練習題,根據學生歷史學習情況和本地化考情,將題目分出“必做題”“選做題”“建議不做題”三個等級,實現“練得更少、學得更好”的目標。

20241025130333292-23-f1ba4.png_scale.png

發布會上,科大訊飛、華為、合肥市大數據資產運營有限公司三方聯合打造的國產超大規模智算平臺“飛星二號”正式啟動。面向未來,劉慶峰認為人工智能產業發展的關鍵是五個關鍵詞:頂天立地、自主可控、通專結合、端云聯動、軟硬一體。劉慶峰說:“堅持這五個關鍵點,我們的人工智能就有大未來,就能真正的解放生產力、釋放想象力,改變產業格局和競爭格局,帶來科研范式的變化,帶來各行各業的變化,最重要的是滿足老百姓對美好生活的期望!這就是我們未來的發展方向?!?/span>