1月25日,科大訊飛董事長劉慶峰在公司年會上場透露,面對算力少、需求多、競爭激烈的環(huán)境,科大訊飛一方面堅定不移地推進自主可控通用大模型底座升級,一方面以GBC聯(lián)動的方式推進大模型應(yīng)用落地,訊飛星火目前已擁有從頂層規(guī)劃到執(zhí)行落地的全套解決方案。
劉慶峰明確訊飛星火大模型的戰(zhàn)略生態(tài)位:堅持自主可控、面向民生剛需、面向國家戰(zhàn)略需求以及賦能科研與生產(chǎn)?!熬劢棺灾骺煽氐牡鬃芰椭攸c應(yīng)用賽道,以長期主義精神保持戰(zhàn)略定力”,他透露,在通用人工智能發(fā)展的新階段,科大訊飛將做全棧自主可控的大模型國家隊。
此前,訊飛星火大模型4.0 Turbo發(fā)布后,在數(shù)學(xué)能力、代碼能力上超過了GPT-4o。由艾倫人工智能研究所、OpenAI等國內(nèi)外權(quán)威單位發(fā)布,涵蓋理解和推理、綜合考試、數(shù)學(xué)和科學(xué)、代碼等不同任務(wù)類型的14項主流測試集中,訊飛星火4.0-Turbo在其中9項測試集中實現(xiàn)超越,效率相對提升50%。
根據(jù)代碼生成HumanEval測試集上的效果對比,訊飛星火4.0 Turbo在Python、Java、JavaScript等任務(wù)上和GPT-4o的差距微弱,在C++能力上超過GPT-4o。在真實應(yīng)用場景,基于認知智能全國重點實驗室構(gòu)建的iFLYCode-Eval-2.0代碼實用場景測試集,訊飛星火4.0 Turbo在代碼生成、代碼檢錯、單元測試等任務(wù)上都超過了GPT-4o。同時推出星火代碼7B版本,滿足代碼生成、代碼補全等極速響應(yīng)型任務(wù),效果業(yè)界最優(yōu)。