3月10日,富士康表示,已推出首款大型語言模型,并計劃利用該技術(shù)改善制造和供應(yīng)鏈管理。
富士康在一份聲明中表示,這個名為“FoxBrain”的模型使用了120塊英偉達(dá)的H100 GPU進(jìn)行訓(xùn)練,并在大約四周內(nèi)完成,這款機(jī)型是基于Meta的Llama 3.1架構(gòu)。
富士康稱,這是中國臺灣首個具有推理能力的大型語言模型,針對傳統(tǒng)中文和中國臺灣語言風(fēng)格進(jìn)行了優(yōu)化。雖然與DeepSeek的相比,F(xiàn)oxBrain的性能略有差距,但其整體性能非常接近世界級標(biāo)準(zhǔn)。
FoxBrain最初是為內(nèi)部應(yīng)用程序設(shè)計的,涵蓋了數(shù)據(jù)分析、決策支持、文檔協(xié)作、數(shù)學(xué)、推理和解決問題以及代碼生成。該公司表示,計劃與技術(shù)合作伙伴合作,擴(kuò)大該模型的應(yīng)用,共享其開源信息,并在制造、供應(yīng)鏈管理和智能決策方面推廣人工智能。(校對/李梅)