人工智能驅(qū)動(dòng)的科學(xué)研究(AI for Science)是加速我國科學(xué)研究范式變革和能力提升,提高我國科技創(chuàng)新能力,搶占全球科技制高點(diǎn)的重要支撐。中國工程院院士、之江實(shí)驗(yàn)室主任、阿里云創(chuàng)始人王堅(jiān)認(rèn)為,人工智能不是一次工具的革命,而是一次科學(xué)革命的工具或者是科學(xué)革命性的工具。
監(jiān)測(cè)青藏高原水資源,對(duì)珊瑚礁進(jìn)行生態(tài)分析,實(shí)現(xiàn)自主天文觀測(cè)……在AI for Science浪潮下,中國科學(xué)院多個(gè)研究所正通過接入阿里通義千問QwQ-32B推理大模型,開啟從“上天”到“入地”,從“觀星”到“察水”的科研智能化遠(yuǎn)征。
精準(zhǔn)預(yù)測(cè)太陽耀斑爆發(fā)
耀斑是太陽最劇烈的活動(dòng)現(xiàn)象之一,每隔約11年就會(huì)大爆發(fā)。為了破解耀斑爆發(fā)之謎,近年來,學(xué)者們從數(shù)據(jù)驅(qū)動(dòng)角度出發(fā),開始用深度學(xué)習(xí)、機(jī)器學(xué)習(xí)等技術(shù)開展研究。然而,隨著觀測(cè)數(shù)據(jù)的不斷積累和數(shù)據(jù)特征維度的不斷增加,對(duì)算法規(guī)模的要求越來越高,研究人員亟需對(duì)海量多模態(tài)數(shù)據(jù)進(jìn)行有效處理。
大模型的出現(xiàn)帶來新解法。在中國科學(xué)院國家天文臺(tái),科研人員利用QwQ-32B構(gòu)建的太陽物理大模型“金烏”,對(duì)太陽耀斑活動(dòng)進(jìn)行精準(zhǔn)預(yù)測(cè)。
國家天文臺(tái)人工智能小組核心成員李瑀旸對(duì)科技日?qǐng)?bào)記者介紹,在阿里通義千問系列模型的基礎(chǔ)上,團(tuán)隊(duì)通過監(jiān)督學(xué)習(xí)、強(qiáng)化學(xué)習(xí),訓(xùn)練模型理解、回答太陽物理問題,以及認(rèn)識(shí)、分析太陽圖像的能力。其中,太陽耀斑爆發(fā)預(yù)報(bào)任務(wù)以SDO(太陽動(dòng)力學(xué)天文臺(tái))衛(wèi)星公開數(shù)據(jù)、懷柔基地35厘米磁場(chǎng)望遠(yuǎn)鏡數(shù)據(jù)、“夸父一號(hào)”(ASO-S)全日面矢量磁像儀數(shù)據(jù)為主要數(shù)據(jù)源進(jìn)行訓(xùn)練和測(cè)試,預(yù)測(cè)準(zhǔn)確率達(dá)到領(lǐng)域內(nèi)前沿水平。
“天文大模型‘星語3.0’則接入國家天文臺(tái)興隆觀測(cè)站望遠(yuǎn)鏡陣列Mini‘司天’,可自主控制觀測(cè)、分析數(shù)據(jù)并推薦后續(xù)計(jì)劃?!崩瞵r旸介紹,“全新升級(jí)的‘星語’大模型正在向智能體方向發(fā)展,將吸收更多細(xì)分領(lǐng)域知識(shí),融合現(xiàn)有科研模型、算法,進(jìn)一步提升科研效率?!?/p>
他還提到,科研對(duì)數(shù)據(jù)安全要求極高,因此,部分科研場(chǎng)景會(huì)把模型部署在本地。QwQ-32B可提供相對(duì)更低的部署成本,并能滿足相關(guān)研究對(duì)模型能力的要求。
探尋青藏高原“水密碼”
青藏高原是“世界屋脊”“亞洲水塔”,也是全球?qū)夂蜃兓憫?yīng)最敏感的區(qū)域之一。第二次青藏科考發(fā)現(xiàn),青藏高原固態(tài)水正在快速融化、液態(tài)水呈增加趨勢(shì)。氣候變化導(dǎo)致的不確定性,會(huì)造成青藏高原潛在的水資源和能源保供風(fēng)險(xiǎn)。
面對(duì)這一挑戰(zhàn),中國科學(xué)院青藏高原研究所聯(lián)合阿里云打造了首個(gè)專注于氣候變化適應(yīng)領(lǐng)域的水—能—糧多模態(tài)推理大模型——“洛書”。
水—能—糧耦合是指水資源、能源系統(tǒng)和糧食生產(chǎn)之間復(fù)雜的相互依存和影響關(guān)系,研究水—能—糧耦合對(duì)制定更有韌性的應(yīng)對(duì)策略至關(guān)重要。
中國科學(xué)院青藏高原研究所助理研究員夏萃慧介紹,“洛書”以研究所自研的科學(xué)模型“思源”為底層,依托青藏高原的時(shí)空數(shù)據(jù)訓(xùn)練而成。其輸出結(jié)果包含兩部分:一部分是直接支撐水電生產(chǎn)預(yù)測(cè)的徑流量,另一部分是精準(zhǔn)描繪水文過程的高維數(shù)據(jù)?!暗祟悷o法直接理解和使用這些數(shù)據(jù)?!荚础尤胪x千問后,可實(shí)現(xiàn)自然語言的查詢和輸出,實(shí)現(xiàn)高維數(shù)據(jù)可視化呈現(xiàn),一線人員可據(jù)此直接進(jìn)行決策?!毕妮突壅f。
更值得一提的是,“洛書”結(jié)合“思源”和QwQ-32B,可直接對(duì)數(shù)據(jù)進(jìn)行推理分析,得出結(jié)論。“比如,在枯水期要觀測(cè)什么、未來要做哪些工作來適應(yīng)氣候變化等問題,都可以通過推理大模型得到解釋,從而輔助決策?!毕妮突壅f,在這項(xiàng)研究中,團(tuán)隊(duì)還借助阿里云提供的AI計(jì)算資源、數(shù)據(jù)存儲(chǔ)和深度學(xué)習(xí)平臺(tái),高效處理海量數(shù)據(jù)和復(fù)雜的計(jì)算任務(wù),實(shí)現(xiàn)對(duì)模型的快速實(shí)驗(yàn)和迭代,大幅提升科研效率。
未來,“洛書”還將接入Qwen-VL以實(shí)現(xiàn)高效識(shí)別圖像數(shù)據(jù),并與智能體、具身智能觀測(cè)和空天地一體化動(dòng)態(tài)數(shù)據(jù)中心相協(xié)同,共同為青藏高原生態(tài)保護(hù)與可持續(xù)發(fā)展提供科技支撐。