亚洲五月天一区二区三区-日本午夜福利视频在线-日本欧美一区二区不卡免费-日韩深夜视频在线观看

0.01%虛假訓練文本可致有害內(nèi)容增加11.2% 警惕人工智能“數(shù)據(jù)投毒”

來源:新華網(wǎng) #AI安全# #數(shù)據(jù)治理# #防污染#
1352

防它!別來污染我的“小助手”

當前,人工智能已深度融入經(jīng)濟社會發(fā)展的方方面面,在深刻改變?nèi)祟惿a(chǎn)生活方式的同時,也成為關(guān)乎高質(zhì)量發(fā)展和高水平安全的關(guān)鍵領域。然而,人工智能的訓練數(shù)據(jù)存在良莠不齊的問題,其中不乏虛假信息、虛構(gòu)內(nèi)容和偏見性觀點,造成數(shù)據(jù)源污染,給人工智能安全帶來新的挑戰(zhàn)。

數(shù)據(jù)是人工智能的基礎

人工智能的三大核心要素是算法、算力和數(shù)據(jù),其中數(shù)據(jù)是訓練AI模型的基礎要素,也是AI應用的核心資源。

——提供AI模型的原料。海量數(shù)據(jù)為AI模型提供了充足的訓練素材,使其得以學習數(shù)據(jù)的內(nèi)在規(guī)律和模式,實現(xiàn)語義理解、智能決策和內(nèi)容生成。同時,數(shù)據(jù)也驅(qū)動人工智能不斷優(yōu)化性能和精度,實現(xiàn)模型的迭代升級,以適應新需求。

——影響AI模型的性能。AI模型對數(shù)據(jù)的數(shù)量、質(zhì)量及多樣性要求極高。充足的數(shù)據(jù)量是充分訓練大規(guī)模模型的前提;高準確性、完整性和一致性的數(shù)據(jù)能有效避免誤導模型;覆蓋多個領域的多樣化數(shù)據(jù),則能提升模型應對實際復雜場景的能力。

——促進AI模型的應用。數(shù)據(jù)資源的日益豐富,加速了“人工智能+”行動的落地,有力促進了人工智能與經(jīng)濟社會各領域的深度融合。這不僅培育和發(fā)展了新質(zhì)生產(chǎn)力,更推動我國科技跨越式發(fā)展、產(chǎn)業(yè)優(yōu)化升級、生產(chǎn)力整體躍升。

數(shù)據(jù)污染沖擊安全防線

高質(zhì)量的數(shù)據(jù)能夠顯著提升模型的準確性和可靠性,但數(shù)據(jù)一旦受到污染,則可能導致模型決策失誤甚至AI系統(tǒng)失效,存在一定的安全隱患。

——投放有害內(nèi)容。通過篡改、虛構(gòu)和重復等“數(shù)據(jù)投毒”行為產(chǎn)生的污染數(shù)據(jù),將干擾模型在訓練階段的參數(shù)調(diào)整,削弱模型性能、降低其準確性,甚至誘發(fā)有害輸出。研究顯示,當訓練數(shù)據(jù)集中僅有0.01%的虛假文本時,模型輸出的有害內(nèi)容會增加11.2%;即使是0.001%的虛假文本,其有害輸出也會相應上升7.2%。

——造成遞歸污染。受到數(shù)據(jù)污染的人工智能生成的虛假內(nèi)容,可能成為后續(xù)模型訓練的數(shù)據(jù)源,形成具有延續(xù)性的“污染遺留效應”。當前,互聯(lián)網(wǎng)AI生成內(nèi)容在數(shù)量上已遠超人類生產(chǎn)的真實內(nèi)容,大量低質(zhì)量及非客觀數(shù)據(jù)充斥其中,導致AI訓練數(shù)據(jù)集中的錯誤信息逐代累積,最終扭曲模型本身的認知能力。

——引發(fā)現(xiàn)實風險。數(shù)據(jù)污染還可能引發(fā)一系列現(xiàn)實風險,尤其在金融市場、公共安全和醫(yī)療健康等領域。在金融領域,不法分子利用AI炮制虛假信息,造成數(shù)據(jù)污染,可能引發(fā)股價異常波動,構(gòu)成新型市場操縱風險;在公共安全領域,數(shù)據(jù)污染容易擾動公眾認知、誤導社會輿論,誘發(fā)社會恐慌情緒;在醫(yī)療健康領域,數(shù)據(jù)污染則可能致使模型生成錯誤診療建議,不僅危及患者生命安全,也加劇偽科學的傳播。

筑牢人工智能數(shù)據(jù)底座

——加強源頭監(jiān)管,防范污染生成。以《網(wǎng)絡安全法》《數(shù)據(jù)安全法》《個人信息保護法》等法律法規(guī)為依據(jù),建立AI數(shù)據(jù)分類分級保護制度,從根本上防范污染數(shù)據(jù)的產(chǎn)生,助力有效防范AI數(shù)據(jù)安全威脅。

——強化風險評估,保障數(shù)據(jù)流通。加強對人工智能數(shù)據(jù)安全風險的整體評估,確保數(shù)據(jù)在采集、存儲、傳輸、使用、交換和備份等全生命周期環(huán)節(jié)安全。同步加快構(gòu)建人工智能安全風險分類管理體系,不斷提高數(shù)據(jù)安全綜合保障能力。

——末端清洗修復,構(gòu)建治理框架。定期依據(jù)法規(guī)標準清洗修復受污數(shù)據(jù)。依據(jù)相關(guān)法律法規(guī)及行業(yè)標準,制定數(shù)據(jù)清洗的具體規(guī)則。逐步構(gòu)建模塊化、可監(jiān)測、可擴展的數(shù)據(jù)治理框架,實現(xiàn)持續(xù)管理與質(zhì)量把控。

國家安全機關(guān)將在以習近平同志為核心的黨中央堅強領導下,全面貫徹總體國家安全觀,與有關(guān)部門一道防范針對我人工智能領域的數(shù)據(jù)污染風險,依法維護人工智能安全和數(shù)據(jù)安全,不斷筑牢國家安全屏障。

責編: 集小微
來源:新華網(wǎng) #AI安全# #數(shù)據(jù)治理# #防污染#
THE END
關(guān)閉
加載

PDF 加載中...