近日,集成電路學(xué)院代月花教授課題組與復(fù)旦大學(xué)芯片與系統(tǒng)前沿研究院劉琦教授團(tuán)隊(duì)開(kāi)展合作,在憶阻器基存算一體技術(shù)領(lǐng)域取得重要進(jìn)展。
相關(guān)成果以“Memristive Bellman Solver for Decision-making”為題發(fā)表于《自然通訊》(Nature Communications)上(DOI:10.1038/s41467-025-60085-w)。安徽大學(xué)集成電路學(xué)院為第一單位,我校集成電路學(xué)院22級(jí)博士生馮哲、吳祖恒副教授和23級(jí)博士生鄒建勛為共同第一作者,集成電路學(xué)院吳祖恒副教授、代月花教授和復(fù)旦大學(xué)劉琦教授為共同通訊作者。
Bellman方程是動(dòng)態(tài)規(guī)劃和決策領(lǐng)域的核心工具,廣泛應(yīng)用于強(qiáng)化學(xué)習(xí)、自動(dòng)駕駛、路徑規(guī)劃等場(chǎng)景。然而,傳統(tǒng)求解方法通常需要大量迭代計(jì)算,計(jì)算復(fù)雜度高,尤其在實(shí)時(shí)性要求高的應(yīng)用中,往往難以滿足應(yīng)用需求。這種低效性限制了動(dòng)態(tài)決策系統(tǒng)在實(shí)際場(chǎng)景中的表現(xiàn),亟需新的技術(shù)突破。
基于憶阻器的Bellman求解器(Memristive Bellman Solver,MBS)為這一難題提供了全新的解決方案。MBS充分利用憶阻器的高效存算一體特性,通過(guò)引入時(shí)間維度,將Bellman方程的雙期望迭代求解轉(zhuǎn)化為循環(huán)點(diǎn)積操作,大幅降低了計(jì)算復(fù)雜度。更獨(dú)特的是,研究團(tuán)隊(duì)將憶阻器的固有噪聲轉(zhuǎn)化為計(jì)算優(yōu)勢(shì),通過(guò)隨機(jī)擾動(dòng)加速了求解過(guò)程的收斂速度,實(shí)現(xiàn)了高效的近似解。這種軟硬件協(xié)同優(yōu)化的設(shè)計(jì),不僅提升了系統(tǒng)計(jì)算效率,還顯著降低了系統(tǒng)能耗(~1000×)。實(shí)驗(yàn)結(jié)果表明,MBS能夠?qū)崿F(xiàn)高效的決策制定,為開(kāi)發(fā)高效決策制定系統(tǒng)提供了新思路。