3月22日,北京理工大學(xué)機(jī)械與車輛學(xué)院孫逢春院士與何洪文教授團(tuán)隊(duì)在國際頂級期刊《自然·通訊》(Nature Communications)發(fā)表研究成果。該團(tuán)隊(duì)發(fā)表的題為《大規(guī)模數(shù)據(jù)驅(qū)動的電動汽車能量管理》(Data-driven energy management for electric vehicles using offline reinforcement learning)論文,突破傳統(tǒng)由專業(yè)工程師設(shè)計控制策略的固有模式,通過利用電動汽車監(jiān)測與管理系統(tǒng)采集的大規(guī)模運(yùn)行數(shù)據(jù),構(gòu)建具備自主學(xué)習(xí)和持續(xù)進(jìn)化能力的智能能量管理系統(tǒng),為電動汽車大數(shù)據(jù)應(yīng)用與控制系統(tǒng)開發(fā)提供了創(chuàng)新解決方案。
在“雙碳”戰(zhàn)略目標(biāo)持續(xù)推進(jìn)和新能源汽車快速普及的背景下,電動汽車能量管理技術(shù)已成為提升車輛續(xù)航里程和系統(tǒng)壽命的關(guān)鍵技術(shù)。然而,傳統(tǒng)方法嚴(yán)重依賴人工規(guī)則設(shè)計和高精度仿真模型,導(dǎo)致開發(fā)周期較長、成本較高,且難以適應(yīng)真實(shí)道路的復(fù)雜工況。針對這一技術(shù)難題,研究團(tuán)隊(duì)提出了基于大規(guī)模數(shù)據(jù)驅(qū)動的電動汽車能量管理方法。該方法采用"數(shù)據(jù)驅(qū)動+智能學(xué)習(xí)"的技術(shù)路線,能量管理智能體能夠直接從數(shù)據(jù)中學(xué)習(xí)最優(yōu)控制策略,不僅擺脫了對專家經(jīng)驗(yàn)設(shè)計控制策略的依賴,也無需建立高精度車輛仿真模型用于策略訓(xùn)練,顯著優(yōu)化了策略開發(fā)流程。且該方法不依賴數(shù)據(jù)質(zhì)量,既可以從次優(yōu)數(shù)據(jù)中學(xué)習(xí)近似最優(yōu)策略,還能在隨機(jī)數(shù)據(jù)條件下優(yōu)化控制策略。
研究團(tuán)隊(duì)通過自主研發(fā)數(shù)據(jù)增強(qiáng)的電動汽車數(shù)字模型,實(shí)現(xiàn)了電動汽車監(jiān)測與管理系統(tǒng)真實(shí)運(yùn)行數(shù)據(jù)與仿真模型數(shù)據(jù)的結(jié)合,成功構(gòu)建了覆蓋多種運(yùn)行工況、包含高維多源數(shù)據(jù)特征的大規(guī)模電動汽車數(shù)據(jù)集。提出了融合行為克隆與判別器混合正則化項(xiàng)的離線強(qiáng)化學(xué)習(xí)方法,解決了策略學(xué)習(xí)中存在的分布偏移問題,既能保持策略學(xué)習(xí)的有效約束,又能實(shí)現(xiàn)性能優(yōu)化。基于實(shí)車運(yùn)行數(shù)據(jù)的學(xué)習(xí)驗(yàn)證,該方法在燃料電池電動汽車上實(shí)現(xiàn)了能耗水平和系統(tǒng)壽命的雙重提升,并具備持續(xù)自我進(jìn)化能力,僅經(jīng)過兩次數(shù)據(jù)學(xué)習(xí),性能就從初始的88%最優(yōu)性提升至98.6%。此外,該方法展現(xiàn)出良好的兼容性,能夠無縫集成到現(xiàn)有基于規(guī)則或其他方法的能量管理系統(tǒng)中。
基于大規(guī)模數(shù)據(jù)驅(qū)動的電動汽車能量管理方法整體技術(shù)路線
能量管理策略持續(xù)進(jìn)化的實(shí)驗(yàn)結(jié)果
注:該研究由孫逢春院士團(tuán)隊(duì)獨(dú)立完成,何洪文教授為本文通訊作者,機(jī)械與車輛學(xué)院博士研究生王勇為第一作者,魏中寶教授和吳京達(dá)副教授也為本項(xiàng)研究作出了重要貢獻(xiàn)。