拉普拉斯核磁共振波譜(Laplace NMR spectroscopy)技術通過檢測與分子動力學和自旋相互作用相關的擴散或弛豫等信息,為研究分子的化學結構和物理環(huán)境提供了一種強大的工具,因此被廣泛應用于化學、材料科學、生物醫(yī)學、食品科學等多個領域。然而,拉普拉斯NMR波譜的有效性在很大程度上依賴于數據后處理算法從實驗采集的指數衰減信號中提取弛豫時間、擴散系數等信息,如拉普拉斯反演(ILT)。由于ILT問題本質上是不適定的,因此很難進行令人滿意的拉普拉斯NMR數據處理和重建,特別是對于二維拉普拉斯NMR實驗。傳統(tǒng)的拉普拉斯NMR數據處理算法通過人為附加不同的約束來限制解的空間,以得到符合預期的結果,但繁瑣的正則化參數調整和冗長的優(yōu)化迭代過程導致許多實際問題依然未解決,在二維甚至更多維的場景中解的病態(tài)性以及對噪聲的敏感性面臨著更嚴峻的挑戰(zhàn)。為了解決該問題,廈門大學陳忠教授團隊將物理信息嵌入仿真數據驅動的神經網絡模型中,在國際上首次提出基于深度學習的多維拉普拉斯磁共振快速重建算法(DLEMLR),克服拉普拉斯反演的病態(tài)性及提高重建譜圖的分辨率,并將重建時間縮短至秒級。
深度學習旨在識別訓練數據集中的基本模式和內在關系,并利用這些信息對未知的數據進行預測。然而,由于儀器機時和樣品種類的限制,構建一個龐大的拉普拉斯NMR訓練數據集是一件不切實際的事情,因此DLEMLR通過前向物理模型生成仿真數據集來訓練神經網絡解決拉普拉斯逆問題。DLEMLR的基礎架構為簡化后的視覺Transforme (ViT)網絡,包含多層感知機(MLP)和多頭注意力機制(MHA)。在輸入網絡前,二維衰減信號與拉普拉斯核矩陣(如與T1弛豫時間相關的1-e-t/T1,與T2弛豫時間相關的e-t/T2,以及與擴散系數相關的e-bD)集成,隨后被劃分為小塊,并在每個小塊中融合嵌入正弦位置編碼信息。隨后,Tokenizer模塊將每個小塊壓縮成表征弛豫或擴散過程相關的物理屬性和高維特征信息的序列。在Transformer編碼器中,MHA模塊進一步計算這些特征序列之間的相關性,使模型能夠高效地整合所有位置的信息。最后,Projector模塊生成所有高維特征序列的綜合表示,從而得到所需的二維拉普拉斯NMR波譜。此外,作者引入包含物理驅動損失項和數據驅動損失項的雙目標損失函數,以提高結果的魯棒性和與實驗數據間的一致性。其中數據驅動損失是網絡輸出f(S;θ)與理想分布譜F之間的誤差,增強了不同組分譜峰位置的準確性。然而,僅依靠數據驅動損失容易使模型忽略了實驗樣品中分子的固有物理屬性,在真實實驗數據不符合仿真數據分布時,模型產生的誤差較大。因此,作者進一步引入物理驅動損失估計網絡輸出與給定前向過程輸入之間的關系。具體來說,DLEMLR的輸出通過給定的拉普拉斯核矩陣(即K1和K2)經前向過程變換到二維衰減域中,隨后由物理驅動損失函數計算生成的2D衰減信號K1f(S;θ)K2T與原始輸入S之間的殘差,從而使重建譜峰的物理屬性(如線寬、峰高)與實際分布更加一致。
作者使用來自白色波特蘭水泥樣品的T1-T2相關實驗數據評估DLEMLR的性能。圖2展示了三種方法的結果,其中T2 ≈ 0.8 ms和20.0 ms處的兩個譜峰在位置、峰高和振幅方面都表現出高度的一致性。白色波特蘭水泥的孔隙結構受樣品制備的影響,持續(xù)的水化過程導致其在儲存時間內不斷演變,這兩個譜峰分別對應于水合物空間和毛細孔中的自旋群。如圖2a和2b所示,Upen2DTool和GRIN-Toolbox重建結果中觀察到的譜峰寬度較寬,表明譜峰位置存在較大的不確定性。Upen2DTool使用多參數Tikhonov正則化來改善結果的平滑度,導致圖2a中所示的譜峰分布較寬且平滑。而 GRIN-Toolbox使用L1范數作為正則化手段提高結果的稀疏性,使譜峰分布相比Upen2DTool更為尖銳。相比之下,DLEMLR的結果以更高的分辨率和更低的不確定度顯示了兩個譜峰之間的差異性(圖2c),更有利于不同成分譜峰的分離。為了更直觀地進行對比,作者在圖2d - 2i中提供了沿T1和T2弛豫時間維度的投影譜,峰值位置為估計的弛豫時間,而峰寬對應于結果的不確定性。這些投影譜能夠更直觀展示譜峰分辨率之間的差異,進一步證明了DLEMLR在獲得高分辨率譜峰方面的優(yōu)越性能。此外,DLEMLR 所需的處理時間,包括數據預處理和算法迭代,僅為 Upen2DTool和GRIN-Toolbox 所需時間的約10%。
為了驗證 DLEMLR 在處理復雜樣品方面的有效性,作者使用了在奶酪成熟過程中第10天、第15天和第20天采集的三組T1-T2實驗數據。如圖3所示,在奶酪生產過程中形成了由水、液態(tài)脂肪和酪蛋白組成的奶酪凝膠網絡,其演變受牛奶質量、牛奶類型、乳酶等因素的影響。如圖3b,在成熟第10天測量的T1-T2相關譜中識別出了三個高分辨率信號。第一個信號(圖3中標記為“W”),T1 ≈ 320 ms和T2 ≈ 40 ms,被歸屬為來源于水分子。第二個信號(圖3中標記為“P”),T1 ≈ 160 ms和T2 ≈ 4 ms,被歸屬為酪蛋白中鎖住的水分子,其T1弛豫時間和T2弛豫時間的比值約為40,表明化學交換是T2弛豫的一種高效機制。第三個信號(圖5中標記為“F”),T1 ≈ 100 ms和T2 ≈ 70 ms,被歸屬為來源于液態(tài)脂肪。該脂肪峰表現出液態(tài)特性,其T1弛豫時間和T2弛豫時間的比值約為1,表明脂肪在奶酪中主要以液態(tài)形式存在。此外,對T1-T2相關譜中相對峰積分的分析表明,蛋白質和脂肪峰隨著成熟時間的增加而成比例增加,而水分子峰則逐漸減少。實驗結果表明DLEMLR方法在處理復雜樣品方面具有顯著的優(yōu)勢,能夠提供高分辨率的成分分析和動態(tài)變化監(jiān)測,對食品工業(yè)和其他相關領域具有重要的應用價值。