美國華盛頓州立大學研究人員開發出一種預測細菌耐藥性基因的新方法,通過機器學習和博弈論模型,他們能以93%—99%的準確率,預測3種不同類型革蘭氏陰性菌中耐藥基因的存在。
細菌對抗菌素的耐藥性已成為影響全球公共健康的重要問題,威脅著億萬人群,僅美國每年就有數百萬人會被耐藥細菌感染,導致成千上萬人死亡。近年來,科學家一直在努力尋找預測、識別抗菌素耐藥性基因的手段,以求更有效地對病患施藥。隨著全基因組測序技術的突破,他們開發出序列比對方法,通過序列相似性來鑒定抗菌素耐藥性基因,但遇到與已知抗菌素耐藥性基因具有高度相似性的序列時,這些方法則有些無能為力。
此次,華盛頓州立大學研究團隊決定使用博弈論來幫助預測、識別抗菌素耐藥性基因。博弈論是一種研究具有斗爭或競爭現象的數學理論和方法,是當前經濟學的標準分析工具之一。在博弈模型中,一個參與者的行為會影響并取決于其他參與者的行為。
研究團隊使用其開發的機器學習算法和博弈論模型,不僅對細菌基因組中簡單的序列相似性進行分析,還深入研究了蛋白質序列結構、理化特征、進化特征、組成特征等多個特征的相互作用,以求準確預測抗菌素耐藥性基因。他們在9日的《科學報告》上發表研究論文稱,使用新方法預測3種革蘭氏陰性菌——假單胞菌、弧菌和腸桿菌的抗菌素耐藥性基因序列,其準確度達到93%—99%。
研究人員表示,這種新穎的博弈論方法特別強大,其將基因特征的相關性和相互依賴性綜合考慮,根據它們在整體上協同工作的能力來識別可能的抗菌素耐藥性基因,因而能夠鑒定出以前通過簡單序列比對方法無法識別的推定抗性基因。隨著抗菌素耐藥性的增長和現有測序基因組數量的增加,迫切需要開發新的、更準確的耐藥基因預測、識別工具,而他們的研究表明,機器學習模型將是一個重要研發方向。(記者劉海英)
總編輯圈點
如果不能加以控制,抗菌素耐藥性每年導致死亡的人數,甚至可能會高于因癌癥去世的人數。因此科學家們才投入巨大的人力物力去識別抗菌素耐藥性基因。但人類不是“超體”,大腦無法處理大規模數據集,這太復雜也太耗費時間。而機器學習卻完全可以勝任這樣的工作,瞬時理清大量信息之間的關系?,F在,用博弈模型和機器學習聯手處理生物數據,無疑將識別的準確度和速度成倍提高,為人們應對這一巨大公共衛生問題,提供了強有力的支撐。