美國(guó)華盛頓州立大學(xué)研究人員開(kāi)發(fā)出一種預(yù)測(cè)細(xì)菌耐藥性基因的新方法,通過(guò)機(jī)器學(xué)習(xí)和博弈論模型,他們能以93%—99%的準(zhǔn)確率,預(yù)測(cè)3種不同類(lèi)型革蘭氏陰性菌中耐藥基因的存在。
細(xì)菌對(duì)抗菌素的耐藥性已成為影響全球公共健康的重要問(wèn)題,威脅著億萬(wàn)人群,僅美國(guó)每年就有數(shù)百萬(wàn)人會(huì)被耐藥細(xì)菌感染,導(dǎo)致成千上萬(wàn)人死亡。近年來(lái),科學(xué)家一直在努力尋找預(yù)測(cè)、識(shí)別抗菌素耐藥性基因的手段,以求更有效地對(duì)病患施藥。隨著全基因組測(cè)序技術(shù)的突破,他們開(kāi)發(fā)出序列比對(duì)方法,通過(guò)序列相似性來(lái)鑒定抗菌素耐藥性基因,但遇到與已知抗菌素耐藥性基因具有高度相似性的序列時(shí),這些方法則有些無(wú)能為力。
此次,華盛頓州立大學(xué)研究團(tuán)隊(duì)決定使用博弈論來(lái)幫助預(yù)測(cè)、識(shí)別抗菌素耐藥性基因。博弈論是一種研究具有斗爭(zhēng)或競(jìng)爭(zhēng)現(xiàn)象的數(shù)學(xué)理論和方法,是當(dāng)前經(jīng)濟(jì)學(xué)的標(biāo)準(zhǔn)分析工具之一。在博弈模型中,一個(gè)參與者的行為會(huì)影響并取決于其他參與者的行為。
研究團(tuán)隊(duì)使用其開(kāi)發(fā)的機(jī)器學(xué)習(xí)算法和博弈論模型,不僅對(duì)細(xì)菌基因組中簡(jiǎn)單的序列相似性進(jìn)行分析,還深入研究了蛋白質(zhì)序列結(jié)構(gòu)、理化特征、進(jìn)化特征、組成特征等多個(gè)特征的相互作用,以求準(zhǔn)確預(yù)測(cè)抗菌素耐藥性基因。他們?cè)?日的《科學(xué)報(bào)告》上發(fā)表研究論文稱(chēng),使用新方法預(yù)測(cè)3種革蘭氏陰性菌——假單胞菌、弧菌和腸桿菌的抗菌素耐藥性基因序列,其準(zhǔn)確度達(dá)到93%—99%。
研究人員表示,這種新穎的博弈論方法特別強(qiáng)大,其將基因特征的相關(guān)性和相互依賴(lài)性綜合考慮,根據(jù)它們?cè)谡w上協(xié)同工作的能力來(lái)識(shí)別可能的抗菌素耐藥性基因,因而能夠鑒定出以前通過(guò)簡(jiǎn)單序列比對(duì)方法無(wú)法識(shí)別的推定抗性基因。隨著抗菌素耐藥性的增長(zhǎng)和現(xiàn)有測(cè)序基因組數(shù)量的增加,迫切需要開(kāi)發(fā)新的、更準(zhǔn)確的耐藥基因預(yù)測(cè)、識(shí)別工具,而他們的研究表明,機(jī)器學(xué)習(xí)模型將是一個(gè)重要研發(fā)方向。(記者劉海英)
總編輯圈點(diǎn)
如果不能加以控制,抗菌素耐藥性每年導(dǎo)致死亡的人數(shù),甚至可能會(huì)高于因癌癥去世的人數(shù)。因此科學(xué)家們才投入巨大的人力物力去識(shí)別抗菌素耐藥性基因。但人類(lèi)不是“超體”,大腦無(wú)法處理大規(guī)模數(shù)據(jù)集,這太復(fù)雜也太耗費(fèi)時(shí)間。而機(jī)器學(xué)習(xí)卻完全可以勝任這樣的工作,瞬時(shí)理清大量信息之間的關(guān)系。現(xiàn)在,用博弈模型和機(jī)器學(xué)習(xí)聯(lián)手處理生物數(shù)據(jù),無(wú)疑將識(shí)別的準(zhǔn)確度和速度成倍提高,為人們應(yīng)對(duì)這一巨大公共衛(wèi)生問(wèn)題,提供了強(qiáng)有力的支撐。