那么問(wèn)題來(lái)了,每一個(gè)自然環(huán)境樣品中,都存在著幾百甚至幾千個(gè)物種,每個(gè)物種在環(huán)境樣品中的豐度又有很大差異,它們的基因組信息混在一起,我們?nèi)绾斡行У膮^(qū)分,并獲得每個(gè)菌株的信息呢?
這就少不了binning的貢獻(xiàn)了。在宏基因組研究中,binning技術(shù)越來(lái)越必需且關(guān)鍵,可謂是CNS必備神器,宏基因組的高分文章中幾乎都能看到binning的身影。
什么是宏基因組binning? Binning能做什么?
Binning的含義是分箱、聚類,指從微生物群體序列中將不同個(gè)體的序列(reads或contigs等)分離開(kāi)來(lái)的過(guò)程。簡(jiǎn)單來(lái)說(shuō)就是把宏基因組數(shù)據(jù)中來(lái)自同一菌株的序列聚到一起,得到一個(gè)菌株的基因組。是的,可以達(dá)到菌株水平。
基于宏基因組binning,主要有兩方面的重要應(yīng)用:
關(guān)聯(lián)分析
即通過(guò)binning得到的bins(暫且簡(jiǎn)稱為bins,更確切的說(shuō)是strain-level clusters 或strain-level taxonomic units)可以進(jìn)行宏基因組關(guān)聯(lián)分析以及多組學(xué)聯(lián)合分析,將特定功能代謝產(chǎn)物與特定物種、特定基因進(jìn)行關(guān)聯(lián)研究,推動(dòng)其因果機(jī)制的探究,為疾病監(jiān)控、環(huán)境監(jiān)測(cè)提供了菌株水平的生物靶標(biāo)。
單菌組裝
通過(guò)對(duì)binning得到的bins進(jìn)行后續(xù)組裝,可以得到很多不能在實(shí)驗(yàn)室里培養(yǎng)的細(xì)菌、古菌、病毒的基因組草圖,然后根據(jù)單菌組裝結(jié)果進(jìn)行菌株水平的基因和功能注釋、比較基因組分析、進(jìn)化分析等,使我們得以洞察這些無(wú)法在實(shí)驗(yàn)室培養(yǎng)獲得的菌株的生態(tài)適應(yīng)機(jī)制,營(yíng)養(yǎng)互作機(jī)制和新陳代謝功能等,可以研究在生態(tài)環(huán)境和復(fù)雜疾病中起重要作用的菌種以及致病菌和宿主的互作機(jī)制及其微進(jìn)化機(jī)制。