除了宏基因組學技術之外,還有另外一種技術就是單細胞基因組測序技術,這也是一種不需要進行實驗室培養(yǎng)的測序技術,只需要從環(huán)境樣本中提取細胞并進行基因組測序就可以完成工作。最近,Rinke等人從多種不同的自然環(huán)境樣本中都成功地分離得到了單細胞標本,并且成功地進行了DNA擴增和測序,獲得了201個基因組(非完整基因組)。據(jù)估計,這些序列的平均完整程度達到了40%.據(jù)我們了解,到目前為止還沒有哪一個單細胞基因組測序工作能夠獲得完整的基因組序列。這種單細胞基因組測序工作獲得的序列基本上都是不完整的。Rinke等人開展的工作已經(jīng)可以算是非常漂亮的工作了,他們獲得的最完整的基因組序列(認為該序列的完整程度幾乎接近100%)也是由10個片段拼接而成的,另外一個完整度達到99%的基因組序列更是由137個片段組成的。
用宏基因組學技術獲得的基因組片段很多都是不完整的(這主要是因為樣品不夠),不過我們可以借助額外的測序工作加以彌補??墒菍τ趩渭毎蚪M測序,再輔以其它測序似乎意義不太大。宏基因組學技術也不需要像單細胞測序技術那樣費時費力,也不需要進行細胞分選,而且還能提供更多的信息。因為宏基因組學技術獲得的是整體的信息?,F(xiàn)在在基因組測序工作中使用的算法大部分都是株系特異性的,很有可能會測出多態(tài)性堿基。另外,如果被測細胞里存在基因插入或者缺失的情況,那么有一部分測序結果可能就只能與參考序列部分吻合了。如果科研人員對整體代謝能力、整體結構、整體多樣性或者進化動力學等問題感興趣,這些信息就對他們會非常有幫助。另外一方面,單細胞基因組測序技術也能夠提供宏基因組學技術無法獲得的信息,比如基因變異連鎖信息等。
由于單細胞基因組測序技術和宏基因組學測序技術都獲得了廣泛的關注與認可,所以我們希望廣大的科研人員能夠使用定義非常明確的術語來描述基因組的完整性,以便于大家對這兩種技術的優(yōu)缺點進行更客觀、更準確的評價。比如只有在經(jīng)過仔細的檢驗之后,確認獲得了一個完整的、連續(xù)的、沒有錯誤或缺口的序列時,我們才可以稱這條序列是一個完整的基因組序列。如果因為存在重復序列,或者其它原因導致基因組組裝出現(xiàn)困難,得到了多條、而不是一條“基因組”序列,那么此時只能說得到了部分完整的基因組序列。根據(jù)Chain等人的工作,我們可以認為這種有多條序列的基因組序列是一個基因組草圖。此時我們可以根據(jù)單拷貝基因名錄來衡量該序列的完整性。由于單拷貝基因通常在整個基因組基因中所占的比例還不到10%,而且在基因組中的分布并不均勻,所以根據(jù)單拷貝基因也只能大概估計序列的完整程度。
因此還需要更強大的基因組草圖完整性評估手段。使用在整個基因組中并非成簇存在的標志物基因也許是一個不錯的辦法。改進取樣技術,獲得更多不能培養(yǎng)的微生物的基因組樣本,從中發(fā)現(xiàn)更多、更普遍存在的基因也會有所幫助。這些信息能夠幫助科學家們從已知序列中發(fā)現(xiàn)更多的單拷貝基因。
隨著測序技術不斷發(fā)展,測序的速度、精度、信息豐富程度都有了大幅度的提升,高通量的宏基因組學技術也逐漸具備了給要求更快、更準確、特異性更高的整個測序診斷領域帶來***性改變的能力。比如如果發(fā)展到了個體微生物組時代,我們就可以快速地對病原體群耐藥基因進行測序和篩選,然后根據(jù)這些結果給出最合適的抗生素。根據(jù)宏基因組學數(shù)據(jù)還可以選擇性地**目標微生物群,治療肥胖癥或慢性腹瀉等疾病。更重要的是,如果掌握了生命之樹中很多之前還沒有被發(fā)現(xiàn)的基因組信息,將極大地豐富我們對生命和進化歷程的認識和了解。