“人類基因組計劃”開啟了諸多前所未有的新學科分支(基因組學、生物信息學、蛋白質(zhì)組學等),推動了科學研究的平臺化和規(guī)模化,比如高性能計算和規(guī)?;飳W數(shù)據(jù)獲取。新研究平臺的建立也同時促進了學科的交叉和整合。
DNA測序技術使我們幾乎可以肆無忌憚地獲取任何物種和其群體的遺傳信息。我們同時也要思考:生物學,尤其是基因組學,還有哪些未解之謎?
隨著DNA測序技術的發(fā)展和廣泛應用,揭開了諸多令人困惑的“科學謎團”,同時也遇到了更復雜、更深刻、更具有挑戰(zhàn)性的新問題。
遺傳學和物種進化理論是生物學的幾大基石之一。DNA測序技術從根本上解決了發(fā)現(xiàn)遺傳變化的手段,使我們幾乎可以肆無忌憚地獲取任何物種和其群體的遺傳信息。我們同時也要思考:生物學,尤其是基因組學,還有那些未解之謎?這里我們不妨先探討其中的三個。
第一個“生命之謎”是植物、脊椎動物、節(jié)肢動物等不同高級譜系基因組之間的結(jié)構(gòu)差異。例如,高等植物基因組有很多基因間區(qū)(基因之間沒有基因的部分,大多是被稱為RNA轉(zhuǎn)座子的重復序列),但是這些部分有時候會是整個基因組核苷酸總數(shù)的95%(例如大麥和小麥)以上,因此我們不禁要問:為什么植物要**這些不編碼蛋白質(zhì)的DNA序列呢?為什么不增加一些編碼基因的序列呢?難道這里是“進化”的“死角”?與植物基因組相反的是:動物基因組將重復序列放在了基因的內(nèi)含子里面(內(nèi)含子是基因的一部分,與外顯子構(gòu)成基因的結(jié)構(gòu)部分),不僅被**了,而且還被轉(zhuǎn)錄了,最后在翻譯之前又被毫不吝惜地丟掉了。從表面上看,也是一種資源的浪費。因此,我們稱之為“**—轉(zhuǎn)錄負擔”之謎,即植物基因組**多余的非編碼DNA,動物基因組轉(zhuǎn)錄多余的RNA.
第二個“生命之謎”是基因突變和自然選擇之間的在分子水平上的復雜性。200余年來,達爾文的進化理論主導了生物學各個領域,達爾文和他的繼承者們否定了拉馬克主義的進化理論(以“用進廢退”和“獲得性遺傳”最為著名),認為遺傳突變是隨機產(chǎn)生的,而且大部分是中性的,或近于中性的弱有害突變。然而,我們十余年來的研究發(fā)現(xiàn)突變和選擇的機制其實既有達爾文主義的原理,也有拉馬克主義的原理,遠比人們已知和想象的要復雜和細致得多。從數(shù)量來看,“達爾文主義變異”(或稱隨機突變)毫無疑問占據(jù)了主要的地位;但是從復雜性來看,“拉馬克主義變異”(非隨機變異和非蛋白質(zhì)功能選擇)則更功能化、更細膩、更無所不在,因此也更神奇。因此,這個“生命之謎”又稱為“生殖系之謎”.
第三個“生命之謎”是遺傳與非遺傳(或稱環(huán)境和表觀遺傳)的關系,或稱“表觀遺傳之謎”.盡管分子生物學也有60年的歷史了,但是遺傳學與分子生物學,尤其是與細胞生物學的邊界還是有很深的鴻溝。比如,細胞生物學家在選擇研究對象時往往忽略遺傳學因素。分子生物學家對機制和分子之間的相互作用感興趣更多。目前生物學研究的總體趨勢是“分久必合”,是信息和知識的大整合時期。邏輯很簡單,生命是復雜的,因此科學研究也應該走向接納復雜性、認識復雜性和解決復雜問題。過去我們對非遺傳因素的定義非常粗略,現(xiàn)在是重視的時候了。我曾提出了所謂的“五流說”,強調(diào)遺傳學只是“信息流”的學問,其他四個“流”是用來定義非遺傳因素的:“操作流”、“分室流”、 “平衡流”和可塑性的研究。這“五流”以各自的研究進展,不斷深化我們對生命奧秘認識的同時,也提出了很多新的問題。
盡管說非遺傳因素或稱表觀遺傳學的研究還剛剛開始,但是值得慶幸的是我們已經(jīng)積累了很多工具和知識,我們需要的是一些主導性的大型項目。目前可數(shù)的是神經(jīng)系統(tǒng)的“連接組” 研究,揭示神經(jīng)元之間的物理和生理關系。“暴露組”研究也在啟動,用于量化物理和化學環(huán)境對生命的影響。前者是為神經(jīng)生物學研究和行為、認知等研究奠定物質(zhì)基礎,而后者則試圖關聯(lián)遺傳因素與非遺傳因素的關系。
作者于軍,系中國科學院北京基因組研究所研究員