次要剪接體:不次要的生命“剪輯師”
作者:萬蕊雪 白蕊(分別系西湖大學(xué)特聘研究員、副研究員,西湖大學(xué)徐珊協(xié)助整理)
如果把微觀生命活動比作一部電影,那么這部精密而復(fù)雜的“影片”就是由無數(shù)蛋白質(zhì)各司其職上演的,它們影響著生命體的健康。而“指揮”這些蛋白質(zhì)、讓它們執(zhí)行各種功能的,就是基因。而在基因塑造生命的過程中,有個隱秘而偉大的遺傳“剪輯師”——次要剪接體。
1.每一次剪接,都關(guān)乎細(xì)胞“命運(yùn)”
剪接體的故事,要從一條生命體的核心規(guī)則——“中心法則”說起。
什么是中心法則呢?我們已經(jīng)知道,基因控制著生命活動的方方面面,但基因并不能直接對蛋白質(zhì)發(fā)布“指令”,而是需要?dú)v經(jīng)遺傳信息的傳遞?;蚴荄NA上攜帶遺傳信息的片段,這些遺傳信息被傳遞給RNA,再由RNA轉(zhuǎn)化為有實(shí)質(zhì)性功能的蛋白質(zhì)。這樣一來,基因中的信息就得到了表達(dá)。這條標(biāo)準(zhǔn)化的“流水線作業(yè)”,就叫作“中心法則”。
我們可以把這個“流水線”想象成多人傳話的游戲——一句簡單的話,在歷經(jīng)人與人的傳遞后,很可能會走樣。那么,保持其準(zhǔn)確、有序、精煉,就成為最關(guān)鍵的一步——形成“正確”的RNA,也就是RNA剪接。
此時,就該剪接體登場了——DNA輸送來的“原始影片素材”,也就是遺傳信息,實(shí)際上是“雜亂無章”的,而剪接體就像一位經(jīng)驗(yàn)豐富的電影“剪輯師”,它會精確完成以下工作——篩選出包含遺傳信息的、需要的片段(即“外顯子”)和多余無用的片段(即“內(nèi)含子”),把無用的片段剪掉后,再把有用的片段按特定的順序連接起來。由此,正確的RNA就形成了,信息才能進(jìn)入下一步的蛋白質(zhì)轉(zhuǎn)化。
剪掉哪段、剪掉多少長度、什么時候剪、如何拼接……電影的剪輯方式和順序會影響最終呈現(xiàn)效果,剪接體的工作也是如此。通過剪接體的“排列組合”后,有限的基因組能有更多的編碼形式,從而形成更多種類的蛋白質(zhì)——這就解釋了,為什么人體只有兩萬多個基因,但蛋白質(zhì)卻有幾十萬種。由此可見,剪接體的每一步操作,都關(guān)乎細(xì)胞的“命運(yùn)”。
2.次要剪接體,關(guān)鍵的“限速”步驟
你可能已經(jīng)意識到,剪接體是生物體內(nèi)不可或缺的存在。從量級上來看,亦是如此,它確實(shí)是“大家伙”——它由幾十到幾百種蛋白質(zhì)和5條RNA動態(tài)組合而成,被教科書稱為“細(xì)胞里最復(fù)雜的超大分子復(fù)合物”。
可是,在這樣無法忽視的存在中,偏偏就有一個被誤讀和忽視的身影——次要剪接體。剪接體分為主要剪接體和次要剪接體,因被冠名“次要”,大家往往望文生義,認(rèn)為它是不重要的剪接體。
事實(shí)上,主要剪接體和次要剪接體的功用相似,都是RNA剪接中缺一不可、相互配合的“剪輯師”搭檔。從重要性上講,二者并無差別。
它們的不同之處在以下兩個方面。第一,二者所識別的“多余無用片段”內(nèi)含子不同。主要剪接體識別的是人體內(nèi)99%以上的內(nèi)含子,占比較多;次要剪接體瞄準(zhǔn)的是在體內(nèi)含量不足1%的稀有內(nèi)含子,占比較少。第二,它們的RNA和蛋白質(zhì)組成存在較大差異。
截至目前,科學(xué)家們尚未具體搞清楚它們二者是如何配合的,但它們所主導(dǎo)的兩條“剪輯”通路,一定是通力協(xié)作的。
說起來,次要剪接體被發(fā)現(xiàn),也比主要剪接體晚得多。1979年,基因剪接現(xiàn)象已經(jīng)被學(xué)界所發(fā)現(xiàn),隨之發(fā)現(xiàn)了剪接體,可直到20世紀(jì)90年代,次要剪接體才“姍姍來遲”,才有了“主要”和“次要”的分別??茖W(xué)家們發(fā)現(xiàn),有一類“多余無用”的片段(內(nèi)含子)和以往熟悉的經(jīng)典序列不同,隨之發(fā)現(xiàn)它們被一類新的剪接體所剪接。新發(fā)現(xiàn)的這類內(nèi)含子占比稀少,故被稱作稀有內(nèi)含子,相對應(yīng)的剪接體,即被命名為次要剪接體。
盡管“露面”較晚,次要剪接體卻隱秘而偉大。它所剪輯的內(nèi)含子,分布在許多重要基因之中,因此這條次要剪接體通路,在許多基本的生命活動中起到重要作用。此外,越來越多的研究表明,次要剪接體“剪”的速度,決定了RNA能不能,以及何時能往下轉(zhuǎn)化為蛋白質(zhì),是中心法則中關(guān)鍵的“限速”步驟。
3.剪接體出錯,引發(fā)癌癥及罕見病
如果電影剪輯師生病了,或者不在狀態(tài),會怎么樣?電影可能會成片錯亂無章、沒有美感。要是遺傳信息“剪輯師”—剪接體出了問題,麻煩就大了。
剪接體出錯,不外乎兩種原因。其一,剪接體作為大分子機(jī)器,自己身上出了問題;其二,剪接體的行為出了問題,“剪”錯了。無論是哪一種情況都很棘手,因?yàn)檫z傳信息將無法正確傳遞、不能合成準(zhǔn)確的蛋白質(zhì)、更無從完成生命活動……這些情況都是引發(fā)疾病的隱患。
研究表明,盡管占比較少,但次要剪接體的異常與許多人類疾病息息相關(guān),主要是癌癥和罕見病。在癌癥中,典型的情況是骨髓增生異常綜合征,這是白血病的前期。它在中國每年新發(fā)病例有30多萬,通過基因測序發(fā)現(xiàn),50%的案例是次要剪接體上的蛋白發(fā)生突變導(dǎo)致,也就是剪接體本身出了問題了。此外,有35%的人類遺傳紊亂疾病被發(fā)現(xiàn)與剪接體相關(guān),這些遺傳病中有一大部分是罕見病。其中,生長激素缺乏癥、早發(fā)型小腦共濟(jì)失調(diào)、小頭畸形骨發(fā)育不良原始侏儒癥、遲發(fā)性脊柱骨骺發(fā)育不良、肌萎縮側(cè)索硬化……這些罕見病都和次要剪接體異常相關(guān)。
遺憾的是,次要剪接體對人類來說,依然是一個神秘的存在。盡管它在上世紀(jì)已被發(fā)現(xiàn),但隨后的研究卻陷入停滯。自剪接體發(fā)現(xiàn)以來,科學(xué)家們一直在探索其中的分子奧秘,期待揭示背后的機(jī)理,但也陷入了長年累月的僵局。
這種困境實(shí)屬事出有因,事實(shí)上,研究剪接體從來并非易事。
剪接體是一個龐大且永遠(yuǎn)處在動態(tài)中的“大分子機(jī)器”,它的機(jī)理非常復(fù)雜。所謂“大分子機(jī)器”,指的是那些像機(jī)器般運(yùn)作、分子量較大的物質(zhì),蛋白質(zhì)、核酸、多糖等生物物質(zhì)也屬于這個類別。說是“機(jī)器”,剪接體遠(yuǎn)比我們生活中見到的機(jī)器復(fù)雜得多。如果想要讓一臺機(jī)器發(fā)揮功能,只需要把它組裝好,然后放在合適的位置,讓它運(yùn)轉(zhuǎn)起來就行了。
但對剪接體來說,并不是這樣——假設(shè)眼前有一個由8個部分組成的剪接體。在找到需要“剪輯”的“片段”后,這些部分并不是一起組裝完成的——可能有一兩個先抵達(dá)工作地,開始忙碌,其他部分在這個過程中可能會陸續(xù)加入、各司其職,也可能會在不同的時間離開,也就是說,這樣的結(jié)合是動態(tài)的。當(dāng)剪輯完成后,所有8個部分會被釋放,等下一次有工作任務(wù)了,再進(jìn)行新一輪的結(jié)合。
近年的科學(xué)研究證實(shí),剪接體這個大分子機(jī)器,每完成一次“剪輯”,期間存在10種不同的狀態(tài)。
即便應(yīng)用倍數(shù)很高的電子顯微鏡,也難以清晰地詳細(xì)觀察剪接體這樣精密又復(fù)雜的工作過程??梢韵胂?,既然主要剪接體的研究已經(jīng)舉步維艱了,對次要剪接體的探索,必然是難上加難。原因非常明了:次要剪接體的含量占比稀少,發(fā)出的“信號”弱,科學(xué)家們更難獲得樣本。
4.破譯剪接體“真身”,向免于病痛邁進(jìn)一步
次要剪接體就存在于人體內(nèi),伴隨著每一刻的呼吸。難道就這樣放棄對它的研究嗎?既然它是存在的,就不應(yīng)該毫無新發(fā)現(xiàn),對不對?抱著這樣樸素的想法,我國的研究團(tuán)隊(duì)決定跟它“死磕”。
眼下,我們希望能夠從生物化學(xué)和結(jié)構(gòu)生物學(xué)的角度,去理解次要剪接體。換句話說,我們想要破譯這類“剪輯師”,搞清楚它到底是誰,由什么構(gòu)成,究竟具體在做什么,是怎么做到的,和主要剪接體如何協(xié)作等。
在研究次要剪接體之前,西湖大學(xué)施一公院士研究組在過去的十多年間,都在致力于剪接體的三維結(jié)構(gòu)解析與分子機(jī)理研究。這個研究組是世界上首個,也是目前唯一一個成功捕獲并解析了RNA剪接過程中所有完全組裝剪接體高分辨率三維結(jié)構(gòu)系列成果的團(tuán)隊(duì)。換句話說,這項(xiàng)研究讓人類看清楚了主要剪接體這位“剪輯師”的完整通路,覆蓋了“剪輯”的全過程。
我們的研究團(tuán)隊(duì)也曾參與其中,在進(jìn)行了大約四五年的主要剪接體研究工作,有了主要剪接體的研究經(jīng)驗(yàn)和成果積累后,我們開始對“被忽視”的次要剪接體進(jìn)行研究。
如何把這1%的次要剪接體捕獲出來,跟主要的剪接體分開,是領(lǐng)域內(nèi)公認(rèn)的難題。這個空白領(lǐng)域中,沒有任何文獻(xiàn)和經(jīng)驗(yàn)可供參考。經(jīng)過長期研究與實(shí)驗(yàn),我們設(shè)計(jì)了一個高效的“誘餌”(pre-mRNA),也就是用一段需要“剪輯師”處理的素材,用它“釣”出了含量極少、被視為很難分離的次要剪接體??梢园堰@個過程想象為針對次要剪接體“喜好”而特別人工設(shè)計(jì)了它感興趣的“片段”,投入細(xì)胞之中,當(dāng)次要剪接體找到這個片段、開始工作時,科研人員就能把它連同片段一起提取出來。同時,科研人員改進(jìn)了后續(xù)的純化方式,使獲得的次要剪接體更加穩(wěn)定、更易被研究。
通過冷凍電鏡技術(shù),科研人員重構(gòu)了這個次要剪接體的結(jié)構(gòu),整體分辨率高達(dá)2.9埃,搭建了它的原子模型,包含了4條RNA和45個蛋白。這是世界上首個被解析的次要剪接體,相關(guān)工作已發(fā)表在國際學(xué)術(shù)期刊《科學(xué)》上。
對次要剪接體的研究,才剛剛開始,未來需要做的工作還有很多。
一方面,科研人員需要獲取更完整的次要剪接體“全景圖”。2021年的研究成果“破譯”的僅僅是激活狀態(tài)下的次要剪接體,還需要逐步完成所有10種狀態(tài)的解析,進(jìn)一步探究其分子機(jī)理、調(diào)控通路及功能意義等。與破譯主要剪接體的“剪輯”類似,科研人員還需要更深度了解,次要剪接體究竟長什么樣、如何工作,怎樣和主要剪接體“配合”,完成遺傳信息遞送中賦予它的使命。
了解這些原理后,科研人員和醫(yī)藥研發(fā)人員將能有針對性地設(shè)計(jì)靶向次要剪接體藥物。無論是這個大分子機(jī)器自身出了毛病,還是它剪錯了,都能被及時糾正,從而使人類免于次要剪接體相關(guān)的癌癥和罕見病之苦。我們的科研團(tuán)隊(duì)希望能夠把次要剪接體的成果,更多地應(yīng)用到維護(hù)人類健康之中,目前已經(jīng)在進(jìn)行與藥物研發(fā)、疾病相關(guān)的研究。
與此同時,次要剪接體的版圖依然是“人跡罕至”的真空地帶,我們希望世界上更多的科研工作者能夠加入這一研究。為此,我們科研團(tuán)隊(duì)想先替大家解決最困難的部分——發(fā)明一種次要剪接體的體外研究活性體系,能方便地對次要剪接體開展實(shí)驗(yàn),讓結(jié)構(gòu)、細(xì)胞、生化、分子等領(lǐng)域的科學(xué)家都參與到對次要剪接體的探索中來。
道長且阻,這是基礎(chǔ)研究的常態(tài),從0到1的開拓,沒有捷徑。基礎(chǔ)研究的成果要邁入技術(shù)應(yīng)用,也還需要經(jīng)年累月的不懈努力。但基礎(chǔ)研究取得創(chuàng)新性的點(diǎn)滴突破,人類對世界的認(rèn)知便向前躍進(jìn)了一步,期待這樣的突破奔涌而來。
版權(quán)聲明:凡注明“來源:中國西藏網(wǎng)”或“中國西藏網(wǎng)文”的所有作品,版權(quán)歸高原(北京)文化傳播有限公司。任何媒體轉(zhuǎn)載、摘編、引用,須注明來源中國西藏網(wǎng)和署著作者名,否則將追究相關(guān)法律責(zé)任。