關于作者

朱欽士,四川省成都市人。1968年畢業(yè)于北京大學生物學系生物化學專業(yè)。1984年獲得荷蘭阿姆斯特丹大學生物化學博士學位。1984年至1986年在中國科學院生物物理研究所酶學和生物能學實驗室工作,同時任碩士研究生導師。1986年到美國西弗吉尼亞大學醫(yī)學院生物化學系做博士后研究。1987年到1991年在洛杉磯兒童醫(yī)院從事基礎醫(yī)學研究。1991年至2009年在美國南加州大學從事研究工作。退休前為南加州大學醫(yī)學院生物化學和分子生物學系副教授。
研究領域包括生物能,酶的結構和功能,蛋白質(zhì)的合成與轉運,癌癥與染色體,神經(jīng)遞質(zhì),基因表達的調(diào)控機制,以及肝臟解毒系統(tǒng)。

細胞核的功能是什么?

朱欽士
2017年03月29日
地球上現(xiàn)存的生物至少有數(shù)百萬種,可以分為原核生物(prokaryotes)和真核生物(eukaryotes)兩大類。原核生物包括細菌(bacteria)和古菌(archaea);真核生物包括原生生物(protists)、真菌(fungi)、植物(plants)和動物(animals)。原核生物和真核生物之間最明顯的區(qū)別是原核生物的細胞沒有細胞核,而真核生物的細胞具有由膜包裹的細胞核。原核生物基本上都是單細胞的,即整個生物體只由1個細胞組成,而且原核生物的細胞比較小,直徑通常在1微米左右。真核細胞比較大,直徑通常有幾十微米,而且許多真核生物是多細胞的,即身體由多種不同的細胞組成。我們眼睛能夠看見的生物,例如各種植物和動物,都是多細胞的真核生物。我們?nèi)祟愐彩钦婧松铩?
對于這種情形,我們早已習以為常了,但是如果我們要問一下細胞核的功能是什么,就不是那么容易回答了。細胞核不過是用兩層膜把DNA包裹起來而已,這有什么必要性和優(yōu)越性嗎?原核生物沒有細胞核,不是也活得好好的嗎?而且原核細胞由于沒有細胞核,DNA是“裸露”在細胞質(zhì)中的,在原核生物合成蛋白質(zhì)時,新合成的信使核糖核酸(mRNA)還沒有完成,合成蛋白質(zhì)的核糖體就“迫不及待”地結合在mRNA分子上,開始蛋白質(zhì)的合成了。因此在原核生物中,DNA的信息被轉移到信使核糖核酸mRNA上(這個過程叫做轉錄)和mRNA攜帶的信息被轉化為蛋白質(zhì)中氨基酸單位的序列(這個過程叫做轉譯)是同時進行的。這使得原核生物合成蛋白質(zhì)的效率非常高,繁殖速度也很快,例如大腸桿菌每20分鐘就可以繁殖一代。
而真核生物的細胞由于有細胞核把DNA和核糖體分開,轉錄和轉譯就不能同時進行了,因為合成蛋白質(zhì)的核糖體是巨大的蛋白質(zhì)和核糖核酸(RNA)的復合物,根本無法進入細胞核,只有等信使核糖核酸在細胞核中合成后,進入細胞質(zhì),蛋白合成才能開始。這就影響了真核細胞合成蛋白質(zhì)的效率。相比原核細胞幾十分鐘就能夠繁殖一代,真核細胞常常需要更長的時間,例如同為單細胞,但是為真核生物的酵母就需要80分鐘或更長才能繁殖一代。
不僅如此,細胞核中的許多蛋白,例如為DNA的轉錄所需要的蛋白質(zhì),是在細胞質(zhì)中合成,再經(jīng)過核膜(細胞核的膜)上的核孔進入細胞核的。這個過程需要特殊的蛋白“陪伴”和“護送”,這些陪伴蛋白在完成輸送任務,回到細胞質(zhì)時,是需要消耗能量的。真核細胞為什么要“自找麻煩”呢?換句話說,真核細胞擁有細胞核的“必要性”或者“好處”是什么呢?這就要從真核細胞出現(xiàn)的過程講起。
真核細胞和原核細胞的根本區(qū)別是真核細胞擁有線粒體
既然被稱為“真核生物”,我們自然會想到它和原核生物最重要的區(qū)別就是它有細胞核。但是在澳大利亞的淡水湖中,科學家發(fā)現(xiàn)了一種細菌,叫做隱球出芽菌(Gemmata obscuriglobus)。這些微生物為球形,像酵母菌那樣出芽生殖。從它們核糖體RNA(5S和16S rRNA)的序列來看,他們應該屬于細菌中的“浮霉菌門”(Planctomycetes)。奇怪的是,這些細菌卻有由兩層膜包裹的細胞核,說明細胞核并不是真核生物的專利。 原核生物的DNA是環(huán)狀的,而真核生物的DNA是線狀的,那么是不是具有線狀DNA的生物就是真核生物呢?引起萊姆?。↙yme disease)的“伯氏疏螺旋體”(Borrellia burgdorferi)是原核生物,卻有一個100萬堿基對長的線性DNA,說明DNA為線狀或者環(huán)狀也不是區(qū)分原核生物與真核生物的標準。那么真核生物和原核生物最根本的區(qū)別是什么?是什么事件使得原核生物變成了真核生物?如果要找一個真核生物都有,原核生物絕對沒有的特征,那就是真核生物的細胞里有線粒體(mitochondria)而原核生物沒有。那么線粒體是個什么東西呢?為什么有線粒體的細胞最后變成了真核細胞呢?
線粒體是真核細胞的“動力工廠”,是細胞合成ATP的地方。葡萄糖和脂肪酸在這里被徹底氧化,變成二氧化碳和水,釋放出來的能量則被用來合成ATP。線粒體和細菌差不多大(直徑約1微米)。如果把真核細胞放大到一間房間那么大,線粒體的大小也不過相當于一個暖水瓶,所以每個真核生物的細胞可以擁有成百上千個線粒體,相當于細胞的“身體”里面有成百上千個發(fā)電廠。細胞有了充足的“電力”供應,做什么事情都有能量保證了。線粒體是用大氣中的氧為電子受體來氧化葡萄糖和脂肪酸的,所以真核生物的出現(xiàn)和空氣中氧含量大大增加的時間(大約23億年前)后不久。換句話說,是線粒體帶來的充足的能量供應使原核細胞變成真核細胞,那么細胞里面的線粒體又是如何出現(xiàn)的呢?
對線粒體的研究發(fā)現(xiàn),線粒體不僅是一個細胞器,而且更像是一個細胞。它被兩層膜(外膜和內(nèi)膜)包裹,有自己的DNA,有自己合成mRNA和蛋白質(zhì)的系統(tǒng)。它的DNA是環(huán)狀的,類似于細菌的環(huán)狀DNA。它合成蛋白質(zhì)的核糖體(70S)不像真核生物的核糖體(80S),而像細菌的核糖體(70S)。它的內(nèi)容物(基質(zhì))相當于細菌的細胞質(zhì),里面含有三羧酸循環(huán)系統(tǒng)。像細菌那樣,線粒體的基因也是組織在“操縱子”(operon)中的,即功能相關的基因共用一個“開關”(啟動子),而不像真核生物那樣,每個基因有自己的啟動子。線粒體也像細菌那樣,通過分裂來繁殖。真核細胞不能“制造”線粒體,所有的線粒體必須從已有的線粒體分裂而來。這也符合“細胞只能來自細胞”的定律。這些事實說明,線粒體是真核細胞中的細胞,是一種原核細胞包裹進了另一個原核細胞變成的。
這個過程是如何發(fā)生的,現(xiàn)在已經(jīng)不可考,但是肯定不是一種細菌“吃下”另一個細菌造成的。吞食是一個非常復雜的過程,需要有控制細胞形狀的“細胞骨架”,還要有類似肌肉收縮的蛋白質(zhì)使細胞膜包裹另一個細胞,還要有專門“消化”另一個細胞的“溶酶體”。所有這些原核生物都不具備,所以沒有細菌吃細菌的事情,而且細菌在細胞膜外面還有細胞壁或者莢膜等形狀比較固定的結構,也不適于吞食。一種可能性是原核生物中的古菌細胞被機械力壓開(例如石頭滾動),而又沒有徹底將細胞壓碎。細胞在恢復過程中裂開的古菌又正好把在附近的一個能夠用氧徹底氧化葡萄糖和脂肪酸的細菌包裹進去。由于古菌沒有溶酶體,被包裹進去的細菌也不被殺死,最后和古菌形成共生關系。要成功地實現(xiàn)這個過程,估計幾率非常小,所以原核生物出現(xiàn)數(shù)億年后,才有這種共生的情況發(fā)生。而且從所有真核生物的線粒體基因來看,它們都來自同一個祖先,也就是這樣的細胞融合只發(fā)生過一次。但是就是這次“幸運”的細胞融合導致了真核生物的誕生。
通過對線粒體中基因的分析(例如磷酸丙糖異構酶基因),發(fā)現(xiàn)它們和一類細菌,即“變形菌門”(proteobacteria)中的一種,alpha-變形菌(alpha-proteobacteria)的基因最為相似。變形菌門是一大類格蘭氏陰性細菌,外膜主要以脂糖構成。因其形狀多變而被稱為變形菌。從這些證據(jù),科學家認為,線粒體是某種古菌 “包容”了?alpha-變形菌的細胞,彼此形成共生關系而演變出來的,因為古菌已經(jīng)擁有真核生物的一些特征,例如含有細菌沒有,而真核細胞擁有的組蛋白。古菌細胞給?alpha-變形菌的細胞穩(wěn)定的生活環(huán)境,而?alpha-變形菌細胞給古菌細胞提供能量。因此真核細胞實際上是兩種細胞的混合物,是“細胞套細胞”,它們各自的DNA至今還在。
在細菌中,徹底氧化食物分子電子傳遞鏈是位于細胞膜(即內(nèi)膜)上的。電子傳遞時釋放出的能量則被用來把氫離子從細胞內(nèi)泵到細胞的內(nèi)膜外,建立一個跨膜的氫離子梯度,類似于水壩蓄水。氫離子通過細胞膜再流回細胞時,就帶動ATP酶合成ATP,像水庫里面高水位的水經(jīng)過水壩帶動水輪機發(fā)電。而在線粒體中,呼吸鏈也是位于內(nèi)膜上的(相當于細菌的內(nèi)膜),電子傳遞釋放出來的能量也是把氫離子從線粒體內(nèi)部泵到內(nèi)膜之外,即線粒體的內(nèi)膜和外膜之間。氫離子流回線粒體內(nèi)部時則帶動ATP酶合成ATP。所以線粒體合成ATP的結構和細菌是一樣的,只不過細菌合成ATP的地方以線粒體的形式被帶到另一個細胞的內(nèi)部。
在?alpha-變形菌的細胞演變?yōu)榫€粒體的過程中,許多?alpha-變形菌的基因逐漸轉移到古菌細胞的DNA中去,使得線粒體DNA中的基因越來越少,最后只剩下為蛋白質(zhì)合成需要的轉移RNA(tRNA)、核糖體RNA(rRNA)的基因、和少數(shù)為蛋白質(zhì)編碼的基因。這些蛋白質(zhì)基本上都是膜蛋白,高度親脂,如果在細胞質(zhì)中合成,轉移到線粒體中都會很不方便,所以它們的基因就留在線粒體中,以便“就地制造”這些親脂的蛋白質(zhì)。在不同的真核生物中,線粒體基因轉移到細胞核DNA中的程度不同。例如單細胞的真核生物“異養(yǎng)鞭毛蟲”(Reclinomonas Americana)的線粒體DNA有6萬9千個堿基對,97個基因,其中62個基因為蛋白質(zhì)編碼,算是保留得比較多的。而在人的線粒體中,DNA只有1萬6千個堿基對,37個基因,其中13個基因為蛋白質(zhì)編碼。引起人瘧疾的瘧原蟲(Plasmodium falciparum)線粒體的DNA只有6千個堿基對長,含5個基因。盡管不同的真核生物的線粒體DNA大小差別很大,基因數(shù)也不一樣,但是所有這些線粒體里面的基因都不出變形菌門細菌基因的范圍,說明線粒體的確是從變形菌門的細菌變化而來的。
對于“真核生物的細胞都有線粒體”這個說法,也有反對意見。這些意見的根據(jù),是有些真核生物的細胞里沒有線粒體。例如寄生在人類小腸內(nèi),引起腹瀉的蘭氏賈第鞭毛蟲(Giardia almblia,簡稱“賈第蟲”)是一種單細胞真核生物,它就沒有線粒體。賈第蟲屬于“古蟲界”(Excavata),里面有許多靠寄生來生活的低級真核生物。這些生物一般都沒有線粒體,曾經(jīng)被認為是最原始的真核生物,還沒有到獲得線粒體的階段,被稱為“無線粒體原生生物”(amitochondriate)。但是隨后的研究發(fā)現(xiàn),這些生物含有“熱休克蛋白70”(heat shock protein70,簡稱Hsp70)基因,和“伴侶素蛋白”60(chaperonin60,簡稱cpn60)和“伴侶素蛋白10(cpn10)的基因。這些基因都只有在線粒體或者?alpha-變形菌中發(fā)現(xiàn),而在古菌和革蘭氏陽性細菌中沒有發(fā)現(xiàn),說明這些“古蟲”都曾經(jīng)獲得過線粒體,只不過后來由于寄生生活或在無氧條件下生活,不再需要線粒體,這些線粒體就退化了。
這些事實說明,所有真核生物的細胞都曾經(jīng)擁有過線粒體,只不過后來一些真核生物不再需要線粒體的氧化磷酸化功能而部分或全部失去線粒體。而原核細胞無一例外地不含線粒體,所以線粒體是區(qū)別真核生物和原核生物最根本的標志。 而且線粒體的作用還不僅是為寄主細胞提供能量,它還帶來了另一個后果,就是基因中的“內(nèi)含子”。正是基因中內(nèi)含子的出現(xiàn)使得細胞核成為必要,因而是線粒體的出現(xiàn)讓原核細胞發(fā)展出了細胞核。
“內(nèi)含子”的“入侵”迫使細胞核出現(xiàn)
線粒體給寄主細胞帶來威力強大的“發(fā)電廠”的同時,也帶來了另一個“不速之客”,那就是“內(nèi)含子”,它的出現(xiàn)使得細胞核成為必要。要知道什么是內(nèi)含子,就要從1977年美國兩個實驗室的意外發(fā)現(xiàn)說起。 在上個世紀70年代以前,人們對基因的認識是很簡單的:基因就是DNA分子上為蛋白質(zhì)編碼的區(qū)段,再加上控制基因表達的“開關”,即啟動子(promoter)。當啟動子把基因“打開”時,這段編碼的DNA序列就被“轉錄”為“信使核糖核酸”(mRNA),mRNA再指導核糖體合成蛋白質(zhì)。為蛋白質(zhì)編碼的DNA序列被認為是連續(xù)的,mRNA分子中為蛋白質(zhì)編碼的RNA序列也因此是連續(xù)的。在原核生物中,這的確是實際情況,因此原核生物合成mRNA和合成蛋白質(zhì)是在同一個地方,幾乎同時進行的。
這種“編碼序列是連續(xù)的”的觀念在1977年被打破了。在這一年,美國冷泉港實驗室的里查德 羅伯茲(Richard J. Roberts)和麻州理工學院的飛利浦 夏普(Phillip A. Sharp)同時在研究引起人感冒的腺病毒(adenovirus)。這種腺病毒的主要蛋白叫做六鄰體(Hexon),是包裹病毒DNA的表面蛋白質(zhì)。他們先從被病毒感染的細胞中提取到六鄰體的mRNA。為了尋找病毒DNA中為六鄰體蛋白編碼的部位,他們讓這種mRNA和病毒的DNA“雜交”,即讓mRNA的序列和DNA分子上相應的序列通過堿基配對彼此結合。出乎他們意料的是,六鄰體mRNA和DNA上四個互不相連的區(qū)段結合,這四個區(qū)段之間沒有和mRNA結合的部分則游離出來,形成三個環(huán)。這個結果使他們認識到,腺病毒DNA為六鄰體蛋白質(zhì)編碼的序列不是連續(xù)的,而是分為許多段,中間被不為蛋白質(zhì)編碼的DNA序列隔開。
在這些實驗結果的基礎上,美國科學家瓦爾托 基爾伯特(Walter Gilbert)于次年(1978年)提出了內(nèi)含子(intron)的概念。內(nèi)含子就是編碼序列之間的DNA區(qū)段,其序列在mRNA合成后被“剪切”掉,不出現(xiàn)在成熟的mRNA分子中。而為蛋白質(zhì)編碼的區(qū)段則被稱為外顯子(exon),它們被內(nèi)含子分隔開,在轉錄過程中和內(nèi)含子的序列一起被轉錄。當mRNA分子中的內(nèi)含子序列被剪切掉以后,外顯子的序列就連在一起,去指導蛋白質(zhì)的合成,最后的效果就像當初內(nèi)含子不存在一樣。我們可以想象為蛋白質(zhì)編碼的DNA序列為藍線,被分成幾段,中間由白線(內(nèi)含子)連起來。把白線剪掉,把藍線部分連起來的過程就叫做mRNA的剪接(splice)。羅伯茲和夏普的研究結果使科學家也去研究真核生物的基因,發(fā)現(xiàn)許多這些基因中編碼序列也是不連續(xù)的,也就是許多真核生物的基因含有內(nèi)含子。這是基因結構觀念上的重大革命,羅伯茲和夏普也因此獲得了1993年的諾貝爾生理和醫(yī)學獎。
內(nèi)含子是如何起源的,至今科學界還沒有統(tǒng)一的意見。一種假說認為,內(nèi)含子在生命出現(xiàn)的早期,在RNA世界時就出現(xiàn)了。當時DNA還沒有出現(xiàn),RNA分子則“一身數(shù)任”:既要催化自己的合成,又要催化蛋白質(zhì)的合成,還要用自己的核苷酸序列為蛋白質(zhì)中的氨基酸序列編碼。要使一個長長的RNA分子的連續(xù)序列來為蛋白質(zhì)編碼,編出來的蛋白質(zhì)又是具有生物功能的,幾率非常小,就像把英文的26個字母隨機地排列在一起會出現(xiàn)一段有意義的文字那樣困難。比較可能的情況是RNA分子內(nèi)有許多小的區(qū)段,每段給一些氨基酸編碼。有選擇性地把這些區(qū)段結合起來,就有可能產(chǎn)生有功能的蛋白質(zhì)。這就像隨機排列的字母不容易產(chǎn)生有意義的詞和句子,但是有選擇性地去掉一些字母,就可以連成有意義的詞和句子。由于RNA分子具有自我剪接的能力,這樣的過程是有可能的。當然這是一個漫長和隨機的過程,但是這樣的目標最終是可以實現(xiàn)的。一旦這樣的組合被固定下來,它們就可以在DNA出現(xiàn)后,被復制到DNA分子中,然后在mRNA階段再進行剪接?,F(xiàn)在原核生物以RNA為最終產(chǎn)物(如轉移核糖核酸t(yī)RNA和核糖體核糖核酸rRNA)的基因(即不為蛋白質(zhì)編碼的基因)中,就還有許多這樣的區(qū)段,他們能夠在RNA分子被合成后,自己把自己剪切掉,包括I型和II型內(nèi)含子(這兩型內(nèi)含子剪切自己的方式不同)。經(jīng)過幾十億年的時間,能夠自我剪接的RNA內(nèi)含子類型居然還有兩種,說明內(nèi)含子在RNA生命階段就出現(xiàn)的學說是有一定道理的。
不過到原核生物出現(xiàn)后,這種為蛋白質(zhì)編碼的方式就不理想了。因為在合成的mRNA分子中,有很大一部分是不為蛋白質(zhì)編碼,因此需要去除的“廢物”。這些內(nèi)含子既占DNA的空間,使得原核生物復制DNA時要付出更多的成本,在合成mRNA時,細胞還要花費資源去合成這些廢物,再把它們剪除掉,而且剪接mRNA也需要時間。而對于簡單的原核生物,資源有限,還必須迅速繁殖才能與其它的原核生物競爭。如果能夠把這些“廢物”去掉,既能節(jié)省資源,又能加速繁殖速度,對于原核生物的生存無疑是非常有利的。這樣經(jīng)過億萬年的演化,原核生物基本上已經(jīng)把內(nèi)含子“清除”掉了。為蛋白質(zhì)編碼的DNA序列是連續(xù)的,生成的mRNA也不需要剪接,而是可以直接用來指導蛋白質(zhì)的合成,因而出現(xiàn)了在原核生物中,轉錄和蛋白質(zhì)合成同時同地進行的情形。在這種情況下,細胞核的存在反而會延遲轉譯開始的時間,因此原核生物中的絕大多數(shù)都沒有細胞核。原核生物的基因之間也有一些“沒用”的DNA序列,不過一般只占DNA序列的10-15%,殘余的內(nèi)含子也基本上“躲”在這些地方。
另一方面,真核生物的基因中卻含有大量的內(nèi)含子。而且越是高級的生物(例如哺乳動物和開花植物),基因中內(nèi)含子的數(shù)量越多。為蛋白質(zhì)編碼的基因,幾乎都含有內(nèi)含子。例如人類,每個基因平均含有8.1個內(nèi)含子,擬南芥(Arabidopsis thaliana,一種開花植物)每個基因平均含有4.4個內(nèi)含子,就連低等動物如果蠅(Drosophila melanogaster)每個基因也平均有3.4個內(nèi)含子,而許多原核生物總共也只有幾個內(nèi)含子。看到這里,估計有人會產(chǎn)生疑問:原核生物想盡量去掉的東西,真核生物怎么會讓它存在并且讓它繁榮起來呢?原因看來有兩個。一是真核生物因為有線粒體提供能量,“財大氣粗”,不在乎這點“廢物”的存在。真核生物是以質(zhì)取勝,即通過自己更強大多樣的功能取勝,而不是像原核生物那樣以量取勝,所以不必拼命繁殖。二是真核生物巧妙地利用了內(nèi)含子的存在來形成更多的蛋白質(zhì)。在原核生物中,因為編碼序列是連續(xù)的,沒有“花樣”可玩。編碼序列什么樣,蛋白質(zhì)就什么樣,一個編碼程序就只能生成一種蛋白質(zhì),真是“一個基因?qū)环N蛋白質(zhì)”。而在真核生物中,由于編碼序列是最后“拼接”起來的,如果改變拼接方法,只使用其中的一些編碼區(qū)段,讓外顯子以不同的方式結合,就可以從同一個基因形成不同的蛋白質(zhì)。這種不同的拼接外顯子的方法叫做選擇性剪接(alternative splicing)。例如果蠅的dsx基因是控制性別的基因。它有6個外顯子。如果把外顯子1、2、3、5、6拼接在一起,就會形成的一個使果蠅向雄性發(fā)育的轉錄因子。但是如果把外顯子1、2、3、4拼接在一起,就會形成一個使果蠅向雌性發(fā)育的轉錄因子。這樣,同一個基因就可以產(chǎn)生功能完全相反的兩種蛋白質(zhì)。一個基因產(chǎn)生巨大數(shù)量蛋白質(zhì)的“冠軍”,要數(shù)果蠅的DSCAM基因。它有95個外顯子,可以形成38,016種不同的組合,即生成38,016種蛋白質(zhì),而果蠅的全部基因數(shù)才15,016個!在人的全部DNA序列測定以后,發(fā)現(xiàn)其中只有大約21,000個基因。這個結果出乎人們的預料,甚至有人認為這是對人類的羞辱,因為那么低級的原核生物大腸桿菌(菌種K-12)都有4,377個基因,其中4,290個基因為蛋白質(zhì)編碼??紤]到人的復雜性遠遠超過大腸桿菌,21,000個基因似乎是太“少”了,人類好像應該至少有100,000個以上的基因才“合理”。其中的奧妙就在人的基因能夠活躍地進行選擇性剪接,所以兩萬個左右的基因可以形成10萬種以上的蛋白質(zhì)。這就可以解釋為什么生物越高級,為蛋白質(zhì)編碼的基因中內(nèi)含子越多。
為蛋白質(zhì)編碼的基因中出現(xiàn)內(nèi)含子,轉錄生成的最初的mRNA就不能直接在核糖體中指導蛋白質(zhì)的合成了,因為那樣會把內(nèi)含子中的序列也當作是編碼,合成出錯誤的蛋白質(zhì),所以必須先把mRNA中的內(nèi)含子部分去掉,然后才能用來合成蛋白質(zhì)。而去掉內(nèi)含子的剪接過程又是比較慢的,怎么才能防止內(nèi)含子去掉之前合成蛋白質(zhì)的過程就開始呢?唯一的辦法就是不讓核糖體接觸到還沒有“加工”完畢的mRNA。換句話說,就是轉錄和蛋白質(zhì)合成必須在空間上分開,而這正是細胞核的作用。細胞核的膜能夠防止完整的核糖體進入細胞,而mRNA在剪接完成前,又不會離開細胞核,這樣核糖體能夠接觸的,就只能是加工完畢的mRNA。其實真核生物加工mRNA還不只是去掉內(nèi)含子,還要給mRNA“穿靴戴帽”?!按┭ァ本褪墙omRNA分子加上一個由100-250個由字母A(腺苷酸)組成的“尾巴”,叫做“多聚A尾巴”?!按髅薄笔窃趍RNA的“頭”(5’端)的“字母”G(鳥苷酸中的嘌呤)上面加一個甲基(-CH3)。這兩個修飾都使mRNA分子更穩(wěn)定,也等于是給mRNA分子戴上了“放行徽章”,可以離開細胞核了。所以細胞核的出現(xiàn),是為蛋白質(zhì)編碼的基因中出現(xiàn)內(nèi)含子的必然結果。
如果把各種真核生物同種基因中內(nèi)含子的位置做比較,發(fā)現(xiàn)許多這些內(nèi)含子的位置是相同的。例如動物和植物之間有17%的內(nèi)含子位置是相同的,真菌和植物之間有13%的內(nèi)含子位置相同,甚至人類和開花植物擬南芥之間,都有25%的內(nèi)含子在基因中的位置相同。這些事實說明,真核生物的內(nèi)含子出現(xiàn)的時間非常早,在所有真核生物的共同祖先中就出現(xiàn)了。據(jù)各種模型的推測,在最早的真核生物中,為蛋白質(zhì)編碼的每個基因平均含有2-3個內(nèi)含子。由于細菌的DNA含有的內(nèi)含子數(shù)量極少,在最初的真核生物形成時,一定有一個內(nèi)含子數(shù)量突然大量增加的事件。由于原核生物經(jīng)過數(shù)億年的進化,已經(jīng)將內(nèi)含子基本消除,真核生物的共同祖先又是從原核生物進化而來的,內(nèi)含子的突然增加是如何發(fā)生的呢?2006年,美國科學家尤金 庫寧(Eugene V. Koonin)提出一個假說,他認為是后來要變成線粒體的?alpha-變形菌進入寄主細胞后,其DNA中的內(nèi)含子“入侵”寄主的DNA并在那里繁殖,使得最初的真核細胞含有大量的內(nèi)含子。
真核生物為了適應這種情況,發(fā)展出了細胞核把DNA和核糖體分開,同時發(fā)展出了更有效的方式來剪除掉mRNA中的內(nèi)含子序列,這就是剪接體(spliceosome)。剪接體是由5個細胞核內(nèi)的小分子RNA(snRNA,包括U1、U2、U4、U5、和U6)和蛋白質(zhì)組成的巨型復合物。5個snRNA分別識別內(nèi)含子的各個部位,例如U1會先辨識內(nèi)含子的5’端剪接點( 內(nèi)含子5’端與外含子結合的地方),而U2 識別3’端剪接點(內(nèi)含子3' 端與另一個外含子結合的地方)上游的“分支點”。這個步驟將mRNA上要被剪切除去的內(nèi)含子定位。然后,由U4-U5-U6組成的三聚體加入,使得分支位點上的一個字母A被連到內(nèi)含子的5'端上,使它脫離外含子,同時內(nèi)含子的RNA鏈形成一個“套馬索”那樣的環(huán)狀結構。脫離了內(nèi)含子的5'外含子再與3'的外含子結合,內(nèi)含子就被剪切掉了。
剪切體剪除內(nèi)含子的過程與II型內(nèi)含子“自我”剪切的過程極為相似,例如都形成“套馬索”那樣的結構和中間步驟,RNA分子的空間結構也高度一致。所以真核生物的剪切體應該是從原核生物的II型內(nèi)含子進化而來的。II型內(nèi)含子是自己切割自己,而剪切體的5個snRNA則是II型內(nèi)含子分開的片斷,再與蛋白質(zhì)形成復合體。所有的原核生物都沒有剪切體,剪切體是被真核生物發(fā)展出來的,即把原核生物自我剪切的內(nèi)含子分成幾段,再分別和蛋白質(zhì)結合。但即使是在人類的細胞里,實際剪切內(nèi)含子的分子還是剪切體中的snRNA,蛋白質(zhì)只起輔助作用。核糖體合成蛋白質(zhì)時,起催化作用的仍然是RNA(rRNA)分子。這些事實都說明,最初的生命是RNA的世界,真核生物的內(nèi)含子也是由RNA分子中的II型內(nèi)含子進化而來的。
有趣的是,并不是所有的真核生物都含有大量的內(nèi)含子。對于那些單細胞的真核生物,繁殖速度對于生存還是很重要的。俗話說,“活在狼群中,就得學狼叫”,所以這些單細胞的真核生物,像同樣是單細胞的原核生物一樣,都去除了大量的內(nèi)含子。例如裂殖酵母(Schizosaccharomyces pombe)每個基因平均只有0.9個內(nèi)含子,出芽酵母(Saccharomyces cerevisae)的內(nèi)含子含量更低,每個基因平均只有0.05個內(nèi)含子。而多細胞的真核生物,則在演化過程中不斷增加內(nèi)含子的數(shù)量,在人身上甚至達到每個基因平均有8個以上的內(nèi)含子。
線粒體的出現(xiàn)給真核生物帶來充足能源的同時,也帶來了內(nèi)含子的入侵。為蛋白質(zhì)編碼的基因中內(nèi)含子的出現(xiàn),又迫使細胞形成細胞核以把DNA和核糖體分隔開來。這大概就是真核細胞出現(xiàn)的根本原因。其它的改變都是在這個基礎上進行的。