




版權說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權,請進行舉報或認領
文檔簡介
1、斷裂基因的來源:最后的真核生物的共同祖先和其他原始真核生物的外顯子一 內(nèi)含子基因結構的重建Eugene V. Koonin,1 Miklos Csuros2 and Igor B. Rogozin1摘要在真核生物中,蛋白編碼序列常被稱為內(nèi)含子的非編碼序列隔開。在mRNA 成熟過程,內(nèi)含子被剪接體切除,編碼序列一外顯子拼接成成熟的編碼區(qū)。在真 核細胞譜系間內(nèi)含子的密度有很大差異,在脊椎動物,無脊椎動物和綠色植物中 每kb編碼序列有6-7個內(nèi)含子,而在許多單細胞真核生物的整個基因組只有少 數(shù)的內(nèi)含子。進化重建采用最大似然方法表明,真核生物的各主要群體的祖先富 含內(nèi)含子。對于動物最后的共同祖先,被推
2、斷是所有現(xiàn)存和已滅絕真核生物內(nèi)含 子密度最高的,內(nèi)含子密度是人類基因內(nèi)含子密度的120 - 130%。此外,人類內(nèi) 含子密度的53 - 74%被推斷在最后的真核生物的共同祖先中存在。因此,所有真 核生物譜系后代基因的進化主要是內(nèi)含子丟失,大量的獲得僅在幾個分支的末 端,包括植物和動物。這些結論有大量生物意義,表明所有現(xiàn)代真核生物的共同 祖先是一個基因結構類似于多細胞生物的復雜有機體。選擇性剪接可能最初出現(xiàn) 是拼接錯誤的必然結果,只是后來被用來產(chǎn)生結構和功能多樣化的蛋白質WIREs RNA 2013, 4:93 - 105. doi: 10.1002/wrna.1143內(nèi)含子早期,內(nèi)含子后期,內(nèi)
3、含子第一:內(nèi)含子起源和演化的競爭情形Walter Gilbert值得紀念的的詞語一真核生物具有“斷裂基因”,蛋白編碼 序列被稱為內(nèi)含子的非編碼序列中斷。內(nèi)含子在供體和受體剪接位點被主要(U2) 或少數(shù)(U12)剪接體一專性的,極其復雜的核糖核蛋白的分子機器切除,這樣 側翼的編碼區(qū),外顯子,剪接成為成熟的mRNA。關于真核基因的外顯子一內(nèi)含 子結構以及內(nèi)含子的起源和進化長期就有“內(nèi)含子早期”與“內(nèi)含子后期”的辯 論。最初的,“強”的內(nèi)含子早期假說認為,真核基因從原核祖先上繼承了(幾 乎)所有內(nèi)含子,而真核基因之間的同源基因結構的差異主要是由于內(nèi)含子的丟 失差異。在這種情況下,現(xiàn)存的原核生物在“基
4、因組精簡”過程中丟失了所有的 原始內(nèi)含子和剪接體。內(nèi)含子早期假說與基因起源和演化的所謂的外顯子理論是 緊密相連的,根據(jù)現(xiàn)代型的蛋白編碼基因的祖先是RNA分子一能編碼外顯子大小 的肽并含有非編碼區(qū):未來的內(nèi)含子。在外顯子理論下,這樣的RNA分子之間的 重組產(chǎn)生的第一個蛋白質編碼基因的外顯子是由內(nèi)含子打斷。因此,內(nèi)含子的存 在被視為蛋白質編碼基因起源的一個必要條件。內(nèi)含子后期觀點反駁說,內(nèi)含子是真核生物獨有的,且新的內(nèi)含子已不斷出 現(xiàn)在真核生物的進化中。在這種情況下,細菌和古細菌從來沒有內(nèi)含子和剪接體。 后來改編的內(nèi)含子早期假說處于兩種假說之間,允許除了古老的一些新的內(nèi)含子 的出現(xiàn),但仍舊認為內(nèi)含
5、子是一種原始特征。這些假設隨后被合并成一個綜合性 的概念,可以被稱為“在真核生物進化中大量的早期內(nèi)含子”,我們將在本文對 一些細節(jié)進行討論?;蚱鹪吹耐怙@子理論的再現(xiàn)是在“內(nèi)含子第一”的情況下出現(xiàn)的,認為第 一個蛋白質編碼基因的外顯子從原始的內(nèi)含子演變而來,非編碼區(qū)被基因中的功 能RNA序列隔開,它存在于假設的,原始的先于蛋白質的RNA世界。真核基因的外顯子-內(nèi)含子結構多個內(nèi)含子隔開編碼序列存在于絕大多數(shù)動物和植物的基因中。內(nèi)含子的密 度在真菌和單細胞真核生物(原生生物)是高度可變的:許多原生生物整個基因 組中只有少數(shù)的內(nèi)含子,但一些原生生物內(nèi)含子的密度和動物植物相近。值得注 意的是,沒有一個
6、完全的真核生物的基因組測序中蛋白質編碼基因沒有內(nèi)含子。 只有一個內(nèi)含子的基因組已被報道:它屬于核態(tài)。是嚴重退化的殘余的真核生物, 它也已失去了剪接體亞單位基因在整個真核域都保留的剪接體是對內(nèi)含子存在普遍性的補充。剪接體由五個 snRNPs (小核核糖核蛋白顆粒),連同許多不穩(wěn)定的相關蛋白組成。核心小RNA 和剪接體蛋白亞基是所有真核生物的保守特征。剪接體與內(nèi)含子和相鄰外顯子的 特異性位點的相互作用以確保準確和有效的拼接。內(nèi)含子末端的核苷酸和相鄰外 顯子的核苷酸參與這些相互作用并形成剪接信號。供體剪接信號序列 (A/C)AG|GU(A/G)AGU(剪接位點由豎線和標有下劃線的內(nèi)含子的前兩個核苷酸
7、表 示)與U1 snRNA的5末端互補,這種相互作用似乎是主要的剪接要求。序列 (C,U)AG|G (內(nèi)含子的最后兩個核苷酸標有下劃線)是典型的受體剪接信號并被 U5 snRNA識別。短分支點信號位于內(nèi)含子剪接信號序列的上游,并含有參與剪 接中間體套索狀結構形成的活性腺苷。內(nèi)含子旁邊的具重要功能的外顯子序列 (A/C)AG|G被稱為protosplice(原始拼接?)位點,暗示著新的內(nèi)含子插入到 該結構的位點。一些種系特異性偏離規(guī)范的剪接信號已經(jīng)確定。例如,一些單細 胞真核生物缺乏分支點信號和3剪接信號之間可識別的多聚U。一些內(nèi)含子極 少的物種,如酵母,擁有一個不尋常的,嚴格約束的供體剪接信號
8、 |GTA(T,A,C)G(T,A,C),并在+4位置上有大量T。現(xiàn)存真核生物的內(nèi)含子密度不同的真核生物顯示出廣泛的內(nèi)含子的密度和大小分布,從許多單細胞生物 整個基因組中只有少數(shù)的內(nèi)含子(翻譯為每基因或每KB接近零的平均密度)到 哺乳動物編碼序列每KB約6個內(nèi)含子(圖1(a)或平均每基因幾乎9個內(nèi)含 子(圖1 (b)。就內(nèi)含子含量而言,真核生物的基因組通常大致分為內(nèi)含子少 的(大部分的原生生物)和內(nèi)含子多的,后者包括動物,植物,真菌,和一些原 生生物如衣藻或某些硅藻(圖1(a)。雖然它的簡單性很具吸引力,可以方便 的用于多種比較和模式研究,但真核生物的基因組117序列內(nèi)含子密度沒有顯示 明顯的
9、雙向聚類(圖1(a)。實際上,在某些真核生物的基因組似乎所有的內(nèi) 含子密度(在0和6個內(nèi)含子/KB)都能觀察到。然而,當對內(nèi)含子的密度與相 應內(nèi)含子長度作圖時,兩類的區(qū)別變得明顯(圖1 (a)。密度達約3個內(nèi)含子/ KB,所有內(nèi)含子短,內(nèi)含子的密度和長度之間的相關性不顯著(圖1(a)。相 反,在內(nèi)含子豐富的基因中可以觀察到一個顯著的正相關關系。一般,這種觀察 與關于積累基因組修飾的基因組容量的急劇轉型的群體遺傳參數(shù)一致,如長的內(nèi) 含子,其長度以有效種群密度和突變率的產(chǎn)物確定閾值。然而,二者在規(guī)模上都 有顯著例外。即使在內(nèi)含子豐富的生物,比如脊椎動物就很突出,很大一部分具 有極長的內(nèi)含子(圖1(
10、a),可能是由于高活性的轉座因子。相反,內(nèi)含子豐 富的擔子菌(3-4個內(nèi)含子/ KBP)只有很短的內(nèi)含子,而有些昆蟲盡管內(nèi)含子 的密度(2-3內(nèi)含子/KBP)相對較低但含有較多的長內(nèi)含子,顯示出廣闊的內(nèi) 含子長度分布(圖1(a)。正如上面所指那樣,盡管存在眾多,不同的內(nèi)含子較少的真核生物基因組, 但絕大多數(shù)不會失去“最后一個”內(nèi)含子和剪接體,雖然剪接體會降解,其中包 括很多組分的損失發(fā)生,例如,酵母。唯一堅定的例外是一個核態(tài)(一個極度退 化的細胞內(nèi)共生菌藻類)的小型基因組,已經(jīng)失去了所有的內(nèi)含子和剪接體。初 步的基因組數(shù)據(jù)表明,在至少一個微孢子蟲(拜氏微孢子蟲)里所有內(nèi)含子可能 已經(jīng)丟失,微孢
11、子蟲是一個與真菌遠親的高度退化的細胞內(nèi)寄生物。目前還不清 楚是否有任何共同的選擇因素或功能上的限制,來支撐在真核生物基因組中至少 有幾個內(nèi)含子的保留。然而,許多情況下,在高度縮減的基因組中保留的幾個內(nèi) 含子,位于編碼核糖體蛋白基因的5部分。在這些基因中的內(nèi)含子已被證明對 核糖體的生物合成和基因表達的調節(jié)很重要,它們的缺失導致了酵母適應性的顯 著降低。因此,真核生物中內(nèi)含子完全丟失的極端罕見,至少有一部分原因可能 是特定,具重要功能的內(nèi)含子丟失會產(chǎn)生有害影響。kv Alveolates & helenokonts , E mi lianaNaeglena & Beiov/iellaGreen p
12、lanls &. algaeAnoebozcaHolozoa r iFungiIntrons per kbp coding sequence- 督i t MJ 1. 4-4 -*-* *42345(b)100k10ksllcuc-t Alveolaiss & heterokonlst EmilianaNglena 撰 BioelowiellaGrsen plants & algae AmofihozosHolczoaFungi1000Genes5k10k20k圖1不同真核生物基因的內(nèi)含子的密度分布。(a)內(nèi)含子的密度與內(nèi)含子的長 度。(b)真核生物的內(nèi)含子數(shù)量和基因數(shù)量。y = d x顯示每個
13、基因的內(nèi)含 子密度(d = 0.06-8.8)。最大的內(nèi)含子密度(約8.8內(nèi)含子/基因)在玻璃海 鞘中。軸圈的數(shù)據(jù)用來展示各自的數(shù)量分布的預測。數(shù)據(jù)來自參考文獻36的17 個額外物種。過去的重建:最后的真核生物的共同祖先的內(nèi)含子密度(幾乎)所有真核生物中具有“斷裂基因”,但內(nèi)含子的密度和大小各異的 認識,在這些模式和真核基因結構演變的多嘗試重建的背景下,觸發(fā)了一個持續(xù) 的可能的進化情況討論。已經(jīng)提出了內(nèi)含子進化的幾種機制,包括內(nèi)含子丟失, 獲得,和滑動。內(nèi)含子的丟失和獲得是真核生物基因結構進化的主要途徑,所以 他們的相對貢獻確定進化過程的結果。動物和植物同源基因的外顯子-內(nèi)含子結 構的系統(tǒng)比較
14、分析顯示,這兩個內(nèi)含子豐富的復雜真核生物基因組約25-30%的 內(nèi)含子位置是共同的(即,位于同源基因完全相同的位置)。這些基本的觀察流 行的解釋是絕大多數(shù)(如果不是全部)在同源基因占據(jù)相同位置的內(nèi)含子是保守 的, L已在相應的祖先基因的等效位置。然而,另一種觀點是很大部分甚至絕 大部分共有內(nèi)含子已被獨立地插在不同品系后代的同源基因的相同位置,這不能 立即消除內(nèi)含子插入過程是高度非隨機的可能性。在系統(tǒng)發(fā)育較遠的真核細胞內(nèi)同源基因同一位點的內(nèi)含子插入(即,平行獲 得)的獨立程度,用原始拼接位點模型框架對此進行了評估。也許令人驚訝的是, 在真核生物基因序列的進化過程中,原始拼接位點比隨機位點更保守。
15、使用所觀 察到的原始拼接位點頻率和內(nèi)含子密度模擬內(nèi)含子插入原始拼接位點的結果表 明,在親緣關系較遠的物種,平行獲得可能只占5-10%共有內(nèi)含子的位置。此 模擬的結果表明,不同的真核生物中的同源基因相同位置上有大量的內(nèi)含子存 在,如動物,真菌,植物,多樣的原生生物反映了主要的進化保留。直系同源和旁系同源基因的內(nèi)含子位置的保守模式和變化模式被用來重建 真核基因的外顯子內(nèi)含子結構的進化方案一采用最大簡約法(MP)和概率最大似 然(ML)。內(nèi)含子位置的比對數(shù)據(jù)可以很自然地表示為一個內(nèi)含子的存在/不存在 矩陣,其中數(shù)學重建方法可以應用。該研究先采用取自8個真核物種的同源基因 并使用了一種最簡單的所謂Do
16、llo簡約法。Dollo算法使用一種樹狀拓撲結構和 內(nèi)含子的存在/不存在模式,構造最簡約的基因結構的進化情形,即,在樹枝上 內(nèi)含子獲得和丟失事件的分布。主要的潛在的假設是一個“字符”(給定位置上 的內(nèi)含子)一旦失去了就不能再獲得,盡管為了解釋所觀察到的模式狀態(tài),在樹 的不同分枝允許有很多平行的內(nèi)含子丟失。通過分析高度保守的真核基因的的幾 千個內(nèi)含子位置,Dollo簡約法產(chǎn)生出一種進化情況,現(xiàn)代真核生物的共同祖先 擁有相對內(nèi)含子豐富的基因,其內(nèi)含子的密度只比大多數(shù)內(nèi)含子豐富的現(xiàn)代脊椎 動物和植物低幾倍。MP方法顯然是過于簡單化,它假設所有譜系特定的內(nèi)含子被自動視為新近 獲得的,忽視了這些內(nèi)含子可
17、能是祖先傳給后代過程丟失的可能性。此外,MP 不提供對祖先狀態(tài)估計的置信區(qū)間。MP的這些限制可以大大歪曲進化重建的結 果,特別是當分析物種的數(shù)量很小時。概率的方法,如ML,至少在原則上可以 解決這些問題。然而,內(nèi)含子進化的前兩個統(tǒng)計研究,采用不同的ML模型產(chǎn)生 了相反的結果:邱等人得出的結論是,古老的內(nèi)含子(如果他們真的存在)沒有 在現(xiàn)存的基因幸存,而羅伊和吉爾伯特認為絕大多數(shù)內(nèi)含子,甚至是譜系特異性 的,是祖先的。第一個結論意味著在真核生物基因的演化中內(nèi)含子的獲得超過內(nèi) 含子的丟失,而第二個表明在進化過程中,內(nèi)含子的丟失占主導地位。這兩項研 究結果之間的差異表明,內(nèi)含子進化的最大似然模型的最
18、優(yōu)參數(shù)仍然有待決定。 后續(xù)工作使用概率模型揭示了這些早期重建的重要缺點:邱等人假定,一個基因 家族在系統(tǒng)進化上內(nèi)含子獲得和丟失是恒定的速度,而羅伊和吉爾伯特假定無限 的潛在的內(nèi)含子位點(忽略原始拼接位點的存在)并推斷在每個祖先節(jié)點上內(nèi)含 子密度是獨立的。真核生物進化過程中,下一代內(nèi)含子的獲得和丟失日益復雜的概率重建,引入了特定基因和譜系特定的內(nèi)含子獲得和丟失率的變化。重要的是,概率模型在 數(shù)學原則上可以考慮祖先的內(nèi)含子在所有譜系后代丟失,這在MP重建中完全被 忽略。依托的基因組越來越多,重建不約而同地發(fā)現(xiàn),古代真核生物祖先的蛋白 質編碼基因,包括最后的真核生物的共同祖先(LECA),已經(jīng)具備和
19、現(xiàn)代內(nèi)含子豐 富的基因組相當?shù)膬?nèi)含子密度。歷史上內(nèi)含子獲得和丟失的最新重建使用 Bayesian方法(Markov Chain Monte Carlo, MCMC)研究取自代表五個真核超 群中的三個物種(單鞭毛生物,植物,和囊泡藻界)的99個基因組中的245個 同源基因,它們含(相對)內(nèi)含子豐富的多個基因組序列容易獲得(圖2)。在 這方面,到目前為止最廣泛的真核生物基因結構的演變,瑪琳軟件包用來從一個 共享的內(nèi)含子矩陣來推斷祖先的狀態(tài),這些內(nèi)含子包括來自245組同源基因的 8403個內(nèi)含子存在一缺失文件MCMC方法用概率型的內(nèi)含子獲得一丟失模型推 斷祖先內(nèi)含子密度,該方法考慮了系譜間和基因位點
20、的異質率。內(nèi)含子豐富的祖 先肯定重建各主要種群。重建產(chǎn)生LECA (最后的真核生物的共同祖先)4.3個內(nèi) 含子/ KB的中值,與95%置信區(qū)間的3.7-5. 1內(nèi)含子/ KB (圖2),即,95%置 信的53 - 74%人類的內(nèi)含子密度。因此,這可能是違反直覺的結論,這些結果表 明,所有現(xiàn)代真核生物的共同祖先是一個基因結構類似于多細胞生物的復雜有機 體。AjHg呼 AUind-pthmc:心:-1.BhUIU-i. 4.hWaniicEam: 1.1海in心El*: 5UnikiMK: J.2Lflkufld: Kj Hihl-ru:7.?Dikjrx 4 yhEmkb 洞 lAhcx: 7.
21、4 VHPnHcHwmc- InwvlE: 5 7r Doiflmwtmr-cs: 7 J圖2在真核生物進化過程中內(nèi)含子的獲得和丟失的重建以及在祖先真核生物形 成中內(nèi)含子的密度。緊靠終端類群和一些較遠祖先顯示了分支寬度與內(nèi)含子的密 度成比例(以每KB編碼序列的單位內(nèi)含子計數(shù))。人類(HSAP)是由一個藍色的 斑點標記。插圖顯示了用MCMC方法以95%的置信區(qū)間(紅條中的圓圈表明中值) 測得的LECA內(nèi)含子密度的可能性分布(藍色);用ML和Dollo簡約法得到的值 用箭頭標出。內(nèi)含子進化動力學99個真核基因組的MCMC重建提供了三個超群基因結構演變的一個透徹認識 并揭示了一些總的趨勢(圖2)。更
22、多譜系顯示凈內(nèi)含子丟失可廣泛存在于囊泡 蟲,有些真菌譜系,綠色藻類或昆蟲;或被隨后的內(nèi)含子獲得抵消,如在陸地植 物,大多數(shù)動物譜系,和一些真菌中。大量的內(nèi)含子獲得只在幾個深支得到了推 斷,最明顯的是后生動物的支,并在較小的程度上,還有mamiellales支(綠色 藻類的一個分支),浮游植物,后鞭毛生物,和后生動物,以及領鞭毛類(圖2)。 這些結果在一個更大的數(shù)據(jù)集,以更大的信心,證明了以前的結論,即,真核生 物的進化過程中主要的內(nèi)含子獲得遠遠少于普遍的大量的內(nèi)含子丟失。大量的內(nèi) 含子丟失事件似乎符合具新型生物特征如后生動物等主要的生物新群體的出現(xiàn)(圖2)。這些結論與一些以前的研究結果一致,在
23、較小的數(shù)據(jù)集和不太先進的 重建方法下進行的,表明至少有一些真核生物的祖先形式可以擁有內(nèi)含子豐富的 基因。此外,對原始動物如海葵以及沙蠶基因結構的觀察與這些推論是兼容的。 一個特別引人注目的結論已在囊泡藻界的基因結構的演化重建達到:雖然在這個 真核生物超群中所有測序的基因組是內(nèi)含子較少的,內(nèi)含子豐富的最后的共同祖 先已推斷為囊泡藻界特別是囊泡蟲類.顯然,重建產(chǎn)生這樣的結果只因為,雖然 在不同囊泡藻界內(nèi)含子缺乏的同源基因中很少有內(nèi)含子的位置是保守的,但在植 物和/或動物的內(nèi)含子豐富的同源基因中,許多這些基因共享大部分內(nèi)含子位點。 這是真核生物基因結構演化的一般模式:內(nèi)含子丟失在真核基因的進化占無可
24、爭 議的主導趨勢,而且,丟失似乎是(幾乎)隨機的,結果是,大部分內(nèi)含子較少 的基因組保留的內(nèi)含子與內(nèi)含子豐富的基因組共享。相反,廣泛的內(nèi)含子獲得事 件的發(fā)生主要與真核生物主要分支的起源相結合,如動物或植物,因為獲得是不 相關的,獲得的內(nèi)含子很少占據(jù)同源基因相同的位置。某一次,大量涌入的基因導入植物的綠色藻類祖先的基因組,其中來自藍藻 共生的一組內(nèi)含子較少基因的內(nèi)含子獲得可以被直接追溯到。也許令人驚訝的 是,在數(shù)千個葉綠體衍生的基因的內(nèi)含子密度竟然只比植物祖先真核基因的內(nèi)含 子密度略低。沿同一路線,已經(jīng)表明,最近從線粒體轉移到核基因組基因的內(nèi)含 子密度與來自以前轉移基因的內(nèi)含子密度是相似的,這表
25、明基因結構通過轉移基 因與基因組的整合后獲得內(nèi)含子而迅速形成。隨著更多基因內(nèi)含子密度的傳聞觀 察,內(nèi)含子顯然是通過個體的真核細胞譜系(例如,線蟲)從細菌水平轉移獲得, 這些研究結果表明,當一個真核生物獲得內(nèi)含子較少的基因,這些基因會很快按 照各自的基因組特征密度獲得內(nèi)含子(幾乎)。這種平衡的內(nèi)含子含量可能是被 內(nèi)含子參與的核質運輸水平和其它階段的基因表達調控相關的選擇所驅動。LECA的選擇性剪接及之后草率的功能形成在多細胞生物中,尤其是動物和植物,選擇性剪接(AS)是調節(jié)基因表達和 功能的主要機制。大規(guī)模的研究基于將表達序列數(shù)據(jù)映射到基因組序列和 RNAseq 上的調查顯示,超過90%的人類基
26、因,超過40%的擬南芥和水稻基因能夠 通過AS產(chǎn)生多個不同的mRNA分子。不能保證所有這些轉錄產(chǎn)物是有功能的,但 許多基因已經(jīng)表明,通過AS產(chǎn)生的蛋白異構體,具有獨特的功能,特別是作為 主要的異構體的活性調節(jié)劑。AS已在許多真核生物存在;然而,目前還不清楚 AS是否頻繁出現(xiàn)在早期的非真核演化中,因為祖先的剪接信號弱并未能提供高 度精確的拼接,或是在多個譜系內(nèi)含子豐富的基因通過強的祖先剪接信號的突變 進行更獨立的演變。然而,上述的進化重建似乎為這一難題提供一個解決方案。 整個譜系從LECA到哺乳動物以及LECA到植物被推斷為一個不間斷的內(nèi)含子豐富 階段.鑒于這一發(fā)現(xiàn)和行之有效的(和種群遺傳理論支
27、持的)事實,內(nèi)含子豐富 的基因組具有較弱的剪接位點,可以推斷出早期真核生物,包括LECA,產(chǎn)生的 無數(shù)的異常剪接形式,是由于一個偶然的機會剪接機制的相對無效造成。在這些 沒有達到較大的有效種群的譜系后代,允許發(fā)展的真核生物收緊剪接信號和消除 異常剪接,眾多的假的轉錄產(chǎn)物總是可用來被招募為功能蛋白的形式,特別是調 控蛋白。因此,功能性的AS精心設計的“劇目”是,動物和(在較小的程度上) 植物的特征是由祖先草率的剪接演變而來的。第一個剪接體內(nèi)含子:U2還是U12?絕大多數(shù)剪接體內(nèi)含子在供體剪接位點含有| GT,在受體剪接位點含有AG |,并幾乎總是由主要的U2剪接體(見“真核基因外顯子一內(nèi)含子結構
28、”部分) 切除。然而,一類獨特罕見的內(nèi)含子:在供體剪接位點含有|AT在受體剪接位點 含有AC|,基于其末端不尋常的二核苷酸而被識別。對這些非典型內(nèi)含子序列的 進一步檢查,發(fā)現(xiàn)了幾個區(qū)分于主要內(nèi)含子的性質,包括供體剪接信號不尋常的 保守信號(|ATATCCTT)和受體剪接信號的上游(TCCTTAAC距剪接位點10-15 堿基)。這類內(nèi)含子被一個獨特的所謂少數(shù)的U12剪接體切除,它包含幾個特有 的,低豐度的snRNP。隨后證明一些| GT-AG |內(nèi)含子也由U12剪接體切除。U12 內(nèi)含子和相關的少數(shù)剪接體不像主要的U2剪接體是普遍保守的,但也廣泛存在 于真核生物,像在脊椎動物,昆蟲,植物,和一些
29、原生生物。小RNA分子系統(tǒng)學的重建與U2和U12剪接體蛋白亞基表明,由于對各部件 基因的一個遠古復制,兩種剪接體都已經(jīng)存在于LECA。U12內(nèi)含子在人類和擬南 芥同源基因上的位置在更大程度上比U2內(nèi)含子的位置要保守。U12內(nèi)含子,特 別是保守的那些,集中在植物和動物基因的5部分??紤]到U12內(nèi)含子在基因 表達調控的一個潛在的重要作用,似乎誘使人推測,祖先的內(nèi)含子是U12型但隨 后被轉換U2型。此外,在U12內(nèi)含子中存在的一些假定的祖先特征也支持了這 一假說。然而,人類和擬南芥中古U2和U12內(nèi)含子的原始拼接位點(圍繞內(nèi)含 子的外顯子序列)比較發(fā)現(xiàn)祖先的內(nèi)含子與U2而不是U12相似。因此,似乎最
30、 有可能的是原始的剪接體內(nèi)含子是U2型。LECA之前的內(nèi)含子古代真核旁系同源基因的外顯子-內(nèi)含子結構的比較,揭示了這些基因中保 守的內(nèi)含子的真實缺失,與進化上甚至最遙遠的真核生物的直系同源以及更近的 旁系同源基因內(nèi)含子位置的保守形成鮮明對比。保守的內(nèi)含子位置在古老的真核 旁系同源基因的缺乏可能反映了這些基因在真核生物進化最早階段的起源,真核 生物進化的特點是由二型自我剪接元素(剪接體內(nèi)含子的可能祖先)伴隨的基因 入侵和大規(guī)模的基因復制。編碼胞漿和線粒體核糖體蛋白的“偽旁系同源”基因 中的平行內(nèi)含子獲得也得到了相似估計,它們通過定義都獲得了自己獨立的內(nèi)含 子:只有約2%的內(nèi)含子在同源位點發(fā)現(xiàn)。古
31、代真核旁系同源基因保守內(nèi)含子的 缺失與在20個最古老(細菌和古細菌分支前復制)的旁系同源基因家族的內(nèi)含 子分布的早期分析結果一致,這些同源基因家族似乎已經(jīng)獨立積累內(nèi)含子。這些 結果意味著,最初的內(nèi)含子在新出現(xiàn)真核生物的入侵是一個持續(xù)過程,發(fā)生在與 基因從線粒體共生細菌到核基因組的轉移和第一波真核基因的復制相稱的時間段。a-p anc mikArchaea-like ancestor of eukaryotesOrigin ofspiiceosomalintrons andspliceosome圖3。真核生物基因結構演化的早期階段的一個假設情況。該方案顯示了從真核 生物的假定祖先到來自II型內(nèi)含子(通過線粒體內(nèi)共生侵入宿主基因組)的剪接 體內(nèi)含子的起源所涉及的一系列事件。剪接體內(nèi)含子的起源與進化
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經(jīng)權益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
- 6. 下載文件中如有侵權或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 快樂游樂園安全第一3篇
- 化糞池清掏業(yè)務協(xié)議3篇
- 單位授權委托書格式設計方案3篇
- 勞務分包工程安全協(xié)議書3篇
- 安全責任書液化氣站3篇
- 學生考試誠信宣言3篇
- 工程合同首頁
- 腈綸纖維在醫(yī)療繃帶產(chǎn)品的開發(fā)考核試卷
- 電腦組件的未來趨勢考核試卷
- 糕點行業(yè)人力資源開發(fā)與培訓考核試卷
- 醫(yī)院培訓課件:《產(chǎn)前準備-為順產(chǎn)做準備》
- 《管理學原理》(課件)
- 長城汽車2025人才測評答案
- 幼兒園法制教育講座
- 河道的管理和防護課件
- 綠化作業(yè)安全教育培訓
- 《中華人民共和國產(chǎn)品質量法》知識培訓
- 技能人才評價命題技術規(guī)程
- 中職不等式的試題及答案
- 深信服aES產(chǎn)品技術白皮書-V1.5
- 浙江省金華義烏市稠州中學2024-2025學年九年級下學期3月獨立作業(yè)英語試卷(原卷版+解析版)
評論
0/150
提交評論