




版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領
文檔簡介
第四章核酸(hésuān)序列分析對實驗室中獲得的一條新的核酸序列進行生物信息學分析(fēnxī)是實驗深入研究前的標準操作。常規分析(掌握三種軟件)序列比對分析基因結構識別1精品PPT常規分析___以水稻瘤矮病毒RGDV基因組S8片段編碼區序列為例,使用(shǐyòng)BioEdit軟件進行分析核酸序列組分分析(BioEdit、DNAMAN、Dnastar)分析核酸序列的分子質量、堿基組成、堿基分布等。序列變換(BioEdit、DNAMAN、Dnastar)根據分析需要,對核酸序列進行(jìnxíng)各種變換,如尋找序列的互補序列、反向序列、反向互補序列等。限制性內切酶分析(BioEdit、DNAMAN、Dnastar)確定核酸序列的酶切位點。2精品PPT步驟一:下載水稻瘤矮病毒(bìngdú)RGDV基因組S8片段編碼區序列3精品PPT文本編輯器UltraEdit4精品PPT步驟二:安裝打開(dǎkāi)BioEdit軟件5精品PPT步驟(bùzhòu)三:載入序列(“File”“Open”)6精品PPT步驟四:序列(xùliè)分析互補(hùbǔ)反向互補核酸組成分析限制性酶切分析7精品PPT核酸(hésuān)序列組分分析步驟五:結果解讀8精品PPT序列變換步驟(bùzhòu)五:結果解讀(互補序列)9精品PPT限制性內切酶分析(fēnxī)10精品PPT11精品PPT限制性酶切分析(fēnxī)步驟五:參數設置12精品PPT限制性酶切分析(fēnxī)步驟六:結果解讀13精品PPT限制性內切酶在線分析(fēnxī)工具14精品PPTDnastar序列(xùliè)格式轉換限制性內切酶分析序列(xùliè)拼接下載(xiàzǎi)網址:/15精品PPT
16精品PPT
17精品PPT
18精品PPT
19精品PPT
20精品PPT
21精品PPT
22精品PPT
結果(jiēguǒ)23精品PPT
24精品PPT
25精品PPT
26精品PPT
27精品PPT
28精品PPT
顯示(xiǎnshì)出所有的酶切位點29精品PPT
只需要切1次的位點,則要選擇(xuǎnzé)切的頻率30精品PPT
在最低和最高都選擇(xuǎnzé)“1”31精品PPT
切1次的酶切位點32精品PPT序列(xùliè)比對定義:序列比對是比較兩個或兩個以上符號序列的相似性或不相似性。理論基礎:如果兩個序列之間具有足夠的相似性,就推測二者可能有共同的進化祖先,經過序列內殘基的替換、殘基或序列片段(piànduàn)的缺失、以及序列重組等遺傳變異過程分別演化而來。意義:從核酸、氨基酸的層次分析序列的相似性,推測其結構功能及進化上的聯系,是基因識別、分子進化、生命起源研究的基礎33精品PPT序列(xùliè)比對的方式數據庫搜索比對(BLAST)將查詢序列與整個數據庫中所有序列進行比對,來獲得數據庫中與其最相似序列的已有數據,作為查詢序列的參考信息。序列兩兩比對(BLAST2sequences)通過比較兩個序列之間的相似區域和保守性位點,尋找兩者可能的分子進化關系。多序列比對(ClustalX)將多個(duōɡè)序列同時進行比較,尋找它們之間共同的保守區域、位點和profile。34精品PPT
序列相似性:指兩個序列之間相同堿基或氨基酸殘基順序所占比例的高低。在蛋白質序列比對中,有時也指兩個序列之間具有相似特性(側鏈基團的大小、電荷性、親疏水性等)的殘基所占的比例。序列一致性:指兩個序列相同位置上出現同樣的堿基或氨基酸殘基的比例。同源性:用來描述蛋白質或核酸(hésuān)來自同一祖先。相似性(similarity)、一致性(identity)和同源性(homology)
35精品PPTidentity=8/45=17.8%similarity=(8+9)/45=37.8%相似的堿基:小分子(fēnzǐ)、疏水性、帶芳香基的氨基酸:A,V,F,P,M,I,L,W;
酸性氨基酸:D,E;
堿性氨基酸:R,H,K;
帶羥基、胺基、堿性氨基酸:S,T,Y,H,C,N,G,Q.圖中:“|”表示(biǎoshì)相同的殘基,“+”表示(biǎoshì)相似殘基。36精品PPT相似性vs同源性序列比對(sequencealignment)的結果顯示序列的相似性,而不是同源性。同源性可以根據序列相似性來推斷。當相似程度高于50%時,可以推測檢測序列和目標序列可能是同源序列;而當相似性程度低于20%時,就難以確定或者(huòzhě)根本無法確定其是否具有同源性。相似性可以量化,如50%similarity;而同源性是定性的概念,如果來自同一祖先就是同源,否則為不同源.%homology×。37精品PPT直系(zhíxì)同源(orthology)VS旁系同源(paralogy)直系同源(orthology)是比較基因組學中最重要的定義。直系同源的定義是:(1)在進化上起源于一個始祖基因并垂直傳遞(verticaldescent)的同源基因;(2)分布于兩種或兩種以上物種的基因組;(3)功能高度保守(bǎoshǒu)乃至于近乎相同,甚至于其在近緣物種可以相互替換;(4)結構相似;(5)組織特異性與亞細胞分布相似
旁系同源(paralogy)基因是指同一基因組(或同系物種的基因組)中,由于始祖基因的加倍而橫向(horizontal)產生的幾個同源基因。38精品PPT直系與旁系的共性是同源,都源于各自(gèzì)的始祖基因。其區別在于:在進化起源上,直系同源是強調在不同基因組中的垂直傳遞,旁系同源則是在同一基因組中的橫向加倍;在功能上,直系同源要求功能高度相似,而旁系同源在定義上對功能上沒有嚴格要求,可能相似,但也可能并不相似(盡管結構上具一定程度的相似),甚至于沒有功能(如基因家族中的假基因)。旁系同源的功能變異可能是橫向加倍后的重排變異或進化上獲得了另一功能,其功能相似也許只是機械式的相關(mechanisticallyrelated),或非直系同源基因取代新產生的非親緣或遠緣蛋白在不同物種具有相似的功能。39精品PPT局部(júbù)比對vs整體比對
序列比對的數學模型大體可以分為兩類,一類從全長序列出發,考慮序列的整體相似性,即整體比對;第二類考慮序列部分區域的相似性,即局部比對。局部相似性比全局相似性更具有生物學意義。兩條DNA長序列,可能只在很小的區域內(密碼區)存在關系。不同家族的蛋白質往往具有功能和結構(jiégòu)上的相同的一些區域(motif)。40精品PPT影響(yǐngxiǎng)相似性分數的因素WORDSIZE的設定是否(shìfǒu)允許空位且空位罰分策略相似性分數矩陣(PAM和BLOSUM)41精品PPT點陣圖評估兩條序列相似度最簡單的方法之一是利用點陣圖。
第一條被比較(bǐjiào)的序列排列在點陣圖空間的橫軸,第二條序列則排列在縱軸。點陣空間中兩條序列中的殘基相同時,在對應的位點上畫上圓點,兩條序列間連續相同的區域在圖中會形成由圓點組成的上斜線。42精品PPT具有(jùyǒu)連續相似區域的兩條DNA序列的簡單點陣圖對人類與黑猩猩的β球蛋白基因序列(xùliè)進行比較的完整點陣圖43精品PPT滑動窗口技術使用滑動窗口代替一次一個位點的比較是解決噪音問題的有效方法。假設窗口大小(dàxiǎo)為10,相似度閾值為8,則每次比較取10個連續的字符,如相同的字符超過8個,則標記基于滑動窗口的點矩陣方法可以明顯地降低點陣圖的噪聲,并且明確無誤的指示出了兩條序列間具有顯著相似性的區域。44精品PPT(a)對人類(rénlèi)(Homosapiens)與黑猩猩(Pongopygmaeus)的β球蛋白基因序列進行比較的完整點陣圖。(b)利用滑動窗口對以上的兩種球蛋白基因序列進行比較的點陣圖,其中窗口大小為10個核苷酸,相似度閾值為8。(a)(b)45精品PPT簡單(jiǎndān)比對比對就是兩條序列字符間簡單的兩兩匹配。比對可以反映出兩條或多條同源序列間的進化關系.最簡單的情況下即不考慮(kǎolǜ)空位,當兩條序列對比時,要做的僅是為較短的序列選擇比對的起始點。46精品PPT考慮這樣的兩條核苷酸序列:AATCTATA和AAGATA僅有三種(sānzhǒnɡ)比對方式不考慮空位的簡單比對,它的打分函數(hánshù)是有對比獎勵和罰分的和來決定上例中三個比對從左至右分別是4、1、3匹配得分:1失配得分:047精品PPT空位(kōnɡwèi)兩條或多條序列比對時,如果考慮到插入與刪除事件(shìjiàn)發生地可能性,那么候選的比對數量就會大大增加,也就導致了比對的復雜性。等等……上節中兩條核苷酸序列,在不考慮空位時僅有三種比對,而較短的那條加入了兩個空位后,便產生了28種不同的比對,例如:48精品PPT簡單(jiǎndān)空位罰分對含有空位的比對打分時,空位罰分就必須包含到打分函數(hánshù)中,空位比對的簡單打分公式如下:例如:假設匹配得分為1,失配得分為0,空位罰分為-1三種空位比對的得分從左至右分別是1、3、349精品PPT起始(qǐshǐ)罰分與長度罰分使用簡單空位罰分對兩條序列進行比對時,經常(jīngcháng)能找到若干同格式最優的比對。進一步區分這些比對的方法是找出哪些比對包含較多的不連續空位,哪些包含較少長度較長的空位片段。50精品PPT插入(chārù)/刪除事件假設兩條序列長度分別是12和9假設這兩條序列是真正的同源序列,那么它們之間長度的差異可以解釋為(1)較長的序列有核苷酸的插入,或者(2)較短的序列發生了核苷酸的刪除,或者(3)兩者都發生了。在不知道(zhīdào)原始父輩序列的情況下,無法判斷導致空位的原因是由于一條序列的插入事件還是另一條的刪除事件,通常把這類事件稱為插入/刪除事件。51精品PPT多聯核苷酸的插入刪除事件相對于單個核苷酸來說會較經常發生。統計(tǒngjì)結果表明,兩條序列長度上的差異更可能是單個三聯核苷酸的插入刪除事件導致的,而多個不連續核苷酸插入刪除事件的可能性比較小。空位罰分由序列中產生的新空位串引起的起始罰分和根據缺少的字符數而定的長度罰分。預設長度罰分小于起始罰分,以此建立的打分函數便能獎勵空位連在一起的比對。52精品PPT假設起始罰分為-2,長度(chángdù)罰分為-1,匹配得分為+1,失配得分為0,則對于這三個比對,從左至右比對的得分(défēn)分別是-1,+1,+2在后兩種比對在使用簡單空位罰分時,最后得分都是+3,現在卻得到了不同的分數。這三個比對,從左至右比對的得分分別是-1,+1,+2在后兩種比對在使用簡單空位罰分時,最后得分都是+3,現在卻得到了不同的分數。53精品PPT大
大極少插入或缺失:適用于非常相關蛋白質間的聯配;
大小少量大塊插入:用于整個功能域可能插入的情況
起始罰分長度罰分說明小大大量小塊插入:適用于親緣關系較遠的蛋白質同源性分析大的起始罰分配(fēnpèi)以很小的長度罰分被普遍證實是最佳的設定思路。54精品PPT打分(dǎfēn)矩陣正如空位罰分可以獎勵與進化相關的比對,失配罰分也可以用來進一步區分相似比對。統計結果表明,兩條同源的序列比對時,某些替換比其他替換常見的多。例:兩條蛋白質序列,其中一條在某一個位置上是丙氨酸,如果該位點被替換成另一個較小的且疏水的氨基酸,比如纈氨酸,則對蛋白質的影響很小,如果被替換成較大且帶電的殘基,比如賴氨酸,那么對蛋白質的影響可能就會非常大。直觀的講,比較保守的替換比隨機(suíjī)替換更可能維持蛋白質的功能,更不容易被淘汰,因此在打分上更傾向于纈氨酸而不是賴氨酸。55精品PPT打分(dǎfēn)矩陣(ScoringMatrix)核酸打分矩陣設DNA序列(xùliè)所用的字母表為={A,C,G,T}a.單位矩陣b.BLAST矩陣c.轉換-顛換矩陣(transition,transversion)(嘌呤:腺嘌呤A,鳥嘌呤G;嘧啶:胞嘧啶C,胸腺嘧啶T)單位矩陣轉換-顛換矩陣BLAST矩陣分別利用三種矩陣計算序列1:GCGCCTC和序列2:GCGGGTC在不考慮空位的情況下比對的得分56精品PPT構建方式:收集序列一致性達到99%的序列進行計算,得到PAM1矩陣.如要產生PAMn矩陣,則把PAM1矩陣自乘n次.缺點:一旦PAM1矩陣有小的誤差(wùchā),自乘n此以后得到的PAMn矩陣誤差(wùchā)有可能非常大.PAM矩陣(jǔzhèn)構建方式:根據BLOCKS數據庫中的序列數據計算得到.BLOSUMn矩陣由BLOCKS數據庫中一致性為n%的序列計算得到.優點:不會出現誤差放大,被廣泛使用.BLOSUM矩陣57精品PPT針對不同(bùtónɡ)的進化距離采用PAM矩陣序列(xùliè)相似度=40%50%60% |||打分矩陣=PAM120PAM80PAM60PAM250→14%-27%
58精品PPTPAM-n中,n越小,表示氨基酸相似的可能性越大;相似的序列之間比較(bǐjiào)應該選用n值小的矩陣,不太相似的序列之間比較(bǐjiào)應該選用n值大的矩陣.PAM-250用于約20%相同序列之間的比較(bǐjiào)。BLOSUM-n中,n越小,表示氨基酸相似的可能性越小;相似的序列之間比較(bǐjiào)應該選用n值大的矩陣,不太相似的序列之間比較(bǐjiào)應該選用n值小的矩陣。BLOSUM-62用來比較(bǐjiào)62%相似度的序列,BLOSUM-80用來比較(bǐjiào)80%左右相似度的序列。59精品PPTPAM100==>Blosum90PAM120==>Blosum80PAM160==>Blosum60PAM200==>Blosum52PAM250==>Blosum45Blosum矩陣(jǔzhèn)更適合用于局部比對Blosum62矩陣(jǔzhèn)適合于大多數的蛋白質序列比對60精品PPT突變(tūbiàn)數據相似性分數矩陣PAM250主對角線上分數值(shùzí)是指兩個相同殘基之間的相似性分數值(shùzí),有些殘基的分值較高,如色氨酸W為17、半胱氨酸C為12,說明它們比較保守,不易突變;有的殘基的分值較低,如絲氨酸S、丙氨酸A、門冬酰氨N三種氨基酸均為2,這些氨基酸則比較容易突變。不同氨基酸之間的分數值(shùzí)越高,它們之間的相似性越高,進化過程中容易發生互相突變,如苯丙氨酸F和酪氨酸Y,它們之間的相似性分數值(shùzí)是7。而相似性分數值(shùzí)為負數的氨基酸之間的相似性則較低,如甘氨酸和色氨酸之間為-7,它們在進化過程中不易發生互相突變61精品PPT模塊(mókuài)替換矩陣BLOSUM6262精品PPT數據庫搜索(sōusuǒ)盡管(jǐnguǎn)序列比對是比較兩條已知序列的極為重要的工具,然而序列比對的更為常見的用途是用來搜索大量序列的數據庫,以找到與特定序列相似的那些序列。在數據庫搜索過程中,由于被搜索序列很長,而且數量巨大,用簡單而直接的方法將數據庫中的每條序列與查詢序列進行比對并返回得分最高的序列難以奏效。作為替代方法,各種索引方法與啟發方式被用來加快搜索的過程,雖然不能保證與查詢序列比對的最好的,但是能返回大部分與查詢序列比對較好的,而且這些方法的效率很高。63精品PPT數據庫搜索(sōusuǒ)的比對得分與統計顯著性搜索結果的比對得分為(fēnwéi)S,E值表示比對結果的統計學顯著性,指的是用于隨機找出的一條或多條序列,比對得分大于等于S的可能性。數據庫搜索引擎一般都為每個搜索結果提供E得分E的值比較低說明該結果與查詢序列具有進化上的關系。64精品PPTBLASTBLAST是目前常用的數據庫搜索程序,它是BasicLocalAlignmentSearchTool的縮寫,意為“基本局部相似性比對搜索工具”。為了有效地搜索大型數據庫,BLASTP首先將查詢序列打碎成一個個單詞,查詢序中所有可能(kěnéng)的單詞是通過查詢序列上滑動與單詞等長的窗口來得到的。除了BLASTP,還有BLASTN和BLASTX等等…65精品PPTBLASTP搜索算法概述(ɡàishù)66精品PPTBLAST程序檢測(jiǎncè)序列和數據庫類型67精品PPT68精品PPT69精品PPT70精品PPT71精品PPT72精品PPT73精品PPT74精品PPT75精品PPT76精品PPT77精品PPT78精品PPT79精品PPT80精品PPT多序列(xùliè)比對定義:將兩條以上可能有系統進化關系的序列進行比對的方法。復雜性:O(m1m2m3…mn),其中m1為第一條序列的長度,m2為第二條序列的長度,mn是最后一條序列的長度。n個序列進行比對時的算法復雜性則為這n個序列長度的乘積。顯然,隨著序列數量的增加,多序列比對的算法復雜性呈指數增長。意義:通過多個序列的相似性,可以了解它們在進化上親緣(qīnyuán)關系的遠近,推斷分子起源和進化規律等。研究多個序列中的保守區域,可以猜測這些區域對結構和功能的重要性,從而進行分子設計。81精品PPT多序列(xùliè)比對工具CLUSTALW免費共享軟件,基于動態規劃算法對DNA或蛋白質序列作全局(quánjú)比對的多序列聯配工具,結果生成具有生物學意義的多序列聯配排列、并構建出表征比對序列間親緣關系的系統樹。下載:ftp://ftp-igbmc.u-strasbg.fr/pub/ClustalW/ftp://ftp-igbmc.u-strasbg.fr/pub/ClustalX/在線分析:/software/ClustalW.htmlhttp://www.ebi.ac.uk/clustalw/82精品PPTCLUSTALW算法執行(zhíxíng)的步驟Step1.簡單的兩序列比對和距離矩陣對所有序列做兩序列比較,并對關系密切序列加權,兩序列比對的得分用來構建距離矩陣;假如有n個序列,將要做n(n-1)/2次兩序列比對(pairwisealignment)。Step2.用鄰接法(Neighbor-Joining)計算系統樹基于兩序列比對得到的距離矩陣,用鄰接法計算系統樹。Step3.累進排列,依據系統樹進行排列從關系最緊密的兩個(liǎnɡɡè)序列開始,以系統樹示出的關系為指導,
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經權益所有人同意不得將文件中的內容挪作商業或盈利用途。
- 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
- 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 天府新區航空職業學院《企業文化與團隊建設》2023-2024學年第二學期期末試卷
- 南京工業大學《電路與模擬電子技術C》2023-2024學年第二學期期末試卷
- 邵陽職業技術學院《藏族文學概論》2023-2024學年第一學期期末試卷
- 山東科技職業學院《教育寫作》2023-2024學年第二學期期末試卷
- 麗水學院《四史》2023-2024學年第一學期期末試卷
- 梧州職業學院《生物醫學檢測技術》2023-2024學年第一學期期末試卷
- 陽泉職業技術學院《法語語音》2023-2024學年第一學期期末試卷
- 鄭州升達經貿管理學院《健身與指導》2023-2024學年第二學期期末試卷
- 配電箱供貨合同
- 養雞場地出租合同
- 司法雇員考試題目及答案
- 山東濰坊工程職業學院招聘考試真題2024
- 2025年03月廣西玉林博白縣總工會社會化工會工作者13人筆試歷年典型考題(歷年真題考點)解題思路附帶答案詳解
- GB/T 37133-2025電動汽車用高壓連接系統
- 2024年榆林市榆陽區公立醫院招聘考試真題
- Unit 2 Go for it!Understanding ideas教學設計 -2024-2025學年外研版(2024)七年級英語下冊
- 2025-2030全球及中國低噪聲塊(LNBs)行業市場現狀供需分析及市場深度研究發展前景及規劃可行性分析研究報告
- 人教版二年級數學下冊全冊大單元教學設計
- Trados簡介以及如何運用其創建翻譯項目
- 《中國漢字聽寫大會》詞語大全
- 柑橘采摘機器人的結構設計說明書
評論
0/150
提交評論