




版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領
文檔簡介
1、 BioEdit是一個性能優良的免費的生物序列編輯器,可在Windows 95/98/NT/2000中運行,它的基本功能是提供蛋白質、核酸序列的編輯、排列、處理和分析。 與DNAMAN相比,其分析內容相對豐富一些,而且提供了很多網絡程序的分析界面和接口,與DNAMAN等軟件配合使用更好。 尤其值得一提是利用BioEdit能夠十分方面地根據指定的核酸序列繪制相應的質粒圖譜。:多種序列輸入方式;:按標題、位置 、定義、參數、注釋等分類;:兩序列的最佳排列及計算同一性和類似性;:僅采用聯配中部分區域進行分析而排除其他。:組成、互補、反轉、翻譯、質粒、限制性內切酶;:氨基酸成分、疏水性輪廓 、疏水力矩
2、平均數:把DNA或RNA翻譯成蛋白質;:在核酸和編碼蛋白質序列中切換核苷酸序列;:相互比較兩序列的矩陣,生成一個點圖。本地使用BLAST o創建本地數據庫 o本地BLAST 搜尋 BLAST INTERNET 客戶端程序 HTML BLAST 網絡瀏覽器 PSI-BLAST nnPredict 使用BioEdit質粒繪圖功能,序列可以通過自動的位置標記,自動修改成環形質粒。特征、多連接位點和限制性位點可以通過使用對話框增加。當將一個序列進入質粒圖時,在背景上出現一個限制性內切酶圖譜,所以可以通過對話框選擇可以增加限制性位點。它們自動增加到當前的位點。質粒功能提供簡單的繪制和標記工具。標簽和繪圖
3、可以通過鼠標移動和縮放。想要編輯目標性質,雙擊目標。想要從一個DNA序列產生一個質粒,從“Sequence ”菜單中“Nucleic Acid ”子菜單中選擇“Create Plasmid from Sequence ”選項。選擇這個選項時,限制性內切酶圖譜將會使用通常商業化的,儲存在存儲器中的限制性內切酶。質粒第一次產生時,它顯示成有10個位點標記的圓圈,中央是標題 。 想要增加限制性位點,從“Vector ”菜單中選擇“Restriction Sites ”選項。將會顯示一下對話框: 想要顯示圖譜中的限制性內切酶,從右邊(“Dont Show ”中)選擇任何想要的酶,用 按鈕將它們移動到左
4、邊。按下“Apply & Close ”時,這個位點就會增加到圖譜中。指定的酶如果只有一個酶切位點,就會在酶切位點上出現一個“U ”。如果沒有“U”, 將會顯示第一個酶切位點。想要移動圖譜中酶的位置,在“Show ”中增加選擇的酶的亮度,按下 按鈕將它們移動另一邊。 點擊“Vector ”菜單中的“Positional Marks ”選項,可以出現以下對話框: 可以通過移動位置標記到“Show” 中,單獨增加位置標記,或者設定應用的分割標記數量。想要沒有標記,選擇“Divide into: ” 中的下拉菜單頂端的“None”。想要增加一個特征,如抗生素抵抗標記,從“Vector” 菜單
5、選擇“Add Feature”。 將顯示以下對話框:選擇的類型是“Normal Arrow ”、“Wide Arrow ”、“Normal Box” 和、“Wide Box ”。在上面例子中的所有特征是“常規”寬度的。如果特征是一個箭頭,箭頭的方向將是從起點位置到終點位置。 增加特征或酶時,他們各自的標記增加在外面,中心是可能的尺寸。標記可以被選擇工具選擇、移動、編輯和縮放。 載體屬性可通過選 “Vector” 菜單中的“Properties ”來更改 : 可以通過指定起點和末端位置,來增加多接頭按鈕。多接頭顯示為“Courier New ”字體。在這個對話框中,特征可以被編輯、增加或者刪除。
6、想要編輯或刪除一個現存的特征,在“Features”下拉式菜單中選擇特征,并點擊合適的按鈕。點擊“Add New” 按鈕,可以增加一個新的特征。 現在只有一個圓形、單鏈質粒是有效的。在以后的版本中中將會改進。 “Font”按鈕改變指示的默認字體。特征標記的字體將可以單獨改變,但是位置標記不能單獨改變。 BioEdit提供兩種方法產生核苷酸序列的限制性內切酶圖。一種內在的限制性內切酶圖功能允許產生序列最多為65,536個核苷酸的限制性內切酶圖。實際上,只能檢測大約35Kb, 而且在速度慢的計算機上會要消耗很長的時間。 你 也 可 以 通 過 萬 維 網 直 接 鏈 接 到WebCutter 限制
7、性內切酶圖上。 點亮你想要圖譜的序列標題,從“World Wide Web”菜單中選擇“Auto-fed WebCutter Restriction Mapping” 點亮你想要圖譜的序列標題,從“Sequence” 菜單選擇“Restriction Map” 。 以下選項將會顯示在一個界面窗口: :顯示或省略序列的全圖譜,互補鏈顯示每個酶的酶切位點.默認值:yes :顯示關于所有內切酶、它們的識別序列、切割頻率和所有位置(5末端開始是1) 的列表.默認值:yes :關于酶切位點的列表.默認值:no :在全部序列中只有一個酶切位點的內切酶列表.默認值:no .默認值:yes :關于所有正確選擇
8、的內切酶和它們切割序列的次數。默認值:no 。默認值:yes : 想要包括這些酶,必須點擊這個選項.默認值:no (不包括本身) :與4-base cutters相同. :有時你可排除它們.默認值:yes :通常用于克隆,只有共同的6-堿基識別酶被使用.:若只顯示一個特殊識別位點的一個內切酶,不選(默認值=不選擇). :顯示沿著排列中的序列翻譯(5端到3端的由左到右的翻譯) :互補鏈的翻譯方向相反. :是酶切位點的核酸的號碼,而不是識別位點的起點.從核酸序列中得到內切酶譜時,顯示酶的生產公司是很有用的。通過在內切酶圖譜中選擇制造廠商和按下按鈕,可以手動瀏覽內切酶。你也可以通過選擇“Option
9、s ”菜單中的“View Restriction Enzymes by Manufacturer”選擇,在任何時候檢查內切酶。顯示如右對話框: 在這個例子中,所有來源于Stratagene的限制性內切酶顯示在左邊的列表中,KpnI的亮度增加。KpnI的識別序列顯示在頂端,同裂酶顯示在它的下方,其他提供KpnI的公司顯示在同裂酶的下方。BioEdit使用ReBase提供的gcgenz表,限制性內切酶數據在萬維網的地址是: 。可以從R e B a s e 下 載 最 新 的 g c g e n z 表 , 將 其 命 名 為“enzyme.tab”, 并且替代在BioEdit安裝文件夾中“tabl
10、es ”目錄下的舊文件。 :表必須是gcgenz格式的。你可以從tables文件夾中打開“enzyme.tab ”文件查看格式,或者查看“Restriction Maps ”。限制性內切酶表格文件名必須是“enzyme.tab ”,而且必須在BioEdit的“tables ”文件夾里。 從“Sequence” 菜單下進入“Protein”, 再進入“amina acid composition”, 可對序列的氨基酸組成分析,結果以摘要和圖例的形式給出。圖例中的柱形條表示每種氨基酸在序列中的摩爾比,如下圖: 以的為例:在聯配文件中有專欄用熵圖來衡量可變性。它衡量的是在聯配中每個位置的“信息量”的
11、缺乏。準確地說,是每個位置的可預測性的缺乏。 3.3.疏水性輪廓疏水性輪廓(profile) (profile) 平均疏水性輪廓采用Kyte &Doolittle 的方法,平均分值(總和/窗口大小)作為序列中各個位置的疏水性值,并以窗口中中間殘基的疏水性值作圖。 4.4.瞬間疏水性輪廓瞬間疏水性輪廓( (hydrophobic moment profilehydrophobic moment profile) )5.5.平均瞬間疏水性輪廓平均瞬間疏水性輪廓6.在聯配中搜尋保守區在聯配中搜尋保守區 有時,即使序列之間的變化很大時,在幾個序列中搜尋保守區是有用的。例如,根據一系列同源序列發
12、現通用的PCR 引物。BioEdiot 查找的是低平均“熵”的區域。 首先選擇你的序列,從“Aligment”-“Find Conserved Region”,對話框中各選項的內容: BioEdit version 5.0.9Conserved region searchAlignment file: Q:Ribosomal_RNAsome_methanos.bio5/10/04 8:57:33 PM Minimum segment length (actual for each sequence): 15Maximum average entropy: 0.2Maximum entropy
13、per position: 0.2Gaps limited to 2 per segmentContiguous gaps limited to 1 in any segment 2 conserved regions found Region 1: Position 755 to 774Consensus:755 AUUAGAUACCCGGGUAGUCC 774 Segment Length: 20Average entropy (Hx): 0.0155Position 755 : 0.0000Position 756 : 0.0000Position 757 : 0.0000Positio
14、n 758 : 0.0708Position 759 : 0.0000Position 760 : 0.0000Position 761 : 0.0000Position 762 : 0.0000Position 763 : 0.0000Position 764 : 0.0708Position 765 : 0.0000Position 766 : 0.1679Position 767 : 0.0000Position 768 : 0.0000Position 769 : 0.0000Position 770 : 0.0000Position 771 : 0.0000Position 772
15、: 0.0000Position 773 : 0.0000Position 774 : 0.0000Region 2: Position 1206 to 1222:1206 ACACGCGGGCUACAAUG 1222 Segment Length: 17Average entropy (Hx): 0.0182Position 1206 : 0.0000Position 1207 : 0.0000Position 1208 : 0.0000Position 1209 : 0.0000Position 1210 : 0.0708Position 1211 : 0.0708Position 121
16、2 : 0.0000Position 1213 : 0.1679Position 1214 : 0.0000Position 1215 : 0.0000Position 1216 : 0.0000Position 1217 : 0.0000Position 1218 : 0.0000Position 1219 : 0.0000Position 1220 : 0.0000Position 1221 : 0.0000Position 1222 : 0.0000BioEdit version 5.0.9Alignment file: G:Ribosomal_RNAsome_methanos.bio5
17、/10/99 9:34:06 PM Minimum segment length (actual for each sequence): 10Maximum average entropy:0.4Maximum entropy per position: 0.4 with 2 exceptions allowed Gaps limited to 2 per segment Contiguous gaps limited to 1 in any segment 結果:結果:7.7.根據密碼子的使用翻譯核苷酸根據密碼子的使用翻譯核苷酸 核苷酸序列可根據三聯體密碼翻譯預測的蛋白序列。從“Sequen
18、ce”-“Protein”-“Translation”, 選擇要按何種讀框翻譯。例如,以下是一個假設的Methanobacterium(甲烷細菌)的ORF(開放閱讀框架)。 A frame 1 of this sequence is displayed as follows in the BioEdit text editor:RNA 的結構定義為核苷酸的堿基的相互作用。最簡單情況下,即螺旋中的堿基對之間的Waltson-Crick 堿基配對。RNA 結構的系統發育比較分析方法建立在如下假定上,即在進化中核苷酸改變,但重要的RNA 二級和三級結構保持不變。一個可能破壞結構的堿基變化可以由序列中
19、另一處的變化補償以保持結構穩定。所以不同物種的同源RNA 中將包含“補償堿基變化”或“共變化,協變(covariation) ”。所以通過檢查來自各個不同生物的同源RNA ,確定這些“補償堿基變化”,從而闡明結構。 例如,一給定的序列,GAAGA 將可能與序列中任一UCUUC 配對,而后者可能在序列中出現數次。如何確定到底是和哪一個配對呢?可以檢查不同生物的同源RNA 序列,找出“補償堿基變化”。 在此例中,只有最后一個UCUUC 才可和GAAGA 配對。象這樣在序列中2 個位置出現“補償堿基變化”,被認為是螺旋存在的證據。兩條序列不能形成互補,表明不存在配對。在“系統發育比較分析”中關鍵是序
20、列聯配,同源序列必須適當聯配。此處同源性是嚴格意義的:同源的核苷酸來自一個共同的祖先。所以開始時,先使用關系緊密的序列進行聯配,這樣在序列相似性基礎上聯配,不需要加入許多聯配的空位。聯配后互補序列的“協變”可被立即發現,從而開始構建二級結構,然后差異大的序列可以添進聯配中。這樣持續添加新序列,進行“協變”分析,直到聯配和二級結構模型出現此過程的完全描述。一旦一個完整的二級結構模型形成,“協變”分析可以鑒定非螺旋區的核苷酸之間的相互作用以及不規則的相互作用。之所以可以被鑒定,是因為涉及的核苷酸即使不形成規則的堿基配對或是一個螺旋的一部分,也仍一致的變化。 共變化指序列中兩個殘基步調一致地變化。嚴
21、格地講即每當聯配序列中x 變化時,y 也變化,兩者是一致的。(例如,當x 變為A ,y 變為T 。每次x 變為A,y 一定變為T)。 殘基間的共變化表明,它們之間一定有重要的相互作用,當重要結構殘基突變時,自然選擇保留了那些有補償突變的序列。 假設我們現有一個聯配序列,它表示了幾種物種共有的一個特定的RNA 的保守的結構。我們希望從聯配中包含的信息推測出RNA 二級結構。 在上述聯配中共有3 對“共變化”的位置點:2/28, 5/25 ,9/21。兩個堿基共變表明它們很可能相互作用。如果一個突變發生在與其他堿基有重要作用的堿基上(常是堿基對),選擇壓力可能會只保留在另一處堿基上發生補償突變的堿
22、基。事實上,上述的堿基共變化都發生在規則的堿基對(Watson-Crick 堿基對或在RNA 中G-U )表明它們可能是堿基配對。共變化堿基對2/5 分別和5/25 的距離相同,而5/25 分別和9/21 的距離也相同,而且界于它們之間的堿基也可形成堿基互補,這都表明聯配序列的兩端可能閉合形成螺旋如下是“Sample1”形成的結構。 當RNA 分子中兩個核苷酸之間存在配對堿基的相互作用力。一個堿基發生突變,另一個堿基為了補償這一突變,可能不僅僅是某一特定核苷酸突變(例如原來的A-T 配對可能在一序列中轉換為G-C,而另一序列中為G-U, )這在共變化分析中將被忽略。因為此種改變并不遵循完全相同
23、的模式。要鑒定這種情況,可以在潛在配對中選定堿基配對的規則。 仍用上例中的序列( 略)BioEdit 中并不要求有位置變化,所以未改變的位置上只要可以形成堿基對,也能被發現同時也可在“preference”中設置以濾出未改變的位置之間的堿基配對。以下是一個聯配序列它和在共變化分析中使用的相同。設置允許A-U/G-C/G-U 堿基配對規則以及1 個錯配,產生下列的結果(以清單格式,濾除了未變化位置的潛在配對)比較這一結果和共變化的結果,發現位置3/27 有一潛在的配對,而共變化的結果未檢出。潛在配對的數據也可以按允許的配對出現的頻率或原始允許配對的數目列出一個(二維矩陣)表。 Potential
24、 Pairings ListInput File: I:BioEdithelpsamples.gbAllowed Mispairings = 116 total sequences, 29 nucleotides per sequence.Axes reflect numbering of the entire alignment.No Mask was used.Hits on invariant pairs have been filtered out. 1 CCCCCCCCCCCCCCCC Position: 2 2 CCGGCCCCCCCCCGCC28 GGCCGGGGGGGGGCGG
25、 0 mis matches 交互信息,象在系統發育比較分析中的應用一樣,主要是衡量在一個適當聯配中兩個位置共有信息的信息量。符號是M(x,y)(位置x,y 的相互信息) 。M(x,y)表明兩個位置相關的緊密程度。此相關程度顯示了兩位置的直接相互作用,如堿基配對。BioEdit 另外計算R1 和R2 兩個參數,它們分別表示位置x,y 對M(x,y)的貢獻。 什么是交互信息什么是交互信息 交互信息分析是以下思想的拓展-在預先對某位置一無所知的情況下(如RNA 中核苷酸),不確定性最大。但一旦確定了某位置是什么核苷酸時,不確定性消除了,此位置的信息量達到最大。現在考慮有多條序列,在某位置均含有一個
26、同源核苷酸。知道第一條序列上此位置上的核苷酸并不能為確定第二條或隨機的一條序列中此序列的核苷酸提供多少信息。但是如果已知此位置在許多乃至幾乎所有序列中均為某一特定堿基(如C ),而不是其它的堿基(如G), 則我們積累了相當多的“信息”,可預測另一個未檢測的序列中,在此位置某核苷酸出現的可能性。即在另一未檢測的序列中,此位置核苷酸的不確定性下降了。交互信息進一步拓展了這一思想,對配對位置的信息量進行檢查,此信息量依賴于并聯系每個位置單獨的信息量,但不能將兩者混淆。總的講,它衡量不確定性的下降,此不確定性指兩種事物相互影響相互作用的程度。Robin Gutell 發展了用交互信息預測RNA 結構的
27、方法,也很適合系統發育比較分析,因為兩個位置交互信息高也提示這2 個殘基直接相互作用。 1 2 3 4 A C G U A C G U A G C U A U A U A U A U A A U U A A U U A G C U如左圖總共8 個序列,其中位置1, 4 是不改變的,信息量最大。位置2 ,3 中C/G/U/A 各出現了2 次,信息量為0 ,我們無法預測下一個序列中這兩個位置的核苷酸,但位置2 ,3都含有它們之間是如何影響彼此的共有信息。我們不能猜出新一序列中位置2 的核苷酸,但如果告訴我位置3 是C, 我們可以推斷出位置2 是G,這即建立在“交互信息分析” (它們遵循共同的配對模
28、式)交互信息也表明這些堿基可能相互作用。 以下是分析細菌RNase P RNA 的部分序列的一個例子。點擊(Aligment)可以觀察此聯配。設置輸出是全部列表(full table)顯示M(x,y)的數值。Nbest 列出各個位置5 個高分值。序列和編號mask 都是根據E.coli. 。序列的編號是根據E.coli的mask序列。此序列中包含了一個RNase P RNA 結構區域的“cruciform region”(十字型區域) 。由于矩陣文件太大,不能在此說明文件中打開觀察。但可通過打點作圖方便地觀察。在BioEdit 矩陣作圖程序中,數據既可以數字也可以圖形的方式被動態的檢查。其中交互信息分析的“cruciform region” (十字型區域)在此輸出中是環型的。此圖象及全部最新的細菌和古細菌的RNase P RNA 結構和序列均可在RNase P 數據庫中找到。 細菌RNase P RNA 聯配的一部分,共有包含極豐富信息的138 條序列。序列包含 “cruciform region” (十字型區域) 。具體數據詳見文本。 例如使用E.coli 作為序列和編號masks ,對146 條細菌RNase P RNA 序列進行M(x,y)分析得到的矩陣
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經權益所有人同意不得將文件中的內容挪作商業或盈利用途。
- 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
- 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 網絡支付平臺開發合作協議
- 房地產銷售技能培訓計劃
- 建筑行業勞動力資源管理計劃
- 環保項目承包人自施工的分包計劃
- 讀三字經心得體會6篇范文
- 歷史上的英雄人物征文
- 奇妙的自然景觀描寫:滕王閣序選讀教學教案
- 玻璃幕墻裝配式施工技術流程
- 2025年小扶手項目市場調查研究報告
- 電子商務領域創業投資證明(6篇)
- 金壇區蘇科版六年級心理健康教育第18課《中學遐想》課件(定稿)
- 日本理研噸位儀負荷實時監視裝置PLA-4N中文說明書
- 粘包鋼加固施工方案
- 信息管理學教程ppt課件匯總(完整版)
- 起重傷害事故現場應急處置卡
- 質量流量計原理與應用-課件
- 抗滑樁施工監測監控措施
- 最新食品工程原理考卷
- 硅烷偶聯劑及其應用技術
- 甲狀腺的外科治療與病ppt課件
- 大壩填筑實施細則
評論
0/150
提交評論