




版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領
文檔簡介
沒火譬比
較
基
因
組
學
原
理
及
應
用成員:韓柳閻
永
偉黃繼
馬壽光
朱琳
姜
南李春麗十
宰波火譬比較基因組學相
關
概
念韓柳十基因組(genome)泛指一個有生命體、病毒或細胞器的全部
遺傳物質;在真核生物,基因組是指一套染色
體
(
單
倍
體
)
DNA。基因組學(genomics)就是發展和應用DNA
制圖、測序新技術以
及計算機程序,分析生命體(包括人類)全部基
因組結構及功能。基
因
組
學
概
念
及
范
疇十亞
領
域內
容結構基因組學整個基因組的遺傳制圖、物理制圖及DNA測序。功能基因組學認識、分析整個基因組所包含的基因、非基因序列及其功能。比較基因組學比較不同物種的整個基因組,增強對各個基因組功能及發育相關性的認識。基因組學概念十
比
較
基因組學
概
念·
定義:
比較基因組學(Comparative
Genomics)是
基于基因
組圖
譜
和
測
序
基
礎上,
對已知的
基因
和
基因組結
構
進
行比較,
來了
解
基因的功能、表達
機
理
和
物
種
進
化的
學
科
?!?/p>
研究內容:
種間的比較基因組學和種內的比較
基
因組學十全長cDNA預測序15%,工作草圖90%,全長100%第22號染色體
第21號染色體ESTs微星遺傳圖物理圖轉錄圖序列圖遺傳圖物理圖轉錄圖序列圖全長cDNA預測序SNPs細菌基因組H.m線蟲果蠅擬南芥小
鼠
人類其它基因組39個物種大腸桿菌釀酒酵母微星SNPsESTs1、
通
過比較
確
知
其
功能的
。2、
在數據庫中有相匹配的蛋白,但不知道其
功能
。3、在現有的數據庫中找不到任何相匹配的蛋
白質序列的新基因。十2、BLAST3、CLUSTAL基
因
組
分
類
:工
具
:概念1、FASTAW物種完成年份總長度/Mp已完成總長的百分數/%占常染色質百分數/Mb基因數/Mb酵母19961293100483線蟲19989699100197果蠅20001166497117擬南芥200011592100221人類第21染色體200034751007人類第22染色體199934709716人類全基因組(Public
Sequence)20012693849012人類全基因組(Celera
Sequence)200126548399-9315基本完成DNA序列分析的真核生物基因組比較V28
V29-1O
10
20(B)
酵母GLKI
SRO9
HiS4FUSIO
IO20(C)玉米O
1O
20(D)
大
腸
桿
菌thrB
IS186
ISlthrA
thrC
dnaKO
10
20KEY外
顯子
假基因TRY430AGPI
C3.0Adhl-F30CarB30重
復序
列部分真核、原核生物基因組成成份分析(A)
人類50
kb50
kb50
kb50
kb40404040BUD3TRY5fixATy2·例子:·尿殖道支原體帶有已知最小的基因組,可依此確定能自我復制的細胞必需的一套最少的
核
心
基因
?!ち鞲惺妊獥U菌的基因組為1.83MB,尿殖道支
原體的基因組只有0.58Mb,
二者相差3倍多
,
那么,基因組是大小影響了基因的數目還
是
基因的
尺
度
?通
過
基
因
組
數
據
進
行
比
較
基
因
組
學
研
究十●流感嗜血桿菌的基因大小平均900bp,尿殖道支
原體的基因為1040bp,他們基因大小差不多·流感嗜血桿菌中平均1024bp有一個基因,尿殖
道支原體平均1
235
bp有一個基因?!そY論:
基因尺度減小并不引起基因密度的增加
和基因本身尺寸的減小。二者的差別在于基因數量上,流感嗜血
桿菌基因有1743個ORF,而尿殖道支原體只有
4
7
0
個ORF十比較基因組有助于解決進化距離問題十激火譬測
序
技
術
與比
較
基
因
組
學閻永偉十比較基因組學是在基因組圖譜和測序的基礎上,利用某個基因組研究獲得的信息推測其他原核生
物、真核生物類群中的基因數目、位置、功能、表達機制和物種進化的學科。該學科的發展及所取得的成果與序列的積累相同步,尤其是人類全基因組序列的分析與比較使
比較基因組學成為整個生物學領域最新、最重要、進展最快和影響最大的學科之一。H1.
已完成的測序比較基因組學從一開始就是人類基因組計劃的
一
部
分。人類基因組計劃的原始計劃是測定人類和一部分模式生物(如細菌,酵母,果蠅,秀麗隱桿
線蟲,小鼠等)
的全基因組序列。十2010年全部完成Lander
et
al.2005
;Waterston
et
al.
2002;Gibbset
al.
2004;Adams
et
al.2000
;Blattner
et
al.
1997Goffeau
et
al.1996Dehal
et
al.2002,Small
et
al.2007;Stain
et
al.2003,Stein
et
al.
1998
。HomoPanMusRattussapienstroglodytesmusculusnorvegicusDrosophilamelanogasterEscherichiacoliSaccharomycescerevisiaeCaenorhabditiselegansCiona
intestinalisHGP
完成
以后
:Gallus
gallusBos
taurusCanis
familiarisApismelliferaAnthocidaris
crassispinaMacaca
mulattaBlattner
et
al.2004
,Elsik
et
al.2009,Lindblad-Tohetal.2005,Lindblad-Toh
et
al.2006,Sodergren
et
al.2006Gibbs
et
al.
2007蜜蜂紫海丹恒河猴十雞
牛
狗InEntrez
Genome,1000
completeProkaryoticGenomes
are
available!Archaea91
3
pclah
mid
somessosmroEukaryota1335
chromosomes7
lasor
aidnsellesp7Eukaryota2483BacteriaWiroids41Viroids41Total
records(12518)Total
species
(6621)統
測
計
序完成情況Viruses3703chromosomesViruses2423Plasmids40plasmidsPlasmids
39Bacteria25462135Archaea15331022.測
序
技
術
概
述絕大多數生物的遺傳物質為DNA,然而遺傳信息卻僅僅由四種堿基——A,T,C,G
排列組合而成。自從DNA的雙螺旋結構被發現以后,能夠知道DNA分子上四種堿基的順序就成為了一個新的熱點。于是,繼蛋白質和RNA測序之后,又出現了DNA
測
序
。十自1977年出現DNA測序技術至今,第
一
代
測
序
技
術第
二
代
測
序
技
術第
三
代
測
序
技
術十(1)測序技術的出現及第一代測序技術1)測序技術的出現1975年,
Sanger
和Coulson
發明了“加減法”測定DNA序列;
1977年,又引入ddNTP,發明了雙脫氧終止法;1977,Maxam
和Gilbert發明了化學降解法測定DNA序列。十DNA題合牌4Klenaw)dNTP1
物—CH?O
t(A..G.T-)H
H
ddNTP一CH?O
R&(A.C.G.T.)H
HddNTPFig1.
雙脫氧終止法測序①T
T②ACG
T
A
A
A
TCGAT
ACG
TAA
G
A之
應
應ACGT
A
A
T
C
aA
C
A
dd
Add.AddA
1dd
AddATPddCTP
ddGTP
ddTTP己ddATP
ddCP
ddGTp
ddT
TP模極DNA標
記
引物十ToTTeoTTtoaTDNAH〇2)第
一
代
測
序
技
術傳統的化學降解法、雙脫氧鏈終止法以及在它們的基礎上發展來的各種DNA測序技術統稱為第一
代DNA測序技術。第一代測序技術在分子生物學研究中發揮過重要的作用,如人類基因組計劃主要基于第一代DNA
測序技術
。十目前基于熒光標記和Sanger
的雙脫氧鏈終止法原理的熒光自動測序儀(如ABI
3730XL)仍被
廣泛地應用。雜交測序技術也是第一代測序技術,但是并非基于以上兩種原理。速度快,但是誤差大。十Fig.2ABI
3730XL十(2)第二代測序技術后基因組時代亦即功能基因組時代的測序技術,顯著特征
是
高
通
量、
低成
本
。主要包括羅氏454公司的GS
FLX測序平臺、Illumina
公司的Solexa
Genome
Analyzer測序平臺和ABI公司的SOLiD測序平臺。十Fig.3Roche454GSFLX
平
臺十m;cnd
PRm=FAB+PCR
Reagents
*Emulsion
olBreakmicrocextorsate
DMA
sontainng
be
adsGensrate"waterin-oil'*mulsionmiero
e3ctorsPertermemuision
PCRCapture
beadswthinmiao-L**40NAbead
into
PeermerPie**a
dapterEadaptarAnneal
ssDA
Captuetemplate
te
EeadsL*Bd
fntyme*XXreadorsHprldormif
BSSDNA
LDray又又isol889AFig.4
lluminaSolexa
平
臺十Extend
first
base.read,and
deblock中
e
r
ve↓<
Generate
base
calsandaboextend
stpeat
steptoRFragmentDNARepair
ends◎
Solect
ligated
DNAAddA
overhangO
Ligate
adapters3
SEQUENCING1-3days
single-read
run30minutes
hands-on
time8
po
(
n
amplernu96eltoerflowanes,uPlG
Attach
DNA
to
flow
celllGPorform
bridge
amplifcationGenerate
clustars
LIBRARY
PREPARATION6houms3
hours
hands-on
time2
CLUSTERGENERATION
4
hours30minutes
hands-on
timeCD—+3-7days
Paired-end
run4Annealprimersequencing↓△十,→Fig.5
ABISOLiD
平臺十Raad
Position0123S6T910111212151617e192021222242526272829381
Unnereal
sog
primer
(n)3er2Univogal
*9primor
in-1
TrrnTmrT)Univorsal
seq
pnmar
(n-2)
3errret4Unversal
seq
prmar(n-3)3
mmmsUnwersal3seq
prmer
ln-4)rrrrm3-
#e:s
C--=Primr35Adap'ar3”,Baad
—5.aIndfcareaponitionaofintenogatknLigatkonCreie?寫3,Baad-—5SaquengeTamydyteSanueneeSequencelenplteSecueneeCHeavage-*mGT5
和的
中
的
的第2E06…101056……83Tonplite
Sequanca-
3'-C-AH0-0-GT山忙SaquanoePrinwerAdageerAdapter貌
猶noPPnmerBead分-FEm-333測
序
技
術454SolexaSOLiD上
市
時
間200520072007價
格
(
萬
美
元2
0
0
7
年
)504.559單次反應數據量(G)0.42050讀
長
(
b
p
)40050×250優
勢長
讀
長低
測
序
成
本
,
高
性
價比高
通
量
,
高
準確度參考
文
獻
:DNA測序技術的發展歷史與最新進展,解增言等
; DNA測序技術發展及其展
望
,孫
海
汐
等
。表
1
三種第二代測序技術對比(3
)
第
三
代
測
序
技
術以
單
分
子
測
序
為
特點
;如:
BioScienceCorporation的HeliScopeSingleMolecular
Sequencer;
Pacific
Biosciences的SingleMoleculeRealTime(SMRT)DNAsequencingtechnology(正在研制);Oxford
Nanopore
Technologies
Ltd的納米孔單分子測序技術。中科院北京基因組研究所,2013年,第一
臺國產樣機十3.
測
序
技
術
與
比
較
基
因
組
學4.
DNA測序已經成為分子生物學研究中一
種基本的研究手段與工具,對于這種手段的需要也
已經極大地促進了DNA測序技術的進步與發展。5.
在此基礎上,將會有更多的生物的全基因組序列被測定,那么針對任何一種生物的比較基
因組學研究將會變得更加簡單。十沒
大
譬基因組序列分析的計算方法1.
引
言2.
點
陣
圖3.兩
序
列
比
對4.多序
列
比
對5.數據庫搜索朱
琳十人類基因組計劃(
HGP)遺傳圖、物理圖、序列圖和轉錄圖區分兩個概念:同源性---------共同的祖先相似性---------定量特征高度相似很可能是同源序列;相似性很低的序列也可能具
有同源序列引言十ACTGTTAGAOCOTQ⊙⊙T⊙⊙⊙TQ⊙○A⊙G⊙C⊙點陣圖A
C
T
G
T
T
A
GI
l
HA
C
T
-
T
T
A
G面臨的問題:進化的過程中同源序列可經過多次的插
入或缺失,導致它們長度不同,這就給比對
帶來了麻煩。要解決的問題:最優比對算法-----尋找最佳的缺失方式使比對序列的相似度達到整體最大兩
序
列
比
對十Needleman-wunsch全
局
比
對
算
法首先構建具有m行n列的矩陣M,
根據殘基配對的函數,給每個矩陣單元格賦值,將矩陣初始化。再進行變換操作,
規則是將某單元格右下方路徑中的最大值疊加到該單元格即M(I,j)=M(I,j)+max[M(i+1,j+1);M(i+1,j+2,...,jmax)-gappenalty;M(i+2,.,imaxj+1)-gap
penalty]使用最簡單的打分系統進行比對,殘基相同時分值是1,
不同時分值為0,空位罰分。此外還有Smith-waterman
算法十基因組比對只能對序列密切相關或非常相似的基因
組比對,序列太長,既有的算法無能為力方法:suffix
tree
數據結構軟件MUMer
能找出兩個基因組的DNA序列
上最大且唯一的匹配區域,然后除去序列中用Smith-waterman
最佳局部比對算法對大量插
入序列、重復序列、短變異區域進行局部鑒定時插入的空位,完成這兩個基因組序列的比對。十三條或多條序列的同時比對是序列的分析中最常用的技術之一。通過一系列同源序列的全局比對來實現的遞進法:
基本思想是同源序列與系統發育相關。具體步驟:1、比對所有可能的序列對。2、用相鄰連接法使用兩兩比對的相似度分值構建(tree)。
3、
這種樹用于指導遞進的多序列比對。多序列比對十DGenomeAnalysesGBGenomeinfomation
brakerGIB-VGB
far
WrusesGTPSRearnotaticn
pf
bacterial
genomes
using
a
nen
oammonprotocolGTOPGenometopratein
structure
and
functimDNextGererationSequenceAnalysisDDBJ
ReadAnnotation
PipelineHish-trro.ehputdataaralysisafnexteeneraticnseq.ence
eta
(Login
D
is
requirsd)getentryData
retrieual
by
aocess
on
numbers,etc.ARSAAll-TourdRetrievalofSequence
and
AmotatinIXSearchRetrieval
of
unified
taocromg
datataseBLASTHomologySearchDDBJVectorScreeningSystem】PhylogereticsClustalWMultple
alenment
and
Tree-making數據庫搜索Ddtabases
ToolsENAHomBEMEL-Bank
HomeAoasSDocumentalion1NewsSubmissiorPublicalionsn
PeoplemContactEMBL
FetchFechanEMBL
recond
byidGo三大核酸數據庫:GenBank、
EMBL、
DDBJResourcesNCB
HomeA
Resources(A-Z)Chemicals8
BipassasData&SotwseDNA8RNADomains&StucuresGenes8
Eypression
Geneics
&MedaneGenomes8WapsHomologrLteraturePrateinsSequenceAnalysisTavnampTrairing&TutoriasAccessionDNf
FroteinAllDesIaxonomrSiteSearchAccessionnumbersGo@oveJ
unFrotOrceOovoOrre
FNent
>>mseFTP/WebAF]
Repart/Statistics
Cantact
Le
)
naneseSequenceRDATAEEioSysterDaiGenBankThethe
the
adThecatInfuenzaPresetputEB|>EMThe
EEuno;
sequsequThe
t
the
D
TepordailyUefAputThe
Eby旦8NCBINaiorslCemterfarBiotedhnolbgy
htormaticnen
Rest
Q
Cheus.DDBJDNA
Data
Bank
ef
JapanALDatanasesNCB
ResoucsHOMESubmissicnHowtollseEntarTaxtHereHwToHOME>Search
and
AralysisBLBSearch/Analysis思能
SDatabaseSearchSearh
Al
Daiatast數據庫搜索使用的最廣泛的算法:FASTA算法和BLAST算法。FASTA算法運用一種包括四個連續階段的
啟發式方法來檢測被查序列與一組序列是相
似性
。BLAST
算法采用非??斓乃惴▉聿檎覕祿?/p>
庫中與預查詢序列最相似是序列?;舅枷?/p>
是:兩個同源序列即使有很大的差異,也有
可能共有高分值的相似片段,這使我們可以理解可靠的區分相關和非相關的序列。十蛋白質序列分析對新蛋白質序列進行分析的第一步是用BLAST進行數
據庫搜索。●如果有明顯相似性可以推測其序列的功能●如果沒有,可用模式識別方法根據特定的結構域或蛋白
質家族的特征進行搜索。-----模式數據庫已經成為識別新序列的特
定功能活性的重要工具。
InterPro數據庫是最重要的蛋白
質模式數據庫之一。十此外還有·蛋白質信號肽的識別及亞細胞定位的預測
·預測卷曲螺旋和螺旋-轉角-螺旋結構·蛋白質折疊的識別與分類等十沒火譬種內比較基因組學
模式生物姜南十·種內基因組的比較·同種群體內基因組存在大量的變異和多態性,正是這種基
因組序列的差異構成了不同個體與群體對疾病的易感性和
對藥物與環境因子不同反應的遺傳學基礎。十·
我總結了:·凡是能夠用來研究同一種群內兩個個體基因組的不同的分
子手段都屬于種內比較基因組學的范疇?!ぶ髁鞣椒ㄊ欠肿訕擞浖夹g:RAPD,RFLP,AFLP
,基因芯片。。?!?/p>
回顧分子標記十水
產
界
舉
例·李太武老師等用20
條隨機引物對皺紋盤鮑、雜色鮑進行
RAPD分析,結果均能產生清晰可重復擴增產物,計算出各
群體擴增位點的多態性比例分別為43.66%和53.05%,
群
體平均遺傳雜合度分別為0.1557
和0.1686,
群體間的遺傳
距離0.2898,
表明皺紋盤鮑與雜色鮑的親緣關系較遠。十模
式
生
物·基因進化上的保守往性和遺傳密碼的通用性,從某一生物
得到的有關基因性質或功能方面的信息往往也適用于其他
生
物?!€體小,易操作,易培養,繁殖快?!げ《?,大腸桿菌,酵母,線蟲,果蠅,斑馬魚,小鼠,擬
南芥十
沒火譬種間比較基因組學研究馬壽光黃繼十通過對不同親緣關系物種的基因組序列進行
比較,
能夠鑒定出編碼序列、非編碼調控序列
及給定物種獨有的序列。而基因組范圍之內的
序列比對,可以了解不同物種在核苷酸組成、
同線性關系和基因順序方面的異同,進而得到
基因分析預測與定位、生物系統發生進化關系
等
方
面的
信
息
。十·1
全
基因組的比較研究·
2系統
發
生的
進
化
關系
分
析十·比較基因組學的基礎是相關生物基因組的
相似性。兩種具有較近共同祖先的生物,它們之間具有種屬差別的基因組是由祖先
基因組進化而來,兩種生物在進化的階段
上越接近,它們的基因組相關性就越高。如果生物之間存在很近的親緣關系,那么它們的基因組就會表現出同線性(synteny),
即基因序列的部分或全部保守。1.全基因組的比較研究十·
Synteny可以
這
樣
假
設
,
人
與
小鼠
或
其
它
哺
乳
動
物有一個共同的祖先,在漫長的進化中,
染色體發生斷裂,重排,加上基因內部的
變
化,
成
為
各
種
不
同
的
物
種
。
但
是
未
發生斷
裂
重
排的
完
整
片
段內
部的
基因
組
織和連鎖順序在不同的物種中保持不變,這就是synteny,是
基因組比較作圖
的
基
礎
所
在
。十·在各種不同的物種中,絕大多數的核心生物功能是
由相當數量的orthologous蛋白承擔,所謂or-thologous蛋白就是一些在不同物種中有共同祖先
的蛋白質。在不同的物種中這些蛋白的數量十分
相似,它們主要是在生物體中執行中介代謝,DNA,RNA
代謝,蛋白折疊,trafficking,和降解的
功能。在較為復雜的生物中,隨著功能不斷地復雜,
就會出現許多蛋白以執行其復雜的功能,而維持最
基本生命活動的蛋白是保守的。兩種物和中蛋自
總數上的差別是由承擔各自特有任務的蛋白數目的不同而造成的。十·
可以
利
用
模
基因
組
之間
編
碼
順
序
上
和
結
構
上的同源性,通過已知基因組的作圖信息
定位另外基因組中的基因,從而揭示基因
潛在的功能、
闡明物種進化關系及基因組
的內在結構。十·人類與多個靈長類動物的比較基因組學研
究,在闡明靈長類特異基因調節元件和劃
分多基因的外顯子方面顯示出了很大的優
勢
?!ち帜究膳c擬南芥(已經獲得了全基因組序
列,
一些基因的功能已被注釋)和毛果楊
等功能基因組研究較深入的物種進行比較
基因組學研究,這將為林木上相關基因功
能的研究提供便利。十·生物最本質的特征是進化,
比較基因組學同樣以進化理論作為理論基石,
同時其研究結果又前所未有地豐富和發展了進化理論
。·當在兩種以上的基因組間進行序列比較時,
實質上就得到了序列在系統發生樹中的進化關系?;蚪M信息的增多使得在基因組
水平上研究分子進化、基因功能成為可能。2.
系統發
生
的進
化
關
系
分
析十·通過對多種生物基因組數據及其垂直進化、
水平演化過程進行研究,就可以對與生命
至關重要的基因的結構及其調控作用有所
了解。但由于生物基因組中約有1.5%~
14.5%
的基因與“橫向遷移現象”有關,
即基因可以在同時存在的種群間遷移,這
樣就會導致與進化無關的序列差異。十·
橫向遷移現象·對人類基因組的分析發現,有幾十個人的
基因只
與
細
菌
基因
相
似,
而
在
果
蠅、
線蟲
中都不存在。如果以人的這些基因序列來
研究進化將會得到荒謬的結論。所以在當
前的分子進化研究中必須選擇垂直進化的
分子作為樣本。并且在系統發生分析中需
要建立較完整的生物進化模型,以避免基
因轉移和欠缺合適的多物種共有保守序列
的
影響
。十·
Z
曲線的GC
輪廓圖方法·基因組序列變換為等價的三維空間曲線——Z
曲
線,經過適當的投影和座標旋轉后得到Z’曲
線,后者又稱為累積GC
輪
廓
圖(
CumulativeGCprofile)
。定
義:在基因組某一堿基處的G+C含量正比于Z’曲線在該點切線的斜率。而在某一窗
口中的平均G+C含量則正比于此量在該窗口內的
定積分
?!τ谌我唤o定的DNA
序列,有唯一的一條Z
曲線
與之對應;反之,給定一條Z
曲線,它所代表的
DNA
序列可以唯一地導出。因此,
Z曲線攜帶了
DNA
序列的全部息。對兩個基因組或染色體序列
的比較,可以通過對它們所對應的Z曲線的比較
來進行?!ぴ谘芯课锓N間的進化關系時,傳統的分子進化研究方法一
般選取一個大分子(如16SRNA)
的序列為標準,研究其在各個物種同源序列之間的差異,并以此構建進化樹。但
是
一個物種的基因組編碼了成千上萬個序列,以其
中一個序
列的差異來代表整個生物體的差異是不全面的。因此,從
全基因組的水平來研究生物的進化應該更為合理。利
用
較基因組學的方法在基因組水平上構建的進化樹將會更加合理的闡述物種之間的進化關系。十·物種序列的優化選擇:當在比較
40~80
My
進化距離的DNA
序列時,其編碼序列與一
些
重
要
的
非
編
碼
序
列
將
是
保守
的,如人與鼠。然而至今在這一進化距離內保守的非編碼序
列中只有少數被鑒定為有特征性的功能元件,其它的僅被認
為是臨近或
200
kb
附近基因的轉錄調控元件。在進化距離
較遠(
450
My)
的序列比較時,將主要揭示保守的編碼序刻
主要是因為蛋白質要維持其功能,因此對替換更為嚴謹保需進化的稍慢一點。所以在建立多序列比較時加入一支稍遠的物種序列(
450
My
)將提高保守序列的鑒別能力。比較分析較近的物種序列如:人與himpanzees或與其它的類人
猿可以用來鑒定在近期進化史上發生的基因改變和重組等。
因此在建立多序列的比較分析中加入一支近距離的物種序
列不僅有助于編碼和非編碼的功能序列的譚制,也能揭示那
些相關物種特征的基因組信息、十·在進行
DNA
序列比較而鑒定保守序列時,有兩種比較分析手段:局部比對和整體比對。局部比對是對序列亞區分析獲得最高一致性的計算方法,其基本原理是在兩序列排隊時采用不同的比對方法,排除了從頭到尾的單一匹配方式。例如當兩長序列進行匹配時,可能內含的同源基因亞區的排列順序或基因的走向不同,因此對這種比對采用多種方式進行搜索分析的結果將比較準確,常用的分析工具是PipMarker服務器。整體比對是尋找所要比較的整個基因序列上的最大的同源性分值,它適用于高度分化但組織結構同源的序列比對,整體比對適用于基因序列整體上同源性較高的比較分析,如保守片斷(
conserved
segments)的比對,可以使用
VISTA
進行分析。十Smith-Waterman算法時間復雜度O(n2);·Sij
=maxof(xi,yj)左到右)
上到下)·本例中:gap:d=12
,線性罰分模型。十例
5:
Smith-Waterman
算
法進行雙序列局部
比對·
兩
條
序
列
如
下
:工
D
SCHG
ES工C
K□目標:使用局部優化算法尋找比對的結果十例
5
:Smith-Waterman
算
法進行雙
序
列
局
部比對·兩條序列如下:工
D
S
C
HG
E
S
工C
K□目標:使用局部優化算法尋找比對的結果十Smith-Waterman算法Gap
L
D
S
CHGap0
0000G
0E
0
Smith-Waterman算法;S
0
Dij
=
max
oiL0C
0K
0十GapLDSCHGap00000GOE0S0L0C00Smith-Waterman算法GapLDSCHGap0O0G0E0SOL0C00Smith-Waterman算法GapLDSCHGap0000OOGO00000E00200OSO02○OOL04O50C0010920O008Smith-Waterman算法GapLDSCHGap00O0O0GO00000E00200SO06OLO4O50C0O12K0O0O8
局部比對結果:
工
D
S
C
H
G
ES
工C
K局就代化比對。十二·
中性突變與隨機漂移學說的核心就是認為大部分對生物種群的遺傳結
構與進化有貢獻的分子突變在自然選擇的意義上都是中性或近中性的,
因而自然選擇對這些突變并不起到篩選的作用。中性突變產生后是通
過一代一代的隨機漂移,或者被固定在種群中并占有一定的比例,或者消失。
生物種群內的遺傳多樣性,如蛋白質(酶)以及DNA的多態
性,都是通過這類中性或近中性突變的隨機漂移而產生的。中性理論并不是說所有突變都是中性的,實際上,相當大的一部分突變是有害
的,這一部分突變具體有多少與有關分子本身可容許的變化程度有關。
有害的突變產生后,會影響攜帶這些突變的蛋白質以及基因的正常功能,影響生物的生存與繁殖,因此很快就會被淘汰掉,從而在進化上是沒有意義的。另一方面,對生物有利的所謂正突變其實是很少的,從而對種群的遺傳結構也沒有什么貢獻,不能說明分子進化中的多態
性現象。
自然選擇只對那些對種群的遺傳結構并不重要的有變和
正突變起作用,卻不能決定對種群的遺傳結構起重要作用的中性或近
中性突變的命運,中性或近中性突變的命運是面隨機因素決定的。因此,又可以把中性理論看作是一種“幸運者生存”的學說。1
·
3從模式生物基因組研究中得出一些規律·
3.1模式生物基因組一般都比較小,但是編碼基因的比例較高,重復順序和非編碼順序較少,是一些“壓縮”的基因組·
3.2模式生物基因組的G+C%比較高同時
CpG
島的比例也比較高。Fugurubripes的G+C
%時44·2%(這是脊椎動物種最高的),而人類則是
40·3%。這可能是因為低等生物中編碼順序的比例比較高,另一個原因
與模式生物的密碼子第三位的堿基選擇有關?!?/p>
3.3模式生物的基因組中,內含子和外顯子的結構組織比較保立勇切應
點在多種生
中
一致。這是Fugu
rubripes和現有的哺乳動物的基因組
順序比較的結果·
3.4在幾種模式生物都發現了重復(duplication)。
同時存在兩份或兩份以上的順序一致或十分相似的編碼蛋白的DNA
順序,稱為冗余。理解
重復的真正本質是闡明基因組中基因生物功能和物種進化的前提。·
3.5生物體的復雜性一般表現在“生物學”的復雜性,與基因組的
C
值
大小及基因數量未必一定呈線性關系。十·首先比較基因組學建立的基礎是功能元件由于選擇的作用
其進化的速率稍慢一點,這有背于中性理論;其次在序列的
比較中對保守區域的thresholds(length
and
percentidentity)的選擇還沒有一套有效的方法,往往兩個物種不
同區域的thresholds
各異十比較基肉組學的應用揭
示
非
編
碼
功
能
序
列發
現
新
基
因發現功能性SNP闡述物種間的進化史闡
明
人
類
疾
病
過
程
的
分
子
機
制李春麗十古細菌---產甲烷球菌●
與原核生物共同之處:1染色體組織與結構:環狀基因組、基因的操縱子結構等
2能量產生和固氮基因與細菌基因有很高的同源3與細胞分裂有關的蛋白質、20多個編碼無機離子運輸蛋
白的ORF與細菌基因同源4調控模式類似于原核生物●
與真核生物共同之處:1
細胞遺傳信息傳遞,尤其是轉錄和翻譯系統
2分泌系統●說明該細菌與真核生物親緣關系較近。比較基因組學與進化十·
比較基因組學提供的結果表明,在進化系統樹上,
古細菌與真核生物親緣關系比原核生物更近?!?/p>
自養生物的三個分支,細菌、古細菌和真核
生物中,細菌的分化發生較早。比
較
基
因
組
學
與
進
化十比
較
基
因
組
學
的
具
體
應
用
方
法
和
策略·序列的比對分析·
確定基因組序列的進化關系·基
因
共
線
性synteny:·染色體片段的分析·物種序列的優化選擇·
對DNA
序列的信息注釋◎
比較基因組學研究舉例·
原核模式生物比較基因組學·
釀酒酵母基因組·
人類基因組十@
模
式
生
物
比
較
基
因
組
研
究
特
點●1模式生物基因組一般都比較小,但編碼基因的
比例較高,重復序列和非編碼序列較少,是
“壓
縮”的基因組?!?模式生物基因組中G+C%
含量高,同時CpG
島
的比例也比較高?!?/p>
3一些模式生物,特別在人的基因組中發現了重
復
。●4各種不同的物種中,大多數重要生物學功能是
由相當數量的同源序列基因蛋白承擔?!?/p>
5同線(syn
teny)連鎖的同源基因在不同物種基因
組中有相同連鎖關系。十@模
式
生
物
基
因
組
的
研
究●尿殖道支原體是已知最小的基因組0.58Mb
,由此可能確
定能自我復制的細胞必需的一套最少的核心基因。●
流感嗜血桿菌的基因組為1.83Mb流感嗜血桿菌基因大小平均900
bp,
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經權益所有人同意不得將文件中的內容挪作商業或盈利用途。
- 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
- 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 9 正確認識廣告 教學設計-2024-2025學年道德與法治四年級上冊統編版
- 3《學會反思》(教學設計)-部編版道德與法治六年級下冊
- 精神心理科普知識
- Unit 8 Wonderland-Further study 教學設計 2024-2025學年譯林版(2024)英語七年級下冊
- 11 ao ou iu 教學設計-2024-2025學年一年級語文上冊統編版
- 絲路的故事(教案)-2024-2025學年人教版(2024)美術一年級下冊
- 血透護理管理規范
- 七年級信息技術上冊 第3課 計算機的發展與應用教學設計 川教版
- 貝爾安親培訓
- 出版專業職業資格《出版理論與實務》測試題庫(含標準答案)
- 大型機械設備進出場及安拆施工專項方案
- 創維電視機E710U系列電子說明書
- 質量為綱-華為公司質量理念與實踐
- 醫院抗菌藥物臨時采購使用申請表
- 高考英語核心詞匯1000個
- 2024-2030年中國多重耐藥菌治療行業市場發展趨勢與前景展望戰略分析報告
- GB/T 4706.66-2024家用和類似用途電器的安全第66部分:泵的特殊要求
- 2023-2024學年河南省安陽市殷都區八年級(下)期末數學試卷(含答案)
- GB/T 35607-2024綠色產品評價家具
- CJJT153-2010 城鎮燃氣標志標準
- 急救藥品、物品交接記錄
評論
0/150
提交評論