基因家族分析_第1頁(yè)
基因家族分析_第2頁(yè)
基因家族分析_第3頁(yè)
基因家族分析_第4頁(yè)
基因家族分析_第5頁(yè)
已閱讀5頁(yè),還剩53頁(yè)未讀 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

基因家族分析——挖掘與物種特性相關(guān)的生物學(xué)問(wèn)題張

龍華中農(nóng)業(yè)大學(xué)&廣東省農(nóng)科院2539570165@qq.cm基本內(nèi)容一、獲取目標(biāo)物種基因二、目標(biāo)物種基因基本信息的獲取(命名、理化性質(zhì)、亞細(xì)

)●蛋白物理化學(xué)性質(zhì)分析/protparam/●亞細(xì)胞定位ttp://www.csbio.sjtu.e/bioinf/plant-multi/#一般將以上信息匯總在一張

表格中在文章中展示。alP/三、構(gòu)建系統(tǒng)發(fā)育樹(shù)——構(gòu)建、評(píng)估、解讀1、構(gòu)建·

序列比對(duì),選擇保守區(qū)域·

有根樹(shù)or

無(wú)根樹(shù):一般由于信息不足,采用無(wú)根樹(shù)·

建樹(shù)方法的選擇:NJ

法(常用,遠(yuǎn)緣)、ML

法(進(jìn)化模型)、MP

(近緣)等2、評(píng)估自展檢驗(yàn)(Bootstrap

method)法,檢驗(yàn)次數(shù)一般1000次,可將分支上的

百分?jǐn)?shù)視為這支結(jié)果的可信度。三、構(gòu)建系統(tǒng)發(fā)育樹(shù)——構(gòu)建、評(píng)估、解讀3、解讀闡明系統(tǒng)進(jìn)化關(guān)系。注意:系統(tǒng)發(fā)育樹(shù)并不能

確切指示進(jìn)化方向FpTPS1pTF

S120eGpTPS

522GppsiAGo輸入的序分7進(jìn)化關(guān)系,數(shù)字是評(píng)估,長(zhǎng)度是進(jìn)化距離亞家族分類ss2四、染色體定位分析1、基因主要分布于哪條染色體?2、是否能形成基因簇?基因簇的形成一般與基因家族的來(lái)源和特定功能有關(guān)。T

patop名言名名的

師0pToptmTPS4五

、motif分析(保守基序分析)在文章中,motif

分布圖通常與基因家族進(jìn)化樹(shù)合并,這樣有助于直觀查看不同分支保守和特異性motif。如果對(duì)某些motif

感興趣,還可進(jìn)一

步用CDD注釋motif

功能。可見(jiàn)每一推測(cè)同一亞家族成員有類似的功能亞家族成員中Motif

組成和

排列順序的與功能相關(guān)六、基因結(jié)構(gòu)分析了解基因家族成員的基本分類信息、提供對(duì)某些基因家族內(nèi)進(jìn)化關(guān)系的見(jiàn)解。在文章中,基因結(jié)構(gòu)圖通常與基因家族進(jìn)化樹(shù)合并,這樣有助于直觀查看不同分支在基因結(jié)構(gòu)上的保守性和特征。同一亞家族成員的基因結(jié)構(gòu)是否類似,反證建樹(shù)是否可靠。UTR(非編碼區(qū)、內(nèi)含子組)、CDS

(編碼區(qū)、外顯子組)數(shù)量與基因結(jié)構(gòu)、功能有關(guān)七、基因復(fù)制和共線性分析闡明目標(biāo)物種基因家族的潛在進(jìn)化機(jī)制,有無(wú)串聯(lián)重復(fù)和大片段復(fù)制。研

究目標(biāo)物種和其他物種基因家族成員之間的直系同源對(duì)關(guān)系。一般來(lái)說(shuō),基因長(zhǎng)度和相似性大于70%則為基因復(fù)制;兩個(gè)重復(fù)基因的物理間隔小于100kb

且被少于5個(gè)基因分隔,則為串聯(lián)重復(fù)基因。紅線越多,直系同源基因?qū)υ蕉?,親緣關(guān)系越近,基因功能越相似紅色:高表達(dá)藍(lán)色:低表達(dá)一般有以下幾種類型:·不同組織表達(dá)分析:根、莖、葉·不同時(shí)間表達(dá)分析:1d、2d、3d·不同處理表達(dá)分析:干旱、鹽堿、水漬

明確基因家族的表達(dá)情況八

、基因表達(dá)分析基因家族的表達(dá)分析與基因功能的關(guān)系最緊密九、啟動(dòng)子分析獲得基因家族功能相關(guān)的上游調(diào)控通路或因子,或響應(yīng)的上游信號(hào)。是否含有某些脅迫響應(yīng)順式元件或激素響應(yīng)相關(guān)的基因。十、其他分析1、蛋白互作網(wǎng)絡(luò)分析:·分析家族成員之間的蛋白互作情況,分析是否需要形成同源或異源二聚體或多聚體來(lái)發(fā)揮功能;·

目標(biāo)基因家族蛋白發(fā)揮作用時(shí)是否需要和其他蛋白形成復(fù)合體;·分析目標(biāo)基因家族蛋白的上下游互作調(diào)控蛋白,比如轉(zhuǎn)錄因子通過(guò)結(jié)合基因啟

動(dòng)子來(lái)調(diào)控基因表達(dá),或者激酶通過(guò)蛋白互作磷酸化該蛋白從而進(jìn)行信號(hào)轉(zhuǎn)導(dǎo);·可以靶向下游基因發(fā)揮作用,比如酶催化底物蛋白進(jìn)行生化反應(yīng)等2、蛋白domian

比對(duì)分析和可視化3、蛋白3D結(jié)構(gòu)分析和可視化4、基因家族特殊結(jié)構(gòu)域分析基因家族分析簡(jiǎn)明教程1、獲取目標(biāo)物種基因2、目標(biāo)物種目標(biāo)基因家族鑒定3、基因家族成員理化性質(zhì)分析4、亞細(xì)胞定位預(yù)測(cè)5、染色體定位分析6、系統(tǒng)進(jìn)化分析7、基因結(jié)構(gòu)分析8、motif分析9、啟動(dòng)子分析10、基因共線性分析11、其他分析目

錄已超鏈接,點(diǎn)擊跳轉(zhuǎn)1.基因家族的鑒定·1.1獲取參考基因組信息NCBI(https://www.ncbi.nlm.nih.gov)在此輸入物種拉丁名+基因家族名稱如:TriticumaestivumTCP1.2獲取目標(biāo)物種相關(guān)基因組數(shù)據(jù)(

DNA,cDNA,CDS,Proteinsequence,Genesets(GTF&GFF3)等)——使用EnsemblPlants

數(shù)據(jù)庫(kù)http://plants.ensembl.org/info/data/ftp/index.htmlLoginRegister2

基因家族成員鑒定:hummer

鑒定在Pfam網(wǎng)站https:

//pfam.xfam.org

/下載隱馬爾可夫模型2

.2在Pfam

網(wǎng)站https://pfam.xfam.org

/下載隱馬爾可夫模型12.3

以下載好的HMM

模型向目標(biāo)物種基因組序列(蛋白)搜索,以篩選得到大

致的基因家族成員(候選基因)。hmmer程序/

下的子程序hmmsearch2.4.1將候選基因提交到

NCBI

中的

Batch

CDDsearch

Pf

am

數(shù)據(jù)庫(kù)比對(duì),驗(yàn)證是否具有目標(biāo)基因特征,刪除假陽(yáng)性基因。

首先是Batch

CDD

search。·打開(kāi)NCBI——CDD——batch—CD—search·輸入剛剛提取得到的蛋白序列,點(diǎn)擊Browse

result,全選序列:2.4.2再點(diǎn)擊show

selected

queries,查看蛋白結(jié)構(gòu)域?qū)⒉缓心?/p>

的基因家族結(jié)構(gòu)域的蛋白刪除,最后得到的蛋白序列即為該基因家族的序

列。或者使用TBtools

中的VisualizeNCBICDDDomainPattern

可視化結(jié)構(gòu)域圖。2.5.1Pfam數(shù)據(jù)庫(kù)驗(yàn)證比對(duì)(

http://pfam-

legacy.xfam.org/search)2.5.2.Pfam結(jié)果可視化2.6根據(jù)驗(yàn)證結(jié)果確定基因,除去以下序列,最終得到確定的基因序列·無(wú)典型結(jié)構(gòu)域·結(jié)構(gòu)不完整·冗余序列3.1

蛋白物理和生化特征分析,預(yù)測(cè)蛋白質(zhì)分子量、等電點(diǎn)、相對(duì)分子質(zhì)量、穩(wěn)定性等(/protparam/)。只輸入氨基酸序列即可,單個(gè)依次分析3.2

結(jié)果解讀ExpasyProtParamHomel

Contact Molecular

weight:29563.71

Theoretical

pI:6.124

亞細(xì)胞定位預(yù)測(cè)(http://wwW.csbio.sjtu.edu.cn/bioinf/plant-multi/#)5

基因位置分析及可視化6.

進(jìn)化樹(shù)構(gòu)建6.1

目標(biāo)物種基因家族文件與擬南芥等參考物種基因家族文件合并。

將兩個(gè)序列信息文件粘貼復(fù)制進(jìn)一個(gè)新的fasta

文件中即可6

.2

MEGA比對(duì),將新合并的fasta

文件拖入ME

GA軟件中,選擇對(duì)齊進(jìn)入。進(jìn)化樹(shù)構(gòu)建6.3

分析,完成后關(guān)閉當(dāng)前頁(yè)面網(wǎng)

Molecular

EvolutionaryGenetics

Analysis□

×File

Analysis

Help點(diǎn)擊建樹(shù)DATA進(jìn)化樹(shù)構(gòu)建6.4

建樹(shù),一般選擇NJ

法進(jìn)化樹(shù)構(gòu)建6.5

導(dǎo)出建樹(shù)文件,并保存。其他分析有用進(jìn)化樹(shù)構(gòu)建6

.6進(jìn)化樹(shù)美化(https://evolgenius.info//evolviewv2/#login)

-進(jìn)化樹(shù)構(gòu)建6、進(jìn)化樹(shù)美化。改變樹(shù)各部分顏色,可點(diǎn)擊下圖紅框框處查看官方詳細(xì)

配置說(shuō)明。具體參考文章https://WWW.csdn.net/tags/0tDaQg4sODkzNjQtYmxvZw0000000000.html添加顏色的分組信息,編輯模板如下:AT2G04880.1,AT2G30250.1blue

adAT4G01250.1,AT4G31550.1red

adAT4G39410.1,AT5G49520.1yellow

ad《7.基因結(jié)構(gòu)分析TBtools8

motif分析8.1

序列提取motif分析8.2

MEME文件提取(

/meme/tools/meme)motif分析8.3motif可視化9.啟動(dòng)子分析9.1

提取基因組文件中前2000bp

作為啟動(dòng)子區(qū)域序列啟動(dòng)子分析9.2

簡(jiǎn)化所提取的啟動(dòng)子區(qū)域序列TBtools

(Toolbox

forBiologists)v1.098774SequenceToolkitBLASTGO&KEGGGraphicsOthersAbout?RepotIHelp0區(qū)

Fasta

stats

區(qū)

sequence

Manipulate

(Rev&Comp)區(qū)

AboutTBtools區(qū)

GXFSequencesExtractFastaID

SimplifySeta

Input

Fasta

FileE:

研究生穿心蓮TCP\8啟動(dòng)子分析12000bp.fasta

目標(biāo)物種啟動(dòng)子序列信息Note:Ifthe

input

file

is

a

table,the

last

column

must

be

the

sequences.□Removeversion輸出文件SimplifyMy

Sequences"IDFile

OutputOutputTextAreaSetanOutput

FileE:研究生穿心蓮TCP\8啟動(dòng)子分析2000bp.simpliy.fasta啟動(dòng)子分析9.3提取目標(biāo)基因家族啟動(dòng)子序列信息啟動(dòng)子分析9.4反向驗(yàn)證提取序列是否是前2000bp啟動(dòng)子分析9.

5

將目標(biāo)基因家族啟動(dòng)子序列信息轉(zhuǎn)化大寫(xiě)(所得大寫(xiě)化的信息需手

動(dòng)復(fù)制進(jìn)新建文本文檔中并修改格式為fasta)啟動(dòng)子分析9.6大寫(xiě)化的目標(biāo)基因家族序列信息提交至plant

care在線網(wǎng)站(

htttml/)

進(jìn)行,等待結(jié)果發(fā)送至郵箱,下載郵箱中的附件,解壓后用execl打開(kāi)其中的xxx.tab

文件p://bioinformatics.psb.ugent.be/webtools/plantcare/h啟動(dòng)子分析9.7

根據(jù)作圖形式整理TAB

文件數(shù)據(jù),刪除無(wú)用列,保留有需要的信息,

對(duì)location列進(jìn)行加減20得出起始、終止位置信息,根據(jù)功能描述列篩選所研究的順勢(shì)作用元件進(jìn)行進(jìn)一步分析。啟動(dòng)子分析9.8.1.作

,TBtools

線形圖需用文件準(zhǔn)備:①整理篩選后的TAB文件信息格式為:第一列基因ID

、第二列起始位置、

第三列終止位置、第四列順式作用元件。ABCDCXN00000643-RA2000CXN00001195-RA2000CXN00002762-RA2000CXN00002878-RA2000CXN00004183-RA2000CXN00004279-RA2000CXN00004746-RA2000CXN00007220-RA2000CXN00008155-RA2000CXN00008471-RA2000CXN00008509-RA2000CXN00008780-RA2000CXN00010818-RA2000啟動(dòng)子分析9.8.1.作

,Tbtools線形圖需用文件準(zhǔn)備:②2000bp

文件準(zhǔn)備:第一列基因ID

,

第二列均為2000。Ex

cel

準(zhǔn)備數(shù)

據(jù)后粘貼復(fù)制進(jìn)新建文本文檔方可使用啟動(dòng)子分析9.8.1.作

,Tbtools線形圖需用文件準(zhǔn)備:③進(jìn)化樹(shù)文件準(zhǔn)備:將只含有目標(biāo)物種目標(biāo)基因家族的序列信息文件放入

MEGA軟件中,進(jìn)行構(gòu)建進(jìn)化樹(shù)操作至導(dǎo)出建樹(shù)文件(本教程進(jìn)化樹(shù)構(gòu)建

第5步)粘貼復(fù)制進(jìn)新建文本文檔中。ABCDEFCXN00001195-RAApTCP2CXN00004183-RAApTCP5CXN00004746-RAApTCP7CXN00008155-RAApTCP9CXN00008780-RAApTCP12CXN00011342-RAApTCP14CXN00011470-RAApTCP15CXN00017071-RAApTCP17CXN00018640-RAApTCP18CXN00019468-RAApTCP19CXN00004279-RAApTCP6CXN00008509-RAApTCP11CXN00020943-RAApTCP22CXN00000643-RAApTCP1CXN00002762-RAApTCP3啟動(dòng)子分析9.8.1.作

,Tbtools線形圖需用文件準(zhǔn)備:④重命名文件:第一列基因ID,

第二列新命名。Excel

準(zhǔn)備數(shù)據(jù)后粘貼

復(fù)制進(jìn)新建文本文檔方可使用。啟動(dòng)子分析9.8.2作圖可視化,將準(zhǔn)備的文件信息導(dǎo)入TBtools

中。ABCDE基因號(hào)順勢(shì)作用元件CXN00000643-RAI-boxCXN00000643-RAI-boxCXN00000643-RAGATA-motifCXN00000643-RAGT1-motifCXN00000643-RALTRCXN00000643-RAMRECXN00000643-RATGA-elementCXN00000643-RAARECXN00000643-RAARECXN00000643-RAAE-boxCXN00000643-RAMBSCXN00000643-RAABRECXN00000643-RAG-boxCXN00000643-RABox

4ICXN00001195-RAGT1-motif啟動(dòng)子分析9.9.1.TBtools

熱圖制作,與上述線性圖一致選用一個(gè)即可。文件準(zhǔn)備:①篩選后的TAB文件信息只保留基因ID和順式作用元件兩列即

可,使用Excel中的數(shù)據(jù)透視表功能處理數(shù)據(jù)如右圖所示。ABCDE基因號(hào)順勢(shì)作用元件CXN00000643-RAI-boxCXN00000643-RAI-boxCXN00000643-RAGATA-motifCXN00000643-RAGT1-motifCXN00000643-RALTRCXN00000643-RAMRECXN00000643-RATGA-elementCXN00000643-RAARECXN00000643-RAARECXN00000643-RAAE-boxCXN00000643-RAMBSCXN00000643-RAABRECXN00000643-RAG-boxCXN00000643-RABox

4ICXN00001195-RAGT1-motif啟動(dòng)子分析9.9.1.TBtools

熱圖制作,與上述線性圖一致選用一個(gè)即可。文件準(zhǔn)備:①篩選后的TAB文件信息只保留基因

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

評(píng)論

0/150

提交評(píng)論