豬全基因組變異位點功能注釋程序開發(fā).pdf_第1頁
已閱讀1頁,還剩69頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

1、變異位點的功能注釋是探究突變與表型間關系的重要環(huán)節(jié)。伴隨下一代測序技術的發(fā)展和測序成本的降低,大量變異位點數(shù)據(jù)被挖掘出來,這些數(shù)據(jù)是功能注釋的基礎。ENCODE計劃產生大量調控元件的實驗數(shù)據(jù),這些數(shù)據(jù)能夠提高模式生物如人與小鼠變異位點注釋的準確性,但如何利用這些數(shù)據(jù)在其他非模式生物中預測突變影響仍是一個挑戰(zhàn)。本研究利用Python語言開發(fā)了一個變異位點功能注釋軟件,并且利用該程序對豬全基因組范圍內的變異位點做出功能注釋,主要獲得以下結果

2、:
  (1)開發(fā)了一個突變位點功能注釋軟件VIP(Variant Integrated Predictor)。該軟件對位于編碼區(qū)突變如同義突變、錯義突變、無義突變、移碼與非移碼突變等能夠提供準確性100%的預測結果,并且能夠對蛋白質結構域作出預測。對位于啟動子區(qū)突變,VIP能基于Jaspar提供的轉錄因子結合序列的位置頻率矩陣提供轉錄因子結合位點變化預測。對位于3'UTR區(qū)突變,VIP能基于miRBase提供的miRNA序列,利

3、用加權的Smith-Waterman方式計算miRNA與3'UTR靶位點的互補分數(shù),并且能夠利用miRDB的預測結果進一步降低注釋假陽性率。對于內含子區(qū)突變,VIP能提供剪接位點預測?;诙噙M程的VIP注釋程序能夠最大化利用多核心CPU,大幅度提高注釋速度,在簡單注釋模式下,注釋速度達每秒79,000個變異位點。并且程序能夠有效節(jié)約內存,可以在8 GB內存計算機上完成豬基因組約6,000萬變異位點注釋。
  (2)基于物種間基因組

4、序列比對結果,我們開發(fā)了配套程序用于構建物種間基因組位置對應關系,在此基礎上轉移ENCODE提供的人相關實驗數(shù)據(jù)用于VIP的數(shù)據(jù)整合注釋。本研究利用人與豬基因組序列比對結果,將豬基因組中11.4億個堿基(40%)與人基因組建立了聯(lián)系,并轉移人基因組位點保守性分值數(shù)據(jù)(PhyloP)及CADD值用于豬基因組變異位點功能注釋,在編碼區(qū)的注釋結果中取得合理的結果。同時,利用這一基因組位置對應關系,我們將ENCODE下載的6組轉錄因子SP1的C

5、hIP數(shù)據(jù)轉移用于豬基因組啟動子區(qū)域變異位點注釋,結合Jaspar提供的SP1靶序列的位置頻率矩陣,注釋發(fā)現(xiàn)了4,248個高質量的SP1結合能力下降的結果。
  (3)利用VIP,我們對豬全基因組范圍內約6,000萬變異位點做出注釋,編碼區(qū)共524,081個注釋結果與Ensembl相比,準確度達到100%。在位于3'UTR的突變中,我們發(fā)現(xiàn)了5,008個由于突變造成新miRNA結合以及5,969個原有miRNA結合消失的注釋結果。

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
  • 5. 眾賞文庫僅提供信息存儲空間,僅對用戶上傳內容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論