1. <ul id="0c1fb"></ul>

      <noscript id="0c1fb"><video id="0c1fb"></video></noscript>
      <noscript id="0c1fb"><listing id="0c1fb"><thead id="0c1fb"></thead></listing></noscript>

      99热在线精品一区二区三区_国产伦精品一区二区三区女破破_亚洲一区二区三区无码_精品国产欧美日韩另类一区

      RELATEED CONSULTING
      相關(guān)咨詢
      選擇下列產(chǎn)品馬上在線溝通
      服務時間:8:30-17:00
      你可能遇到了下面的問題
      關(guān)閉右側(cè)工具欄

      新聞中心

      這里有您想知道的互聯(lián)網(wǎng)營銷解決方案
      stringTie工具有什么用

      這篇文章主要介紹stringTie工具有什么用,文中介紹的非常詳細,具有一定的參考價值,感興趣的小伙伴們一定要看完!

      公司主營業(yè)務:成都網(wǎng)站制作、網(wǎng)站建設、移動網(wǎng)站開發(fā)等業(yè)務。幫助企業(yè)客戶真正實現(xiàn)互聯(lián)網(wǎng)宣傳,提高企業(yè)的競爭能力。成都創(chuàng)新互聯(lián)公司是一支青春激揚、勤奮敬業(yè)、活力青春激揚、勤奮敬業(yè)、活力澎湃、和諧高效的團隊。公司秉承以“開放、自由、嚴謹、自律”為核心的企業(yè)文化,感謝他們對我們的高要求,感謝他們從不同領域給我們帶來的挑戰(zhàn),讓我們激情的團隊有機會用頭腦與智慧不斷的給客戶帶來驚喜。成都創(chuàng)新互聯(lián)公司推出崇陽免費做網(wǎng)站回饋大家。

      對于轉(zhuǎn)錄組數(shù)據(jù)而言,最基礎的分析就是基因和轉(zhuǎn)錄本水平的定量了,定量就是確定一個基因或者轉(zhuǎn)錄本的表達量,其中定量的方式有很多種。

      最直接的方式就是統(tǒng)計mapping到這個基因/轉(zhuǎn)錄本上的reads的個數(shù),將reads數(shù)作為表達量。我們稱這種表達量為raw count。

      在raw count的基礎上,利用外顯子長度進行歸一化,就得到了TPM值的定量方式。對于每個基因,將raw count除了該基因的長度(exon長度之和) , 得到長度歸一化之后的表達量。某個基因的TPM值就是利用歸一化之后的表達量,計算了一個相對豐度。具體計算公式如下,注意基因長度以k為單位

      stringTie工具有什么用
      在raw count的基礎上,利用測序量和外顯子長度兩個因素進行歸一化,就得到了RPKM/FPKM值的定量方式。首先將raw  count除了mapping 上的所有reads數(shù),得到相對豐度,在除以該基因長度(exon長度之和), 就可以計算出RPKM值。測試時每一條插入片段稱為一個fragment, 對于雙端測序,一個fragment 會得到兩條reads。

      RPKM和FPKM 唯一不同的地方在于raw count的計算,RPKM 計算的是reads 數(shù),而FPKM 值計算的是fragments 數(shù),對于單端測序, fragment 和 reads 的個數(shù)是相等的;對于雙端測序,reads 數(shù)目是fragments 數(shù)目的兩倍,對于FPKM 而言,即使雙端的兩條reads都比對上了基因組,在計數(shù)時也知計一次,因為兩條reads來源于同一個fragment。

      具體計算公式如下, 需要注意單位,mapping上的reads 總數(shù)以M為單位,基因長度以k為單位。

      stringTie工具有什么用

      能夠進行定量的軟件有很多,本文主要介紹stringTie這款軟件。

      在早期的轉(zhuǎn)錄組數(shù)據(jù)分析中,最經(jīng)典的分析策略是tophat+cufflinks+cuffdiff, 這套分析的pipeline會給出基于FPKM值的定量結(jié)果,然后進行差異分析,但是隨著測序數(shù)據(jù)量的提高和分析手段的發(fā)展,這套分析策略出現(xiàn)了很多的問題。

      首先就是tophat的速度很慢,相比新出的比對軟件,其速度可以算得上是龜速了,同樣的數(shù)據(jù)量,hisat/star只需要半個小時就可以比對完成,tophat2至少需要5到6個小時;其次,基于FPKM值得到的差異結(jié)果和實驗手段如qPCR驗證的一致性較差。

      為了順應測序和分析的新趨勢,原本的開發(fā)團隊對整個pipeline進行了全面升級, 用hisat 代替tophat, 用stringTie + ballgown 代替cufflinks + cuffdiff。

      stringTie 可以看做是cufflinks 軟件的升級版本,其功能和cufflinks是一樣的 ,包括下面兩個主要功能

      1. 轉(zhuǎn)錄本組裝

      2. 定量

      相比cuffinks, 其運行速度更快。該軟件的官網(wǎng)如下

      https://ccb.jhu.edu/software/stringtie/index.shtml

      stringTie工具有什么用

      stringTie的輸入文件為經(jīng)過排序之后的bam文件,常見用法有以下幾種

      1. 對已知轉(zhuǎn)錄本進行定量

      對于模式生物,如human, mouse等,通常只需要對已知的轉(zhuǎn)錄本定量即可,用法如下

      stringtie -p 10 \
      -G hg19.gtf \
      -o output.gtf  \
      -b ballgown_out_dir -e \
      align.sorted.bam

      -G參數(shù)指定參考基因組的gtf文件,-o指定輸出的文件,格式也為gtf, -b指定ballgown的輸出結(jié)果目錄,這個參數(shù)是為了方便下游進行ballgown差異分析,-e參數(shù)要求軟件只輸出已知轉(zhuǎn)錄本的定量結(jié)果。

      在輸出的GTF格式的文件中,對于每個轉(zhuǎn)錄本,會給出以下3種表達量

      1. coverage

      2. TPM

      3. FPKM

      2.  組裝本組裝

      對于單個樣本進行組裝,用法如下

      stringtie align.sorted.bam
      -o assembly.gtf
      -p 20
      -G hg19.gtf

      在組裝的轉(zhuǎn)錄本中,也會給出定量的結(jié)果,對于組裝的新轉(zhuǎn)錄本和基因,默認采用STRG加數(shù)字編號進行區(qū)分,示例如下

      gene_id "STRG.1"
      transcript_id "STRG.1.1"

      單個樣本組裝完成后,會合并所有樣本的轉(zhuǎn)錄本組裝結(jié)果,得到一個非冗余的轉(zhuǎn)錄本集合,用法如下

      stringtie --merge \
      -o assembly.gtf \
      -p 20 \
      -G hg19.gtf \
      sampleA.gtf sampleB.gtf

      在合并的非冗余轉(zhuǎn)錄本中,采用MSTRG加數(shù)字編號對基因和轉(zhuǎn)錄本進行編號,示例如下

      gene_id "MSTRG.2"
      transcript_id "MSTRG.2.2"

      本質(zhì)上,stringTie只提供了轉(zhuǎn)錄本水平的表達量,定量方式包括TPM和FPKM值兩種。為了進行raw count的定量方式,官方提供了prepED.py腳本,可以計算出raw count的表達量,用法如下

      python prepDE.py \
      -i sample_list.txt  \
      -g gene_count_matrix.csv  \
      -o transcript_count_matrix.csv

      輸入文件為sample_list.txt, 該文件為\t分隔的兩列,第一列為樣本名稱,第二列為定量的gtf文件的路徑,示例如下

      sampleA A.stringtie.gtf
      sampleB B.stringtie.gtf

      同時輸出基因和轉(zhuǎn)錄本水平的raw count表達量值。

      采用stringTie進行定量,運行速度快是一個優(yōu)勢,同時提供raw count, FPKM, TPM 3種定量方式的結(jié)果,也是其最便利的地方。

      以上是“stringTie工具有什么用”這篇文章的所有內(nèi)容,感謝各位的閱讀!希望分享的內(nèi)容對大家有幫助,更多相關(guān)知識,歡迎關(guān)注創(chuàng)新互聯(lián)行業(yè)資訊頻道!


      分享文章:stringTie工具有什么用
      鏈接URL:http://ef60e0e.cn/article/geceoj.html
      99热在线精品一区二区三区_国产伦精品一区二区三区女破破_亚洲一区二区三区无码_精品国产欧美日韩另类一区
      1. <ul id="0c1fb"></ul>

        <noscript id="0c1fb"><video id="0c1fb"></video></noscript>
        <noscript id="0c1fb"><listing id="0c1fb"><thead id="0c1fb"></thead></listing></noscript>

        谢通门县| 柳林县| 临澧县| 岳阳县| 通许县| 璧山县| 双辽市| 八宿县| 巧家县| 榆林市| 青田县| 祁门县| 民丰县| 西藏| 务川| 水富县| 麻江县| 和政县| 柞水县| 黑龙江省| 九台市| 武宣县| 濮阳县| 隆昌县| 铁岭市| 平果县| 耒阳市| 阿克| 宝坻区| 泰顺县| 柏乡县| 赣榆县| 铜梁县| 长治县| 板桥市| 盖州市| 平度市| 深州市| 金塔县| 忻城县| 南充市|