Cufflinks的使用

Cufflinks的使用一 简介 Cufflinks 下主要包含 cufflinks cuffmerge cuffcompare 和 cuffdiff 等几支主要的程序 主要用于基因表达量的计算和差异表达基因的寻找 二 安装 Cufflinks 下载网页 1 为了安装 Cufflinks 必须有 Boost C libraries 下载 Boost 并安装

大家好,我是讯享网,很高兴认识大家。

一. 简介

Cufflinks下主要包含cufflinks,cuffmerge,cuffcompare和cuffdiff等几支主要的程序。主要用于基因表达量的计算和差异表达基因的寻找。

二. 安装

Cufflinks下载网页。
1. 为了安装Cufflinks,必须有Boost C++ libraries。下载Boost并安装。默认安装在/usr/local。

$ tar jxvf boost_1_53_0.tar.bz2 $ cd boost_1_53_0 $ ./bootstrap.sh $ sudo ./b2 install 

讯享网

2.安装SAM tools。

讯享网下载SAM tools。 $ tar jxvf samtools-0.1.18.tar.bz2 $ cd samtools-0.1.18 $ make $ sudo su # mkdir /usr/local/include/bam # cp libbam.a /usr/local/lib # cp *.h /usr/local/include/bam/ # cp samtools /usr/bin/ 

3. 安装 Eigen libraries。

下载Eigen $ tar jxvf 3.1.2.tar.bz2 $ cd eigen-eigen-5097c01bcdc4 $ sudo cp -r Eigen/ /usr/local/include/ 

4. 安装Cufflinks。

讯享网$ tar zxvf cufflinks-2.0.2.tar.gz $ cd cufflinks-2.0.2 $ ./configure --prefix=/path/to/cufflinks/install --with-boost=/usr/local/ --with-eigen=/usr/local/include//Eigen/ $ make $ make install 

5. 可以直接下载Linux x86_64 binary。不需要上述繁琐步骤,解压后的程序直接可用。(推荐)

三. Cufflinks的使用

1. Cufflinks简介

Cufflinks程序主要根据Tophat的比对结果,依托或不依托于参考基因组的GTF注释文件,计算出(各个gene的)isoform的FPKM值,并给出trascripts.gtf注释结果(组装出转录组)。

注意:

1. fragment的长度的估测,若为pair-end测序,则cufflinks自己会有一套算法,算出结果。若为single-end测序,则cufflinks默认的是高斯分布,或者你自己提供相关的参数设置。

2. cufflinks计算multi-mapped reads,一般a read map到10个位置,则每个位置记为10%。a read mapping to 10 positions will count as 10% of a read at each position.


讯享网

3. 一般不推荐用cufflinks拼接细菌的转录组,推荐 Glimmer。但是,若有注释文件,可以用cufflinks和cuffdiff来检测基因的表达和差异性。

4. cufflinks/cuffdiff不能计算出exon或splicing event的FPKM

5.cuffdiff处理时间序列data:采用参数-t

6.当你使用cufflinks时,在最后出现了99%,然后一直不动。因为cuffdiff需要更多的CPU来处理一些匹配很多reads的loci。而这些位点一般要等其他位点全部解决了后,才由cuffdiff来处理。可以用参数-M来提供相关的文件,过滤掉rRNA或者线粒体RNA。

7. 当使用cufflinks或cuffdiff出现了“crash with a ‘bad_alloc' error”,cuffdiff和cufflinks运行了很长时间才结束————这表明计算机拼接一个高表达的基因或定量分析一个高表达的基因,运行的内存使用玩尽了!解决方法:修改选项“-max-bundle-frags”,可以先尝试,若错误依旧在,可以继续下调!

8. cuffdiff报道的结果里面所有的基因和转录本的FPKM=0,这表明GTF中的染色体名字和BAM里的名字不匹配。

9.  cuffdiff和cufflinks的缺点:存在一定的假基因和转录本(原因:测序深度,测序质量,测序样本的测序次数,以及注释的错误)

10. large fold change表达量不代表数据的明显性(这些基因的isform多或这些基因测序测到的少,整体较低的表达)。cuffdiff中明显表达倍数改变的基因,存在不确定性。

11.  通过cufflinks产生的结果中transcript.gtf文件中cuff标识的转录本就是新的转录本。相应的,其他模块输出中CUFF标识代表着新的转录本。

12. 若出现了如下错误:

You are using Cufflinks v2.2.1, which is the most recent release.
open: No such file or directory
File 30 doesn't appear to be valid BAM file, trying SAM...
Error: cannot open alignment file 30 for reading
这表明,你的参数有问题。例如“--min-intron-length”,你设置为了:“-min-intron-length”
小讯
上一篇 2025-02-19 20:37
下一篇 2025-02-11 19:31

相关推荐

版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容,请联系我们,一经查实,本站将立刻删除。
如需转载请保留出处:https://51itzy.com/kjqy/125175.html