玩转基因组浏览器之tdf文件

玩转基因组浏览器之tdf文件欢迎关注 生信修炼手册 将 bam 文件导入 IGV 之后 可以直观的查看测序深度的分布情况 但是直接导入 bam 文件会占用比较大的内存 如果只是想要查看测序深度信息 有很多其他的代替方案 tdf 是 IGV 官方推荐的一种二进制格式 类似 bedgraph 格式 用窗口的方式来记录测序深度信息 相比 bam 文件 tdf 文件会小很多 导入和查看也更快速 可以通过 igvtools 来生成 tdf 文件

大家好,我是讯享网,很高兴认识大家。

欢迎关注”生信修炼手册”!

将bam文件导入IGV之后,可以直观的查看测序深度的分布情况, 但是直接导入bam文件会占用比较大的内存,如果只是想要查看测序深度信息,有很多其他的代替方案。

tdf是IGV官方推荐的一种二进制格式,类似bedgraph格式,用窗口的方式来记录测序深度信息。相比bam文件,tdf文件会小很多,导入和查看也更快速。可以通过igvtools来生成tdf文件,命令如下

igvtools count input.bam out.tdf hg19.chrom.sizes

讯享网

需要三个参数,第一个参数为输入文件,支持bam, sam等格式,第二个参数为输出文件,支持tdf和wig两种格式,第三个参数为基因组的ID或者保存染色体大小的chrom.sizes文件。在igvtools的安装目录,有个lib/genomes文件夹,保存了很多物种的chrom.sizes文件


讯享网

当你提供了基因组ID时,软件会自动在该目录下查找对应的文件,默认的ID是hg18, 当然你也可以自己准备这个文件,内容如下所示

\t分隔的两列,第一列为染色体名称,第二列为染色体长度。在我的测试中,bam文件大小为1.3G, 输出的tdf文件大小为17M, 而wig文件为59M,转换为二进制的bigwig文件大小为25M。可以看到,tdf的文件大小最小。输出的tdf文件可以直接导入IGV进行查看,示意如下

上图的wig,tdf来自同一个bam文件,从峰型可以看出,三者基本一致。只所以说基本一致,是因为wig和tdf都是以窗口的方式来统计测序深度的,而bam则以单个碱基为单位。在IGV中进一步放大,可以看到下图

小讯
上一篇 2025-02-05 18:19
下一篇 2025-02-11 14:26

相关推荐

版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容,请联系我们,一经查实,本站将立刻删除。
如需转载请保留出处:https://51itzy.com/kjqy/70916.html