Indel (Insertion and Deletion)分析简介

Indel (Insertion and Deletion)分析简介Indel Insertion and Deletion 分析简介 InDel 简介 InDel 是指基因组中小片段的插入或缺失序列 其长度在 1 50bp 之间 原因在于 Illumina 测序的 reads 读长 大小为 100bp 左右 包括单端测序 single end 100bp

大家好,我是讯享网,很高兴认识大家。

Indel (Insertion and Deletion)分析简介

InDel 简介
InDel 是指基因组中小片段的插入或缺失序列,其长度在 1-50bp 之间。原因在于Illumina测序的reads(读长)大小为100bp左右,包括单端测序(single-end, 100bp),双端测序(paired-end,2 x 100bp)两种。因此在序列比对SNP calling时,能够检测到的可靠的Indel大多小于100bp,通常最大在50bp左右。 Small InDel 变异一般比SNP 变异少,同样反映了样品与参考基因组之间的差异,编码区的 InDel 会引起移码突变,导致基因功能的变化。


讯享网

用GATK对RNA-seq做数据做 INDEL分析流程:

  1. 用STAR软件将数据比对到参考基因组(mapping to the reference)。
  2. 用picard的markduplicates命令进行data cleanup。
  3. 用GATK的SplitNCigarReads包处理cigar里含有N的reads。
  4. 碱基质量分数重校准(Base Quality Recalibration),就是利用机器学习的方式调整原始碱基的质量分数。
  5. Variant Calling,Filtering和Annotation。
小讯
上一篇 2025-03-29 11:26
下一篇 2025-02-06 16:01

相关推荐

版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容,请联系我们,一经查实,本站将立刻删除。
如需转载请保留出处:https://51itzy.com/kjqy/49091.html