进行KOG注释的方法和COG一致。对真核生物使用KOG注释:
$wget ftp://ftp.ncbi.nih.gov/pub/COG/KOG/kyva
$makeblastdb -in kyva -dbtype prot -title kog -parse_seqids -out /opt/biosoft/ncbi-blast-2.2.28+/db/kog -logfile /opt/biosoft/ncbi-blast-2.2.28+/db/kog.log
$cat /opt/biosoft/ncbi-blast-2.2.28+/db/kog.log
然后,使用Blastp将基因组蛋白质序列比对到COG数据库
$blast.pl blastp kog proteins.fasta 1e-5 4 kog 5
$blast.pl blastp kog proteins.fasta 1e-5 4 cog 5
下载KOG数据库的koghefun.txt文件。kog文件包含KOG编号和KOG数据库中序列名的对应关系,也包含KOG编号和25个大类的对应关系;fun.txt是25个大类的描述性信息。我们根据这2个文件的信息来编写程序对Blast的结果进行处理,得到KOG注释。
$mkdir ~/bin/kog
$wget ftp://ftp.ncbi.nih.gov/pub/COG/COG/whog -P ~/bin/kog
$wget ftp://ftp.ncbi.nih.gov/pub/COG/COG/fun.txt -P ~/bin/kog
$kog_from_xml.pl kog.xml 1e-5

版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容,请联系我们,一经查实,本站将立刻删除。
如需转载请保留出处:https://51itzy.com/kjqy/56542.html