GWAS数据分析流程—SNP、Indel注释
GWAS数据分析流程—SNP、Indel注释
1、snpeff
1.1、snpeff软件下载
wget windows/versions/snpEff_latest_core.zip
如何为文件夹加密
unzip snpEff_latest_core.zip
cd snpEff
解压后即可使⽤。
1.2、在snpeff⽂件夹下新建⼀个命名为data的⽂件夹,data⽂件夹下⾯再新建⼀个要⽣成数据库的⽂件夹,命名为maize,在maize⾥⾯
下载参考基因组序列和基因组的GTF⽂件,分别重命名为sequences.fa和f。
1.3、定义fig⽂件,
fig打开fig⽂件,添加
# maize genome, version maizev5
< : maize
如图所⽰:
1.4、SNP、Indel注释
##SNP注释
java -Xmx4g -jar  /ipm1/hang/pl/program/snp_indel_snpeff/snpEff/snpEff.jar -c  /ipm1/hang/pl/program/snp_indel_snpeff/fig -ud 2000 -csvStats m
##indel注释
java -Xmx4g -jar  /ipm1/hang/pl/program/snp_indel_snpeff/snpEff/snpEff.jar -c  /ipm1/hang/pl/program/snp_indel_snpeff/fig -ud 2000 -csvStats m
2、annovar
2.1、软件安装
annovar下载地址
解压后输出环境变量
export PATH=/ipm1/hang/pl/program/snp_indel_snpeff/annovar:$PATH
annovar的使⽤需要gtfToGenePred软件包
下载后运⾏ chmod +x ./gtfToGenePred 增加运⾏权限
2.2、将GTF⽂件转换成refGene格式
gtfToGenePred -genePredExt -ignoreGroupsWithoutExons  f 
2.3、建⽴注释库
/ipm1/hang/pl/program/snp_indel_snpeff/annovar/retrieve_seq_from_fasta.pl --format refGene --seqfile sequences.fa --out maize_refG
2.4、将VCF⽂件转换成表格格式输⼊⽂件
##SNP
/ipm1/hang/pl/program/snp_indel_snpeff/annovar/convert2annovar.pl -format vcf4 -allsample -withfreq maize.snp.filed.vcf > maize.snp.vcf.annovar.input
##Indel
/ipm1/hang/pl/program/snp_indel_snpeff/annovar/convert2annovar.pl -format vcf4 -allsample -withfreq maize.indel.filed.vcf > maize.indel.vcf.annovar.input
2.5、SNP、Indel注释
##SNP注释
/ipm1/hang/pl/program/snp_indel_snpeff/annovar/annotate_variation.pl -geneanno --neargene 2000 -buildver maize  -dbtype refGene -outfile maizesnp.anno -ex
##indel注释
/ipm1/hang/pl/program/snp_indel_snpeff/annovar/annotate_variation.pl -geneanno --neargene 2000 -buildver maize  -dbtype refGene -outfile maizeindel.anno -e 2.6、统计变异信息、查看变异类型等
less -S maizesnp.anno.variant_function |cut -f 1|sed 's/;/\n/g' |sort | uniq -c
less -S maizeindel.anno.variant_function |cut -f 1|sed 's/;/\n/g' |sort | uniq -c

版权声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系QQ:729038198,我们将在24小时内删除。