python 注解annotation,@transactional注解作用
新的一年到了,到了该更新数据库的时候了,首先就从常用的安诺瓦尔软件以及所使用的数据库开始更新吧
1.下载最新版的安诺瓦尔软件,annovar.latest版本,需要一个电子显示器(电子显示unit)ˌ教育机构域名(education)ˌ实验发展处(实验发展组)的邮箱
2.下载注释所用的数据库,官网上太多,可以根据需要自行下载,比如下载hg19版本的,clinvar数据库更新到20190305版本了,但是美国国家生物技术信息中心数据库已经更新到20191223了,可以自己下载后转化为安诺瓦尔可用的格式
$ annotate _ variationpl-build ver hg19-down d b-web from anno var ref gene humandb/$ annotate _ variationpl-build ver hg19-down d b-web from anno var refGeneWithVer humandb/#下载加withVer版本的参考基因文件可以在注释时转录本带上相对应的版本号1 $ annotate _ variationpl-build ver hg19-down db cyto band human db/$ annotate _ variationpl-build ver hg19-down d b-web from anno var exa c03 humandb/$ annotate _ variationpl-build ver hg19-down d b-web from anno var avsnp 147 humandb/$ annotate _ variationpl-build ver hg19-down d b-web from anno var dbnsfp 30 a humandb/$ annotate _ variationpl-build ver hg19-down d b-web from anno var clin var _错义变异的临床解释(不支持因德尔斯),ACMG所对应的数据库3.下载完数据库后,可以利用安诺瓦尔自带的例子数据进行注释
①平时工作中常规的用法:用table_annovar.pl进行注释可一次性完成三种类型的注释
首先把椎体压缩性骨折文件转换为可注释的格式,fmt文件,通常为#Chr开始结束参考高度这五列,不包括列名,然后再用table_annovar.pl进行一次性注释最后删除滤波多音文件
注:-csvout表示输出的文件是战斗支援车文件,不加时,默认为文本文件(文本文件)文件
refGeneWithVer替换了refGene后,注释出来后的a改变列变为AAChange.refGeneWithVer列,转录本也加上了版本号
新版安诺瓦尔的不同之处有:- intronhgvs,加上这个,可以把多少bp机机的内含子注释出来
输入文件=XXXvcfoutputname=xxxconvert 2 anno varpl格式的VC F4 $输入文件-outfile fmt-includeinfotable _ anno varpl fmt/media/GS admin/vd2/tmp/database/humandb/-build ver hg19-out $ output name-remove-protocol refGeneWithVer,cytoBand,avsnp150,1000g2015aug_all,1000g2015aug_eas,esp6500siv2_all,exa-螺纹10-cs vout-polish-其他信息-intronhgvs 50rm fmt②对于床文件的数据,需要五列,不需要convert2annovar.pl这一步,只需要第二步即可其中不能注释,不符合以下规则的点,会被放在一个有病人的文件里
开始和目标的关系:
如果是一个碱基的变异,插入,缺失,则开始=结束
如果是大于一个(名词)碱基的缺失,则开始(n-1)=1结束
如果是大于一个碱基的插入,则开始=结束
③对于家族的样本的椎体压缩性骨折注释,可以先把椎体压缩性骨折文件合并,然后再一起注释
如果需要先转化为标准的5列,然后在进行注释时,要注意
输入文件=merge _ outvcfoutputname=xxxxx
$ convert 2 anno var。pl格式vcf 4旧$输入文件-输出文件fmt-包含信息$ table _ anno var。pl fmt/media/GS admin/vd2/tmp/database/humandb/-build ver hg19-out $ output name-remove-protocol refGeneWithVer,cytoBand,avsnp150,1000g2015aug_all,1000g2015aug_eas,esp6500siv2_all,exac03,clin var _ 2015-螺纹10-cs vout-polish-其他信息RM fmt #非合并文件时是-格式化vcf #给老安诺瓦尔用户的警告:这个程序不再对多样本椎体压缩性骨折文件进行行到行的转换。如果要在输出中包含所有变量,请使用-格式化vcf4old 或格式vcf4 -allsample -withfreq 来代替2008-vcf input表示输入文件直接是vcf,不用进行转化
$ table _ anno var。pl $ input file/media/GS admin/vd2/tmp/database/humandb/-build ver hg19-out $ output name-remove-protocol refGeneWithVer,cytoBand,avsnp150,1000g2015aug_all,1000g2015aug_eas,esp6500siv2_all,exac03,clinvar_20191223,hgmd_20191223,dbnsfp33a,MCA-螺纹10 -vcfinput -polish 多个椎体压缩性骨折文件合并,那就可以进行椎体压缩性骨折文件的拆分
convert2annovar.pl格式vcf4示例/ex2.vcf -outfile ex2 -allsample 对于芮博思达国际舞蹈进行注释,还是先进行格式转换为五列,再加一列同悦
转换2个年度变量。pl格式rsid示例/SNP列表。txt-dbsnpfile humandb/hg19 _ SNP 138。txt snn列表。avinput其它相关功能
对于一个区域内的所有变异的注释:chr1:2000001-2000003
$ convert 2 anno var。pl-格式区域-seqdir humandb/hg19 _ seq/chr 1:2000001-2000003 #要为此添加x-bp插入和删除,请使用-尺寸x和-delsize x,其中x是整数$ convert 2 anno var。pl-format region-seqdir humandb/hg19 _ seq/chr 1:2000001-2000003-ins size 1-delsize 2 $/media/GS admin/vd2/tmp/software/anno var。最新/年度变量/转换2年度变量。pl-格式区域-seqdir/mnt/GS admin/report _ group/tmp/database/GATK/library/chrom fa/chr 1:20000001-2000
基于基因的注释
$ annotate _ variation。pl-gene anno-dbtype ref gene-out ex1-build hg19 ex1。avinput humandb/#-gene anno表示使用基于基因的注释# -dbtype refGene表示使用refGene数据库# -out ex1表示输出文件以ex1为前缀基于区域的注释
$ annotate _ variation。pl-regionan no-build hg19-out ex1-dbtype phastconselements 46路示例/ex1。avinput humandb/#-区域编号表示使用基于区域的注释# -dbtype phastConsElements46way表示使用phastConsElements46way 数据库,注意需要使用基于区域的的数据库基于过滤的注释
$ annotate _ variation。pl-filter-dbtype 1000g 2012 apr _ EUR-build ver hg19-out ex1 ex1 ex1。avinput humandb/#-过滤器使用基于过滤的注释# -dbtype 1000g2012apr_eur使用 1000g2012apr_eur 数据库#运行命令后,已知的变异会被写入一个*已删除结尾的文件,而没有在数据库中找到的变异将会被写入*已过滤结尾的文件,*已删除文件是我们所需要的结果。这个文件内容如下
郑重声明:本文由网友发布,不代表盛行IT的观点,版权归原作者所有,仅为传播更多信息之目的,如有侵权请联系,我们将第一时间修改或删除,多谢。