对snpeff注释的理解性问题3.0版本

生信分析必须了解的4种文件格式 - 知乎 ()
基因组注释文件(二)| gff 和 gtf文件格式说明 - 简书 ()
2.FA文件(FASTA格式):这是一种常见的DNA或蛋白质序列文件格式,每条序列通常以一个唯一的标识符开始 , 后面跟着该序列的碱基(DNA)或氨基酸(蛋白质)序列 。FA文件提供了基因组的序列信息,用于将变异与基因组序列对应起来 。
不管如何说,注释的理由就是(个人理解):从注释的过程中知道SNP具体信息,方便后续操作 。
3.其他一些东西
之前我因为报错太多,主要是位点不在染色体范围内报错很多,7%左右,所以我们得验证一下这个是否真的是位点不在染色体范围内,
0.EXCEL表格的方式查找可能会更快 , 但是我们的数据太大了 1.的 on或者是UCSC的data
本来还有一篇文章的,实在是没找到,下次我遇到了,我在加上去
高通量测序分析——从基因组重测序数据中获取突变信息 - 知乎 ()
()
2.敲代码,寻找这个范围
由于我技术不过关卡了很久,大家可以试试 , 我改天在尝试一下 , 下次写出来直接公示
3 , 最后我是怎么发现的,说实话这是一个玄学,
半夜两三点的时候,我用代码跑linux的时候,无意间看到最后一个是报错信息,也就是说,报错信息会直接体现出来,把注释好的vcf放在在kate里面,不知道说啥,亏我找了那么久,不然我真得通宵了 。
4.其他注释的软件和一些相关文献
因为种种原因我还是没有完全使用其他的注释,但是这边我也想记录一下其他注释软件,上面有一篇文章有一些介绍 , 在这里我汇总一下:
1.,
我们就不多说了,是一个用于注释单核苷酸多态性(SNP)和小型插入/删除(Indel)的工具具 。。它能够根据变异的位置、类型和影响等信息,提供关于这些变异可能的功能效果和相关注释的预测 。例如非同义突变、错义突变和无义突变等,根据数据库提供的信息进行变异分类 。意思就是,在寻找与疾病相关的遗传变异或解释个体基因组数据中的变异时,通过它可以帮助研究人员更好更快地理解变异对蛋白质结构和功能的影响,从而揭示潜在的影响 。
的优势在于它具有开放源代码、灵活性高、易于自定义和扩展等特点,
2.
是由perl编写的程序 , 学术用途可以免费试用,一个常用的基因变异注释工具 , 它可以对基因组变异进行功能注释和分类 。有机会试一下 。
| 变异注释【上】 - 简书 ()
注释|自建数据库 - 简书 ()
3.vep注释
是由开发的一个广泛使用的基因变异注释工具,可以识别和注释各种类型的变异,如单核苷酸变异、插入/删除、结构变异等 。VEP还提供了丰富的注释信息,包括变异的功能、频率、疾病相关性等,支持多个数据库源 , 网上有很多教程 。
()
安装VEP及其注释数据库-腾讯云开发者社区-腾讯云 ()
SNP注释神器——VEP(生信)_vep注释_小飞棍来喽~的博客-CSDN博客
VEP--强大的变异注释工具 |文档
用 VEP 注释突变数据-腾讯云开发者社区-腾讯云 ()

对snpeff注释的理解性问题3.0版本

文章插图
大底上,conda安装,自建数据库还是需要gff文件,这个我粗略的搜寻一下,好像没有自建数据库的文章,也可能是我查错了,据说是自建不太灵活,过年回去试试 。
4.
进行gwas基因注释,这可以直接去看邓飞老师的 。使用进行gwas基因注释 - 知乎 ()
下次的学习注释的目标 , 
1 , 这几个注释都可以回家没事尝试一下 。
【对snpeff注释的理解性问题3.0版本】2,()
3,UCSC的data
当时看这个的时候就很懵 , 不太能理解,主要是一下软件的应用以及软件在注释上的一些不同之处 。
最后,还说一点,我们得查看一下一些文献,虽然只能是粗略的检索一下
香菇L808细胞核与线粒体基因组注释分析 - 中国知网 ()
基于高效SNP芯片的小麦产量相关性状全基因组关联分析 - 中国知网 ()
对全球鸡种群的精细结构和混合的研究揭示了种群与育种史上重要事件之间的联系 - PMC ()
实在是没啥好看的,我看得过于混乱,注释和其他注释软件的一些文章
:共现变异分析仪 |BMC 研究简报 |全文 ()
: Aof ,and VEP ()
主要是我并不知道,这个注释的基因在我们整个文章中怎么使用,缺乏检索能力 。