ncbi是什么数据库 NCBI的全称


ncbi是什么数据库 NCBI的全称

文章插图
ncbi是什么数据库1NCBI是National Center for Biotechnology Information的缩写,指美国国家生物技术信息中心,建立于1988年 。NCBI的初衷是为了给分子生物学家提供一个信息储存和处理的系统,除了建有GenBank核酸序列数据库(该数据库的数据资源来自全球几大DNA数据库,其中包括日本DNA数据库DDBJ、欧洲分子生物学实验室数据库EMBL以及其它几个知名科研机构)之外,NCBI还可以提供众多功能强大的数据检索与分析工具 。
收藏|一图介绍GEO数据库2GEO数据库全称GENE EXPRESSION OMNIBUS,是由美国国立生物技术信息中心NCBI创建并维护的基因表达数据库 。它创建于2000年,收录了世界各国研究机构提交的高通量基因表达数据,也就是说只要是目前已经发表的论文,论文中涉及到的基因表达检测的数据都可以通过这个数据库中找到 。关键是这个数据是免费的!
NCBI Gene Expression Omnibus(GEO)作为各种高通量实验数据的公共存储库 。这些数据包括基于单通道和双通道微阵列的实验,检测mRNA,基因组DNA和蛋白质丰度,以及非阵列技术,如基因表达系列分析(SAGE),质谱蛋白质组学数据和高通量测序数据 。
在GEO最基本的组织层面,有四种基本实体类型 。前三个(样本,平台和系列)由用户提供; 第四,数据集由GEO工作人员根据用户提交的数据进行编译和策划 。
【ncbi是什么数据库 NCBI的全称】检索界面,网址:http://www.ncbi.nlm.nih.gov/geo
总结作者已经整理好的数据下载,可通过GEOquery包直接得到表达矩阵,GSE号下载数据为seires Matrix File文件,含有整理好的表达矩阵、样品信息等,GDS号数据下载数据为soft文件,数据下载之后有时需要标准化,如log2变换 。
探针注释文件含有genelD和探针直接的对应关系,最好不要通过R包下载探针注释文件,下载结果有时候不完全,所以还是去GEO官网下载注释文件,原始芯片数据一样可以通过GEOquery包getGEOSuppFiles()函数下载,筛选CEL结尾的文件,AffyBatch类,用于存储探针水平数据 。需要标准化.
科研路其修远兮,吾将上下而求索,有烦恼苦闷或者有趣好玩的事情记得告诉小助理,希望陪伴您一起成长 。
踌躇满志无限期
扬帆起航正当时
科研小助理为您在线解答