美国国家生物技术信息中心

数据库

国家生物技术信息中心National Center for Biotechnology Information,简称NCBI)是美国国家医学图书馆(NLM)的一部分(该图书馆是美国国家卫生研究所的一部分)。NCBI位于美国马里兰州贝塞斯达,建立于1988年。

NCBI的logo

NCBI设置有与生物技术和生物医学相关的一系列数据库,是生物信息学工具和服务的重要资源。 主要数据库包括DNA序列GenBank,和生物医学文献书目数据库PubMed。 其他数据库包括NCBI表观基因组数据库英语NCBI Epigenomics。 所有这些数据库都可以通过Entrez搜索引擎在线获取。

许多受尊敬的研究者在NCBI工作,如比较基因组学领域的一位多产的科学家尤金·库宁BLAST序列数据库搜索算法的作者Stephen Altschul

NCBI在研究数据库r3data.org的注册表中列出[1]

GenBank 编辑

NCBI自1992年开始负责维护DNA序列数据库英语Biological databasesGenBank。GenBank数据库每日都会实时更新并和另外两家数据库(欧洲的EMBL与日本的DDBJ)交换数据,以确保三家数据库的序列数据的一致性[2]。自1992开始,NCBI陆续将其它数据库与GenBank整合起来,包括Gene英语Gene (database)在线人类孟德尔遗传数据库、 分子模型数据库(一个蛋白质三维结构数据库)、dbSNP(一个单核苷酸多态性数据库)、Reference Sequence Collection(一个人类基因组图谱)以及分类学浏览方式和美国国家癌症研究所提供的癌症基因组剖析计划英语Cancer Genome Project数据。NCBI也对每一个物种都设立了一个分类编号(taxonomy ID number)。

NCBI提供的一些在线软件可供FTP或WWW浏览,比如BLAST序列相似性比对程序,可在15秒内完成与GenBank数据库的序列比较。

NCBI书架 编辑

NCBI书架是一个集合了可以自由获取、下载的线上精选生物医学书籍数据库。截至2011年4月,书架有845本书籍,涵盖广泛的主题包括分子生物学生物化学细胞生物学遗传学,和微生物学。从分子和细胞从角度分析的疾病状态、研究方法,和病毒学。一些书是以前出版的图书的在线版本,而其他如Coffee Break(书)是由NCBI的工作人员编写和编辑。书架是同行评审Entrez PubMed库的期刊摘要的补充,因为它能提供前沿领域的已确立的观点,并整理许多不同的零散的研究报告。

基本本地比对搜索工具(BLAST) 编辑

BLAST是用于计算生物序列之间的序列相似性的算法,例如DNA的核苷酸序列和蛋白质的氨基酸序列[3]BLAST是查找与同一生物体内或不同生物体中的查询序列相似的序列的有力工具。 它搜索NCBI数据库和服务器上的查询序列,并将结果以选定的格式发布回该人员的浏览器。BLAST的输入序列大部分采用FASTA或Genbank格式,而输出可以以各种格式(如HTML,XML格式和纯文本)传送。 HTML是NCBI网页的默认输出格式。 NCBI-BLAST的结果以图形格式显示,找到所有命中结果,具有具有得分相关数据的命中结果的序列标识符的表格,以及感兴趣序列的比对以及用于这些的类似BLAST得分的命中结果[4]

Entrez 编辑

Entrez全球查询跨数据库搜索系统在NCBI中用于所有主要数据库,如核苷酸和蛋白质序列,蛋白质结构,PubMed,分类学,完整基因组,OMIM等[5]。Entrez是既具有生物医学研究来源的数据的索引和检索系统。NCBI于1991年分发了第一版Entrez,由蛋白质数据库(PDB)GenBank的核苷酸序列,SWISS-PROT,翻译的GenBank,PIR,PRF和PDB的蛋白质序列组成,PubMed的相关摘要和引文。 Entrez专门设计用于将来自不同来源,数据库和格式的数据集成到统一的信息模型和检索系统中,可以有效地检索相关的参考文献,序列和结构[6]

参见 编辑

参考文献 编辑

  1. ^ NCBI | re3data.org. service.re3data.org. [2021-03-07]. (原始内容存档于2016-03-05). 
  2. ^ Mizrachi, Ilene. Chapter 1 GenBank: The Nucleotide Sequence Database. GenBank: The Nucleotide Sequence Database. National Center for Biotechnology Information (US). 2007-08-22 [2021-03-07]. (原始内容存档于2021-03-15) (英语). 
  3. ^ Altschul, S. F.; Gish, W.; Miller, W.; Myers, E. W.; Lipman, D. J. Basic local alignment search tool. Journal of Molecular Biology. 1990-10-05, 215 (3): 403–410 [2021-03-07]. ISSN 0022-2836. PMID 2231712. doi:10.1016/S0022-2836(05)80360-2. (原始内容存档于2021-04-30). 
  4. ^ Madden T. (2002). The NCBI handbook, 2nd edition, Chapter 16, The BLAST Sequence Analysis Tool
  5. ^ Sayers, Eric W.; Agarwala, Richa; Bolton, Evan E.; Brister, J. Rodney; Canese, Kathi; Clark, Karen; Connor, Ryan; Fiorini, Nicolas; Funk, Kathryn. Database resources of the National Center for Biotechnology Information. Nucleic Acids Research. 01 08, 2019, 47 (D1): D23–D28 [2021-03-07]. ISSN 1362-4962. PMC 6323993 . PMID 30395293. doi:10.1093/nar/gky1069. (原始内容存档于2021-04-20). 
  6. ^ Ostell J. (2002). The NCBI handbook, 2nd edition, Chapter 15, The Entrez Search and Retrieval System

外部链接 编辑