Entrez分子序列数据库系统(Entrez Molecular Sequence Database System)是一个集成型的检索界面,网址为:https://www.ncbi.nlm.nih.gov/search/,由美国国家生医信息中心(National Center for Biotechnology Information, NCBI)建置,在此界面可搜索到6大类37种数据库的数据,用户可依检索结果直接连到特定数据库做更深入的检索。本文针对上述数据库简介如下:
Literature (文献类数据库)
Genes (基因相关数据库)
Genetics (遗传学相关数据库)
Proteins (蛋白质相关数据库)
Genomes(基因组相关数据库)
Chemicals (化学相关数据库)
Bookshelf在线数据库收录超过1000种由NCBI所撰写或列管之生物、医学以及生命科学相关之图书、报告、以及其他形式的学术文献。
本数据库做为NLM Literature Archive (LitArch)的图书类全文数位寄存(digital repository)系统,除了致力于保存并维持生医领域电子全文的免费取用,同时通过与其他NCBI资源的集成,如PubMed、Gene、OMIN、以及PubChem,让用户可链接到Bookshelf,增加探索的机会。用户可以检索到图书的篇章及全文,通过检索与浏览功能,可利用关键字检索或浏览相关主题之图书。
MeSH (Medical Subject Headings)是用来索引PubMed中期刊文献的国家医学图书馆控制词汇索引典(thesaurus)。收录在PubMed中的期刊文献都会被赋予不只一组MeSH关键字。通过这些MeSH关键字可以有效聚集相关主题之期刊文献。通过MeSH可以进一步了解关键字之间的树状关联,进而查找更广泛或更精确之文献,亦可初步了解生医领域主题的全貌。
NLM Catalog提供美国国家医学图书馆的书目数据链接,包含期刊、图书、视听数据、电脑软件、电子资源、以及其他类型数据等。亦提供链接至美国国家医学图书馆在线馆藏目录LocatorPlus。
PubMed收录超过2800万笔来自MEDLINE的生医领域文献、生命科学期刊、以及电子书书目数据。书目数据报含PubMed Central与出版社网站的全文链接(使用权取决于所属单位或个人是否有购买)。
PubMed Central (PMC)是美国国家医学图书馆所提供,关于生医与生命科学期刊文献的免费电子全文寄存网站。此平台提供出版社与作者个人申请存放其著作之电子期刊全文,并免费提供链接使用。
本数据库集成广大范围之物种信息,单笔数据可能包含:命名法(nomenclature)、参考序列(RefSeqs)、图谱(maps)、路径(pathways)、变异(variations)、表型(phenotypes)以及来自全世界的基因组、表型、与基因特异链接。
本数据库储存基因表现型的数据集(DataSet),以及GEO数据库中的原始Series及Platform纪录。可输入关键字查找相关的实验。DataSet纪录包含群集工具(cluster tools)以及差异性表现查找(differential expression queries)等额外资源。
本数据库储存GEO DataSet数据库中的单一基因表现谱(individual gene expression profiles),可以用基因注记(gene annotation)或预先运算之表现谱特征为基础搜索特定表现谱数据。
通过来自全世界的真核物种基因集,本数据库可查找出假设的同源群体数据。
本数据库提供通过演化相关实验而收集的DNA序列组,这些序列组可能来自相同物种中不同成员,也可能来自不同物种的有机物。
本数据库可运算出来自相同基因座(locus)的转译文本,依照健康状态、年龄、以及组织来分析表现型,以及提供相关蛋白质以及相关生物拷贝所需资源(clone resources)。
本数据库收集遗传变异及其与人类健康之关系的相关信息。
本数据库全称为“基因型与表现型数据库”(The database of Genotypes and Phenotypes, dbGaP),主要致力于典藏与传播人类基因型与表现型交互作用相关观察及研究所产生之数据。
本数据库包含人类单一核甘酸变异、微卫星DNA (microsatellites)、小规模核甘酸的插入/缺失及其造成的分子结果、以及突变(一般与临床)的基因组与RefSeq比对信息。
本数据库为人类基因组结构变异相关数据库,包含DNA片段缺失、插入、重复、重排、倒位等。
全称为遗传学测试注册数据库(The Genetic Testing Registry, GTR®),提供全世界的自愿者注册其所进行的遗传学测试信息,范围包含测试目的、方法、信度、测验的实用证据、以及实验室的连络信息等。
本数据库集成了人类医疗遗传学相关信息,例如某些疾病状态特性与遗传之关系,本数据库也提供医疗遗传学相关文献链接。
本数据库汇整人类基因与遗传表现型,免费且每天更新,本数据库由约翰霍普金斯医学院McKusick-Nathans遗传医学研究所负责维护,所长为Ada Hamosh博士,此数据库的官方主页为omim.org.
全称为保守结构域数据库(Conserved Domain Database),提供蛋白质中功能单元注记所需资源,收录NCBI利用3D结构产生的结构域模型,帮助了解序列/结构/功能的关联。
全称为相似蛋白质群组数据库(Identical Protein Groups),在单一款目下集成不同来源,如GenBank、RefSeq、SwissProt、以及PDB等等的相似蛋白质序列数据,本数据库让研究者可获得更精准的结果,并快速找到与研究主题相关之蛋白质。
收录来自GenBank、RefSeq、TPA、SwissProt、PIR、PRF、及PDB等数据库的蛋白质序列数据。
收录相似蛋白质序列群集,包含自完整注记基因组、细胞器、或质体中截取之蛋白质,目前限制在古细菌、细菌、植物、真菌类、原生生物等类别。
依照结构域架构(domain architecture)所做的蛋白质功能分类。
收录分子生物结构实验产出之3D结构,可提供生物功能以及大分子演化历史等丰富信息,也可用来验证序列-结构-功能的关系、交互作用、活性位点(active sites)等。
提供基因组组装信息,包含已组装之基因组、组装名称、统计报表、以及基因组序列数据之链接等。
博物馆、标本馆以及其他生物寄存单位之收藏清单(以Collection为单位)。
提供数据给NCBI之生物计划小组清单。
提供上传至NCBI之生物资源之描述与后设数据,原始数据存放于SRA, GEO, dbGaP, GenBank, EST, GSS, WGS等数据库,且可链接至BioProject数据库。这些描述与后设数据内容是由生物资源上传者提供。
提供来自全世界研究者所产出的DNA与RNA序列数据。
本数据库是用来从事各种生物医学研究应用之核酸试剂的公开注册平台,收录信息包含、探测效度、以及经计算的序列相似性等信息。
收集通过新一代定序工具取得之基因序列数据,例如Roche 454 GS System®, Illumina Genome Analyzer®, Applied Biosystems SOLiD System®, Helicos Heliscope®, Complete Genomics®, and Pacific Biosciences SMRT®等。
本数据库可查得公开序列数据库中有机物的分类与命名法。目前大约收录地球上10%的已知物种信息。
提供链接至各种生物系统,包含其组成的基因、蛋白质、以及小分子信息(含传导路径等),另外也包含文献数据,以及Entrez上的相关数据。
本数据库包含PubChem Subtance中对于化学物质的生物活动监控信息,本数据库针对每个生物检定法(bioassay)提供可搜索的描述,包含各种情况及特定监控程序之输出(readouts)。
本数据库提供有效的描述性信息用以描述PubChem Substance数据库中的物质。储存于本数据库中的化学结构都被按照相似性与名称聚集起来,并充分互相参照。
本数据库收录样本的描述,并提供的链接至PubChem BioAssay数据库的生物监控结果信息,如果这些化学内容包含了已知化学物质,则会提供链接至PubChem Compound数据库。
参考数据:https://www.ncbi.nlm.nih.gov/Web/Search/entrezfs.html
post by: Wen-Chi Huang