中国科学院北京基因组研究所(国家生物信息中心)国家基因组科学数据中心在Genomics Proteomics & Bioinformatics上发表了最新研发成果,全球生物数据库目录Database Commons正式发布。

文章题目
Database Commons: A Catalog of Worldwide Biological Databases
第一作者:Lina Ma, Dong Zou, Lin Liu
通讯作者:Lina Ma, Zhang Zhang
通讯单位:中国科学院北京基因组研究所(国家生物信息中心)国家基因组科学数据中心
杂志:Genomics Proteomics & Bioinformatics
影响因子:6.409/Q1
文章链接:
https://doi.org/10.1016/j.gpb.2022.12.004
数据库链接:
https://ngdc.cncb.ac.cn/databasecommons/
研究背景
由于高通量测序技术的应用日益广泛,生物数据以爆炸性的速度和规模生成,导致数据处理的瓶颈从生产到管理转移。在如今的大数据时代,生物数据库存档、集成和共享不同类型的生物数据已是大势所趋,然而缺少全球生物数据库的标准化信息整合和评估平台。随着生物数据库规模和重要性不断增加,目前尚不清楚全球生物数据库数量,有哪些机构和国家参与,以及它们对生命科学及相关学科研究的影响。
全球生物数据库能够有效应对数据洪流,作为全球科学界共用基础设施为科学研究提供基础数据资源,并推动生命科学和相关学科的重大创新。
研究意义
Database Commons提供了一个全面而系统的生物数据库目录,此外它还提供多种评估来描述数据库的科学影响,并相应地产生一系列统计数据和全球范围内生物数据库发展趋势,为更好地了解数据库发展态势及其对生命科学和相关学科研究的影响提供全球性视角。
数据库共享是一个涵盖不同物种的全球生物数据库策划目录,所包含的数据种类繁多,并由不同国家的不同机构开发/维护。

▲全球生物数据库概况(截至2022年9月20日)
研究者们从8931种出版材料中筛选了5825个生物数据库,这些数据库分布在72个国家/地区,由1975个机构整理(截至2022年9月20日)。新提出一种评价指标z-index,结合引用次数和用户评分等多方面评估数据库质量和影响力;并根据文章引用和z-index对所有生物数据库及其隶属机构和国家进行排名。

▲Database Commons数据库首页
研究者提供了一系列世界范围内生物数据库的统计数据和趋势,提供了一个全球视角,以更好地了解它们对生命科学和相关学科的排名和影响。全球生物数据库的最新目录及其元信息和衍生统计数据都可以在数据库中公开获取。