俊才|国家微生物科学数据中心

细菌、病毒、真菌、支原体、衣原体……
谈及它们 , 你定会避之不及 。 但是 , 你知道吗?在地球生物圈 , 它们占据着重要位置——环境、食品、医药、健康、工业、农业、化学化工、材料、生物安全 , 与人类存续相关的所有环节 , 几乎都与它们有关 。 其家族成员还包括放线菌、立克次氏体、螺旋体……它们 , 都是微生物 。
微生物研究 , 是科技界持续关注的热点 , 也正因此 , 微生物科学数据成为一种重要战略资源 。
2019年6月 , 作为我国首批启动的20个国家科学数据中心之一 , 依托中科院微生物研究所 , 与中国疾控中心传染病所、中科院海洋所、中科院上海植物生理生态研究所、中科院计算机网络信息中心等单位共建的国家微生物科学数据中心 , 开始承担起保存、整合、挖掘、利用微生物科学数据的重大使命 。
模式微生物、基因序列、标本、菌种……从开始的自有数据共享 , 到如今 , 国家科技计划汇交数据、期刊数据、华大基因等测序公司数据源源不断地汇集 , 你能想象吗?这里 , 已汇集数据条数超过40亿、3PB;这里 , 已成为我国最重要、在世界上有极大影响力的微生物科学数据中心 。
不仅如此 , 国家微生物科学数据中心还制定了第一个微生物数据领域的国际ISO数据标准 , 覆盖资源、物种、组学、功能等方面的数据管理与发布 。 他们还在此基础上开发了拥有自主知识产权的数据管理平台 , 在国内外上百家单位使用 。
中心主任、中科院微生物所研究员马俊才时常会被问到这样一个问题:“国际上已经有GENBANK、GISAID等比较知名的微生物数据库 , 如果科学是无国界的 , 为什么我们还要建立自己的数据库?”
马俊才的回答总是耐心而坚定——
“国家微生物科学数据中心与这些数据库从来不是非此即彼的关系 , 它的建立 , 既是为了保障国家微生物数据主权 , 也是为了依法依规推动数据共享和国际交流 。 ”
马俊才说 , 目前几家比较大的数据库均在国外 , 数据收录和公布的流程比较复杂、时间比较长 , 有些数据库的下载还要收费 。
“我们国家财政支持的科研所产生的数据 , 中国科学家使用还得给别人交钱 , 这合理吗?”
好消息来了!马俊才说 , 作为国家科技资源共享服务平台 , 中心数据资源全部免费共享 , “这从某种程度上解决了我国科学家不能使用我国数据的窘境” 。
有了科学数据 , 还要让数据“活”起来——
国家微生物科学数据中心在数据的加工整理和分析挖掘上下了大功夫 。 马俊才说 , 他们以国家微生物科学数据中心为依托 , 与国家食品安全领域开展合作 , 建立了国家食源性致病微生物全基因组数据库及溯源网络 , 对31个省区市的60种食品基质、9000株细菌、500株真菌、500株病毒的菌种进行测序 , 并建立了相应的大数据平台和应用系统 , 保障国家食品安全 。

推荐阅读