当前位置: 首页» 专题» 聚焦2024全国两会» 提案议案

农工党界别小组关于建立国家级生物多样性公共数据库 加强和改善数据共享的提案

长期以来,全世界科学研究产生的生物多样性数据在发表论文时都要提交给国际三大数据库,即美国国立生物技术信息中心(NCBI)、欧洲生物信息学研究所(EBI)和日本核酸数据库(DDBJ)。截至目前,我国已有数千TB的生物学数据存储在国外生物数据中心。2018年,科学技术部首次公开了涉及人类遗传资源的行政处罚案例,对违反《人类遗传资源管理暂行办法》(国办发〔1998〕36号)《中华人民共和国行政处罚法》等有关规定,违规采集、收集、买卖、出口、出境人类遗传资源的相关单位作出行政处罚。案例显示,某些机构、企业漠视国家管理规范,违规将大量基因资源和检测数据输送境外,严重威胁了我国生物数字主权。

同时,我国科学基金项目和重点研发计划产生了大量生物多样性数据,由于生物安全数据管理的要求,这些生物大数据分散在不同研究单位和实验室,成为无法共享和进一步挖掘利用的“数据孤岛”。2016年12月,国家发改委联合8部门发布的《国家重大科技基础设施建设“十三五”规划》,将“国家生物医学大数据基础设施”建设方案列入5个后备项目之一。截至目前,国内有若干运行较好的数据库,但真正能够整合大量国内数据的公共数据库不多,而且规模有限,基本不具备共享、整合并提供大规模数据服务的能力。

为此,建议:

一是建立国家级生物多样性公共数据库。对标国际三大数据库,高水平建设我国公共的生物多样性数据库。明确任务落实的责任部门和责任单位,可新建,也可依托原有某个数据库进行升级改造,还可以在大型公共基础数据库上设立生物多样性主题数据库。

二是设立专门管理部门,建立生物多样性数据评级分类制度。依托国家数据局设立专门部门,负责监督和管理生物多样性数据的安全和隐私保护,制定标准、审核项目、协调数据共享等任务。建立生物多样性数据的分类制度,区分不同级别的数据敏感性,根据级别采用不同的保护措施,尽可能开放能公开共享的数据,对于基因信息等敏感或重要数据,尽可能封闭,保障安全。

三是结合现有数据格式,制定通用数据标准,设立数据审核机制。组织专业机构制定通用的生物多样性数据标准。标准应该涵盖数据格式、元数据规范、命名约定等,以确保数据的一致性和互操作性。建立数据审核机制,通过设立数据审核委员会或使用自动化工具进行数据质量检查,确保科研人员共享的数据符合规定的格式和标准。

四是推动开放数据倡议,制定数据共享协议,明确数据共享期限。由国家自然科学基金委员会发起并推动开放数据倡议,鼓励研究机构、科研人员和数据提供者加入开放数据倡议,承诺遵守通用标准并将数据开放共享。明确定义数据共享的内容、类型及时间节点,使用具体的时间或者特定的事件触发机制来定义共享期限,如明确指定在协议签署后的若干时间内共享数据,或者当研究论文发表、项目完成、特定里程碑达成等事件发生时,共享期限开始或结束。

五是开发数据编辑工具,加强平台的数据安全管理,建立违规处罚政策。开发便捷的数据管理工具和安全平台,支持研究者将其数据以符合标准格式的方式上传和共享。加强数字化技术的应用和数据管理规范化,加强对生物大数据安全和隐私保护的管理,严厉惩处违反数据安全和隐私规定的行为。