数据汇交
DATA ARCHIVING

项目汇交邮箱:datarchive@cnic.cn

王老师:8610-58813784

常见问题

问:科学数据是什么?

答:根据《科学数据管理办法》,科学数据主要包括在自然科学、工程技术等领域,通过基础研究、应用研究、试验开发等产生的数据,以及通过观测监测、考察调查、检验检测等方式取得并可用于科学研究活动的原始数据及其衍生数据。


问:为什么要做科技项目的科学数据汇交?

答:科学数据是信息时代传播速度最快、影响面最宽、开发利用潜力最大的战略性、基础性科技资源。近年来,随着我国科技投入不断增加,科学数据呈现出“井喷式”增长,而且质量大幅提高,为中国创新型国家建设奠定了良好基础。为进一步提升我国科学数据工作水平,充分发挥国家财政投入产出的综合利用效益,提高科技创新、经济社会发展、国家安全、人民健康等方面的支撑保障能力。2018年,国务院办公厅正式发布《科学数据管理办法》,明确提出“各级科技计划(专项、基金等)管理部门应建立先汇交科学数据、再验收科技计划(专项、基金等)项目的机制”。


问:科技项目科学数据汇交在任何一家国家科学数据中心都可以吗?

答:《科技部、财政部关于发布国家科技资源共享服务平台优化调整名单的通知》(国科发基〔2019〕194 号)公布了 20个国家科学数据中心,均可以协助科技计划项目管理方、科技计划项目方完成科学数据汇交。建议优先选择项目管理方指定的对口国家科学数据中心,或者按学科就近原则自行联系。本中心面向基础学科,具有跨学科性质,将提供项目数据汇交的综合服务。

20个国家科学数据中心数据汇交联系信息:https://www.escience.org.cn/data-archive/contact


问:是否只有牵头单位负有汇交数据的责任?

答:项目牵头单位对重点研发计划科学数据汇交总体负责,牵头汇总项目成员单位产生的科学数据后,统一提交至本中心。

根据《科技计划项目科学数据汇交工作方案(试行)》(国科办基〔2019〕104号)文件,课题承担方、参与方均有责任、有义务向项目牵头单位如实提交科学数据,全面配合科学数据汇交工作。


问:本中心的项目汇交数据范围?

答:本中心要求项目方汇交如下科学数据:

(1).考核指标或研究内容中“数据库”:项目任务书中的考核指标或研究内容中涉及的数据库、数据集、规则库等,数据量应不低于考核指标所约定的指标值;

(2).项目实施过程中产生的原始性观测数据、探测数据、试验数据、实验数据、调查数据、考察数据、统计数据、模拟仿真数据等;

(3).研究过程中产生的分析数据

(4).关键考核指标的支撑数据(检测报告、论文、新方法、新理论等)

(5).设备运行、信息系统、(云)平台等,项目期数据。


问:没有科学数据汇交指标,是否需要制定科学数据汇交计划?

答:科技项目没有与科学数据相关的考核指标,且项目实施过程中也不产生任何具有汇交、再利用意义科学数据的(详见前一问题),可以提请项目管理方、项目责任专家等共同议定,然后把共识性结论书面提供给本中心。


问:哪些数据不在汇交范围?

答:(1).项目实施过程中使用的第三方的数据可不汇交,但通过第三方数据分析处理后的数据应在汇交范围。

(2).涉密数据,即有相应资质的机关、 单位依法定密的数据;

(3).涉及个人隐私、企业或社会机构等不适合公布的敏感数据,必要时须进行脱敏处理后提交。


问:文章、专利、研究报告、测试报告是否在汇交范围之内?

答:严格意义上来说,这些材料不属于科学数据。支撑文章、专利等科研成果的科学数据应该汇交,在汇交时建议说明科学数据支撑产出的成果。测试报告常常是成果的考核方式,和关键考核指标的评测密切相关,评测数据应当汇交,相应的测试报告可以作为测试数据的质控文档一并提交。

原则上由项目资助的文章支撑数据应全面汇交,但文章与数据集的数量并非要求一对一的关系。


问:如何理解数据集的元数据信息?

答:元数据就是数据的数据,对于项目科学数据汇交而言,为了便于共享用户发现、了解、访问和使用数据,需要为每个数据集填写一条相应的数据集元数据信息。


问:数据集的命名原则?

答:数据集可以按照相关成果分类,也可以根据指标具体细分,划分粒度可自行定义即可。数据集的名称需要尽量体现数据的主题内容,描述精准、范围恰当;应从数据的来源、时间、位置、研究对象类型、所记录的主要信息等维度考虑数据集的命名。

《科学数据汇交计划》资源清单中数据集名称应与《科学数据质量报告》、《数据集元数据信息表》、实体数据保持一致。


问:对于已经在验收期的项目(立项时间为2016年-2018年),从制订科学数据汇交计划到获得汇交凭证平均需要多长时间?

答:一般来说,项目数据汇交要经过如下流程:①制定汇交计划②汇交计划形式审核③汇交计划专家审核④整理提交数据⑤数据形式审核⑥数据专家审核⑦邮寄纸质材料⑧开具凭证。

完成时间和项目方材料对工作理解程度、材料准备情况、组织专家评审效率呈正相关。以本中心收到项目任务书为起点,拿到汇交凭证为截止计算,平均需要两个月左右的时间。


问:形式审核主要包括哪些方面?

答:本中心负责汇交材料等形式审核。主要按照《科学数据汇交计划》和科学数据标准规范要求对于汇交数据的技术质量进行形式审核,包括数据的完整性、规范性、一致性和安全性等方面,对汇交数据的质量不做深入研究。主要审核内容有:

完整与规范性:汇交材料是否完整、规范,是否符合共享发布的条件;数据文件是否完整;数据组织是否规范;数据命名是否规范等。

一致性:结合项目任务书,《科学数据汇交计划》、数据描述信息、数据实体是否保持一致。形式审核不合格的,需要数据汇交方及时进行修改并重新提交审查。


问:同行专家评审主要包括哪些方面?

答:同行专家评审主要分为《科学数据汇交计划》和科学数据的评审。

原则上汇交项目的《科学数据汇交计划》、科学数据均应在本中心形式审核通过后,组织同行专家评审,对《科学数据汇交计划》是否符合项目任务书规定的研究内容、考核指标,以及项目实施的实际情况等作出专业判断;对汇交数据的科学质量进行评估,包括数据的真实性、准确性和可用性等方面。如能提供证明数据质量的材料可以免审数据,如第三方检测报告、现场专家审查报告等。

若提交的《科学数据汇交计划》、科学数据存在问题,需要数据提交方及时进行修改并重s新提交审查。


问:同行专家如何评审数据?

答:本中心和数据提交方应为评审专家提供可在线访问、下载、预览和校验所提交数据的审核环境,包括专门的辅助软件工具。如汇交数据量较大,可采用抽样评审,对照《科学数据汇交计划》等材料综合评判汇交数据的科学质量并出具评审意见。具体抽样的样本数量、抽样规则等由评审专家自行决定。


问:同行专家评审组织方式?

答:科学数据汇交计划及科学数据形式审核通过之后,原则上由本中心统一组织同行专家评审,特殊情况下可在本中心组织和要求下由项目方自行组织。

要求至少3名同行专家评审。且遵循评审回避原则,同行专家须与项目(单位)无关联关系。相关评审材料须提交给本中心作为汇交凭证开具依据。


问:项目产生的数据为涉密数据,是否需要汇交?

答:项目产生的涉密数据不需汇交,这里所说的涉密数据应由具有相应资质的机关、 单位定密。

项目内部数据不属于涉密数据,内部数据可在项目管理方同意的前提下,按相关管理原则设定优先试用期,一般不超过12个月。


问:数据实体和各类科学数据描述信息的提交时间有什么要求?

答:原则上科技计划项目科学数据汇交应在项目验收结题前保质保量完成,并取得汇交凭证,客观原因不能完成的,科技计划项目方应明确提出后续汇交计划。

注:在国家科技管理信息系统公共服务平台填报项目绩效评价材料时,数据汇交方案及凭证作为必填项需要同时提交,具体可咨询项目管理机构。


问:汇交数据能不能全部“不开放”?

答:不可以。应对《科学数据管理办法》中“开放为常态,不开放为例外”等要求加深理解,认识到数据共享发布是项目工作意义的延伸体现,落实任务书相关指标,合理开放共享,不人为设置障碍阻止数据共享。


问:涉及机构核心竞争力的数据可否不交?

答:原则上涉及机构核心竞争力的数据不属于涉密数据,应当汇交。必要时需提交申请,由项目管理机构、责任专家和数据管理机构共同商定。


问:汇交数据通过何种方式提交给本中心?

答:结合数据量的大小、数据汇交方的实际网络环境等要求,目前可采用在线(小于1TB的,建议邮件、FTP)和离线(大于1TB的,建议硬盘)等多种方式提交。

如采用FTP方式提交,需联系本中心开通账户。后期项目方可在线填报项目相关信息后,开通独立的空间进行数据的上传。


问:科学数据提交和存储的费用如何计算?

答:目前凡指定国家基础学科公共科学数据中心为数据管理方的国家重点研发计划项目科学数据汇交,数据存储、管理和开放共享均不收费。