美国地质调查局“科学数据生命周期模型”的开发、批准和实施

以下为文章摘要,如需全文,请订阅我们的产品。

1、引言

美国地质调查局(USGS)已经认识到,需要一种有针对性的方法来确保USGS的科学产品在得到充分保护的同时易于获取。2009年,USGS建立了数据集成团队(CDI),目的是充分利用该机构及其合作伙伴在数据管理、信息技术、档案和信息管理以及信息治理等方面已有的专业知识。在CDI中,数据管理工作组(DMWG)的主要工作是让数据管理方法与USGS的业务流程衔接得更加紧密。DMWG的重要成果之一是数据生命周期模型的概念化、开发和发布,而USGS的数据管理活动均遵守该模型。目前,“科学数据生命周期模型”已经从不同方面证明了对USGS十分有用。一个基于该模型建立的数据管理网站,为USGS的科学家提供了运用该模型各组件的方法和工具。2017年,针对模型中的元素,还发布了一套数据管理规定。最后,为了USGS科学家进行数据管理,根据该模型还构建和维护了相关的企业应用程序与工具。“科学数据生命周期模型”是USGS数据管理过程中沟通与实践的关键组成部分。

2、初期工作

最初,DMWG相信能找到一种合适的模型(可能需要极少量的优化)交由USGS使用。跨学科研究小组通过文献检索,发现了许多可能有用的生命周期模型。然后用各种检索方法,找到开发这些模型的高校、机构和国际组织,以便获取模型资料进行研究。随后该小组用数月时间,每周定期开会对每个模型进行了深入研究。研究团队对每个生命周期模型中的每个元素都进行了讨论,并从多学科角度评估了该元素表示USGS业务流程的能力。

最终提出了“USGS科学数据生命周期模型”,该模型及其相关说明自2013年发布以来广泛影响了USGS科学数据管理的发展方向。“保存”这个元素在模型中的位置十分重要。在生命周期中,“保存”位于“发布/共享”之前,具有独特的战略地位,它特别体现了采取措施保护“科学数据”这个USGS最有价值的资产之一的重要性。还有一点值得注意的是,在模型中采用了线状连续过程来表示流程(图1)。虽然用多个循环图更易于表达科学研究过程的复杂性,但模型的作者希望该模型能够被更快地理解,因而选择了相对简单的线状图形。

图1 USGS科学数据生命周期模型

3、USGS数据管理网站

“USGS数据管理网站”于2012年推出,是由CDI资助的合作研究成果之一,最初是围绕着“科学数据生命周期模型”的概念而构思的。该网站作为一种机制,为该模型的每个概念提供指引、工具和方法,还通过介绍应遵循的相关规定,为USGS政策的实施提供了支撑(图2)。

图2 USGS数据管理网站

4、科学数据生命周期的支持工具

介绍DMPTool、元数据在线编辑器、元数据向导工具、DOITool、ScienceBase、USGS科学数据目录等模块进行介绍。

5、结论

USGS在地质调查过程中开展了大范围、综合性、世界级科学研究,生产了能够被广大用户所利用的信息产品和科学数据。USGS认识到,为科研人员开展数据管理提供支撑,实现科学数据的可获得、可理解、可保存和可复用,这是一项重大需求。USGS开发了“科学数据生命周期模型”来构建数据管理政策和工具,并开展教育和培训指导。“科学数据生命周期模型”已经成为新的、更全面的数据管理政策及其实现工具的基础。USGS发布的相关政策体现了认识科学数据生命周期的重要性,反映了数据管理计划所能发挥的重要作用,表明了良好元数据的关键意义以及USGS为确保科学数据未来可复用所担负的重大责任。美国国家海洋和大气管理局准确地概括了联邦研究机构的责任,指出“对地球及其周围空间进行准确、及时和全面的观测对于支持政府决策和政策制定、科学研究以及保障国家和世界的经济、环境和公共健康至关重要。”USGS的“科学数据生命周期模型”有助于USGS履行其职责,因为它已经成为一种具有影响力的较完善的方法,包括了实现卓有成效的数据管理所必需的各项活动,也体现了USGS全力实现提供重要的基础性地球科学数据的承诺。未来数年,该模型将继续为USGS服务。它将继续作为制定未来数据管理政策的基础,也将作为科学数据管理应用开发的框架。

未经允许不得转载:地学情报 » 美国地质调查局“科学数据生命周期模型”的开发、批准和实施

赞 (1)