概述
NOMAD(Novel Materials Discovery)是一个专注于材料科学的开源数据平台,旨在帮助研究者管理、共享和发布可重复使用的研究数据。平台由 FAIRmat 联盟开发和运营,提供在线服务与可部署的解决方案(NOMAD Oasis),适用于个人上传、团队协作以及对外发布。NOMAD 强调 FAIR 原则(可查找、可访问、可互操作、可重复使用),并通过结构化的数据抽取、统一的数据格式与开放许可(CC-BY-4.0)来提高数据的可重用性和可发现性。
核心能力
-
文件解析与数据抽取: 从 60+ 种文件格式中自动提取结构化数据与元数据,统一表示不同计算代码和实验流程的结果。
-
搜索与可视化: 基于丰富的元数据进行全文检索与过滤,支持数据预览、图形化可视化以及按需下载原始文件或处理后的数据。
-
发布与引用: 支持将数据集发布到公共库并分配 DOI,便于同行重用和引用,且默认采用 CC-BY-4.0 许可提升开放获取性。
-
可编程访问与分析工具: 所有功能均可通过 REST API 和编程接口访问,平台内置可在浏览器中运行的笔记本环境,并提供一个AI 工具包,便于开展机器学习与高通量分析。
-
团队级管理(NOMAD Oasis): NOMAD Oasis 可在用户自有资源上部署,提供本地权限控制、数据整合、定制化 ELN(电子实验记录)以及将选定数据发布到公共 NOMAD 的通道(即将支持长期存档功能)。
额外特性与生态
NOMAD 提供统计与透明的使用数据(例如上传条目数、表示材料数、存储量等),并通过社区渠道(如 Discord)维持活跃的用户与开发者生态。其设计兼顾研究工作流的灵活性與长期可持续性,能够与现有科研基础设施和数据管理策略集成。平台为科研人员提供从数据生成、处理、管理到发布的端到端支持,并鼓励采用开放数据与可重用的数据实践。
推荐原因
NOMAD 适合需要处理大量异构计算或实验数据的材料科学团队与个人研究者。其优势在于:
- 提高数据可重复性与可发现性:通过结构化抽取与统一格式,降低复现与二次利用门槛。
- 端到端工作流支持:从上传、索引、分析到发布均有支持,减少重复劳动。
- 灵活的部署与开放生态:既可以使用公共服务快速共享,也可以部署 NOMAD Oasis 实现本地化管理与合规控制。
NOMAD 是一个面向未来的科研数据基础设施组件,尤其适合希望将材料数据转化为可机器处理、可组合与可扩展知识资源的研究单位。


