关于平台
中国科学院作为中国自然科学的研究中心,在长期的科学研究实践中,通过观测、考察、试验、计算等多种途径产生和积累了大量具有重要科学价值和实用意义的科学数据和资
上世纪80年代,利用数据库技术来保存和管理科学数据的研究所逐渐增多。为了促进更多的研究所以数据库技术更有效地管理和开发应用积累的科学数据,中国科学院于1982年将科学数据库建设列入了“七五”和后十年重大基本建设项目,并于1984年成立了“科学数据库工程筹备处”(设立在中国科学院计算中心),提出了“科学数据库及其信息系统工程”可行性研究报告。1986年,国家计委对“科学数据库及其信息系统”工程任务书进行了批复,科学数据库及其信息系统开始启动建设。1987年,第一批19个专业库鉴定了建库项目协议书,正式启动科学数据资源建设。
在“十五”期间,科学数据库项目资助的建库单位已达到45个。到“十五”结束之时,科学数据库的专业子库数量达到了503个,总数据量达到16.6TB,其中可通过网络共享的数据量达到9.48TB。数据库内容更加丰富,覆盖了物理、化学、天文与空间、材料、生物、地学、资源、环境、能源、海洋等众多学科领域,数据库种类包括数值库、事实库和多媒体库。科学数据库二十年的发展不仅为中国科学院乃至我国积累了一批宝贵的科学数据资源,成为中国科学院乃至我国科技创新的重要基础数据平台。除数据资源建设外,“十五”期间,科学数据库项目开始重视标准规范的研制与实施工作,陆续研制完成了一系列标准规范和支撑软件工具体系,初步建成了科学数据库支撑服务体系。
“十一五”期间,鉴于数据资源的迅速增长、对数据资源重要性认识的普及以及对数据资源长期、妥善保存日益增长的需求,在科学数据库数据资源建设与服务之外,专门设立了“数据资源中心建设”任务,面向中国科学院重要数据资产备份、长期保存的需求,建设存储能力6PB的海量数据存储与处理设施,为各研究所和广大科研人员提供多种形式的存储服务。科学数据库系统的建设、数据资源中心的建设以及基于数据资源和存储资源建立各种应用和提供各种服务,三者共同构成了中国科学院“十一五”信息化建设重大专项“数据应用环境建设与服务”项目的内容。
“十二五”期间,中国科学院面向科技创新和科研信息化需求,启动“科技数据资源整合与共享工程”建设,目标着眼于“海•云”思想,全面推动全院科技数据基础资源、海量存储与处理基础设施、数据集成与应用先进环境的建设与服务。计算机网络信息中心作为总承担单位,秉承“统筹规划,整合集成,公开共享,服务科研”原则,到2015年底科技数据资源整合与共享工程项目建成了52PB 存储容量的数据资源中心,系统地整合了58家单位的科学数据库,可共享数据量达655TB。初步实现了以基础设施云服务、科研数据云服务、数据应用云服务为主体的多层次、交叉式信息化服务体系;立足中国科学院,面向科技界,逐渐建设形成共享开放、服务创新的国家级科技数据中心。
当前正处在“十三五”建设期间内,十三五科学大数据工程的总体目标是建设科学大数据管理与分析平台,完善科学大数据资源体系和公共服务云平台,发展大数据驱动科研创新的应用示范,显著提升我院科学大数据支撑服务水平,显著提升我院科学数据资源共享开放水平,显著提升我院科学大数据应用水平,奠基我院“十三五”规划之“数据与计算平台”,推动国家科学大数据中心建设。目前,已建成具有PB级数据管理能力的大数据管理平台,实现了10类以上主流大数据管理处理系统的一键式部署、配置管理和监控;建成数据分析软件云服务平台,已实现4类共性的数据挖掘算法与工具软件云服务:已构建2类共性的工具软件云服务(iJupyter、iWorkflow);已构建2类共性的数据挖掘算法库(基于R语言、基于python语言的等)。完成分布式数据汇聚与关联网络建设全部子系统基本建设任务;重点覆盖分布式数据资源传输汇聚子系统、数据资源管理与发布子系统,数据资源服务与关联化集成子系统(含服务监控统计)的研发、测试、部署。通过技术优化和系统扩展,已初步具备了支撑亿级数据对象关联管理能力。通过四个大数据驱动学科创新示范平台建设,探索了数据驱动科技创新和科学发现的新模式,以及示范性验证我院科学大数据管理、分析挖掘和应用等新技术的突破,促进新技术与学科领域的融合示范持续推动。同时,科学数据库持续积累与服务提升,建设了七个学科领域重点数据库及二十个特色数据库,采用“绩效评估、运行补贴”的模式,完善了科学数据资源体系建设。
关于中心
中国科学院计算机网络信息中心成立于1995年3月,是中国科学院科研信息化与管理信息化的系统集成、运行和服务保障机构,信息化应用技术的研发和示范基地。计算机网络信息中心现有13个业务部门,分别承担着中国科学院和国家的信息化建设与服务不同领域方向的建设、运行与服务任务。大数据技术与应用发展部源自1986年中国科学院科学数据库工程,长期负责中国科学院信息化环境存储设施的建设和运行服务。大数据部负责牵头中科院科学数据库建设和科技部基础科学数据共享服务平台项目,通过多年工作的积累,已提出一套完善的科学数据汇聚、存储、管理、共享与服务通用解决方案,同时也面向学科领域深度挖掘,建立了地理空间数据云等特色数据平台。大数据部仍将致力于数据环境提升为数据云服务。