数据学与数据科学

信息化是将现实世界中的事物和现象以数据的形式存储到CYBER空间中,是一个生产数据的过程。这些数据是自然和生命的一种表示形式,这些数据还记录了人类的行为,包括工作、生活和社会发展。今天,数据被快速大量地生产并存储在CYBER空间中,这种现象称为数据爆炸(data explosion),数据爆炸在CYBER空间中形成数据界(datanature)。数据是CYBER空间中的唯一存在,需要研究和探索CYBER空间中数据的规律和现象。另外,探索CYBER空间中数据的规律,就是探索宇宙的规律、探索生命的规律寻找人类行为的规律、寻找社会发展的规律的一种重要手段,例如:可以通过研究数据来研究生命(生物信息学)、研究人类行为(行为信息学)。数据学(Dataology)和数据科学(Data Science)是关于数据的科学或者研究数据的科学,定义为:研究探索Cyberspace中数据界(datanature)奥秘的理论、方法和技术,研究的对象是数据界中的数据。与自然科学和社会科学不同,数据学和数据科学的研究对象是Cyberspace的数据,是新的科学。数据学和数据科学主要有两个内涵:一个是研究数据本身,研究数据的各种类型、状态、属性及变化形式和变化规律;另一个是为自然科学和社会科学研究提供一种新的方法,称为科学研究的数据方法,其目的在于揭示自然界和人类行为现象和规律。

数据科学已经有一些方法和技术,例如:数据获取、数据存储与管理、数据安全、数据分析、可视化等;还需要有基础理论和新技术,例如:数据存在性、数据测度、时间、数据代数、数据相似性与簇论、数据分类与数据百科全书、数据伪装与识别、数据实验、数据感知等等。数据科学的理论和方法将改进现有的科学研究方法,形成新型的科学研究方法,并且针对各个研究领域开发出专门的理论、技术和方法,从而形成专门领域的数据学,例如:行为数据学、生命数据学、脑数据学、气象数据学、金融数据学、地理数据学等等。

数据产业是网络空间数据资源开发利用所形成的产业,其产业链主要包括:从网络空间获取数据并进行整合、加工和生产,数据产品传播、流通和交易,相关的法律和其他咨询服务。

在当今网络时代,数据产业含盖了数字出版与文化业、电子图书馆和情报业、多媒体产业、数字内容业、数据服务业和信息咨询业、领域数据资源开发服务业(政务、商务、科学、社会、金融、经济、地理等等)。

数据产业是信息产业的升级数据产业与信息产业的最大区别在于,信息产业主要是指信息化,是国民经济与社会信息化形成的产业,从技术效果上看是将现实世界中的事物以数据的形式存储到网络空间中,即信息化是一个生产数据的过程。而数据产业是对信息化生产的数据进行收集整合、开发利用而形成的产业。

产业升级表现为:从基础设施和设备投资转向对数据资源的投资;从“国民经济与社会信息化战略”转向“基于网络空间的现代国家管理发展战略”。

数据产业是战略型新兴产业,数据科技是智慧城市、云计算、物联网的核心。

(引用标注:朱扬勇,熊赟.数据学和数据科学[TR][OL].2009.available at: http://dataology.fudan.edu.cn/85/83/c4598a34179/page.htm)

友情链接
联系我们
地址: 中国 上海市杨浦区淞沪路2005号复旦大学江湾校区2号交叉学科楼
邮编: 200438
电话: +86-21-31242153
传真: +86-21-31242153
E-mail: dataology@fudan.edu.cn