大数据是数据、技术,还是应用

朱扬勇1,2,熊 赟1,2

1. 复旦大学计算机科学技术学院 上海 201203;2. 上海市数据科学重点实验室(筹) 上海 201203

 

摘要

通常认为大数据是一个现有技术难以处理的复杂而庞大的数据集,这将导致一个谬误的出现:大数据都不能被处理,能处理的都不是大数据。显然,如何定义大数据是一个问题。分析了已有的大数据定义和现象,发现数据、技术和应用是大数据的3个要素,但不能将大数据定义为一个数据集,也不能将大数据定义为一批技术,更不能将大数据定义为一个应用。基于此,定义大数据是为决策问题提供服务的大数据集、大数据技术和大数据应用的总称。其中,大数据集是指一个决策问题所用到的所有可能的数据,而不是一个领域的所有数据。还给出了大数据应用遇到的6个问题及大数据技术挑战,并指出大数据储备技术、大数据开发技术、数据科学是大数据未来的研究方向。


关键词

大数据;数据科学;数据界

 

论文引用格式:

朱扬勇,熊赟. 大数据是数据、技术,还是应用. 大数据, 2015007

 

全文下载:大数据是数据、技术,还是应用