科学研究的数据方法

    目前,几乎所有的科学研究都使用了计算机,在计算机系统中都存放有巨量的数据,科学研究面临方法的变革和创新,需要研究基于数据和数据技术的科学研究方法,称为科学研究的数据方法。科学研究方法从之前的“科学假设”-->“科学实验”-->“实验结果分析”-->“证伪假设”-->“科学假设”,转变为“科学假设”-->“数据获取与整合形成数据资源”-->“数据挖掘与分析”-->“数据结果分析”-->“科学实验”-->“实验结果分析”-->“证伪假设”-->“科学假设”,从而利用数据提高科学研究的效果和效率。


领域数据学

    现代科学研究需要多种研究方法的融合,例如,生物实验方法和生物计算方法的融合,产生了生物信息学。如何将数据方法融合到具体领域的科学研究中是一个重要课题,需要探索数据密集型科学研究的共性问题,并在基础较好的学科中开展实践。除一般的理论和方法,对数据内容的很多研究将由各领域的科学家来进行,发展专门的理论、技术和方法,从而形成专门领域的数据学,例如:脑数据学、行为数据学、生物数据学、气象数据学、金融数据学、地理数据学等等。


大数据复杂性

    大数据的复杂性是制约大数据处理效率和效果的关键要素之一,也是大数据处理成为一个技术问题的重要因素。大数据复杂性分析需要从系统层面,运用系统科学的基础理论与方法探索其机理、寻找基本方法体系(包括:研究数据集复杂性的建模理论、处理过程复杂性的约简方法、知识体系复杂性的表示理论等),建立大数据处理、分析的过程模型。 


大数据挖掘技术

    通过分析大数据的复杂性以及大数据环境下产生的新数据挖掘需求,归纳、抽象和定义新型数据挖掘任务(例如数据网络挖掘、特异群组挖掘、图挖掘等),提出相应的数据挖掘度量(例如特异度度量、兴趣度度量等),建立针对复杂数据的新型挖掘模型,优化数据挖掘算法等,在形式化定义的基础上形成新型数据挖掘理论体系和方法框架。 


大数据应用

    面向上海经济建设和社会发展重大需求,开展科技成果转化和产学研结合工作,研究数据技术在上海智慧城市建设中的应用,包括智慧交通、智慧医疗、智慧金融等各领域的应用,例如个性化线路推荐、数字医院、移动医疗、区域医疗建设、舆情与市场行情异常波动分析等。