个人简介
地址:中国上海杨浦区淞沪路2005号江湾校区2号交叉学科楼
E-mail: yyzhu@fudan.edu.cn
Tel: +86-21-51355519
Fax: +86-21-51355518
复旦大学计算机科学技术学院教授、博士生导师,上海市曙光学者,上海市数据科学重点实验室主任,《大数据》期刊编委会副主任、大数据协同安全国家工程实验室副理事长、中国自动化学会国防大数据专委会副主任、中国计算机学会大数据专家委员会首批专家、农业大数据产业技术创新战略联盟副理事长兼首席科学家、上海市大数据专家。从事数据领域研究25年,是国内最早一批从事数据挖掘研究的学者,是国际数据科学研究的主要倡导者之一。主持过国家自然科学基金、国家863计划项目、上海市科委重点等多项数据挖掘领域的研究课题,曾获上海市科技进步一、二、三等奖。相关研究成果在国内外权威期刊或会议上发表论文100余篇,出版专著2本,教材3本。2009年发表了数据科学论文“Data Explosion, Data Nature and Dataology”,并出版了第一本数据科学专著《数据学》(《DATAOLOGY AND DATASCIENCE》),对数据科学进行了系统化的探讨和描述。创办了“International Workshop on Dataology and Data Science”和“International Conference on Data Science”。第462次香山科学会议“数据科学与大数据的理论问题探索”的执行主席。《大数据技术与应用丛书》主编。
研究兴趣
数据科学和数据经济
数字化转型、数据财政、数据资产、数据自治与数据跨境等
数据挖掘及其应用(金融、保险、生物医疗、智能交通等领域)
科研项目
[1]特异群组挖掘算法研究国家自然科学基金项目
[2]证券行业云建设规划与设计方案企业合作
[3]“新一代高清图像智能交通监控与信息服务系统产业化” 上海市高新技术产业化重大项目计划
[4]“生物序列数据库数据模型、索引、体系结构研究” 国家自然科学基金项目
[5]“转录因子结合位点及其组合模块的挖掘” 国家863项目
[6]“军用计算机系统可测试性设计技术” 总装备部预研项目
[7]“海量信息系统可生存性分析方法及软件可生存性增强技术”之“面向入侵行为的软件结构调整算法” 国家973项目
[8]“某医院信息化发展规划” 企业合作项目
[9]“短线操纵行为模式与监管研究” 企业合作项目
[10]“药物靶点识别的生物信息学平台开发及应用” 国家863项目(项目副组长)
[11]“生物信息的整合与挖掘”之“整合的生物信息学数据仓库平台BioDW” 上海市重大科技项目
[12]“数据挖掘应用平台及相关技术研究” 上海市科学技术发展基金项目
[13]“世博网站的优化技术与实现” 上海市科学技术发展基金项目
[14]“数据挖掘应用平台研制及其应用” 国家863项目
[15]“数据采掘工具的研制及其应用” 国家863项目(共同负责人)
代表论文
[1]Yizhou Zhang,Yun Xiong,Xiangnan Kong,Shanshan Li,Jinhong Mi,Yangyong Zhu: Deep Collective Classification in Heterogeneous Information Networks. WWW. 2018: 399-408.
[2]Chang Liao, Yun Xiong, Xiangnan Kong, Yangyong Zhu, Shimin Zhao, Shanshan Li: Functional-Oriented Relationship Strength Estimation: From Online Events to Offline Interactions.DASFAA 2018, (1): 442-459.
[3]Yun Xiong, Yizhou Zhang, Xiangnan Kong, Yangyong Zhu: NetCycle+: A Framework for Collective Evolution Inference in Dynamic Heterogeneous Networks.IEEE Trans. Knowl. Data Eng. 2018, 30(8): 1547-1560 .
[4]Chang Liao, Yun Xiong, Xiangnan Kong, Yangyong Zhu: Tracking Dynamic Magnet Communities: Insights from a Network Perspective.DASFAA. 2018(1): 406-424.
[5]Guandong Sun, Yun Xiong, Yangyong Zhu:How the Passengers Flow in Complex Metro Networks?SSDBM. 2017: 23:1-23:6.
[6]Yao Zhang, Yun Xiong, Xiangnan Kong, Yangyong Zhu: Learning Node Embeddings in Interaction Graphs.CIKM. 2017: 397-406.
[7]Yao Zhang, Yun Xiong, Xinyue Liu, Xiangnan Kong, Yangyong Zhu: Meta-Path Graphical Lasso for Learning Heterogeneous Connectivities.SDM. 2017: 642-650.
[8]Mingmin Chi, Antonio Plaza, Jon Atli Benediktsson, Zhongyi Sun, Jinsheng Shen, Yangyong Zhu: Big Data for Remote Sensing: Challenges and Opportunities.Proceedings of the IEEE. 2016, 104(11): 2207-2219 .
[9]Yizhou Zhang, Yun Xiong, Xiangnan Kong, Yangyong Zhu: NetCycle: Collective Evolution Inference in Heterogeneous Information Networks.KDD. 2016: 1365-1374.
[10]Zhongyi Sun, Fengke Chen, Mingmin Chi, Yangyong Zhu: A Spark-Based Big Data Platform for Massive Remote Sensing Data Processing.ICDS. 2015: 120-126.
[11]Yangyong Zhu, Yun Xiong: Defining Data Science.Computer Science, 2015.
[12]Jing Sun, Yun Xiong, Yangyong Zhu, Junming Liu, Chu Guan, Hui Xiong: Multi-source Information Fusion for Personalized Restaurant Recommendation.SIGIR. 2015: 983-986.
[13]Li Cai,Yangyong Zhu: The Challenges of Data Quality and Data Quality Assessment in the Big Data Era. Data Science Journal. 2015,14(1): 21-23.
[14]Yun Xiong, Yangyong Zhu, Philip S. Yu: Top-k Similarity Join in Heterogeneous Information Networks.IEEE Trans. Knowl. Data Eng.2015, 27(6): 1710-1723.
[15]Zhu Y, Xiong Y. Towards Data Science. Data Science Journal. 2015, 14:1-7.
[16]Zhicheng Liao,Yun Xiong,Yangyong Zhu: DacIoT: A data cloud for the internet of things. Computer Science and Applications - Proceedings of the Asia-Pacific Conference on Computer Science and Applications (CSAC). 2014: 181-186.
[17]Zhicheng Liao,Yangyong Zhu: When a classifier meets more data. Procedia Computer Science. 2014, 30(30): 50-59.
[18]Xue Bai, Yun Xiong, Yangyong Zhu, Qi Liu, Zhiyuan Chen: Co-anomaly Event Detection in Multiple Temperature Series.KSEM2013: 1-14.
[19]Jing Sun, Yangyong Zhu: Microblogging Personalized Recommendation Based on Ego Networks.Web Intelligence2013: 165-170.
[20]Li Xue, Yun Xiong, Yangyong Zhu, Jianfeng Wu, Zhiyuan Chen: Stock Trend Prediction by Classifying Aggregative Web Topic-Opinion.PAKDD (2)2013: 173-184.
[21]Xue Bai, Yun Xiong, Yangyong Zhu, Hengshu Zhu: Time Series Representation: A Random Shifting Perspective.WAIM2013: 37-50.
[22]Yun Xiong,Yangyong Zhu,PhilipS.Yu,Jian Pei: Towards cohesive anomaly mining. Twenty-Seventh AAAI Conference on Artificial Intelligence. AAAI Press. 2013: 984-990.
[23]Xue Bai, Zezhen Lin, Yun Xiong, Yangyong Zhu: Clustering Based on Yukawa Potential.SDM2012: 672-683.
[24]Mingmin Chi, Jun Liu, Huijun He, Jiangfeng Bao, Yangyong Zhu: Construction of Chinese A-shares Network Using Latent Dirichlet Allocation.Web Intelligence2012: 45-49.
[25]Zhicheng Liao, Yun Xiong, Yangyong Zhu: FIND-A Data Cloud Platform for Financial Data Services.DATA2012: 117-122.
[26]Zhijie Lin, Yun Xiong, Yangyong Zhu: Link Prediction Using BenefitRanks in Weighted Networks. International Conferences on Web Intelligence and Intelligent Agent Technology, 2012(1): 423-430.
[27]Zhijie Lin, Yan Chen, Shiwei Wu, Yun Xiong, Yangyong Zhu, Guangyong Zheng: Mining hub-based protein complexes in massive biological networks.BIBM Workshops2012: 166-173.
[28]Li Xue, Yun Xiong, Yangyong Zhu: A Brain Data Integration Model Based on Multiple Ontology and Semantic Similarity.Brain Informatics2010: 192-199.
[29]Li Xue, Ming Chen, Yun Xiong, Yangyong Zhu: User Navigation Behavior Mining Using Multiple Data Domain Description.Web Intelligence/IAT Workshops2010: 132-135.
[30]Yun Xiong, Guangyong Zheng, Qing Yang, Yangyong Zhu: A Collaborative Multiagent System for Mining Transcriptional Regulatory Elements.IEEE Intelligent Systems. 2009, 24(3): 26-37.
[31]Gang Zhao, Yun Xiong, Longbing Cao, Dan Luo, Xuchun Su, Yangyong Zhu: A Cost-Effective LSH Filter for Fast Pairwise Mining.ICDM2009: 1088-1093.
[32]Yangyong Zhu, Ning Zhong, Yun Xiong: Data Explosion, Data Nature and Dataology.Brain Informatics2009: 147-158.
[33]Yun Xiong, Yangyong Zhu: Mining Peculiarity Groups in Day-by-Day Behavioral Datasets.ICDM2009: 578-587.
[34]Yun Xiong, Guangyong Zheng, Qing Yang, Yangyong Zhu: An Agent-Based Approach to Mine Transcriptional Regulatory Elements.Web Intelligence/IAT Workshops2008: 567-570.
[35]Jin-Jiu Li, Sheng-Li Sun, Yangyong Zhu: Efficient Maintaining of Skyline over Probabilistic Data Stream.ICNC (4)2008: 378-382.
[36]Guangyong Zheng, Kang Tu, Qing Yang, Yun Xiong, Chaochun Wei, Lu Xie, Yangyong Zhu, Yixue Li: ITFP: an integrated platform of mammalian transcription factors.Bioinformatics. 2008, 24(20): 2416-2417.
[37]Guangyong Zheng, Ziliang Qian, Qing Yang, Chaochun Wei, Lu Xie, Yangyong Zhu, Yixue Li: The combination approach of SVM and ECOC for powerful identification and classification of transcription factor.BMC Bioinformatics9. 2008
[38]Sen Yang, Jiankui Guo, Yangyong Zhu: An Efficient Algorithm for Web Access Pattern Mining.FSKD. 2007(2): 726-729.
[39]Jiankui Guo, Qing Wang, Zhenhua Huang, Sheng-Li Sun, Yangyong Zhu:Estimating Similarity over Data Streams Based on Dynamic Time Warping.FSKD (3)2007: 53-57.
[40]Yue Chen, Jiankui Guo, Yaqin Wang, Yun Xiong, Yangyong Zhu: Incremental Mining of Sequential Patterns Using Prefix Tree.PAKDD2007: 433-440.
[41]Yaqin Wang,Yue Chen,Minggui Qin,Yangyong Zhu: SPANBRE: An Efficient Hierarchical Clustering Algorithm for Spatial Data with Neighborhood Relations. Fourth International Conference on Fuzzy Systems and Knowledge Discovery (FSKD 2007). 2007(3): 665-669.
[42]Yue Chen, Yaqin Wang, Yangyong Zhu: Grid-Enabled Metropolis Shared Research Platform.APWeb Workshops2006: 477-485.
[43]Yun Xiong, Yangyong Zhu: A Multi-Supports-Based Sequential Pattern Mining Algorithm.CIT2005: 170-174.
[44]Jiankui Guo, Beijun Ruan, Zunping Cheng, Fang-zhong Su, Yaqin Wang, Xu-bin Deng, Ning Shang, Yangyong Zhu: A Top-Down Algorithm for Mining Web Access Patterns from Web Logs.PAKDD2005: 838-843.
[45]Xu-bin Deng,Yangyong Zhu: L-Tree Match: A New Data Extraction Model and Algorithm for Huge Text Stream with Noises. 计算机科学技术学报(英文版). 2005, 20(6): 763-773.
[46]Fengzhao Yang, Yangyong Zhu, Bole Shi: A New Algorithm for Performing Ratings-Based Collaborative Filtering.APWeb2003: 239-250.
[47]Haofeng Zhao, Jianqiu Zhu, Yangyong Zhu, Baile Shi: ARMiner: A Data Mining Tool Based on Association Rules.J. Comput. Sci. Technol. 2002, 17(5): 594-602.
[48]Haofeng Zhou, Beijun Ruan, Jianqiu Zhu, Yangyong Zhu, Baile Shi: ARMiner: A Data Mining Tool Based on Association Rules.WAIM. 2001: 114-121.
[49]Haofeng Zhou, Pan Gao, Yangyong Zhu: Mining Association Rules with Negative Items Using Interest Measure.Web-Age Information Management2000: 121-132.
[50]Yangyong Zhu, Depei Guo, Baile Shi: Techniques of integrating Datalog with PROLOG.J. Comput. Sci. Technol.12(6): 520-531 (1997).
[51]熊贇,朱扬勇.面向数据自治开放的数据盒模型.大数据,2018(2).
[52]朱扬勇,熊贇,廖志成,等.数据自治开放模式.大数据,2018(2).
[53]沈逸,姚旭,朱扬勇.数据自治开放与治理模式创新.大数据,2018(2).
[54]朱扬勇,熊贇.大数据的若干基础研究方向[J].大数据,2017, 3(2):104-114.
[55]朱扬勇,熊贇.大数据人才培养的基础条件初探[J].大数据,2016, 2(5):107-114.
[56]朱扬勇,熊贇.大数据时代的数据科学家培养[J].大数据,2016, 2(3):106-112.
[57]蔡莉,胡洪斌,朱扬勇.大数据时代下非物质文化遗产的数据模型研究[C].2016.
[58]何友,朱扬勇,赵鹏,柴勇,廖志成,周伟,周向东,王海鹏,汪卫,熊赟,许舟军,彭煊,孟晖,王生进.国防大数据概论[J].系统工程与电子技术,2016, 38(6):1300-1305.
[59]朱扬勇,熊赟.大数据是数据、技术,还是应用[J].大数据,2015, 1(1):71-81.
[60]熊赟,朱扬勇.特异群组挖掘:框架与应用[J].大数据,2015(2):66-77.
[61]朱扬勇,孙婧.推荐系统研究进展[J].计算机科学与探索,2015, 9(5):513-525.
[62]朱扬勇.政府须变“土地财政”为“数据财政”[J].小康,2015(23):24-25.
[63]徐宗本,张维,刘雷,郭崇慧,于剑,池明旻,朱扬勇.“数据科学与大数据的科学原理及发展前景”--香山科学会议第462次学术讨论会专家发言摘登[J].科技促进发展,2014(1):66-75.
[64]杨林瑞,陈磊,熊赟,先梦涵,朱扬勇.PuMA:面向微博话题分析的舆情数据服务平台[C].中国数据库学术会议.2014.
[65]周健雯,李聪聪,熊赟,朱扬勇. 一种基于R*树的自相似性连接算法[J].计算机应用与软件,2014, 31(8):50-53.
[66]朱扬勇,胡乃静.数据科技:智慧金融的技术基础[J].上海金融学院学报,2012,01:16-22.
[67]徐宇明,陈诚,熊赟,朱扬勇.APT-KNN:一种面向分类问题的高效缺失值填充算法[J].计算机应用与软件,2011, 28(4):135-139.
[68]周坤,王爱荣,张敬谊,熊赟,朱扬勇.VPM:一个就医行为模式挖掘算法[J].计算机应用与软件,2011, 28(8):123-125.
[69]陈鸣,薛慧君,熊赟,朱扬勇. 基于多数据域描述的转录因子结合位点识别[J].计算机应用与软件,2011, 28(6):1-4.
[70]高臻耀,张敬谊,林志杰,熊赟,朱扬勇.一个医保基金风险防控平台中的数据挖掘技术[J].计算机应用与软件,2011, 28(8):120-122.
[71]秦德霖,王爱荣,陈诚,林志杰,熊赟,朱扬勇.一个医保基金风险防控数据仓库的设计和实现[J].计算机应用与软件,2011, 28(7):75-78.
[72]王月,王伟俊,童庆,熊赟,朱扬勇. 一个医保数据仓库的元数据管理解决方案[J]. 计算机应用与软件,2011, 28(8):126-129.
[73]汤春蕾,董家麒,戴东波,朱扬勇.一种序列模式的相似性查询算法[J].计算机研究与发展,2011,48(s3):510-517.
[74]何俊华,张静谊,熊赟,朱扬勇.医保就医聚集行为挖掘[J].计算机应用与软件,2011,28(7):79-81.
[75]戴东波,熊赟,朱扬勇.基于参考集索引的高效序列相似性查找算法[J].软件学报.2010,21(4):718-731.
[76]王漫,包敏,冯改玲,裴俊,朱扬勇.无线传感器网络运行状态的实测分析与预警[J].2010,27(5):89-92.
[77]袁朴,朱扬勇.校园网上行为审计监控系统分析与设计[J].2010,(5):157-158.
[78]朱扬勇,戴东波,熊赟.序列数据相似性查询技术研究[J].计算机研究与发展.2010,47(2):264-276.
[79]戴东波,汤春蕾,邱伯仁,熊赟,朱扬勇.一种优化多重过滤的序列查询算法[J].计算机研究与发展.2010,42(10): 1785-1796.
[80]邱伯仁,熊赟,朱扬勇.BioIndex:一种生物序列相似性查询的高效索引[J].计算机应用与软件.2009,26(10):1-4.
[81]欧阳树生,李金玖,覃明贵,朱扬勇.RISQ:一种高效处理概率数据流上Skyline查询的算法[J].2009,26(12):167-169.
[82]孙圣力,李金玖,朱扬勇.高效处理分布式数据流上skyline持续查询算法[J].软件学报.2009,(7):1839-1853.
[83]戴东波,汤春蕾,邱伯仁,熊赟,朱扬勇.一种优化多重过滤的序列查询算法[J].第三届中国数据挖掘学术会议(CCDM2009)论文集复旦大学.2009:80.
[84]朱扬勇,熊赟.BioSeg: 一个生物序列数据模型[J].计算机科学与探索.2008, 1:77-96.
[85]熊赟,邱伯仁,张坤,朱扬勇.Gen-Cluster:一个基因表达数据的高维聚类算法[J].复旦学报(自然科学版).2008,47(2):135-146.
[86]杨青,郑广勇,熊赟,朱扬勇.Qnet-BSTM:一个转录因子结合位点文本挖掘算法[J].第二十五届中国数据库学术会议(NDBC2008)论文集复旦大学.2008:562-568.
[87]李金玖,熊贇,朱扬勇.不确定数据集上的k-Skyline查询[J].第二十五届中国数据库学术会议(NDBC2008)论文集复旦大学.2008:554-561.
[88]杨森,郭建奎,朱扬勇.基于事中反馈的信用卡欺诈检测与防控[J].计算机应用与软件.2008,25(9):154-156.
[89]杨森,夏燕,曹颅良,邓绪斌,朱扬勇.语义异构生物数据源中的数据集成与更新[J].计算机工程.2008,34(8):38-40.
[90]朱扬勇,熊赟.DNA序列数据挖掘技术.软件学报.2007,18(11): 2766-2781.
[91]熊赟,陈越,朱扬勇.ProFaM:一个蛋白质序列家族挖掘算法.计算机研究与发展.2007,44(7): 1160-1168.
[92]朱扬勇,熊贇. 数据的经济活动及其所需要的权利. 大数据, 2020, v.6(06):146-156.
[93]朱扬勇,熊贇.跨境数据监管初探.大数据,2020.
[94]余万,付聿炜,熊贇,朱扬勇. Paper Pal:一个中英文论文及其代码大数据搜索平台.大数据,2020(5).
[95]Joseph M. Plasek, Chunlei Tang, Yangyong Zhu, Yajun Huang, David W. Bates. Following Data as it Crosses Borders During the COVID-19 Pandemic. JAMIA,2020.05.
[96]Huidi Chen,Yun Xiong,Yangyong Zhu,Philip S. Yu. Highly Liquid Temporal Interaction Graph Embeddings. WWW'2,2021.04.
代表专著
[1]熊贇,朱扬勇.《特异群组挖掘》.人民邮电出版社.2020. ISBN:978-115-54326-4.
[2]朱扬勇.《大数据资源》.上海科技出版发行有限公司.2018.ISBN:9787547834268.
[3]朱扬勇.《旖旎数据——100分钟读懂大数据》.上海科学技术出版社.2018.ISBN:9787547841723
[4]何承,朱扬勇.《城市道路交通状态指数研究(大数据技术与应用)》.上海科学技术出版社.ISBN:978754783747.
[5]蔡莉,朱扬勇.《大数据质量》.上海科学技术出版社.2017.ISBN:9787547833742.
[6]熊赟,朱扬勇.《大数据挖掘》.上海科学技术出版社.2016.ISBN:9787547829615.
[7]何承,朱扬勇.《城市交通大数据》.上海科学技术出版社.2015.ISBN:9787547823729.
[8]Chengqi Zhang, Wei Huang, Yong Shi, Philip S. Yu, Yangyong Zhu, Yingjie Tian, Peng Zhang, Jing He: Data Science - Second International Conference, ICDS 2015 Sydney, Australia, August 8-9, 2015. Proceedings.Lecture Notes in Computer Science 9208, Springer2015, ISBN 978-3-319-24473-0.
[9]吴俊伟,朱扬勇.《大数据技术与应用:汇计划在行动》.上海科学技术出版社.2015.ISBN:9787547824474.
[10]朱扬勇,熊赟.《数据学》.复旦大学出版社.2009.ISBN978-7-309-06956-3/T.350.
[11]朱扬勇,熊赟.《生物数据整合与挖掘》.复旦大学出版社.2009.ISBN978-7-309-06614-2/Q.72.