朱扬勇

个人简介

地址:中国上海杨浦区淞沪路2005号江湾校区2号交叉学科楼

E-mail: yyzhu@fudan.edu.cn

Tel: +86-21-51355519

Fax: +86-21-51355518


复旦大学计算机科学技术学院教授、博士生导师,上海市曙光学者,上海市数据科学重点实验室主任,《大数据》期刊编委会副主任、大数据协同安全国家工程实验室副理事长、中国自动化学会国防大数据专委会副主任、中国计算机学会大数据专家委员会首批专家、农业大数据产业技术创新战略联盟副理事长兼首席科学家、上海市大数据专家。从事数据领域研究25年,是国内最早一批从事数据挖掘研究的学者,是国际数据科学研究的主要倡导者之一。主持过国家自然科学基金、国家863计划项目、上海市科委重点等多项数据挖掘领域的研究课题,曾获上海市科技进步一、二、三等奖。相关研究成果在国内外权威期刊或会议上发表论文100余篇,出版专著2本,教材3本。2009年发表了数据科学论文Data Explosion, Data Nature and Dataology,并出版了第一本数据科学专著《数据学》(《DATAOLOGY AND DATASCIENCE》),对数据科学进行了系统化的探讨和描述。创办了International Workshop on Dataology and Data ScienceInternational Conference on Data Science。第462次香山科学会议数据科学与大数据的理论问题探索的执行主席。《大数据技术与应用丛书》主编。

  

研究兴趣

数据科学和数据经济

数字化转型、数据财政、数据资产、数据自治与数据跨境等

数据挖掘及其应用(金融、保险、生物医疗、智能交通等领域)


  

科研项目

[1]特异群组挖掘算法研究国家自然科学基金项目

[2]证券行业云建设规划与设计方案企业合作

[3]新一代高清图像智能交通监控与信息服务系统产业化上海市高新技术产业化重大项目计划

[4]生物序列数据库数据模型、索引、体系结构研究国家自然科学基金项目

[5]转录因子结合位点及其组合模块的挖掘国家863项目

[6]军用计算机系统可测试性设计技术总装备部预研项目

[7]海量信息系统可生存性分析方法及软件可生存性增强技术面向入侵行为的软件结构调整算法国家973项目

[8]某医院信息化发展规划企业合作项目

[9]短线操纵行为模式与监管研究企业合作项目

[10]药物靶点识别的生物信息学平台开发及应用国家863项目(项目副组长)

[11]生物信息的整合与挖掘整合的生物信息学数据仓库平台BioDW上海市重大科技项目

[12]数据挖掘应用平台及相关技术研究上海市科学技术发展基金项目

[13]世博网站的优化技术与实现上海市科学技术发展基金项目

[14]数据挖掘应用平台研制及其应用国家863项目

[15]数据采掘工具的研制及其应用国家863项目(共同负责人)

  

代表论文

[1]Yizhou Zhang,Yun Xiong,Xiangnan Kong,Shanshan Li,Jinhong Mi,Yangyong Zhu: Deep Collective Classification in Heterogeneous Information Networks. WWW. 2018: 399-408.

[2]Chang Liao, Yun Xiong, Xiangnan Kong, Yangyong Zhu, Shimin Zhao, Shanshan Li: Functional-Oriented Relationship Strength Estimation: From Online Events to Offline Interactions.DASFAA 2018, (1): 442-459.

[3]Yun Xiong, Yizhou Zhang, Xiangnan Kong, Yangyong Zhu: NetCycle+: A Framework for Collective Evolution Inference in Dynamic Heterogeneous Networks.IEEE Trans. Knowl. Data Eng. 2018, 30(8): 1547-1560 .

[4]Chang Liao, Yun Xiong, Xiangnan Kong, Yangyong Zhu: Tracking Dynamic Magnet Communities: Insights from a Network Perspective.DASFAA. 2018(1): 406-424.

[5]Guandong Sun, Yun Xiong, Yangyong Zhu:How the Passengers Flow in Complex Metro Networks?SSDBM. 2017: 23:1-23:6.

[6]Yao Zhang, Yun Xiong, Xiangnan Kong, Yangyong Zhu: Learning Node Embeddings in Interaction Graphs.CIKM. 2017: 397-406.

[7]Yao Zhang, Yun Xiong, Xinyue Liu, Xiangnan Kong, Yangyong Zhu: Meta-Path Graphical Lasso for Learning Heterogeneous Connectivities.SDM. 2017: 642-650.

[8]Mingmin Chi, Antonio Plaza, Jon Atli Benediktsson, Zhongyi Sun, Jinsheng Shen, Yangyong Zhu: Big Data for Remote Sensing: Challenges and Opportunities.Proceedings of the IEEE. 2016, 104(11): 2207-2219 .

[9]Yizhou Zhang, Yun Xiong, Xiangnan Kong, Yangyong Zhu: NetCycle: Collective Evolution Inference in Heterogeneous Information Networks.KDD. 2016: 1365-1374.

[10]Zhongyi Sun, Fengke Chen, Mingmin Chi, Yangyong Zhu: A Spark-Based Big Data Platform for Massive Remote Sensing Data Processing.ICDS. 2015: 120-126.

[11]Yangyong Zhu, Yun Xiong: Defining Data Science.Computer Science, 2015.

[12]Jing Sun, Yun Xiong, Yangyong Zhu, Junming Liu, Chu Guan, Hui Xiong: Multi-source Information Fusion for Personalized Restaurant Recommendation.SIGIR. 2015: 983-986.

[13]Li Cai,Yangyong Zhu: The Challenges of Data Quality and Data Quality Assessment in the Big Data Era. Data Science Journal. 2015,14(1): 21-23.

[14]Yun Xiong, Yangyong Zhu, Philip S. Yu: Top-k Similarity Join in Heterogeneous Information Networks.IEEE Trans. Knowl. Data Eng.2015, 27(6): 1710-1723.

[15]Zhu Y, Xiong Y. Towards Data Science. Data Science Journal. 2015, 14:1-7.

[16]Zhicheng Liao,Yun Xiong,Yangyong Zhu: DacIoT: A data cloud for the internet of things. Computer Science and Applications - Proceedings of the Asia-Pacific Conference on Computer Science and Applications (CSAC). 2014: 181-186.

[17]Zhicheng Liao,Yangyong Zhu: When a classifier meets more data. Procedia Computer Science. 2014, 30(30): 50-59.

[18]Xue Bai, Yun Xiong, Yangyong Zhu, Qi Liu, Zhiyuan Chen: Co-anomaly Event Detection in Multiple Temperature Series.KSEM2013: 1-14.

[19]Jing Sun, Yangyong Zhu: Microblogging Personalized Recommendation Based on Ego Networks.Web Intelligence2013: 165-170.

[20]Li Xue, Yun Xiong, Yangyong Zhu, Jianfeng Wu, Zhiyuan Chen: Stock Trend Prediction by Classifying Aggregative Web Topic-Opinion.PAKDD (2)2013: 173-184.

[21]Xue Bai, Yun Xiong, Yangyong Zhu, Hengshu Zhu: Time Series Representation: A Random Shifting Perspective.WAIM2013: 37-50.

[22]Yun Xiong,Yangyong Zhu,PhilipS.Yu,Jian Pei: Towards cohesive anomaly mining. Twenty-Seventh AAAI Conference on Artificial Intelligence. AAAI Press. 2013: 984-990.

[23]Xue Bai, Zezhen Lin, Yun Xiong, Yangyong Zhu: Clustering Based on Yukawa Potential.SDM2012: 672-683.

[24]Mingmin Chi, Jun Liu, Huijun He, Jiangfeng Bao, Yangyong Zhu: Construction of Chinese A-shares Network Using Latent Dirichlet Allocation.Web Intelligence2012: 45-49.

[25]Zhicheng Liao, Yun Xiong, Yangyong Zhu: FIND-A Data Cloud Platform for Financial Data Services.DATA2012: 117-122.

[26]Zhijie Lin, Yun Xiong, Yangyong Zhu: Link Prediction Using BenefitRanks in Weighted Networks. International Conferences on Web Intelligence and Intelligent Agent Technology, 2012(1): 423-430.

[27]Zhijie Lin, Yan Chen, Shiwei Wu, Yun Xiong, Yangyong Zhu, Guangyong Zheng: Mining hub-based protein complexes in massive biological networks.BIBM Workshops2012: 166-173.

[28]Li Xue, Yun Xiong, Yangyong Zhu: A Brain Data Integration Model Based on Multiple Ontology and Semantic Similarity.Brain Informatics2010: 192-199.

[29]Li Xue, Ming Chen, Yun Xiong, Yangyong Zhu: User Navigation Behavior Mining Using Multiple Data Domain Description.Web Intelligence/IAT Workshops2010: 132-135.

[30]Yun XiongGuangyong ZhengQing Yang, Yangyong Zhu: A Collaborative Multiagent System for Mining Transcriptional Regulatory Elements.IEEE Intelligent Systems.  2009, 24(3): 26-37.

[31]Gang Zhao, Yun Xiong, Longbing Cao, Dan Luo, Xuchun Su, Yangyong Zhu: A Cost-Effective LSH Filter for Fast Pairwise Mining.ICDM2009: 1088-1093.

[32]Yangyong Zhu, Ning Zhong, Yun Xiong: Data Explosion, Data Nature and Dataology.Brain Informatics2009: 147-158.

[33]Yun Xiong, Yangyong Zhu: Mining Peculiarity Groups in Day-by-Day Behavioral Datasets.ICDM2009: 578-587.

[34]Yun Xiong, Guangyong Zheng, Qing Yang, Yangyong Zhu: An Agent-Based Approach to Mine Transcriptional Regulatory Elements.Web Intelligence/IAT Workshops2008: 567-570.

[35]Jin-Jiu Li, Sheng-Li Sun, Yangyong Zhu: Efficient Maintaining of Skyline over Probabilistic Data Stream.ICNC (4)2008: 378-382.

[36]Guangyong Zheng, Kang Tu, Qing Yang, Yun Xiong, Chaochun Wei, Lu Xie, Yangyong Zhu, Yixue Li: ITFP: an integrated platform of mammalian transcription factors.Bioinformatics. 2008, 24(20): 2416-2417.

[37]Guangyong Zheng, Ziliang Qian, Qing Yang, Chaochun Wei, Lu Xie, Yangyong Zhu, Yixue Li: The combination approach of SVM and ECOC for powerful identification and classification of transcription factor.BMC Bioinformatics9. 2008

[38]Sen Yang, Jiankui Guo, Yangyong Zhu: An Efficient Algorithm for Web Access Pattern Mining.FSKD. 2007(2): 726-729.

[39]Jiankui Guo, Qing Wang, Zhenhua Huang, Sheng-Li Sun, Yangyong Zhu:Estimating Similarity over Data Streams Based on Dynamic Time Warping.FSKD (3)2007: 53-57.

[40]Yue Chen, Jiankui Guo, Yaqin Wang, Yun Xiong, Yangyong Zhu: Incremental Mining of Sequential Patterns Using Prefix Tree.PAKDD2007: 433-440.

[41]Yaqin Wang,Yue Chen,Minggui Qin,Yangyong Zhu: SPANBRE: An Efficient Hierarchical Clustering Algorithm for Spatial Data with Neighborhood Relations. Fourth International Conference on Fuzzy Systems and Knowledge Discovery (FSKD 2007). 2007(3): 665-669. 

[42]Yue Chen, Yaqin Wang, Yangyong Zhu: Grid-Enabled Metropolis Shared Research Platform.APWeb Workshops2006: 477-485.

[43]Yun Xiong, Yangyong Zhu: A Multi-Supports-Based Sequential Pattern Mining Algorithm.CIT2005: 170-174.

[44]Jiankui Guo, Beijun Ruan, Zunping Cheng, Fang-zhong Su, Yaqin Wang, Xu-bin Deng, Ning Shang, Yangyong Zhu: A Top-Down Algorithm for Mining Web Access Patterns from Web Logs.PAKDD2005: 838-843.

[45]Xu-bin Deng,Yangyong Zhu: L-Tree Match: A New Data Extraction Model and Algorithm for Huge Text Stream with Noises. 计算机科学技术学报(英文版). 2005, 20(6): 763-773.

[46]Fengzhao Yang, Yangyong Zhu, Bole Shi: A New Algorithm for Performing Ratings-Based Collaborative Filtering.APWeb2003: 239-250.

[47]Haofeng Zhao, Jianqiu Zhu, Yangyong Zhu, Baile Shi: ARMiner: A Data Mining Tool Based on Association Rules.J. Comput. Sci. Technol.  2002, 17(5): 594-602.

[48]Haofeng Zhou, Beijun Ruan, Jianqiu Zhu, Yangyong Zhu, Baile Shi: ARMiner: A Data Mining Tool Based on Association Rules.WAIM. 2001: 114-121.

[49]Haofeng Zhou, Pan Gao, Yangyong Zhu: Mining Association Rules with Negative Items Using Interest Measure.Web-Age Information Management2000: 121-132.

[50]Yangyong Zhu, Depei Guo, Baile Shi: Techniques of integrating Datalog with PROLOG.J. Comput. Sci. Technol.12(6): 520-531 (1997).

[51]熊贇朱扬勇.面向数据自治开放的数据盒模型.大数据2018(2).

[52]朱扬勇熊贇廖志成,等.数据自治开放模式.大数据2018(2).

[53]沈逸姚旭朱扬勇.数据自治开放与治理模式创新.大数据2018(2).

[54]朱扬勇,熊贇.大数据的若干基础研究方向[J].大数据,2017, 3(2):104-114.

[55]朱扬勇,熊贇.大数据人才培养的基础条件初探[J].大数据2016, 2(5):107-114.

[56]朱扬勇,熊贇.大数据时代的数据科学家培养[J].大数据,2016, 2(3):106-112.

[57]蔡莉,胡洪斌,朱扬勇.大数据时代下非物质文化遗产的数据模型研究[C].2016.

[58]何友,朱扬勇,赵鹏,柴勇,廖志成,周伟,周向东,王海鹏,汪卫,熊赟,许舟军,彭煊,孟晖,王生进.国防大数据概论[J].系统工程与电子技术2016, 38(6):1300-1305.

[59]朱扬勇,熊赟.大数据是数据、技术,还是应用[J].大数据,2015, 1(1):71-81.

[60]熊赟,朱扬勇.特异群组挖掘:框架与应用[J].大数据2015(2):66-77.

[61]朱扬勇,孙婧.推荐系统研究进展[J].计算机科学与探索,2015, 9(5):513-525.

[62]朱扬勇.政府须变“土地财政”为“数据财政”[J].小康2015(23):24-25.

[63]徐宗本,张维,刘雷,郭崇慧,于剑,池明旻,朱扬勇.“数据科学与大数据的科学原理及发展前景”--香山科学会议第462次学术讨论会专家发言摘登[J].科技促进发展2014(1):66-75.

[64]杨林瑞,陈磊,熊赟,先梦涵,朱扬勇.PuMA:面向微博话题分析的舆情数据服务平台[C].中国数据库学术会议.2014.

[65]周健雯,李聪聪,熊赟,朱扬勇. 一种基于R*树的自相似性连接算法[J].计算机应用与软件2014, 31(8):50-53.

[66]朱扬勇,胡乃静.数据科技:智慧金融的技术基础[J].上海金融学院学报,2012,01:16-22.

[67]徐宇明,陈诚,熊赟,朱扬勇.APT-KNN:一种面向分类问题的高效缺失值填充算法[J].计算机应用与软件2011, 28(4):135-139.

[68]周坤,王爱荣,张敬谊,熊赟,朱扬勇.VPM:一个就医行为模式挖掘算法[J].计算机应用与软件,2011, 28(8):123-125.

[69]陈鸣,薛慧君,熊赟,朱扬勇. 基于多数据域描述的转录因子结合位点识别[J].计算机应用与软件,2011, 28(6):1-4.

[70]高臻耀,张敬谊,林志杰,熊赟,朱扬勇.一个医保基金风险防控平台中的数据挖掘技术[J].计算机应用与软件,2011, 28(8):120-122.

[71]秦德霖,王爱荣,陈诚,林志杰,熊赟,朱扬勇.一个医保基金风险防控数据仓库的设计和实现[J].计算机应用与软件,2011, 28(7):75-78.

[72]王月,王伟俊,童庆,熊赟,朱扬勇. 一个医保数据仓库的元数据管理解决方案[J]. 计算机应用与软件,2011, 28(8):126-129.

[73]汤春蕾,董家麒,戴东波,朱扬勇.一种序列模式的相似性查询算法[J].计算机研究与发展,2011,48(s3):510-517.

[74]何俊华,张静谊,熊赟,朱扬勇.医保就医聚集行为挖掘[J].计算机应用与软件,2011,28(7):79-81.

[75]戴东波熊赟朱扬勇.基于参考集索引的高效序列相似性查找算法[J].软件学报.201021(4):718-731.

[76]王漫,包敏,冯改玲,裴俊,朱扬勇.无线传感器网络运行状态的实测分析与预警[J].2010,27(5):89-92.

[77]袁朴,朱扬勇.校园网上行为审计监控系统分析与设计[J].2010,(5):157-158.

[78]朱扬勇戴东波熊赟.序列数据相似性查询技术研究[J].计算机研究与发展.201047(2):264-276.

[79]戴东波汤春蕾邱伯仁熊赟朱扬勇.一种优化多重过滤的序列查询算法[J].计算机研究与发展.201042(10)1785-1796.

[80]邱伯仁,熊赟,朱扬勇.BioIndex:一种生物序列相似性查询的高效索引[J].计算机应用与软件.2009,26(10):1-4.

[81]欧阳树生,李金玖,覃明贵,朱扬勇.RISQ:一种高效处理概率数据流上Skyline查询的算法[J].2009,26(12):167-169.

[82]孙圣力,李金玖,朱扬勇.高效处理分布式数据流上skyline持续查询算法[J].软件学报.2009,(7):1839-1853.

[83]戴东波,汤春蕾,邱伯仁,熊赟,朱扬勇.一种优化多重过滤的序列查询算法[J].第三届中国数据挖掘学术会议(CCDM2009)论文集复旦大学.2009:80.

[84]朱扬勇熊赟.BioSeg一个生物序列数据模型[J].计算机科学与探索.2008, 1:77-96.

[85]熊赟,邱伯仁,张坤,朱扬勇.Gen-Cluster:一个基因表达数据的高维聚类算法[J].复旦学报(自然科学版).2008,47(2):135-146.

[86]杨青,郑广勇,熊赟,朱扬勇.Qnet-BSTM:一个转录因子结合位点文本挖掘算法[J].第二十五届中国数据库学术会议(NDBC2008)论文集复旦大学.2008:562-568.

[87]李金玖,熊贇,朱扬勇.不确定数据集上的k-Skyline查询[J].第二十五届中国数据库学术会议(NDBC2008)论文集复旦大学.2008:554-561.

[88]杨森,郭建奎,朱扬勇.基于事中反馈的信用卡欺诈检测与防控[J].计算机应用与软件.2008,25(9):154-156.

[89]杨森,夏燕,曹颅良,邓绪斌,朱扬勇.语义异构生物数据源中的数据集成与更新[J].计算机工程.2008,34(8):38-40.

[90]朱扬勇熊赟.DNA序列数据挖掘技术.软件学报.200718(11): 2766-2781.

[91]熊赟陈越朱扬勇.ProFaM:一个蛋白质序列家族挖掘算法.计算机研究与发展.200744(7): 1160-1168.

[92]朱扬勇,熊贇. 数据的经济活动及其所需要的权利. 大数据, 2020, v.6(06):146-156.

[93]朱扬勇,熊贇.跨境数据监管初探.大数据,2020.

[94]余万,付聿炜,熊贇,朱扬勇. Paper Pal:一个中英文论文及其代码大数据搜索平台.大数据,2020(5).

[95]Joseph M. Plasek, Chunlei Tang, Yangyong Zhu, Yajun Huang, David W. Bates. Following Data as it Crosses Borders During the COVID-19 Pandemic. JAMIA,2020.05.

[96]Huidi Chen,Yun Xiong,Yangyong Zhu,Philip S. Yu. Highly Liquid Temporal Interaction Graph Embeddings. WWW'2,2021.04.





代表专著

[1]熊贇,朱扬勇.《特异群组挖掘》.人民邮电出版社.2020. ISBN:978-115-54326-4.

[2]扬勇.《大数据资源》.上海科技出版发行有限公司.2018.ISBN:9787547834268.

[3]朱扬勇.《旖旎数据——100分钟读懂大数据》.上海科学技术出版社.2018.ISBN:9787547841723

[4]何承,朱扬勇.《城市道路交通状态指数研究(大数据技术与应用)》.上海科学技术出版社.ISBN:978754783747.

[5]蔡莉,朱扬勇.《大数据质量》.上海科学技术出版社.2017.ISBN:9787547833742.

[6]熊赟,朱扬勇.《大数据挖掘》.上海科学技术出版社.2016.ISBN:9787547829615.

[7]何承,朱扬勇.《城市交通大数据》.上海科学技术出版社.2015.ISBN:9787547823729.

[8]Chengqi Zhang, Wei Huang, Yong Shi, Philip S. Yu, Yangyong Zhu, Yingjie Tian, Peng Zhang, Jing He: Data Science - Second International Conference, ICDS 2015 Sydney, Australia, August 8-9, 2015. Proceedings.Lecture Notes in Computer Science 9208, Springer2015, ISBN 978-3-319-24473-0.

[9]吴俊伟,朱扬勇.《大数据技术与应用:汇计划在行动》.上海科学技术出版社.2015.ISBN:9787547824474.

[10]朱扬勇熊赟.《数据学》.复旦大学出版社.2009.ISBN978-7-309-06956-3/T.350.

[11]朱扬勇熊赟.《生物数据整合与挖掘》.复旦大学出版社.2009.ISBN978-7-309-06614-2/Q.72.







  



友情链接
联系我们
地址: 中国 上海市杨浦区淞沪路2005号复旦大学江湾校区2号交叉学科楼
邮编: 200438
电话: +86-21-31242153
传真: +86-21-31242153
E-mail: dataology@fudan.edu.cn