一、课程基本情况简介
《大数据挖掘》是由计算机科学技术学院开设的一门研究生学位核心课程,2021年获复旦大学研究生课程思政课程建设项目立项,2023年6月入选复旦大学首批研究生课程思政标杆课程。
课程负责人熊贇,复旦大学计算机科学技术学院教授、博士生导师,上海市数据科学重点实验室副主任,研究工作获得国家自然科学基金、国家863计划、国家科技支撑计划、上海市科委基金以及企业资助。发表论文80余篇,出版专著4本。获中国计算机学会科学技术发明奖、上海市科技进步奖、上海市计算机学会科技进步奖等奖项。在国内率先开展大数据和数据科学的研究工作,2009年出版第一本数据科学专著《数据学》(《Dataology and Data Science》),提出一系列新型大数据挖掘算法并构建金融、医疗、交通等领域大数据挖掘算法库,这些算法已经被应用于证券交易所、医联平台、交通信息中心等上海市大数据建设重要领域。先后开设了《大数据挖掘》、《数据科学》、《大数据引论》、《大数据分析技术》、《高级数据库》和《计算机工程伦理》等本科生和研究生课程,将大数据技术和产业发展等思政元素融入教学实践中,曾获复旦大学研究生教学成果奖。
二、课程教学与课程思政开展情况
1.课程开设沿革
本课程从2008年开设以来,随着数据领域新技术的发展,紧跟国家重大战略需求和部署,教学内容不断完善。2015年,十八届五中全会首次提出“国家大数据战略”,《促进大数据发展行动纲要》发布。主讲人通过认真学习研读“十三五”规划,将全面推进大数据发展和应用,加快建设数据强国,推动数据资源开放共享这一重要国家大数据战略思想和目标融入课程教学内容,课程从《数据仓库与数据挖掘》更名为《大数据挖掘》。2019年,党的十九届四中全会首次将“数据”列为生产要素,陆续出台一系列关注数据要素的相关政策,指出加快培育数据要素市场,推动数据资源开发利用。主讲人持续引入国内外科研进展以及主讲人的最新科研成果于教学内容中,始终保持教学内容的先进性、前沿性,注重思政元素的隐式浸润,教学方法持续优化。
2.课程教学目标
本课程教学的目标是使学生理解和掌握大数据挖掘原理和方法,熟练应用大数据挖掘技术解决大数据领域实际应用问题。在教学过程中动态地、隐性地融入思政教育元素以提升学生的数据能力和数据素养,同时激发学生深入体会大数据时代人类面临的挑战和机遇,能够在数字化转型、数字化建设中发挥重要作用,具备为推动实施国家大数据战略、加快建设数字中国所需的扎实理论和坚实基础。
3.课程教学内容与特色
“培养什么人、怎样培养人、为谁培养人”是习总书记强调的重中之重,是教育的根本问题。新时代教育不仅仅是传授知识,更需要培养全面人才,实现价值引领。本课程针对专业知识与思政教育融合难的挑战,通过国家重要战略规划的研读、数据产业项目实践经验的积累以及学生职业生涯规划的深入调研,精心设计课程教学内容,在大数据的原理、方法和应用的讲述和实践中承载丰富的思政教育资源,传递专业知识蕴含的思政教育元素,实现知识传授与价值引领的同频共振。
(1)思政元素全过程动态浸润
把国家大数据相关战略政策等作为学习内容,通过讲述和解读,让学生在学习专业理论知识时,不仅对大数据挖掘概念和技术“有了解、会应用”,更重要的是要理解学习技术的目标,理解为什么需要和如何为国家和社会发展做出贡献,理解这些技术能够为推动社会、国家发展起到基础性、支撑性的作用很关键。同学们正处于这个发展的机遇期,鼓励他们深入地学习和理解大数据挖掘技术,并且能够灵活应用来应对相关的困难和挑战,让他们树立为国家和社会发展作出贡献的价值观,具备正确的成长观、职业观、人才观。
图1讲述国家大数据相关战略政策
(2)科学精神引导与创新思维激发
党的二十大首次把教育、科技、人才“三位一体”统筹部署,要求培养具有前瞻性、国际视野和创新能力的高层次人才,致力改革创新、攻坚克难,“在世界舞台提出中国方案、作出中国贡献”。本课程在教学中持续加入国际前沿科技进展的介绍和分析,作为基础概念和方法的延伸和拓展,加强内容的体系化和可扩展性,让同学们看见国际科研前沿。同时,结合介绍主讲人及其所在课题组的最新科研成果,让同学们看见身边(包括课题组学长和同学)的创新,激发同学们的创新和进取精神。在讲解科研论文相关技术思路的同时,强化引导和培养严谨的科研态和科学精神。
图2上:金融时序分析方面的国际前沿工作;
下:金融时序分析方面的课题组应用情况
(3)立体多元引入和拓展应用场景
本课程将热点应用和实际问题与教学内容有机结合,不限于大数据挖掘算法模型本身的讲解,而是多维度、多层次地将真实的领域应用结合起来讲解。在讲述具体技术知识点后,描述相应应用场景问题,引导学生在面临具体问题时,有选择地将不同技术或模型灵活组合使用,培养灵活应用和解决问题的能力,让学生不仅“懂原理”,而且“能拓展、能创新”。创新课程实践项目的内容和形式,通过开放的学生实践课程项目,让学生选择感兴趣的数据及其场景探索,将主动应用数据理念和数据思维解决感兴趣的问题作为出发点,不断优化大数据挖掘方法,解决学生自己感兴趣的场景问题,引导学生在应用数据技术过程中有所收获,并凝练和总结所做课程实践项目的实际意义。
图3从论文合作网络分析拓展到企业人事关系分析
三、课程教学与课程思政成效
本课程是培养学生掌握数据能力的一门重要课程,已纳入博士研究生资格考试范围。教学方法采用了主讲老师课堂讲授、学生课程项目实践和课堂讨论与汇报相结合的形式。学生课程项目实践通过学生自由选择与自身科研方向相关或感兴趣领域的数据集及其挖掘分析需求、应用并改进数据挖掘算法,提升了学生对大数据挖掘方法的应用能力,锻炼了学生发现问题和思辨的能力。诸多学生反馈修读本课程后受益匪浅,例如:课程强调了实践能力的培养与科研能力的训练,不仅学习了理论知识,还自主确立研究课题,获得了实践经验和技能,对于前沿论文的算法及改进之处提出了自己的见解。同时,通过收集学生的反馈建议不断改进和优化课程教学,例如:提供数据资源和环境,为进一步建设课程拓展了思路。
授课教师通过参加课程教学研讨会和论坛,与同行交流和分享课程建设经验。关于本课程将讲述和解读大数据相关政策融入课程原理讲授的做法得到了同行的认可,并通过总结和凝练,发表大数据人才培养相关论文,发挥了示范作用。同时,也通过学习同行专家的优秀经验以提升课程教学质量。
综上,通过在“讲-用-练”三个阶段有机融入思政要素,培养德才兼备、全面发展的新时代高层次人才。“讲”是共性的引导和培养,提升学生的业务素质;“用”与“练”更聚焦于注重学生个性体验的结合,让学生在同一个学习过程中汲取具有个性化、差异化的养分,提升学生的思考能力。整个课程教学与课程思政的实施过程是专业与思政的一体化育人过程。