建校119周年校庆系列学术报告会 丨上海市数据科学重点实验室“数据科学校友论坛专场”圆满落幕!

春光流淌,首夏清和;卿云烂漫,奏鸣相辉。在复旦大学119周年校庆到来之际,上海市数据科学重点实验室于5月25日成功举办了“数据科学校友论坛”。本次论坛聚焦数据科学领域的最新研究与实践,邀请了来自厦门大学、东华大学、上海理工大学、江苏第二师范学院、上海财经大学及宁波财经大学等高校的多位知名校友返校进行交流与探讨。论坛上,各位学者纷纷带来了他们的精彩报告。

数据科学校友论坛现场

林琛教授分享现场

  厦门大学的林琛教授以“鲁棒索引推荐”为题作报告,索引对于提升数据库的处理效率有着重要的意义,因此索引推荐是数据库领域的研究热点之一。目前索引推荐方法可以分为两大类,即启发式方法和学习型方法。但是索引推荐的鲁棒性还未得到充分研究:(1)缺乏对索引推荐自适应性的全面评估。索引推荐方法对动态工作负载不能保持稳定的优化性能。(2)缺乏对学习型索引推荐方法可靠性的评估。学习型索引推荐方法性能受到训练和测试负载不一致的影响。(3)缺乏对学习型索引推荐方法的自适应能力的优化。学习型索引推荐方法为了提高自适应能力,训练和推理开销较大。本次报告林琛教授介绍了课题组在鲁棒索引推荐的系列研究,提出了TRAP和PIPA两种方法来评估和提高索引顾问的性能,并讨论了如何利用动态和异构工作负载知识来进一步提升索引顾问的性能。


徐波副教授分享现场


  东华大学徐波副教授汇报了题为“基于大语言模型的运维代码理解及生成”的报告,深入探讨了运维领域中的代码作为人与机器之间的重要桥梁所扮演的角色。他指出,尽管传统的单任务处理方法在满足高准确率和强泛化性的需求方面存在挑战,但大模型的强大生成、通识、评估以及复杂任务执行与规划能力为运维领域带来了新的可能性。徐波教授强调,在运维日志理解任务中,小模型仍然是主力,但可以借助大模型的通识能力生成日志的背景知识,从而增强小模型的性能。而在运维代码生成任务中,微调开源大模型成为了一种趋势。这种方法可以将能力更强的闭源大模型的能力转移到较弱的开源大模型上,通过思维链提示的方法进行微调,从而增强模型处理复杂问题的能力。徐波副教授的报告为运维领域的发展提供了新的思路和方法,展示了大语言模型在运维代码理解和生成方面的巨大潜力。


张明西教授分享现场


  上海理工大学的张明西特聘教授以“大规模图数据的单源相似度查询”为题作报告。相似度查询的目标是发现相似的实体,这是推荐系统、链路预测等现实网络应用的重要依据。为了降低查询效率,提出一种基于路径聚合的单源SimRank相似度查询方法VecSim,仅需要在内存中维护少数向量即可实现高效精准的单源相似度查询。实验表明,在精确度相当的前提下,VecSim在查询效率方面显著领先现有方法,并在每个测试数据集上都能够以0.1秒或更低时间开销达到10-4级别的平均误差。

朱辉生教授分享现场


  下半场开始,江苏第二师范学院计算机工程学院院长朱辉生教授以“计算机类专业产教融合的探索与实践——以江苏第二师范学院为例”为题作报告。他首先解释了高校产教融合的背景和涵义,然后从专业共建、平台共搭、项目共研、人才共育四个方面介绍了江苏第二师范学院与合作企业开展的产教融合工作,最后分享了江苏第二师范学院计算机科学与技术专业、物联网工程专业通过产教融合在国家级一流本科专业、省级品牌专业、省级卓越工程师教育培养计划2.0专业、工信部产教融合试点专业、省级工程研究中心、省级国际合作联合实验室、省级优秀基层教学组织、省级优秀教学团队、省级产教融合重点基地、省级一流本科课程、产教融合型一流课程、教育部产学合作协同育人项目、江苏省产学研合作项目以及指导学生参加工程师认证和学科竞赛等方面取得的成效。

崔万云副教授分享现场


  上海财经大学的崔万云副教授以“基于参数异质性的大模型高效推理”为题作主题报告,在报告中,崔教授揭示了大型语言模型(LLMs)中参数异质性的现象。一小部分核心参数对模型性能有着不成比例的巨大影响,而绝大多数参数的影响微乎其微。这种异质性广泛存在于不同规模、类型和家族的LLMs中。受此观察启发,崔教授团队提出了CherryQ,一种统一优化混合精度参数的新量化方法,识别并保留高精度的关键核心参数,同时将其余参数大幅量化为低精度。CherryQ在困惑度和下游任务性能上都优于现有的量化方法。值得注意的是,崔教授团队的3比特量化Vicuna-1.5模型展现出与16比特模型相媲美的性能。


论坛交流讨论现场


  在交流讨论环节,与会者积极发言,就数据科学领域的热点问题进行了深入交流和探讨,讨论了大模型对于企业工作、学生编码以及工程中的应用与挑战,同时谈到大模型对于教师来说是一个挑战,可能会替代部分工作,但未来可能不需要保持。但在技术发展迅速的时代,挑战也伴随着机会。因此,在教学过程中,教师应抓住机会,让学生自己去学习,培养他们在这个领域的竞争力。


友情链接
联系我们
地址: 中国 上海市杨浦区淞沪路2005号复旦大学江湾校区2号交叉学科楼
邮编: 200438
电话: +86-21-31242153
传真: +86-21-31242153
E-mail: dataology@fudan.edu.cn