2024年 10月 26日上午 ,由上海市数据科学重点实验室主办的 “创智能引擎・助新质跃迁 —— 计算机科学技术学院学科周 数据科学博士后论坛” 在复旦大学江湾校区交叉学科二号楼 A3009会议室成功举办。本次论坛通过视频号 DataFun Talk进行直播,吸引了三千多位计算机科学领域的研究者和爱好者在线观看。
蒋思航博士以“面向领域应用的大模型推理技术研究”为题,他分享了包括生成式大语言模型在领域适配上面临的挑战,以及如何通过双系统协作机制提升大模型在特定领域的应用效果。报告重点介绍了双系统协同的基本框架,并通过多个案例展示了如何结合数据和知识来增强大模型的推理能力。最后,报告从面向领域的评测、复杂故障认知与诊断、数据与知识联合推理等方面介绍了团队的最新研究进展。
李诺博士主要分享了面向推荐系统的群智知识迁移方法研究,包括跨场景自适应的群智知识迁移技术和基于信息论的用户知识可迁移性机制,该研究旨在通过建模用户间、行为间以及群体用户间的相关性,提高目标域性能,并解决推荐系统中用户数据稀少的问题。最后,他还提出了未来的研究方向,包括大模型Agent驱动的智能推荐和以人为中心的推荐系统。
杨强博士主要介绍了异构图的可解释学习及其在生物医学领域的应用,包括了异构图表示学习的挑战、模型、实验和应用案例。最后总结了所提出的基于元路径和注意力机制的异构图可解释关系学习模型,以及基于DNN的异构图可解释研究兴趣转移检测模型,并分析了这些模型在生物医学领域的应用。
费奔博士的演讲聚焦于扩散模型条件引导生成机制,探讨了其在科学领域的广泛应用,包括图像恢复和气候变量预测。同时报告还展示了当前改善盲图像恢复和北极海冰预测的新方法。此外,费奔博士还分享了机器学习模型在大气动力学平衡关系表示上的问题以及降水预报中的模糊问题。
李浩然博士介绍了一种基于情境完整性理论的大模型隐私分类器,并深入探讨了AI隐私与安全合规性的演进,从简单的模式匹配到复杂的推理过程。他详细讨论了大语言模型的发展、AI的安全隐私挑战、现有隐私研究以及数据提取攻击的威胁。此外,报告还提出将隐私问题转化为推理问题,并展示了如何利用大语言模型来评估隐私合规性。
白佳欣博士的演讲关注于知识图谱上的复杂逻辑推理,研究重点是下一代知识图谱的构建、推理和应用。报告提出了复杂查询解答(CQA)的概念,并探讨了如何通过事件、状态和行动来增强知识图谱的推理能力。同时,报告还介绍了构建基于行为的关系意图知识图谱(RIG),并研究从假设生成的推理方法等工作。
周萧驰博士介绍了知识图谱在环境、灾害、化学等领域的应用,特别是TheWorldAvatar平台如何通过整合多个领域子图谱和语义智能体来支持复杂决策和仿真。该平台遵循多层级、复用和FAIR原则,实现了从城市到分子的多层数据整合。典型应用案例包括航运污染物扩散仿真、实验室协同、洪灾评估平台和Marie KGQA系统,展示了知识图谱在跨领域数据整合和智能体应用中的潜力。
此次论坛为数据科学领域的博士后研究者提供了一个高水平的交流平台,促进了学科间的交叉融合和创新发展。通过此次论坛,大家不仅了解了数据科学领域的最新动态,也为今后的研究工作提供了新的思路和方向。