本文转发自可视分析陈思明老师,数据科学重点实验室成员
7月15日上午,第十五期北京大学可视化发展前沿研究生暑期学校系列线下课程中,复旦大学陈思明老师为同学们带来了专题讲座:大数据可视化:科技、文化与艺术的融合。
陈思明老师的报告分为四个子主题:可视化是什么、数字人文可视化应用、可视化故事叙述设计空间以及智能可视分析与故事叙述方法。
可视分析概念
可视化是什么
在报告的开始,陈思明老师以社交媒体可视化案例说明了可视化在数据分析中的重要性。
陈老师首先介绍了 D-Map 工作。通过使用地图隐喻的方式,D-Map 以微博数据为例,展现了社交媒体中信息的传播路径和传播模式。高流量人物,如网红明星等的参与,会大大加速热点话题的传播速度和范围;而类似运营不良的公众号或是微商群体的媒体传播网络则会显得相对固定,影响范围较小。
Co-Bridges可视化以桥梁隐喻比较两个人物在社交媒体上的发言,陈思明老师通过2016美国大选中特朗普和希拉里在推特上的交锋为例,展示了Co-Bridges能在多尺度上呈现双方话语的内容和特点。
Context-Wing提供了一个特色的以单个关键词为中心的细节视图,这一视图形如一个翅膀,展示了关键词出现的上下文。
陈老师通过上述的案例,为同学们展示了信息编码与交互方法如何帮助用户快速挖掘社交媒体中的信息,理解其中的内容并识别其中的特征。
社交媒体与信息传播可视分析
Map算法设计与视觉映射
Co-Bridges可视化隐喻
Context Wing可视分析系统
数字人文可视化应用
历史人文学科与数据科学的交叉,例如将可视化技术应用到相关领域中能够引起传统人文领域研究范式的改变。首先,针对历史史料中经常出现的数据缺失问题,陈老师介绍了一个辅助信息推理的可视分析系统。通过基于知识图谱的推荐和交互式推理视图,从时间、空间、人物、事件四个维度出发,结合迭代的逻辑运算和通过在其他配合视图的交互式配合,能够支持用户一步步地推理事件中缺失的数据维度。随后,陈老师介绍了古藻声韵-古汉语典籍韵部流变系统,一个为专家学者和文化爱好者提供交互式可视化的汉语语音演变探索的数字平台。在这个领域,传统的研究方法不能够很好地适应时代的需求,而现有的古籍可视化探索均较为浅层。这使得历史悠久,受众庞大的汉语,在音韵研究方面反而成为“独门绝学的冷门学科”。为了在如今的国际环境下进一步讲好中国故事,增强文化自信,陈老师与领域专家合作,从古汉语声韵的三个阶段:上古《诗经》、中古《广韵》、近代《中原音韵》入手,深度挖掘了其中的文本信息,完成了这个工作。通过可视化,综合三个阶段的信息,呈现同一韵部的字在不同时代的变化,链汇古今。
历史人物可视化
宋词可视分析系统
可视化故事叙述设计空间
在可视化故事叙述设计空间方面,陈老师与同学们分享了探索设计空间的工作逻辑和方法。陈老师首先通过介绍 GeoCamera 工作,分享如何对空间叙事的镜头语言进行编码。通过分析电影片段中的镜头操作,可以总结标注镜头叙述的目的、对象以及镜头移动方法。进一步通过与专家合作讨论,进一步总结出地理空间叙事的叙事模型。根据叙事模型,进一步开发出支持空间叙事镜头编辑的工具 GeoCamera。整体上,该工作经历了收集数据--标注数据--标注总结设计空间--提炼设计模型--系统实现总共五个步骤。在文字可视化方面,陈老师介绍了Emordle和Wikey-Wikey,Emordle调研了一个使用词云动画展示情感的设计空间,该设计空间主要考虑时间与动画过渡曲线,利用速度与熵等度量将词云动画的设计空间分成了几个正交维度。Wikey-Wikey则提出了一种可以依据参考动画效果生成文字动画的算法,该算法基于以往计算机视觉领域中动画迁移的算法,针对文字这一矢量对象,利用了矢量对象的几何表达对字形的动画差值进行了优化,避免了字形在动画中的断裂现象。
数据真实性与设计
其次,陈老师强调了真实数据在可视化中的重要性,他指出即使数据是真实的,它的展示形式也需要经过设计,以确保信息的有效传达。例如,The SelfieXploratory通过真实数据的展示,增强了信息的可信度。同时,他展示了如何在保持数据真实性的基础上,通过设计使复杂数据易于理解,增强数据的吸引力和可读性。
智能可视分析与故事叙述方法
陈老师还提到了将大模型融入可视分析和故事叙述创作中,他先介绍了Narrative Player,这个工作借助大模型,能够根据用户提供的脚本将静态可视化转换为可视化动画。在Narrative Player中,静态可视化首先被识别并反推出数据表格,大模型则找到用户脚本中的每一句话对应的数据表格中的相关部分,之后每句话对应的可视化状态以及两个可视化状态之间的动画过渡将被优化计算,最终产生一个完整的动画。之后,陈老师介绍了他们实验室今年被IEEE VIS接受的工作LightVA,该工作与以往的可视分析系统不同,没有事先定义的复杂的视图和交互,而是借助大模型的能力动态地生成可视化视图。LightVA系统通过与用户对话,帮助用户明确任务初始目标,并逐渐分解复杂任务,并为拆分后的简单任务生成可视化视图。最后LightVA能支持这些视图之间的联动,并支持导出一个完整的可视分析系统。陈老师也分享了大模型在教育领域微调的经验,陈老师介绍了一个辅助学生自学的可视化系统,其被一个在知识图谱提取与学习计划构建等方面微调增强过的大模型驱动。在课程的最后,陈思明老师播放了Hoga's Life的介绍视频,一个讲述苏东坡人生中作品和美食的可视化作品。该可视化借用了星系的形式,星星依据时间顺序以顺时针排列,内层的星星代表苏东坡的作品,外部的星星代表苏东坡在不同地点留下的美食,内部的词云则用于帮助用户窥探更具体的内容。跟随视频中的交互,我们看到了苏东坡跌宕起伏的一生中不同时期的作品特点和美食故事。
苏东坡的生平可视化
总 结
总的来说,陈思明老师为我们带来了一场内容丰富的讲座,给我们呈现了许多精彩的可视化案例。可视化技术既能够被用于如社交媒体数据的分析中,也能够帮助跨学科合作创新,同时可以融合大语言模型等智能技术。陈老师围绕科技、文化与艺术融合中许多关键的挑战与可能的解决方案,为同学们展现了可视化的无限的可能性。