当前位置:首页 > 行业观察 > 详情

数据可视化的新疆界

2019-03-18
中国计算机学会

编者注:本文对数据可视化这一科学方向做了详细介绍,对当今的数据分析技术提出了需进一步加强的要点,对东软平台云为代表的数据分析技术有借鉴和参考作用,予以转载。


在一些人的眼中,可能可视化只是把计算分析的结果图形化。实则不然,可视化是人类认识、分析复杂数据的重要途径。随着数据科学的发展,可视化在不同的方向扮演了越来越多的角色。本期我们将讨论一些新的可视化工作方向。


从世界范围来看,可视化这一学科方向的形成和发展是在20世纪80年代末,其重要的推动力来自科学计算和观测技术的进步,特别是医学图像领域中CT、MRI等成像技术的出现和发展。如果回顾90年代的可视化研究工作,会发现相当一部分研究集中于三维医学成像数据的可视化,即体可视化(volume visualization)。


在经历了30多年的发展之后,可视化和生物医学之间的联系依然紧密,但是研究范围逐步扩大,转移到了更为复杂的对象上。在医疗领域,随着信息技术的发展,医疗过程除了常规性地产生和收集各种影像数据以外,就诊者各项生理指标的测量数据也能被系统地收集并和其他就诊记录一同被纳入电子病历的数据管理之中。对于复杂的病历,一方面需要将其以合理先进的方法提供给病患个体,用于医患沟通;另一方面,挖掘分析其中的内在规律、发现问题也是医疗工作者的迫切需要,可视化与可视分析可以提供相当有效的手段。这方面早期的工作可以追溯到1994年耶鲁大学统计学家爱德华·塔夫提(Edward Tufte)在《柳叶刀》上发表的论文“Graphical Summary of Patient Status”和1996年马里兰大学本·施耐德曼(Ben Shneiderman)与同事在国际人机交互会议CHI上发表的“LifeLines: Visualizing Personal Histories”。经过多年的发展,如今不仅可以通过可视化理解分析个人的电子病历记录,相关研究还拓展到大规模人群的群体相似性分析和基于医疗知识图谱的可视分析技术上。本期同济大学曹楠教授撰写的《信息可视化及可视分析在智慧医疗领域的应用》一文将深入介绍上述方向的工作。


可视化和基础生命科学同样密切相关。好莱坞科幻电影的镜头中,经常出现从人体开始,推进放大到血液中细胞乃至分子的运动变化等科幻场景。这些场景并不只是出现在电影的蒙太奇手法之中,科学家本身也非常关心大规模跨尺度、跨模态的成像理解。最近我国支持建设的一系列大科学装置中,就有“多模态跨尺度生物医学成像”国家重大科技基础设施项目,希望提供革命性的研究手段,对生命体结构与功能进行跨尺度可视化描绘与精确测量,进而破解生命与疾病的奥秘。因此本期我们邀请了来自奥地利维也纳科技大学和沙特阿卜杜拉国王科技大学的伊万·维奥拉(Ivan Viola)及其同事撰文《从细胞到分子——生物信息可视化》,讨论如何利用最新的可视化和图形学技术,组合结构元素创建完整生物体的结构模型。值得注意的是这些成果是由计算机科学家与来自美国斯克里普斯研究所(The Scripps Research Institute, USA)综合结构和计算生物学系(Department of Integrative Structural and Computational Biology)的科学家共同合作完成的。

纵观欧美发达国家的科研力量的配置,我们可以看到和生物医学相关的研究占据了相当大的部分。美国国立卫生研究院(NIH)的经费力度要远超过美国国家科学基金会(NSF)。从上面的例子,我们可以看到更多计算机科学与生命科学合作的机会。


回顾可视化初期历史,和研究的医学图像数据相对应,还有一类是模拟计算别是流场数据。对于流场的图形化描绘可以回溯到达芬奇的笔记,在其中已经可以看到对水流的线形描绘。类似的抽象绘画形式也可以在中国传统的山水画中找到踪迹。然而,对于模拟流场数据忠实、高精度的科学呈现还是近几十年来的工作。这方面的研究,对于提高航天航空飞行器设计水平、理解大气海洋行为等都有重要意义。而从可视化方法来看,流线相关的方法已经发展得较为成熟,我们邀请了来自中山大学的陶钧教授撰写《从流线到流面:流场可视化新进展与展望》一文,讨论流场可视化面临的挑战及机遇。

除了以上提到的几个传统应用的新扩展外,在计算机科学内部,可视化和诸多最新发展的前沿领域有密切的融合。随着深度学习近年来在各个应用领域的成功,以机器学习为代表的人工智能技术迅速扩展到社会的各个角落。使用者在享受全自动人工智能模型便利的同时,也因为无法理解模型内部的工作机理,遇到了巨大的困扰。提高工作机理复杂的深度学习模型的可解释性,对于技术发展本身和关键决策过程应用都有重要意义,也因此受到世界各国重视,成为当前学科的一个热点。清华大学的刘世霞教授是可视分析领域中较早对深度学习的可解释性进行交互式可视化探索和分析的学者。我们邀请她撰写《基于可视分析的可解释深度学习》一文,从模型理解、模型诊断和模型改进方面讨论利用可视分析对学习模型开展的研究。

在智能和大数据时代,另一个引起关注的问题是数据的隐私保护。如果把整个可视化看作一个信息的传播系统,我们可以看到在信道的不同阶段,通过合理控制信息的转化,有可能在数据通过可视化传递给用户的同时,提供相应的隐私保护。本期专题我们邀请了浙江大学的陈为教授撰写《面向隐私保护的可视分析》一文讨论这一新兴的议题。

人类对于理解世界的需求是无止境的。可视化通过视觉这一通道,和交互结合,为人类用户提供高效的数据分析理解能力。人作为婴儿来到这个世界的时候,通过眼睛看到母亲,看到缤纷的世界;在数据时代,人通过可视化看到变幻万千的数据空间,相信随着社会的进步和发展,我们将看到更多的拓展和尝试。


本文系转载,如有版权疑问,请联系东软平台云删除

延伸阅读


东软平台云是东软集团云服务平台。东软平台云通过移动化、社交化、平台化、免维护、免部署、按需使用的云服务方式,创造性地把信息、任务、智慧、决策等工作场景精准、即时、无缝、在线地整合在一起,实现在时间与空间上的深度融合,提供无与伦比的知识工作自动化平台,高效应对数字化时代瞬息万变的市场需求,大幅提高客户在数字化时代的生产效率。东软平台云现有顷刻应用表单制作工具、SNAP企业社交化协作平台OhwYaa企业知识社区DataViz可视化数据分析软件、图表秀在线图表制作工具等云服务产品。