Wordle是优秀的信息可视化吗?如何真正使用Wordle?

《数据可视化之美》(Beautiful Visualization)

Wordle是优秀的信息可视化吗?

如果你认为Wordle 是严格意义上的信息可视化工具,它在设计的某些方面存在误导或者干扰用户的潜在可能,有必要指出并加以批判。以下是我认为Wordle 存在的不足之处。

单词大小调整太初级

Wordle 在计算其字体大小时,并没有考虑单词的长度,或者它所绘制的文字的字形。其结果是,给定使用次数相同的两个单词,包含的字母越多的单词在屏幕上会占用更多的空间,这可能会给读者带来这样的印象:单词越长,其出现频度越高。

此外,据我所知,在关于单词大小和感知上的相对权重的关系上没有任何研究。更糟糕的是,常见的策略是把单词的权值根据其平方根进行缩放(为了体现单词拥有区域而不仅仅是长度这一事实),这只会使Wordle 显得很无聊。

颜色毫无意义

在你的电脑屏幕的中央提供了最宝贵的几个维度,令人吃惊的是,Wordle 在颜色使用上非常“散漫”。在Wordle 中,颜色是毫无意义的;它仅仅是用来提高单词边界的对比度和增加一些美感。

颜色可以用于对各个维度进行编码,如聚集(意味着这些单词通常是一起使用的)或者统计学意义(如图3-19 中的总统就职演说的单词云)。Wordle 还可以使用颜色在同一空间表示两种或者更多不同的文本。

值得一提的是,Wordle 并没有为色盲的读者做出什么特意安排,虽然人们总是可以通过应用小程序的色彩菜单栏创建一个定制的调色板。


图3-19 :这个演讲使用了很多“Government ”(政府)这个词,但是在其他演讲中该词用得更多;“pleasing ”(愉快)只被用了几次,但是它在语料库中是一个不寻常的单词;“people”(人民)被用了很多,其频率在该演讲中非同寻常。

字体是使人充满遐想的

Wordle 的很多字体都更倾向于美学和表现力,而不是可读性。这么做的原因一部分是因为Wordle 的Web 站点设计——如果缺乏形式多样的字体,画面将是单调的。最重要的是,Wordle 中的字体必须看起来很优美,这意味着它不一定很适合于正文文本。

对于易读性至关重要的应用,Wordle 提供了Ray Larabie 的Expressway 字体,该字体被美国运输部作为标准字母。

字数计数不够具体

Wordle 对《New Testament 》中的每一卷的页面中出现的“Lord ”(上帝)这个单词的次数进行了求和,但是它没有提供任何关于各个章节的区别的信息。仅仅简单地对单词计数并不能对相似的文本做出有意义的比较。比如有一个博客帖子,突出该帖子和该博客的其他帖子的不同之处,或者说明它和其他博客的在同一主题上的区别,甚至是说明该帖子和新闻报道文章的用语的不同,这些方面的说明可能是最具有启迪性的。

存在很多统计学方法,可以应用于一篇“样本”文章,来基于一些“范文”的正文来抽取“样本”中的特定字符,尤其注意一些单词的使用在统计上是更重要的。除了单词出现频度,还可以对单词权重进行更细致深入地探析,然后应用Wordle 布局算法来展示结果。

在分析每个总统就职演说时,我都探索了这个想法,把每个演说都和当时最接近的5个演讲、10 个最接近的演讲以及所有其他的就职演说进行了比较。这种分析的优点是可以揭示一些不可预见的单词。举个例子,图3-20 是哈里·杜鲁门在1948 年的就职演说的可视化。左侧是该就职演说中使用的单词的Wordle 形式的展现,右侧是他那个时代的其他总统所使用次数更多的单词的展现。该可视化展现说明了杜鲁门的演说强调的是对外政策。


图3-20 :哈里·杜鲁门在1948 年的总统就职演说:和他同时代的其他总统就职演说相比,杜鲁门的演说当中很明显缺乏那些红色标注的单词。

如何真正使用Wordle?

Wordle 不是为可视化专家、文本分析专家甚至是有经验的计算机用户而设计的。我试着把Wordle 做得尽可能像个工具。

在撰写本章时,人们在Wordle 画廊中已经创造、保存了超过140 万的“单词云”。这些单词云被用于:总结和修饰商务演示和博士论文,插图说明新的文章和电视新闻报道,提炼和抽象受害者个人痛苦的回忆。Wrodle 还发现形形色色的充满热情的教师社区,他们使用Wordle 来展示拼写列表、总结话题以及促使不识字的青年参与到享受文本的乐趣中。

如表3-1 的调查结果表明(Viégas、Wattenberg 和Feinberg,2009 ),使用Wordle 激发了人们的创造力,人们会觉得他们正在做创造性的事情。

表3-1 :人们创造Wordle时的感受  

感受 赞成% 中立% 不赞成%
激发我的创造力 88 9 4
我感到一种情绪反应 66 22 12
从文本中我学到了一些新的知识 63 24 13
它证实了我对文本的理解 57 33 10
它勾起了我的回忆 50 35 15
Wordle 使我感到困惑 5 9 86

因此,通过对可视化效能应用传统的学术评估——“从文本中我学到了一些新的知识”——至少可以认为Wordle 是比较成功的。但是Wordle 真正闪光之处在于其交际作品的创作。使用Wordle 的人们感觉他们似乎创造了一些东西,它成功地表示一些有意义的事物,并准确地反映或增强了源文本。这种意义看起来主要是直观的,因为很多人并没有意识到单词大小和单词频度是相关的(相反地,猜测该大小表示“情感重视”甚至是“单词意义”)。

Wordle 的特性缘于文本的特性。只是简单地把一个单词放到屏幕上,其字体要么对单词本身的涵义进行补充,要么对其进行反衬,可以马上使读者产生共鸣(实际上,在公共画廊上保存了成千上万的单词)。当你把两个或者更多的单词并排展示时,一个有文化的人就会自然而然地去理解该序列化单词。Wordle 对单词的随机组合给人们创造了喜悦、惊喜、某种程度的认可,以及如诗般激发了人们的洞察力。

为传统的信息可视化使用Wordle

Wordle 的信息可视化分析用途当然可以为专业用户所用,更不用说Wordle 所具备的特定的情感和交际特性。为了满足那些使用Wordle 给“加权文本”创建可视化的用户,其权重不一定是基于单词的出现频度,Wordle 的Web 站点提供了“高级”用户界面,用户可以输入包含任意(可选)色彩的加权单词或短语的表格数据。

Wordle 的更高级的使用方式可能是通过“单词云生成器”控制台应用程序,可以通过IBM 的alphaWorks Web 站点进行查看。

ManyEyes 协作式数据可视化网站还把Wordle 作为文本可视化选项,其他的还有创新型的Phrase Net 和Word Tree 可视化(以及更传统的标签云)。

---------------------------
本文节选自《数据可视化之美》(Beautiful Visualization)第3章“Wordle”,作者Jonathan Feinberg。
更多本书相关链接,请点击:【华章官网】【互动网】【卓越网】【当当网】【京东网】【豆瓣网

原文地址:https://www.cnblogs.com/hzbook/p/2093436.html