从Oho到Siri (语言心理学简介)

作者: Vamei, http://www.cnblogs.com/vamei。欢迎转载。也请保留此声明。

这篇是之前贴再新浪博客的文章。准备放弃新浪博客了,把文章暂时贴过来作为备份。这一篇是简介语言心理学的。语言心理学中的许多实验让我印象非常深刻,特别是下面要提到的两个。心理学的许多论点都是建立在行为学实验的基础上的,所以心理学是非常有用的科学学科。心理学和代码很远,但和人很近,希望对园子里的朋友也有用。

语言的意义

语言是进化赋予人类的一个重要工具。其基本功能是交流,实现信息的共享。我们利用语音和音调的变化来区分基本音节 (phoneme),再进一步组合成有意义的词。初级的语言在语法的指导下进一步组合成为复杂的句子。利用语言,人类可以以很大的信息量在个体之间交流。这样的交流促进人类的协作,大大提高了物种存活下去的机会。动物也有语言,但相对简单,比如见咆哮、嘶吼,再比如人猿泰山发出简单的"Oho"声。此外,与动物语言相比,人类语言除了结构复杂之外,还具备传递复杂情感的能力。我们可以通过文学作品体味到爱、恨、孤独乃至空虚,也可以通过向朋友叙述来让朋友了解自己的心情,这也是人类语言的一大魅力所在。这种感情功能最终促进丰富的人际关系的形成。许多语言还拥有相应的文字,从而以图形化的方式记录。文字可以保存信息,允许人类的经验和知识得到积累。

语言同样帮助个体的思维。语言实际上是一套语音或图形构成的符号系统。如果没有语言的话,大脑很难将概念抽象化。抽象化的概念对于逻辑思维和记忆都很重要。当我们进行理性思考的时,我们会用一些名词来代替我们常见的事物,比如说"大象"。如果在思考"猎人杀死大象"时候,我们都要重新定义一遍大象的形状和其他特征,就会大大加重注意力 (attention) 系统和工作记忆 (working memory) 系统的负担。语言的抽象同时也可以帮助我们记忆。比如我们常常以语言叙述的方式来组织自己的某段经历。当我们回忆的时候,语言是很好的索引。我们回忆的时候,语言信息(比如说人名、故乡的名字)快速有效的找到相关的回忆。这时,语言信息就好像提供了一套寻找记忆的目录。

语言实验

正因为承载着重要的社会和个体功能,人类对语言的使用也在漫长的进化过程中得到了增强。人们的语言系统是由多个脑功能合作实现的,比如听觉、视觉、运动区域、注意力和工作记忆等,但语言相关的动作往往模块化(modularity),其相关神经回路得到强化,并独立地负责语言相关的功能。模块化的功能具有反应快处理快的优势,但也容易被误导。我们可以做一个小测试,请立即说出图中出现的颜色:


尽管我们已经知道,实验要求说出真正的颜色,但相关的文字信息依然会干扰我们的判断。这被成为Stroop effect。当我们看到图片的时候,人脑实际上在执行两个任务,识别真正的颜色和读取文字。第一个任务是由注意力控制的有意识过程,这个过程相对较慢。第二个任务是快速的模块化动作,注意力还没有反应过来,信息已经被读取。尽管我们只想知道真实颜色,文字理解功能还是不断地干扰我们的有意识过程。

在听觉过程中,我们同样可以观察到类似的语言模块化功能,比如Garrett, Bever和Foder在1966年做的实验。我们给参与实验的人播放下面一个句子,并在*号处同时播放一个滴答声:

尽管国庆节让人有一个漫长的假期,但四处*的拥堵还是让人很崩溃。

但是会有许多人会报告说听到的如下:

尽管国庆节让人有一个漫长的假期,*但四处的拥堵还是让人很崩溃。

我们可以看到,滴答声被认为是出现的意义的断裂 (逗号) 处。语言的模块化让我们迅速地形成情境(schema),也就是理解了整个句子的主要意义,再自上而下地补充细节。滴答声不被看作主要意义的一部分,所以是后来补充进去的,所以很容易被放置在这样的意义断裂处。可见,人脑并不是按照先后顺序来接收并理解语言的。

语言的本质

现代的几种主流语言之间具有很大的相似性,它们都有很广泛的词汇,也有相当的兼容新信息的能力,这对于信息时代来说非常重要。比如“屌丝”这个词在中文中就被赋予了新的意义,并迅速被人们接受。现代语言也都符合相似的流程,比如两个人的交谈一般会围绕一个主题,不可以随意地跳跃;一个人如果问了一句,那么另一个人的接下来的话就被当作回答。现代语言的相似性曾经让语言学家误以为语种都非常类似,并都可以实现我们上面提到的功能。但是,随着对小语种,特别是封闭的海岛上土著语种的研究,语言学家发现,这些小语种可以和主流语言存在很大的差异。比如说,有的语种中没有“笑”这个概念的词,那么当地人就没有“笑”这个动作。这揭示了现代语言的许多功能都是不断进化来的,而不是一开始就存在。

传统意义上,人们认为语法是逻辑构成的系统,所以语法是理解语言的关键。在计算机时代,由于搜索和语言处理的需要,人们希望计算机能够根据语法来理解一段文字的含义。自然语言理解就是针对这一问题的研究方向。然而,研究人员逐渐发现,由于人类语言的多义性,通过语法分析得到的结果并不可靠。这种方式往往带来很多错误。后来,统计学方法被引入到自然语言的理解中。计算机先经过大量文本的训练,建立统计样本。当计算机遇到一个新的句子的时候,可以根据之前的统计经验,来“猜测”这个句子的意义。苹果公司的Siri产品就是一个获得广泛社会关注的人机语言交互的应用。自然语言理解再取得成功的同时,似乎也暗示了语言的本质:大脑可能是根据统计,而不是语法去理解语言的。具体来说,大脑随着经验建立了一个巨大的文本库,这个文本库中的句子根据其意义分组,当我们听到一个句子的时候,就去寻找这个句子最可能的意义。可以说,Siri带给人惊艳的同时,也让人思考语言的本质。

或许有一天,我们会以一种全新的方式来学习和使用语言。

原文地址:https://www.cnblogs.com/vamei/p/2865483.html