只要 62 个单词,就能掌握世界上所有语言?

你是否相信:世界上任何一种语言,无论内容有多丰富,都可以拆解成 62 个基石词汇,而无论人们操那种语言,思考时使用的都是这些基础编码?如果真是如此,我们还要用得着背那么多单词吗?

本文来自微信公众号:大象公会(idxgh2013),作者:朱不换,虎嗅获授权发表。

想象一下,你穿越到了大航海时代,经过漫长孤独的航行,来到一个陌生的小岛,却发现岛上的原住民说着你完全听不懂的语言。

从零开始的你,最少需要学会多少个单词,才能和他们讲话沟通?

根据当代语言学家维兹毕卡的发现,你只需要 62 个单词就够了,列表如下:

维兹毕卡认为,上图中这  62  个单词,是人类语言的语义元(semantic primitive),是英语、汉语、西班牙语、马来语等主流人类语言的大厦基石。

一个学习外语的人,除了人名、地名等专有名词外,只要掌握了该外语中的这 62 个词,原则上就可以用这门外语表达任何思想。

▍波兰语言学家,澳大利亚国立大学荣休教授安娜·维兹毕卡

事情真的会这么容易吗?以英语而论,成年的英语母语者平均英语词汇量为三万左右。62 个简单单词,要媲美三万单词那样丰富、庞大的表达力,看起来简直是天方夜谭。

秘密在于,绝大部分含义复杂的词语,都可以被一步步解释、拆分成其他含义更简单、更一般的单词,直至最基本的 62 个「基石单词」。

▍例如,普林斯顿大学的 WordNet 词语网络收录了 15 万英文单词,所有单词都按照语义关系与上级、同级和下级单词联结起来,组成一个巨型的同心圆,外环单词可以被拆解为更简单更抽象的内环单词。同心圆的核心区域是「实体」,「物理实体」「心理特征」等最抽象的概念。

例如,「约翰向玛丽说谎」(John lied to Mary)这句话中,「说谎」这个词并不在 62 个基石单词之内。但是,通过对说谎的含义进行分解,可以把「约翰向玛丽说谎」这句话,分解还原成四句话:

对照一下 62 个基石单词表就会发现,分解后的四句话中,除了人名之外,所有单词都在基石词表之内。

不过,维兹毕卡总结出这 62 个基石词汇,本意倒不是为了跨时空航海做准备,而是在寻找我们的「思想语」(language of thought)的基本词汇。

思想说什么语言

当我们思考问题的时候,思想用的是哪国语?

最符合直觉的回答是:既然我说汉语,我的思想当然也是说汉语。当我们沉思默想,自言自语时,头脑中回荡的声音确实是母语的声音。

事情并不这么简单。当我们说错话的时候,内心会觉察到,嘴巴说出的东西并不是心里想的东西,二者不一致;我们因此得以比较二者,发现自己犯下的口误、笔误。

这就说明,思想在大脑中的实现方式,与我们最终用语言文字表达出来的东西是不一样的。

▍弗洛伊德认为口误反映了人的潜意识想法

而且,即使我们的想法非常确定,在表达出来时也经常充斥着歧义性双关和逻辑不一致性。

比如这句话:「我背着总经理和副总经理把钱存进了银行」,就有四种不同的解释。然而,当嫌疑人在审讯室说出这句话时,他心里肯定明明白白的知道,他想说的是其中哪一个。

▍日常语言的歧义性是各种冷笑话、脑筋急转弯的来源

可见,人类大脑在思考时,另有一套比我们的日常语言更基本的符号系统。我们运用这套系统来思考,并通过这套系统来检查反思自己话语中的失误和歧义。

如果把人脑比作一台电脑机器,我们听到和说出的话只是这台机器的输入和输出。它在对这些语言文字进行推理计算时,使用的是另一套符号系统,这就是所谓的「思想语」。

▍心理学家史蒂芬·平克与哲学家杰瑞·福多是思想语假说的主要支持者

思想语假说认为,大脑中的思想符号系统在结构上与日常语言相似,也是由概念和语法构成。

而且,既然所有人类大脑中加工语言的神经结构都相同,那么,由这些神经结构承载的基本语义和基本语法也应该是相同的。

▍人类大脑的语言回路,上方的背侧通路参与语音工作记忆、语言发音和复杂句法处理,下方的腹侧通路涉及语音识别,语音提取和简单语法处理

也就是说,尽管地球上有数千种人类语言,这些语言都共享相同的最基本语法。同时,各语言的词汇虽然千差万别,但都共享一组相同的基本概念。

▍例如,斯坦福大学的「普遍依存句法」项目,致力于寻找跨越人类各语言的普遍句法,目前已用普遍句法分析了英语、汉语等 76 种不同的古今语言/方言

▍从普遍依存句法的角度看,汉语和英语句子虽然语序不同,但都遵循相同的普遍依存句法

维兹毕卡发现的 62 个基石词汇,很可能就是人类共有的思想语中的基本概念,至少是这些基本概念的「近亲」。

从基石单词到核心词汇

当然,真的只用这 62 个单词交流的话,虽然基本能表达任何思想,但说话却会变得极其啰嗦。

John lied to Mary 本来只有 4 个单词,如果只用 62 个基石单词来表达,就会变成四句话、32 个词,长度扩增了 8 倍。

如果你想对朋友说,「我想吃东西」,翻译成基石词汇,是类似这样的可怕句子:「我想要一些东西;这些东西运动于我身体最上面部分的内部;之后这些东西会很长时间在我身体内部……」

如果在「能够表达任何思想」之外,再增加一个「不许太啰嗦」的要求,那就需要适度扩增词汇量。

以英语为例,非母语的英语学习者只要精通两千至三千词的核心词汇,其实就足以完整、不啰嗦的表达各种思想。

掌握了这两三千个基本词汇后,即使某个生僻词你不会说,也很容易用已掌握的两三千个词对你想表达的这个词进行相对简洁的解释、替代。

大概因为意识到了这一点,各种权威的英语学习词典,都采用 2000-3000 个基础词汇,作为其他词汇的释义词汇,用这些释义词汇来解释其他所有词条。

▍牛津高阶学习词典,剑桥高阶学习词典和柯林斯高阶学习词典分别采用 3000 词、2000 词和 2500 词的核心释义词表

然而,只用基本词汇表达,仍难免会显得啰嗦可笑,比如著名的某国红灯区中文警示广播:

注意听,注意听,不要跟拉客的人走,他们会带你们到小屋里,说有美女睡觉,但是那个女人跟照片上不是同一个女人……别相信他们,他们会说一小时只要 5000 元,带你喝高浓度的酒,喝到烂醉,趁机扒窃银行卡或信用卡,取钱,刷钱,上述情况不断发生,千万别相信他们,上当受骗……

要想真正熟练、准确地掌握一门外语,2000-3000个核心词汇显然也才刚刚开始。

然而,理解比表达更吃词汇

而且,虽然精通一门语言的 62 个基石词汇、2000-3000 个核心词汇,就足以完整表达各种思想,这还只是从向外「输出」语言的角度来说的。

从向内「输入」的角度,如果要听懂外语对话、看懂外文文献,两三千的词汇量就远远不够了。

因为,能不能听懂别人的表达,取决于对方表达者话语中的词汇量有多大,句子有多难。而英语母语使用者日常使用的词汇量,显然超过两三千这个数目。

▍美国教育界通常使用蓝思标准公式(Lexile Specification Equation)来衡量英文文本的难度。文本中的句子越长,稀有词汇越多,文本越难。

根据统计测试,如果要读懂中等难度英文文献中 98% 以上的词汇,需要 8000-9000 的英文词汇量。如果要听懂普通英语对话中 98% 以上的词汇,需要 6000-7000 的词汇量。综合起来,读懂、听懂普通英语,最低限度需要 8000 左右的词汇量。

▍托福 iBT,雅思,密歇根英语与培生学术英语测试的分数对照

这个最低限度词汇量,也可以从托福、雅思等出国英语考试的分数线上看出端倪。雅思 6.5 分或托福 80 分是主流英美高校录取外国学生的最低线。据统计,雅思 6.5 分的人的平均词汇量为 7393,托福 80 分的人的平均词汇量为 7773,也都在 8000 左右。

总之,如果你想在外语环境中生存,读得懂书、听得懂话,62 个基石单词救不了你,8000 个单词才是底线。如果你的词汇量不够,还是老老实实背单词去吧。

本文来自微信公众号:大象公会(idxgh2013),作者:朱不换