1、本科毕业论文(20 届)声望在语言的形成和演化中的作用所在学院 专业班级 应用物理 学生姓名 学号 指导教师 职称 完成日期 年 月 声望在语言的形成和演化中的作用摘要我们对一个修改后的命名博弈进行了研究,该博弈是近期引入的模型,它介绍了在没有任何中央控制的情况下,如何在人群中自发地共享词汇表。我们特别地引进了一个允许内部词汇的持续交替的机制。在实施一项起作用的政策时,该政策受个人声望在社会上的定义- 这种分级结构的影响。我们分析这些特征是如何影响对融合时代、代理的认知努以及时间和记忆的标度无关行为。 关键字:命名博弈 语言 声望Consequence of reputation in an
2、open-ended naming gameABSTRACTWe study a modified version of the naming game, a recently introduced model which describes how shared vocabulary can emerge spontaneously in a population without any central control. In particular, we introduce a mechanism that allows a continuous interchange with the
3、external inventory of words. A playing strategy, influenced by the hierarchical structure that individuals reputation defines in the community, is implemented. We analyze how these features influence the convergence times, the cognitive efforts of the agents, and the scaling behavior in memory and t
4、ime.Key Words: Naming Game Language Reputation目 录第一章 引言 .11.1 研究背景及意义 .11.2 研究进展 .11.3 本论文的研究内容 .2第二章 模型及动力学 .4第三章 模拟结果 .5第四章 标度律 .7第五章 结论 .9天津理工大学 2014 届本科毕业论文1第一章 引言1.1 研究背景及意义语言的起源和传播以及它们的分化演变,都是要通过各种理论来解决的问题;而这些理论跨越不同的哲学取向,从先天主义和进化主义到行为主义和约定主义。在 Wittgenstein 的见解的最后部分可以找到这最后一种观点(约定主义)的一个不错的原型1。语言
5、可以被看成是在人类生活中自始至终都在起作用的一种任意地将某种含义归属于单词的活动。语言的运用(use of language)将含义定义为:“一个单词的含义是它在语言中的用途 ”1。这样看来,语言是在涉及一个特定符号时以特定的方式反应的一种训练:语言博弈(Language Game) 。一个特殊的语言问题一个新的语言量的上升,这可被认为是这种假设的一背景测试。语言学家试图以定量的方式对这种变化进行表征2,使用数学模型来描述这些语言元素的上升(或下降)3。我们可能会把我们的学习重点放在这些具有动态过程速度快的特点的变化中,特别是在这些可能的不同语言的变化中,例如,新词的诞生。翻翻字典,你会发现,
6、每年是有多么多的数以千计的新词出现或者代替其他词。甚至,阅读比较不同时期的一些报纸时,我们可以发现有多少词语或句法变化沿用或代替以前的。最后,我们就可以观察到一些属于术语、行话或习惯用语的出现和消亡。用于测试更一般的理论,这些事实可以被看成是很好的范例;这些也可以相同的方式,导致生物学方面的长期过程-非常快的进化转变,好比一个人(微观进化)的寿命,可以解释以地质时期规模为特征的行为演变进程。1.2 研究进展为了测验这些关于前文我们提到过的语言起源的假说,一个著名的仿真实验来实现模拟这些快速学习动力学,也就是“talking heads experiment”4。在那里没有任何外部干预的情况下,
7、具体的软件代理引导共享的词汇。机器人是的语言博弈的参与者,在整个自组织过程中开发词汇,也就是命名博弈。Wittgenstein 还有相似的观点,语言可被看成是一个自适应系统,由当地的语言活动之应用和行为形成和再形成 5。近日,这些研究也吸引了统计物理学界的兴趣。这种命名博弈动力学的特征是新竞争的天津理工大学 2014 届本科毕业论文2单词的一短时间的扩散和传播,随后突然过渡 2,3到使用一个单字。对于其他的社会动力学来说,这些事实非常普遍 6,因为这些社会动力学中的人口旨在达成一个共同的共享状态、共识 7。其中一项研究的新颖之处在于放弃任何进化方法 8,是基于快速的时间尺度来处理出现的交流约定
8、。即使存在一些选择的形式,甚至也没有考虑任何可以确定一个全球协调的中央控制。这个方向的首个研究已经出现 9,直接从使用机器人的试验中得到启发 5。再这样的工作实践中,命名博弈越尽可能的简单,以达到复杂性和处理能力的较低界限。每个参与者的特点是,具有与对象相关联的单词的库存。每次随机抽取 2 个参与者,按照以下的一些简单规则进行互动。说者(Speaker) 从自己的单词库中检索一个单词,或者它的单词库为空,则构造一个新单词并且把所选择的单词发送给听者(Hearer)。如果听者(Hearer)的词库中有这个单词,通信交流就算成功。2 个代理更新他们的词库,以便仅保留所涉及的互动中的单词。否则,通信
9、是失败的;听者(Hearer)为新词和对象之间增加关联。这些简单规则付诸行动有 3个机制:一个上传机制- 从外部词库为自己的词库引入新单词;一个重叠机制- 允许传播参与者之间的特殊的单词;以及一个协议机制- 删除没用的单词。有了这些机制,该系统经历了一个从无序到有序的转变,朝向一个“以一个单一的单词面向所有参与者”为特点的吸收状态。这种状态可覆盖很大数量的人群。1.3 本论文的研究内容如上所述,Baronchelli 等人 9 进行了他们的命名博弈,这些博弈的灵感来自 talking heads experiment 的行为。本文中,我们的兴趣点在于制造一些更多的和说者(Speaker)的真实
10、团体有关的特点,比如,学生的教室变得可胜任语言教学活动,一个学习新语言的外国人社团,或者是一个都市部落或一组研究人员的行话创作动力学。综观这些情况,现实世界中的语言是开放式的,对不同的词的可能数量没有明显的限制。我们可以证实一种流动性,通过它新单词能进入或离开术语库。与此相反,在原有的模型中 9,每个代理可以存储无限数量的唯一可能的不同名称,而不是现实中的。如果我们关注那些动态,这就比较好理解。即使代理可以存储无限数量的单词,博弈的规则仅允许在代理的词库是空的情况下引进新词,并且这种情况只能发证在蒙特卡洛模拟(MC )的第一步。在此瞬变之后,当每人至少有一个单词的时候,该系统本身表现地像一个封
11、闭的系统,不包括其它新单词。该博弈的特征是,整个重叠和协议机制中, 不同的单词的固定数目都减到 1.天津理工大学 2014 届本科毕业论文3我们想要证明的第二个观点是,在一个失败的通信及与社会结构关系的情况下,说者(Speaker)之间的有限反馈。在一个实际失败的案例中,只有当他认识到说者(Speaker) 作为一种教师时,听者(Hearer)才被引导去学习对象和单词之间的联系。甚至事实上,如果对话是成功的,或对话似乎没有一种足够的证据来证明学习新联系,说者(Speaker)和听者(Hearer)能够通过各种后续的行动而建立。相比之下,在命名博弈的最初的定义中,重叠机制实际上总是强迫听者(He
12、arer)去学习说者(Speaker) 的内容。这种动力学或许在达成共识状态时是最为有力的,但是仅仅在说者(Speaker) 具有固定的监控作用并且听者(Hearer)复制的情况下,才可能考虑这种现实;也就是说,假设说者(Speaker)充当老师的角色,听者(Hearer)就像是学生。一般在现实中的假设是,这些角色都是由团体的社会结构所定义的,在每次的通信中不是随机分配的。以前由 Baronchelli 等人描述的方案 9,假定参与者完全匿名操作。在之后的工作中已经出现了对团体的社会结构以及人口异质性的作用的普遍关注;这些之后的工作定义了异构的拓扑结构,其中,不同的代理扮演不同的角色 10,或
13、不是完全随机的交互 11。然而,在我们的工作中,我们要指出的是我们关注更具体的事实。在和人有关的情况下,参与者可以积累他们的环境信息,尤其是专门对未来潜在的合作伙伴的交互信息。所有的参与者都具有某种声望,来表征自己在交互中的成功,并且通过观察第三方的交互和谈话,参与者的声望被别人所知道。最后,我们可以假定所有的参与者都愿意从代理处获得主要的成功的交互信息。如果 Baronchelli 等人的模型对于考虑这些一般假设的改变,以及这些因素对动态和系统统计行为造成的影响的改变是充足的,我们就会很自然的被引导去探索。我们之所以有兴趣引进这些新的元素,不仅仅是为了描述一个更实际的情况,而且还要测试之前描
14、述的模型机制的坚固性,并且进行研究,看看在达成共识时,是否这些简单的新结构可以改善我们的系统性能。因此,在本文的其余部分,我们将提出我们的模型版本。我们将描述一个开放系统,其中,每个代理实际上可以存储无限数量的不同名字。这实际上可能要归功于一个动力学,它允许在每一步的 MC 引进不同的单词。此外,我们给用我们博弈的代理之间的命名引入了分层结构,使得区分参与者成为可能,其中一部分参与者充当教师,其他参与者就相当于学生。通过建立地位或声望的概念来达到这样的效果;这也是人类社会的一个普遍特征,通常可以与众多大型集体行为有关 12。如果我们把语言作为一种集体的、非个人主义的解决问题的过程,那么引进这个
15、概念的重要性就变得清晰。天津理工大学 2014 届本科毕业论文4第二章 模型及动力学该博弈由代理 P 进行。一个包含的每个代理可以存储任意数量的单词的库存。此外,用整数(R )标示每个参与者和其在团体中的声望。我们把声望作为一种得分 13,一种即时变量。人数一开始是由 R 规则随机分配的,在时间演变过程中,每个参与者的声望根据它在博弈中的表现而改变,按照以下说明的规则进行。在每一个互动中,具有更大的声望的代理就像一个老师,而另一个像一个学习者。在每个时间步骤中, 我们的模型受下列细微规则控制。(1)具有 RS声望的发言者,从他的库存总检索一个单词,或如果他的库存为空,创建一个新词。(2)具有信
16、誉 RH特点的说者(Speaker)把选择的单词传输给听者(Hearer)。(3a) 若果听者(Hearer)的词库中包含这样的单词,通信成功;2 个代理都更细他们的词库,仅仅保存交互中出现的单词。说者(Speaker)的声望增加 1。(3b) 若果 ,听者(Hearer)给自己的词库中增添新单词,而发言者没有任何事 发生;或者若 ,发言者创建了一个新单词,听者(Hearer)却没有任何事发生。则通 信是失败的,发言者的声望降 1。实施的这些规则定义了一个开放系统,其中实际上可发明无限数量的单词。若参与者的词库为空(仅发生在模拟的早期阶段)或如果他们的沟通是失败的,他们可以创建新的单词。实际上
17、,我们可以想像在现实社会中,无法交流的个人很自然地被引导去找寻新的单词。在人群中该过程确定了一个层次结构,允许个人在每个通信事件中定义为不同的角色。这种结构是动态的,随着时间的演化而变化。每个参与者被不断评估:声望被定义为得分,可高可低,取决于上一轮博弈的情况。天津理工大学 2014 届本科毕业论文5第三章 模拟结果我们将通过一些通常的全局量描述自己系统的时间演变 9:人口中存在的单词的总数量(Ntot),不同单词的数量(N dif),以及成功率(S)用于衡量交流成功的平均比率。初始瞬值存在于词库为空的代理中。在这样的早期阶段,每次的交互中,每个说者(Speaker)至少发明了一个新单词,每个
18、听者(Hearer)可能学会了一个。到了这个阶段,我们的模型行为与原来命名博弈已经不同。事实上,在模拟中,这一阶段相当于 Ndif 的上升阶段以及不同的单词的总数达到其最大值的最后阶段,这个最大值等于 N/2,一直维持在平稳时期。在我们的模型中,曲线 Ntot(t)和 Ndif(t)具有相同的表现,一直增长直到在 tmax处达到最大值。在这漫长的学习阶段中,不同单词的总数没有表现出任何停滞(见图 1)图 3.1Fig.3.1随着博弈成功的次数增加,当单词的多余量达到一个足够高的水平。曲线 Ntot(t) 和Ndif(t)开始沿着一样的速度下降,一个常见的词对于所有参与者是一致的,时间达到点Tc
19、on。在这个动态中,对两个阶段进行区分是很可能的。第一个阶段中,系统可以自我识别,天津理工大学 2014 届本科毕业论文6建立相互关系-作为集体行为的一个结果。当时间演化达到 Tmax 前 S(t)保持线性增加。第二个阶段,随着无序到有序的转化,一个非常快速的引人注目的收敛过程发生。此外,在我们的模型中,在进入快速转变动态之前,该系统经过了快速重组。图 1 中,我们称某一时间的对应数据为 Ntot(t),N dif(t)和 S(t)。在这些模拟中,代理声望的原始数据遵循中心为零的正态分布,标准偏差 = 5一般来说,系统演变非常依赖于声望分配的初始条件。很显然这种演变不是取决于 R分布的均值,取
20、决于其 范围的数值。比如,如果我们在开始的时候,每个参与者都有相同的 R 值,在相同的参数下,单词的总数量达到最大值。也就是说,这种情况下,系统需要非常大的存储空间。随着范围数值的增长,必要的存储空间尺寸减小,直到达到一个最小值。举个例子,如果我们从正态分布中选择一个 R 值,并且增加标准偏差,最大存储空间随着博弈成功数的减小,达到标准偏差的最小值 5(被保存为不同人口规模的最优值) 。在 值的这种区间中,朝着共同的收敛时间似乎差别不大。相比之下,如果我们进一步增加范围,Tcon 肯定还会增加。长期存在的准静止状态出现,特点是一个固定的小数量的单词指向同一对象。对此,图 2 清楚地显示了这种情
21、况。我们可以这样理解这个事实,如果代理有较高的声望,一般情况下,它不会知道其他参与者的话。另一方面,会更有机会来宣传自己的话。带有高 R 值的代理将成为核点,引发话语的传播,一般都会存在到最终状态中。基于此,对于声望广泛分布的人群,一些来自于不同族群中且具有相同单词的很多著名代理,会以一种非常缓慢的变化达到共识。此外,我们探讨 R 的最初的不对称分布是如何影响系统演化的(参见图 3) 。我们模拟运行两个类别的代理:其中一个的 R =5 ,另一个的 R = 5。当 R =5 的子种群的参与者为多数,就存储器成本而言,系统性能变得糟糕。相比之下,如果具有高水平声望的参与者数量较小,为了达到共识的必要的存储器成本切合实际的降低了。这些结果有一个简单的解释。在一个专制团体中,达到这样的共识相对较简单;在一个专制团体中,少数有很高声望的人能轻松、有效地在人群中传播他们的话语。