APP下载

基于语言分布预测的国际办事处位置选取研究

2018-10-31常晶晶吴傲庭杨云杰

求知导刊 2018年22期

常晶晶 吴傲庭 杨云杰

摘 要:文章通过对世界主要语言的发展进行预测,从而确定主流语言多元化区域,为企业的国际化拓展和国际办事处的选址提供指导,对使用人数排名靠前的12种语言,建立了基于马尔科夫链的语言发展趋势预测模型,以得到随着时间推移多种语言的分布情况及发展趋势。在已建立的语言发展趋势预测模型的基础上,结合语言数量、语言使用比例、语言的辐射半径和地点选取指数之间的关系,采用节点搜索算法对地点选取指数进行求解,得出国际办事处的合理地点和所用语言。

关键词:语言传播规律;节点搜索算法;位置选取;社交半径

一、引言

大型跨国服务公司的拓展,需要开设更多的国际办事处,员工需要有包括英语在内的多语交流能力。在全球化和世界经济一体化背景下,区域语言多元化可以为区域市场经济的多元化发展打下坚实的基础,从而为开展对外贸易提供语言上的支持,对顺利引进外资、学习和借鉴先进技术及管理经验具有重要意义。对语言的发展和分布趋势进行预测,可以找到未来一段时间内语言多元化的地区,结合其他因素,可以筛选出适合国际企业设立办事处的地点,为企业寻找合适的办事处提供语言环境方面的信息支撑。

二、语言传播初始概率相关指标的求解

1.语言的傳播规律

语言在个体间的传播有两种形式,分别为垂直传播(父辈遗传)和水平传播(同辈学习),一方面,语言从父辈到子代属于垂直传播,即父辈个体将其所掌握的语言传播给后代,模型规定了人口死亡率μ,死亡的父辈成年人以比例μ由新生孩子取代,孩子从父母获取的语言由垂直传播方式确定;另一方面,同辈成年人之间的语言传播则由水平传播确定,即同辈个体间通过相互学习掌握新语言[1]。

以两种语言之间的传播为例,设模型中的每个个体掌握语言的情况符合以下情况中的一种:单语A、单语B以及双语AB,具体描述如下(见下表):

垂直传播如连接状态的定义图(a)所示,具体规则是:

(1)传播过程中,父辈个体为单语者(A or B)其后代完全遗传父辈的一种语言,即A↓A or B↓B。

(2)如果在传播过程中,父辈个体为双语者AB,其后代可能只学习到其中的一种语言,即AB↓A和AB↓B,也可能出现后代同时掌握父辈的两种语言AB,即AB↓AB。

水平传播如连接状态的定义图(b)所示,具体规则如下:

(1)水平传播过程中,所有已经掌握双语的同辈成年个体仍旧保留双语的状态不变,即AB→AB。

(2)同辈成年个体只掌握单语A或B,最终仍保留单语者的状态。即A→A或者B→B。

(3)传播过程中的同辈成年个体只掌握单语A或B,后来受到相邻同辈个体另一种语言的影响,最终变成双语者AB,即A→AB或者B→AB。

2.语言传播概率

传播过程中,每个个体都会受到与其有连接关系的个体的影响,按照一定的概率改变语言状态,根据以上的具体传播规则,设定了语言传播概率计算公式[2],主要依据复杂网络语言中的语言垂直与水平传播公式。

3.相邻个体使用语言比例

个体在语言的传播过程中,是通过社交来完成传播的,个体社交半径的大小,决定了他相邻个体的数目,所以本文建立一个连接社交模型来体现语言的传播过程,具体规则是个体在二维空间中的位置来代表它在现实社会中所处的地理位置;认为两个个体在二维空间中位置越近,它们的联系就越紧密。个体的社会网络连接表示其社交范围,即个体认识处于它的社会网络连接内的其他个体,社会网络连接的大小用它的社会半径来描述。在创建个体间联系时,要求双方都认识对方才认为两者是连接状态,如下图所示,a)为非连接状态,b)为连接状态[3]。

三、国际办事处位置的选取

一家大型跨国服务公司在美国纽约和中国上海设有办事处,正在继续扩大规模,调查增设6个新的国际办事处。考虑跨国企业开设新的国际办事处的问题,可以从语言的多样性和语言的辐射力度两方面考虑,一方面,语言的某一地区语言的多样性可以促进区域市场经济多元化的发展,为开展对外贸易提供语言上的支持。

另一方面,多元化的语言当中要包含相对活跃的、辐射力度较强的语言,才能对经济有积极的作用。因此,设立单位面积的语言数量N,语言使用比例ρi和语言的辐射半径γi三个指标来衡量一个地区是否可以设立国际办事处。

1.六个国际办事处的选取

设立国际办事处的标准是考虑待选取地区的满足指数Γ的大小,指数Γ受以下3个指标的影响,分别是:单位面积的语言数量N,语言使用比例ρi和语言的辐射半径γi。

三个指标之间的函数关系如13式所示:

Γ=N∏(γiρi) (13)

式中Γ表示设立国际办事处的满足指数,N=1,2,...,m表示语言的数量,ρi表示语言使用比例,γi表示语言的辐射半径,用该语言的覆盖面积衡量,γi=√Si,Si表示i语言的覆盖面积。

由于新的国际办事处的员工都需要用英语和一种或多种其他语言进行讲话,所以,以英语覆盖区域为目标,采用节点搜索算法[4][5],具体过程如下:

(1)将目标区域划分成2d个大小规模相等的区域,计算每个节点的 Γ值。

(2)通过随机选取中心点,以选取的点为中心,向外累加Γ值,当前累加的值越大,朝向这个点方向累加的速度越大,当达到一定面积后(上限为一个城市的面积)累加区域朝累加速度最快的方向移动,移动速度为当前累加点和溢出点Γ值的差值,当区域移动速度等于0时,停止累加,区域内的点不再参与累加过程。

(3)当所有区域都被累加结束后,比较所有求和之后的Γ值,选取其中Γ值最大的6个区域。

(4)对选取的6个区域进行语言辐射力度检验,若区域Ⅰ的辐射半径γi范围内包含区域∏,则舍去区域∏,若区域Ⅰ的辐射区域和区域∏的辐射区域相互包含,则选取其中辐射半径较大的一个区域,将另一区域排除,再引进新的区域作为填补,直到满足6个区域为止。

(5)将最终得到的6个区域作为新的国际办事处的设立地点。

设时间长度为50年,运行上面的过程,运行结果显示,Γ值最大的地點在以下6个城市附近,分别为:新加坡,斯里兰卡,巴黎,悉尼,开罗和里约热内卢,新加坡使用汉语、英语和马来语,斯里兰卡使用印地语、英语和旁遮普语,巴黎使用法语,英语和德语,悉尼使用英语和西班牙语,开罗使用阿拉伯语,英语和豪萨语。

以50年时间长度的预测结果基础,逐步将时间长度改为60年、70年、80年,当时间长度改为80年时,模型输出结果发生改变,确定的6个地点为:伦敦、斯里兰卡、悉尼、开罗、开普敦和里约热内卢,巴黎和新加坡被伦敦和开普敦代替。

2.通信性质变化后的模型

更加快捷的通信设备和互联网,使得全球通信距离缩短,从本文模型的角度考虑,使得个体的社交半径扩大,语言的辐射范围变得更远,在上述模型的基础上,增大模型中个体的社交半径[6],以原有社交半径的3倍作为新的社交半径,运行程序后发现各强势语言的分布面积明显增加。

在新的结果的基础上计算社交半径增大后的语言覆盖面积Si',则修正后的语言的辐射γi'也随之增加,新的辐射半径导致了斯里兰卡和新加坡的相互辐射包裹,且新加坡的辐射区域和上海的辐射区域部分重叠,从节省公司资源的角度考虑,可以去掉新加坡,建立5个国际办事处。若需要从其他方面考虑,如从撤销国际办事处所损失的公司利润,未覆盖区域的潜在经济价值等方面考虑,则需要相关地区的经济状况,该公司具体的服务性质,资本情况等信息,用这些信息综合分析建立更多国际办事处的利润和投产比,可以得出更令人满意的结果。

四、结论

(1)在考虑了语言的多样性和语言的辐射力度两方面的因素后,得出增设6个新的国际办事处的位置为:伦敦,斯里兰卡、悉尼、开罗、开普敦、里约热内卢。

(2)更加快捷的通信设备和互联网,使得全球通信距离缩短,加速了强势语言的扩散。

(3)随着强势语言的扩散导致语言辐射半径的增加,从节省成本的角度考虑国际办事处的数目可以降低。

参考文献:

[1]Anne Kandler,James Steele.Ecological Models of Language Competition[J].Biological Theory,2008(2):164-173.

[2]Jin Cong,Liu Haitao.Approaching human language with complex networks[J].Physics of life reviews,2014(4).

[3]王 超,毕贵红,张寿明.基于Agent社会圈子空间分布网络的语言竞争模型[J].计算机工程与应用,2016(7).

[4]Jianshu Weng,Ee-Peng Lim,Jing Jiang,et al.TwitterRank:finding topic-sensitive influential Twitterers[C].Proceedings of the3rd ACM International Conference on Web Search and Da ta Mining(WSDM 10),2010.

[5]Eric Gilbert,Karrie Karahalios.Predicting Tie Strength With Social Media[C].Proc CHI,2009.

[6]张 璐,蔡皖东,彭 冬.社交网络种子节点搜索算法[J].计算机工程与设计,2013(12).