APP下载

基于语言监测的汉语高频新词语研究(2000—2020)

2022-07-27郭伏良

关键词:词频汉语曲线

郭伏良,侯 丽

(河北大学 文学院,河北 保定 071002)

新词语是社会生活的一面镜子,真实地反映出语言和社会生活共变的特征。21世纪以来,包括中国在内的世界处在一个重大的社会变革和转型时期,社会的政治、经济、科技以及人们的思想观念等都发生着巨大的变化,信息技术的发展又为词语传播提供了丰富的土壤和强大的驱动力。本文在建立21世纪新词语表的基础上,结合语言监测与数据分析,对高频新词语的动态发展变化进行初步的描写记录和归纳。

一、新词语表的建立

(一)新词语的界定

新是一个模糊概念,也是一个时间概念,新出现的词语,在多久的时段里,可以算作新词语呢?刘叔新将这一时间段定为15-20年左右,产生在现在至20年前时间段内的,便是新词语。按照这种认识,新词语,则是指21世纪以来,即2000年以来“陆续产生而稳定地使用到今天的词语”[1],涵盖新形式、新意义、新用法,既包括新词也包括新语。

(二)新词语表的建立

本文的新词语从2000年以后出版的新词新语词典中进行选取,汇总2000年之后出版的新词新语词典共有近20部:周洪波主编的《新华新词语词典》[2],曲伟、韩明安主编的《当代汉语新词词典》[3],沈孟璎主编的《新中国60年新词新语词典》[4],刘海润、亢世勇主编的《现代汉语新词语词典》[5],宋子然主编的《100年汉语新词新语大辞典》(1912年—2011年)[6]等。根据词典的出版时间、收词时间和编撰体例、书证选录原则等因素,我们从中选取了两部词典、两组编年本系列词典作为新词语的选取来源。

宋子然主编的《100年汉语新词新语大辞典》(1912年—2011年)在国内属于起步早、持续时间久、收词自成系统的出版物,其语料收集有代表性,词义释义客观公允,每个词目都有早期书证材料。在其下卷(1978年—2011年)中人工选取2000年及以后出现至2011年的新词新语条目共2 705个,收入词表。亢世勇、刘海润主编的《新世纪新词语大词典》(2000年—2015年)[7]以人民网为语料库进行检索统计,收录了2000—2015年间出现的新词语5 400余条,并全部收入词表。

2000年之后出现的编年本新词语词典有两组:第一组是宋子然主编的《汉语新词新语年编》[8-9]、宋子然、杨小平主编的《汉语新词新语年编》[10-12],取其中2000—2010年词语2 784个,收入词表。第二组是教育部语言文字信息管理司策划的系列编年本汉语新词语。从2006年至2018年每年国家语言资源监测与研究中心都在主流媒体中统计提取年度新词语,至今已出版14册①14册书是:周荐主编《2006汉语新词语》,侯敏、周荐主编《2007汉语新词语》,侯敏、周荐主编《2008汉语新词语》,侯敏、周荐主编《2009汉语新词语》,侯敏、周荐主编《2010汉语新词语》,侯敏、杨尔弘主编《2011汉语新词语》,侯敏、邹煜主编《2012汉语新词语》,侯敏、邹煜主编《2013汉语新词语》,侯敏、邹煜主编《2014汉语新词语》,侯敏、邹煜主编《2015汉语新词语》,侯敏、邹煜主编《2016汉语新词语》,邹煜主编《2017汉语新词语》,邹煜主编《2018汉语新词语》,邹煜主编《2019—2020汉语新词语》,此14册书均由商务印书馆出版。,共收录新词语6 439个,收入词表。

这两部词典、两组系列编年本的出版时间都在2000年之后,所收录词语符合新词语的时间范围;收词原则基本一致,对于使用范围较窄,使用频度低的不稳定的词语不收录,低俗庸俗的词语也尽量不收录;每个词都有较早的书证材料,语料来源包括通行的报刊、书籍以及网络和一些有声媒体等,基本涵盖了不同地区、不同性质的文本,具有代表性。词表对这些新词语取并集,词目著录出现年代如有不一致,取早舍晚,选取有较早书证的年代。经过整理,建立了2000—2020年的汉语新词语表,共收词语12 797个。

新词语表建立后,为保证新词语出现时间的准确性,人工查询了BCC语料库、CCL语料库、人民日报图文数据库(1946—2021)、中国重要报纸全文数据库、《字母词词典》等,对词条进行了跨年度语料的回查、验证,对新词语的首次出现时间再次进行核准,对存在2000年以前书证材料的新词语进行了删除,力争所有新词语的首见书证都是在2000年及以后,最终形成的2000—2020年汉语新词语表共有词条10 521个,由新词语、首次出现时间组成。平均每年度产生新词语约500个(图1)。

图1 新词语年度词条数

二、高频词语表的建立

(一)高频词语的界定

(二)高频词语表及特点

2005—2021年《中国语言生活状况报告》中国家语言资源监测与研究中心发布的每年度“高频词语表”,共有16个词表,每个词表约1万个词条⑥自2010年起《中国语言生活状况报告》中发布的高频词语表是覆盖了95%语料的高频词语,为了保持研究的一致性,本文2010—2019年的高频词语只保留了覆盖90%语料的高频词语,以与2009年以前的高频词语范围保持一致。。词语表对人名类、地名类、专有名词类以及数字类(第一、第二或一、二、三等)做了人工排除,但保留概指性的地名和重要新闻事件的发生地、保留国际机构等重要机构名。词语表不区分同形词与多义词,没有考虑同一词形不同词性或词义的区别。

高频词语的使用具有一定的稳定性。纵观16年的高频词语中,相同的词种数有7 983个,这近八千个词语在16年间呈稳定的高频分布状态,不同年度之间变化很小,没有随着时间增长或调查文本的增减而不断变化(表1)。

表1 2005—2020年高频词语数量

三、新词语成长期动态监测

新词语产生后,经过一段时间的使用,我们称为新词语的成长期,成长期的动态监测即通过对比分析各年度的新词语表与高频词语表,监测新词语成为高频词语的时间轨迹,描述新词语的动态发展变化。

(一)动态监测的可行性

新词语表来源于规范的新词语词典,语料来源包括通行的报刊、书籍以及网络和一些有声媒体等;高频词语表是以动态流通语料库为基本监测平台,以平面媒体、有声媒体、网络媒体等真实语料库文本为来源。其中《汉语新词语》编年本词典系列本身就是《中国语言生活状况报告》中的一部分,都是由教育部语言文字信息管理司策划的,语料来源都是国家语言资源监测与研究中心的动态语料库。新词语表与高频词语表在词语提取方法、监测手段、语料来源等方面基本一致,为进行新词语成长期的动态监测提供了可行性。新词语表归纳的是2000年以来陆续产生而稳定使用的新词语,高频词语表统计的时间起点是2005年。从时间跨度上看,两个词语表的对比也具有可行性。

(二)动态监测方法

使用Access软件,把每一年作为一个监测时点,把16年作为监测时段,统计新词语进入到每年高频词语表中的词条,探索新词语的发展轨迹。

由于语言监测工作实时性的特点以及监测手段的技术限制,高频词语表无法区分展示同一词形不同词性或词义的词频。所以统计每一年度新词语进入到高频词语表时,对产生了新意义新用法的新词语进行了人工删除,只保留有新形式的新词语。如:微商,2013年产生的新词语,2015年即成为高频词语,但因与高等数学中“微商”概念词形一致,在词频统计中无法具体区分,属于已有词形产生了新意义的新词语,所以人工整理中予以删除。类似的词语还有微信号、土豪等。

(三)动态监测结果

新词语成为高频新词语分为两种情况:一种是新词语出现当年就成为高频词语,如:八荣八耻、沪港通、一带一路、H7N9禽流感、新冠病毒、给力、余额宝、中国大妈等,因其所表示事物当年受到高度关注成为热点进而成为高频词语;另一种是新词语出现当年使用频次并不高,但随着时间推移新事物、新现象越来越受到人们的关注,使用频次大幅增高,如:博客、微博、微信、支付宝、房企、动漫、小长假等,这些新词语占高频新词语的大多数,有些会在语言生活中慢慢稳定下来,甚至成为常用词语(表2)。

表2 2005—2020年新词语成为高频词语的数量(新形式新词语)

续表2

四、高频新词语特点

语言动态监测就是在相对较长的时段内观察和记录语言使用状况,描述语言变化实态。纵观21年间新词语的发展变化,我们把产生之后能进入到高频词语表的新词语称为高频新词语。按照本文只统计以新形式出现的新词语的归纳原则,21年间高频新词语的词种数是173个。本文从以下几个方面对高频新词语进行了考察分析,以进一步深化对高频新词语的认识。

(一)语义类型

高频新词语大多是随着新事物、新观念、新制度的产生而产生的新词语,从反映的内容和应用的领域来看,大致归纳为六个类别,包括政治、经济、科技、文化体育教育娱乐、社会生活、军事等。

1.政治类:共23个高频新词语,占比13%。自21世纪以来,中国政局稳定,全面依法治国,发展社会主义民主政治,正确处理改革、发展、稳定的关系,逐步消除贫困和改善民生,保障社会主义现代化建设顺利进行。这时期出现的高频新词语有:科学发展观、和谐社会、八荣八耻、人类命运共同体、美丽中国、精准扶贫、一带一路、两学一做、放管服、止暴制乱等,展示了中国社会的发展进程。

2.经济类:共48个高频新词语,占比28%,占比最多。经济类词语在历史各个时期也都是占比较大的类型。21世纪以来,国民经济持续快速健康发展,综合国力进一步增强。供给侧结构性改革继续深化,新兴产业逐步壮大,居民收入增长与经济增长基本同步;生活质量也逐步提高。这类高频新词语有:房企、福彩、网银、夜经济、限价房、创客、消费券、欧债危机、刷单、自贸试验区、定向降准、首付贷、区块链、众创空间、校园贷、炒鞋、数字人民币等。

3.科技类:共26个高频新词语,占比15%。21世纪是信息技术的时代,信息技术的迅速发展和普及不断改变着人们的生产、生活方式。这一时期产生的科技类高频新词语主要表现为与互联网相关的一系列新生事物,如:博客、云计算、支付宝、大数据、3D打印、微博、上网本、刷脸、微信、微信群、公众号、互联网+等。

4.文化体育教育娱乐类:共31个高频新词语,占比18%。物质生活的丰富促进了文化教育及娱乐的发展。这时期出现的高频新词语有:表示文化现象的“工匠精神、申遗、非遗、文博会、女汉子、小鲜肉”;表示教育的“雅思、艺考”;表示体育的“福娃”;表示娱乐现象的“真人秀、报料、快男、恶搞、刷屏、网红、盲盒”等。

5.社会生活类:共42个高频新词语,占比24%,比重仅次于占比最高的经济类。社会的发展科技的进步改变着人们生活的方方面面。如:月嫂、拼车、自驾游、群租、蚁族、海淘、失联、讨薪、业委会、光盘行动、非典、新冠、新冠病毒、绿码等。

6.军事类:共3个高频新词语,分别是联合军演、恐袭、暴恐。由于涉及国家安全及特殊领域,因此这类高频新词语相对较少,仅限一些大型公开军事事件的描述。

(二)来源类型

高频新词语依据其具体情况有不同的产生来源与形成途径。

1.新事物、新现象、新思想、新制度的出现是高频新词语产生的主要来源途径,这类词语共108个,占比62%。如:由新事物出现而产生的“博客、福娃、微信、公众号、健康码”等,由新现象出现而产生的“交强险、群租、拼车、互联网+、炒鞋”等,由新思想、新制度出现而产生的“精准扶贫、万众创新、两学一做、四个自信、人类命运共同体”等。

2.对现有事物现象等产生了新名称、新说法、新称谓,这类词语有40个,占比23%。如:“月嫂”是当代对从事该行业人员的新称谓;“暖男、剩女、女汉子、小鲜肉、富二代、80后”等都是使用形象丰富的语言对已有人员产生的新名称;随着社会发展语言不断求新求雅,产生了“颜值、呆萌、高富帅、驴友、给力、高冷、巨亏”等新说法新表达。

3.已有词语缩略后产生了新的词语,共18个。如“公号、官微、新冠”是在“公众号、官方微博、新冠肺炎”等新词语产生后,较短时间内又形成了新的缩略词语;“动漫、社融、央企、恐袭”是在“动画和漫画、社会融资、中央企业、恐怖袭击”等已有词语使用基础上,缩略而成的新词语。

4.吸收外来词语形成的新词语,共有7个。如:脸书、推特、雅思、众筹、比特币等。

(三)词语长度

高频新词语中以二、三、四音节长度为主,双音节词语77个,三、四音节的词语共89个。对于新词语来说,音节多表现力更丰富,因此三、四音节词语数量比双音节略多一些。五音节及以上的只有7个,多为专有名词。如“H7N9禽流感、科学发展观、自贸试验区、上海合作组织、人类命运共同体”等。高频新词语中新词118个,占比68%,其中三音节新词21个,四音节新词13个,三、四音节词长的占新词的28.8%。新语共55个,其中90%是三音节、四音节的词组。

(四)词性分布

高频新词语以名词和动词为主。名词和名词词组共126个,占比72%,如:央企、限价房、暖男、中国大妈等;动词和动词词组41个,占比23.6%,如:讨薪、拼车、跟帖、合租等;形容词和形容词词组有6个,占比3.4%,如:高富帅、呆萌、高大上、高冷等。

五、高频新词语发展曲线

对高频新词语成长期的动态监测就是要观察记录高频新词语的生命历程并研究其背后的语言学及社会学成因。一个新词语从产生到成为词汇系统中稳定的一员,经历了不同的发展变化。纵观16年来高频新词语的发展,每个新词语的词频①词语频次的数据来源于《中国语言生活状况报告》2005—2021年发布的“年度高频词语表”。都可以绘制成一条“历时词频发展变化曲线图”,具有不同特点、不同类型的新词语,历时词频发展曲线的类型也不同,由此反映出相应的政治、经济、文化等的社会发展变化。

(一)孤点型

这类新词语产生之后迅速流行形成高频词语,只在某一监测年度上出现一次,然后很快消失或退出高频范围[13]。

1.隐退不再使用。这类新词语成为高频词语后,由于某种原因,逐渐隐退或很快消失,不再使用。如:2007年新词语“快男”,是湖南卫视举办的大众歌手偶像选秀赛《快乐男声》的简称。2010年成为高频词语,随着娱乐热点的更迭迅速降频不再使用(图2)。

图2 2007年新词语“快男”2000—2020年词频曲线

(1)随着事物的消失而隐退。一些新词语如2000年产生的“3G手机”、2008年的“上网本”等,随着科技的进步、社会的发展,短期内成为高频新词语。随着新事物被社会淘汰,这些新词语也很快被淘汰。3G手机,2000年新词语。第一代手机是模拟制式手机(1G),第二代是GSM、TDMA等数字手机(2G),第三代手机将无线通信与互联网等多媒体通信与移动通信相结合,是手机的一大变革,经过一段时间3G手机成为高频新词语。随着科技的发展和人们认知水平的提高,4G、5G手机逐步投入使用,3G手机也逐渐淡出人们言语交际范畴。上网本,2008年新词语,指低配置小巧轻便的便携式计算机,具备上网、收发邮件以及即时信息等功能。随着技术的进步,后期的上网本已经达到了和普通笔记本电脑一样的功能,从某些意义上说,这类计算机已不属于上网本的范畴了。“上网本”这个词语也渐渐退出市场,淡出人们语言交际范围。

(2)随着政策的改变而隐退。一些经济类新词语如2014年新词语“首付贷”,2016年新词语“校园贷”等,政策性新词语如2013年新词语“单独两孩”等,受政治经济制度和政策的影响,成为昙花一现式高频新词语。首付贷,2014年新词语,自产生以来就成为买房贷款的焦点话题,2016年被国家明令禁止,严禁开展此性质的业务,此后不再使用该词语。校园贷,2016年新词语,指在校学生向金融机构或者其他借贷平台借钱的行为。该现象一出现就暴露出各种问题,2017年教育部发布文件明确“取缔校园贷款业务”,诸多涉及校园贷业务的平台也转型或退出。该词语也退出人们交际范畴。单独两孩,2013年新词语,2014年成为高频词语,后随着政策调整,全面两孩的放开,不再使用该词语。

(3)被新事物新词语所取代。新词语产生使用一段时间后被其他新词语所取代,比较典型的有:约租车和网约车。约租车,2011年新词语,2015年成为高频词语。约租车是一种新型的租车模式,最初一般称为“电话叫车”。仿照已有词语“出租车”,新造词语“约租车”,重点体现“约”。随着科技发展,各种网络租车软件盛行,不再使用电话叫车,在约租车基础上新造词语“网约车”,重点体现“网”。“网约车”2015年产生,2016年词频就已达到32 876次[14],取代“约租车”使用至今(图3)。说明“网约车”这种方式更容易被大众接受,是人们生活方式的改变使“约租车”这一新词语没有了存在的社会基础。

图3 新词语“约租车”“网约车”2010—2020年词频曲线对比

2.退出高频词语范围。这类新词语退出高频词语范围后,并未消失,仍在使用,但不再是高频词语。一旦再次出现相关的热点事件或现象,这些词语仍会再次成为高频词语。如:2003年新词语“非典”“讨薪”,2008年“裸官”,2009年的“甲流”“蚁族”,2012年的“房姐”等,均是由于在某时段中发生了特定事件导致使用频次增加,随着疫情消退、关注点降低,这些词语则渐渐退出高频新词语的范围。一些政治性军事性词语如2006年新词语“八荣八耻”、2000年新词语“联合军演”、2011年“走转改”、2012年“暴恐”、2013年“占中”等,这些新词语是随着政策制度的出台或事件的发生而产生,在某时段内成为高频新词语,又随着政策的调整或事态的发展词频产生了较大变化。

(二)时段型

这类高频新词语只在某一时间段出现,持续高频两年或三年,然后逐渐或迅速退出高频词语范围。一旦再次出现相关的热点事件或现象,这些词语仍会再次成为高频词语。

1.随政策而改变。一些政治经济类或政策性词语如2000年新词语“三个代表”“家电下乡”、2001年“上海合作组织”、2003年“科学发展观”、2004年“和谐社会”、2014年“三严三实”、2016“两学一做”等,这些新词语是随着政策制度的出台而产生,随着政策制度的推广而成为高频词语,也由于政策的调整而词频发生了较大变化。如:限价房,2005年新词语,2010、2011年成为高频词语,又称限房价、限地价的“两限”商品房。在推行一段时间后,各地纷纷落实廉租房和经济适用房的建设计划,限价房在政策执行中缺乏刚性约束,处于“坐冷板凳”的尴尬位置。该词语也在成为两年高频词语后退出高频范围。

2.随热点事件而改变。一些热点新词语,如2005年新词语“福娃”、2011年“高富帅”、2011年“暖男”、2013年“小鲜肉”、2013年“H7N9禽流感”、2013年“中国大妈”等,都是由于在某时段中发生了特定事件使新词语使用频次增加,随着关注点降低,这些词语则渐渐退出了高频新词语的范围。如:群租,2006年新词语,2013、2014年成为高频新词语,群租是租赁行为,也是一种生活方式,因其廉价租金在社会上客观存在。随着社会的积极引导,群租行为越来越少,该词语使用频率也逐步降低,不再是高频词语。

3.成长期的潜力高频新词语。这类时段型高频新词语虽然暂时退出了高频范围,但随着科技的进步、社会的发展,具有再次成为高频词语的可能性。如:车联网,2009年新词语,2014、2015年成为高频词语,源于物联网,即车辆物联网,是以行驶中的车辆为信息感知对象,实现车与车、人、路、服务平台之间的网络连接。随着核心技术的突破和社会的发展,该词语有很大的使用空间。海绵城市,2013年新词语,2016、2017年成为高频新词语,是新一代城市雨洪管理概念。目前海绵城市还在试点中,随着社会的发展和科技的进步,建设海绵城市的需求仍会增加,该词语有很大的使用空间。

(三)断续型

这类新词语出现后,断断续续进入高频词语范围,或在持续成为高频词语过程中偶然掉出高频词语范围。说明这类新词语所表示的事物或现象所受到的关注也是断续的,不具有稳定性。比如:申遗,在当年有申遗项目时是高频词语,其他时间则不再高频使用。类似的还有一些经济类新词语:余额宝、团购、网银、定投、营改增、降准、众筹、交强险、QDII、QFII等。

余额宝,2013年新词语,是由第三方支付平台支付宝推出的一项余额增值服务,产生当年就成为高频词语,三年后退出高频范围,2017、2018年又再次成为高频词语,虽然频次不高(图4)。这种断断续续的高频使用是其运行和受人们关注的一个真实反映。团购,2000年新词语,2010年成为高频新词语,2011年词频达52 582次[15],已成为一种深受欢迎的购物方式。此后词频逐年下降直至退出高频新词语范围,2020年受疫情影响,此种购物方式又重现活力,该词语也重新成为高频词语(图5)。

图4 2013年新词语“余额宝”2013—2020年词频曲线

图5 2000年新词语“团购”2006—2020年词频曲线

还有一些网络新词语,如QQ、网络直播、博客、博主、刷屏、刷脸等。博客,2002年新词语,2006年成为高频词语后,基本持续高频,但2007、2008和2019、2020年不是高频词语。这说明了该词语的不稳定性和关注度的持续下降。

(四)持续型

一些高频新词语的高频次具有一定的稳定性和持久性,连续几年保持较高的频次,说明其所代表的事物或现象深入人心,具有较高的关注度。有10个新词语是在2010—2020年间一直持续高频,按产生时间排序分别是:动漫、房企、福彩、双色球、云计算、央企、支付宝、物联网、小长假、微博。有23个新词语是自高频年份起持续到了现在,仍有继续高频发展的潜能,如:工匠精神、大数据、非遗、推特、爆款、失联、脸书、官微、微信、比特币、微信群、点赞、公众号、自贸试验区、精准扶贫、互联网+、一带一路、颜值、混改、网约车、网红、区块链、获得感等。我们对这些高频新词语绘制了“历时词频发展变化曲线图”,根据不同的特点把曲线图划分为以下几种类型。

1.成长型。整体曲线的走势是逐渐提升的。新词语产生后,使用频次和使用范围随着时间的推移不断扩大,呈逐渐提升或突增并持续的趋势。这些新词语大多具有较强的生命力,在发展过程中逐渐被大众接受并广泛使用。“大数据、微信群、云计算、物联网”这4个新词语都是随着新事物产生而产生的,也是随着信息技术的发展而产生的高科技含量的新事物,词频虽偶有波动,但整体仍呈上升趋势(图6-7)。

图6 2005年新词语“大数据”2013—2020年词频曲线

图7 2012年新词语“微信群”2015—2020年词频曲线

2.衰减型。整体曲线的走势是逐渐减弱的。词频在统计起点上已达到峰值,随着时间的推移,频次逐渐减弱或逐步淡出高频词范围,甚至有归零的趋势。这些新词语的使用范围逐渐缩小甚至消失。“动漫”产生于21世纪早期,随着社会的发展这类新词语的使用范围逐渐缩小,因此词频也逐渐呈下降趋势(图8)。“互联网+”是2013年新词语,2015年成为高频词语,频次43 368[16],代表一种新的经济形态(图9)。“互联网+”广泛应用于诸多传统行业,改变了我们的生产、工作、生活方式,每个小领域新模式的产生也催生了新的词语表达,如云系统、电商、机器人、共享单车等,所以宏观的互联网+词频有所下降。

图8 2000年新词语“动漫”2010—2020年词频曲线

图9 2013年新词语“互联网+”2015—2020年词频曲线

3.周期型。词频发展曲线呈周期性变化。统计起点和终点的词频数基本保持一致,因所指对象周期性地受到关注而引起词频变化,词频曲线呈周期性。福彩、支付宝、小长假都是社会发展中的新生事物,受社会制度、政策、经济形势等的影响,词频随之而变化(图10-11)。

图10 2000年新词语“福彩”2010—2020年词频曲线

图11 2007年新词语“小长假”2010—2020年词频曲线

4.波动型。词频发展曲线不规律的出现峰值或低谷,波动较大,无规律可循。这些新词语大多与社会重大事件或热点事件有关,新词语是对社会热点的记录和反映。微博、双色球自产生之后就受到大众喜爱,词语使用频次持续升高,但随着社会的发展词频又达到低谷。词语频次与当年社会热点事件关系密切,代表性词语如“失联”,曲线峰值的年份都有失联的热点事件发生(图12-13)。

图12 2009年新词语“微博”2010—2020年词频曲线

图13 2003年新词语“失联”2013—2020年词频曲线

以上归纳的历时词频发展变化曲线图类型不能涵盖所有的高频新词语,新词语的词频变化方式更加多样,即使是具有典型曲线特征的新词语,也具有自己个性化的发展变化方式。同时,高频新词语的词频发展曲线是相对的,处于不断的发展变化中,本文归纳的孤点型、时段型随着时间的推移会演变成断续型,持续型曲线放到更长时间范围内看,也有可能发展成断续型或时段型。其中的成长型、衰减型更是处于不断的变化中。监测时间跨度越长,对高频新词语发展变化观测会越准。

充满活力的语言,不仅是文化的基础要素和鲜明标志,也是观测历史发展和社会进步的重要窗口。高频新词语真实记录反映了这21年间社会生活的发展变化,社会的发展变化也促使汉语词汇不断地发展变化、逐渐丰富和多元化。本文将汉语词汇的发展融入社会的发展、历史的考察中,以“共时中包含有历时和历时中包含有共时”的相对时间观为指导,基于语言监测技术整理归纳了21世纪以来高频新词语,厘清了高频新词语的产生时间、来源理据及发展变化,以此了解语言、认识社会进而规范语言、服务社会。

猜你喜欢

词频汉语曲线
未来访谈:出版的第二增长曲线在哪里?
学汉语
基于词频比的改进Jaccard系数文本相似度计算
轻轻松松聊汉语 后海
幸福曲线
词汇习得中的词频效应研究
追剧宅女教汉语
汉语不能成为“乱炖”
梦寐以求的S曲线
词频,一部隐秘的历史