APP下载

《新实用汉语》第一册生词重现研究

2016-05-30吴国伟刘宇熙

现代语文(学术综合) 2016年2期
关键词:生词调查

吴国伟 刘宇熙

摘  要:本文通过对《新实用汉语》第一册进行软件统计,对该丛书第一册的生词重现情况做出整体评估。以此尝试探讨生词重现研究如何更好与软件相结合,从而大幅度提高统计效率和准确性。

关键词:生词  重现  调查

引言

针对目前国内学者较少关注生词重现软件统计和研究,本文主要通过该手段对《新实用汉语》第一册的生词重现问题进行研究,利用电子统计工具完成对《新实用汉语》第一册的生词等级选取情况、重现率、总词频、平均词频和词汇分布情况的统计。基于此,对《新实用汉语》第一册的生词重现情况做出整体评价,尝试对这方面的研究提出若干建设性意见。

一、相关研究综述

随着对外汉语研究的不断深入,对外汉语教材生词重现研究问题受到越来越多学者的关注。当前对于生词重现的研究主要体现在生词等级情况、重现频率、重现分布情况等方面。下面我们对相关文献作大致的梳理。

国内对于词汇重现方面的研究起步较早。例如,张维(1979)指出,生词重现对于学生而言是很重要的;刘珣(1982)认为,生词重现的情况是评价一本语言教材好坏的标准;赵金铭(1998)指出:“我们的对外汉语教材在编写方面尚普遍存在的问题之一:词汇量大,复现率低。”进入21世纪,针对生词在教材中重现情况,柳艳梅(2002)对欧美学生学习效果的影响进行了真实实验,并提出相应意见。不过,上述研究均使用传统的统计手段和研究方法(直至池中华(2012)。根据我们的调查,熊熙瑶(2013)硕士论文首次提到了软件统计方式和研究方法,但并没有做出具体的阐释,也没有给出研究的具体方法。就学界现状而言,国内目前在生词重现问题上,并没有形成统一的统计模式,对软件统计也没有做出更深入的研究。

二、调查方法及其结果

(一)调查方法

首先将书本扫描成pdf文件,然后用转换软件转换成word格式。接着对word文本进行整理,依据教材组成部分和认知层次理论将课本分为三个部分:主课文、阅读课文、课后练习。整理生词库表,与《汉语水平词汇和汉字文化等级大纲》进行比照,完善词性分类、等级分类。而后通过已经制定好的生词表进行重现检索,从第一词一直检索至最后一词。

检索方法:a.利用检索软件,进行生词定位。然后逐个位置筛查,排除同音同形但意义不同的词,用检索到的总词数减去同音同形不同意的词(统计说明作解)的个数再减一,就是该生词的重现率。b.在主课文部分、阅读课文部分、练习部分(练习答案)依次进行a部分的检索操作,直至把所有的生词都检定完毕。c.统计每一词在各个部分(三个层次)的重现率,然后综合每一词在全书的重现率,得出總词频、平均词频、重现频率、重现分布情况,最后将所有数据录入并分析得出调查结论。

(二)统计说明

在研究过程中,由于软件问题,会遇到同字统计(即单音节词词义不同或出现在复合词中但仍统计次数)的问题。所以每一个生词在重现率统计时,必须要逐词查对,保证生词重现的准确性。在逐词查对时遵循以下原则:1.单字成词时在复合词中又会检定一次,如甲级词“吃”与甲级词“吃饭”中吃字会被检索到两次,只能算一次。2.检词过程中要区分同词不同音,主要体现在单音节词上,如“都”有“dou”和 “du”两个读音。3.检词过程中要区分多义词的不同义项,如“好”这个词在该书中的英文翻译包括了所有“好”的义项,但是在中文中“你好”和“好东西”的义项差距大,在这种情况下算两个不同的生词来统计。4.复合词如“星期一”“星期二”等要看《汉语水平词汇及等级大纲》中有没有将该词列为一个词语。如列为一个词语,按照该词语统计次数。如没有该词,按照其前缀或后缀的词统计次数。如“星期”作为前缀时可以组成“星期一”等,但《汉语水平词汇及等级大纲》中只将“星期日”单独列出,所以其余“星期一”“星期二”等词出现的“星期”一词计入生词“星期”的统计次数,“星期日”单独统计。5.书本中介绍生字书写方法存在以某字为部首组成的情况,比如“三”的书写顺序中会出现“一”“二”,要将这些也排除在统计次数以外。6.其他看课本情况依据《现代汉语八百词》和《汉语水平词汇及等级大纲》来确定。如该课本将“男朋友”一词中的“朋友”和“朋友”一词意义相等,所以检索中就不需要排除“男朋友”中的出现的“朋友”的次数。

(三)统计结果

《新实用汉语》全书257个词,依照《汉语水平词汇及等级大纲》得到全部生词的等级情况:

表1:《新实用汉语》词汇等级表

甲级 乙级 丙级 丁级 不在大纲

词汇等级 216 21 2 2 16

根据表1,可以发现,本教材生词92%以上是甲级词汇。词汇基本依据大纲选择,符合大纲要求,所以本教材的生词选择是合理的。

需要指出的是,本教材257个生词在课本中一共出现8817次,即该课本的总词频为8817,平均词频为34.3。从平均词频来说,远远大于Saragi,Nantion & Meister(1978)关于词汇重现次数最低必须大于6次的记忆标准。但是,在研究过程中我们发现,生词中绝对高频词对由总词频得到的平均词频产生了巨大影响,这对于其他重现频率较低的词汇的重现统计造成了严重影响。例如,绝对高频词汇占词汇总数不到10%,其总词频却占所有词汇的总词频的40%以上。所以,在通过将生词表与《汉语词汇高频词汇表》交叉对比后,列出本书的绝对高频词汇和相对高频词汇,通过图表探讨他们的总体影响:

图1:平均词频折线图

从这张平均词频折线图可以看出,绝对高频词汇和相对高频词汇的平均词频远大于一般词汇的平均词频。所以,直接以总词频和整体生词的平均词频来判断重现情况是不科学的,必须分成三个部分加以分析。

通过前文对绝对高频词汇和相对高频词汇的整理与分析,该书在这两部分的重现是相当充分的。所以主要分析第三部分,即一般词汇的重现情况。该书中一般词汇一共212个,总词频3640、平均词频17.16,符合最小重现次数不得小于6次的记忆规律。同时,该书中没有出现生词重现率为0的情况。重现率小于6的生词共40个,与《现代汉语高频词汇表》比较后发现,“拜拜”“哪里”“水”“没关系”等都属于汉語中出现次数比较高的词汇。所以,本书作为一本初级教材,在这一方面还需要加强。

另外,除了重现率以外,生词在各个部分的重现分布和多久出现一次的重现频率也是衡量一本教材生词重现情况的重要依据。由于本书的词汇过多,无法将所有词汇的重现分布和重现频率在此列出。所以针对绝对高频词汇、相对高频词汇和一般词汇随机选取一个词来展示这本书生词的重现情况和重现频率,如下图所示:

图2:绝对高频词汇“他”重现分布图

图3:相对高频词汇“吃”重现分布图

图4:一般词汇“大”重现分布图

从上述词汇分布情况可以看出,几乎所有频段的词都是练习部分重现率大于阅读部分重现率和课文部分重现率。一般情况下,阅读部分的重现率大于课文部分的重现率。这符合课文学习、课后巩固的教学方法,也符合认知规律,即通过阅读,再结合具体语境理解和大量练习,从而掌握课文中学到的生词。

除了结构性分布以外,词汇重现也需要考查其呈现频率,即词汇的“左邻右舍”和“前村后店”,从而保证重现分布将集中性与广泛性相结合。本书的词汇集中出现非常充分,如前文提到的“大”字,在学完该课后练习部分重现14次。对于广泛性,我们通过抽样调查的方法调查了60个词汇的呈现频率,这里以相对高频词汇“买”为例:

图5:“买”重现分布图

“买”在课文部分一共出现11次,分别分布在第八课、第九课和第十二课。同时,大部分被调查的生词多个课时同时出现。只有部分总词频低于10的生词在这一方面做的不够。可以看出,在生词分布情况上,该教材总体情况较好,但仍有需要改进的地方。

三、总结和建议

通过对本书的生词重现率、生词分布情况等加以调查分析,我们认为,《新实用汉语》第一册的生词重现状况符合一本优秀教材对于生词重现的要求。但是,对部分重现率较低的词汇,还需要做出进一步的努力。同时,通过本次的软件研究,我们发现:通过计算机软件,全过程完成共花费18个小时,大大减少了人工检索带来的时间问题,也降低了人工统计所不可避免的误差。所以,通过软件进行对外汉语教材生词重现研究,有利于相关研究的深入开展。通过本文的探讨,我们希望有更多的学者关注这一议题,从而使该领域的相关研究得到进一步的发展。

参考文献:

[1]张维.汉语词汇教学琐谈[J].语言教学与研究,1979,(1).

[2]刘珣.试谈基础汉语教科书的编写原则[J].语言教学与研究,1982,(4).

[3]赵金铭.论对外汉语教材评估[J].语言教学与研究,1998,(3).

[4]柳艳梅.生词重现率对欧美学生汉语词汇学习的影响[J].语言教学与研究,2002,(5).

[5]康艳红,董明.初级对外汉语教材的词汇重现率研究[J].语言文字应用,2005,(11).

[6]池中华.初、中级对外汉语教材生词重现率研究——以三组对外汉语初、中级教材为例[D].乌鲁木齐:新疆师范大学硕士学位论文,2012.

[7]熊熙瑶.《新实用汉语课本》(初级1-4册)生词重现调查报告[D].重庆:重庆师范大学硕士学位论文,2013.

[8]吴日娜.对外汉语中级口语教材词汇问题的分析研究——以《发展汉语·中级口语》为例[D].北京:北京外国语大学硕士学位论文,2014.

[9]郝中婧.《成功之路》(初)教材的词汇研究[D].长沙:湖南师范大学硕士学位论文,2014.

(吴国伟  刘宇熙  江苏大学文法学院  212013)

猜你喜欢

生词调查
『五个生词』快速阅读法
高职学生志愿填报取向及满意度调查研究
天台县城区有毒观赏植物资源调查初报
营口市典型区土壤现状调查与污染土壤的修复
对外汉语教材生词注释存在的问题及改进建议
英语阅读中的生词或难词处理策略
生词库
生词库
生词库