APP下载

《汉斯反查词典》研究

2021-11-10钟磊

文学天地 2021年6期
关键词:方法

摘要:本课题研究的主要内容是汉语-斯瓦希里语反查词典的编纂可行性与具体方法研究,因为有《斯汉速查手册》的事先编纂完成,加上在这过程中对斯词类词典结构的认识与掌握,加之在此过程中对软件使用经验的积累,对汉斯类工具书的编纂方法有一定认识,通过制定体例、词条表格化、词条义项分割、斯汉转向、文件合并、词条排序(音序法升序)、人工调序、义项合并、整体编辑、完善成书,最终完成编纂。《汉斯反查词典》对斯瓦希里语的学习研究都有一定的帮助,对于东非方向旅行者而言,也是较为有益的参考书,也有利于汉语使用者研究东非的文化;对斯语者也有一定参考价值。

关键词:斯瓦希里语;汉斯反查词典;编纂;方法

汉斯词典研究,处于起始阶段,近年来,我国逐步加强文化外宣,也意识到汉斯词典研究的重要性,外文出版社一直为此而努力。目前国内市场上还没有汉斯类词典,因此,我选择汉斯反查词典为研究方向,希望一番努力,能够有所收获。对于东非方向旅行者而言,也是较为有益的文化参考书,可以用于学习和简单的翻译,也有利于汉语使用者研究东非的文化;对于斯语母语者而言,也有一定的参考价值。

一、研究述评

从编篡《斯汉词汇速查手册》过程中所接触到的双语词典来看,多种语对的斯语双语词典都存在,而且是双语双向,且有部分存在在线版,如:斯俄/俄斯,斯意/意斯,斯英/英斯等。以斯英双语为例,常见的斯英词典有,Edward Steere(1894), A.C.Madan(1903),Charles W.Rechenbach(1967),TUKI(2001), 英斯词典有,TUKI(2000),R.A.Snoxall & H.B.Mshindo(2012),單语斯语词典有TUKI(2013),我国曾有一本1971年内部使用的《斯汉词典》 ,虽然没有公开发行,但在院校专业内部使用广泛,影响较大,可称为中国现代斯语研究的基石。沈玉宁编纂过《新斯汉词典》,没有纸质出版物。市场上没有普通的汉斯词典 ,因此,可以参考的材料很少,但《汉斯词典》有很高研究价值。

二、研究问题

根据资源总量和可行性考量,我们定位于《斯汉反查词典》的编纂。由于我2017年就开始相关基础性工作,因为,到2019年报吉林省高教学会科研项目立项,已有两年铺垫,等到中期考查时,汉斯词汇对照表(合并前)已经制订完,这是最为关键的一环。否则这个研究问题的设定如果从2019年开始,2021年就难以完成,因此,实际研究周期为四年。

三、研究策略

这本词典编制任务艰巨,需要较为可靠的斯汉词典类工具书作为研究基础,还要有可靠的方法策略,才能得以省时高效的完成,研究策略离不开对基础的认识与把握,我们先说明实践基础,然后再阐述方法策略。

1.研究基础。

《斯汉速查手册》含斯语词条14800多条,属于比较普通的类型,国际上多数斯语双语词典词条数量多是这个数量上下,词条数量较大,可以满足一般斯语学习者的需求。这本词典的蓝本是2001年出版的Kamusi Ya Kiswahili-Kiingereza(TUKI),这本词典是达累斯萨拉姆大学斯瓦希里语研究所编写,与其相配的是English-Kiswahili Dictionary(TUKI)。但是由于在编写过程中发现TUKI版斯英词典里有部分义项错误,尤其是鱼类名称,我使用了Charles W. Rechenbach主编的Swahili-English Dictionary(The Catholic University of America Press, 1967)、《标准斯瓦希里语词典》(TUKI单语)和国外动植物网站去纠正了其中的错误。因此,《斯汉词汇速查手册》的义项的准确性较高,作为研究基础是比较稳妥。

2.策略制定。

因为有《斯汉速查手册》的编纂经验,因此对斯语类词典结构有一定深度的认识与掌握,对一些英斯词典的词条义项和信息类型及符号使用进行了学习研究,从而构思出《汉斯反查词典》的义项信息序列架构,通过对原有蓝本的词条和义项信息进行删减、重整和排序制定出新体例,这是具体操作实施的指导性本件。另外,《手册》本身也涉及EXCEL和WORD的使用技巧,对文本处理软件EXCEL和WORD使用经验不断积累促成对文本与表格的灵活转换,这都对汉斯类工具书的编纂大有裨益。

3.具体步骤。

重新审视编纂过程,可以大致整理出下列步骤:制定体例、小规模试验、词条表格化、词条义项分割、文件合并、斯汉转向、词条排序、人工调序、义项合并、整体编辑、完善成书,最终完成编纂。

步骤1:体例制定。体例参考Kamusi Ya Kiswahili-Kingereza(TUKI)并进行了调整删减。本手册的词条按照词条拼音字母顺序排列(从A到Z)。每一个字母之内,同一字母组合情况下,按音调四声顺序排列,多音字按实际读音排列。每个词条信息包括:词条、词性、义项、例句。如果一个词具有多种词性,一般按照nm.kt.kv.kl.ku.ki.这样的顺序。另外,对于外来语,在词条的右上角标“﹡”,“<>”用于标注外来语源信息,如:<阿>,指来自阿拉伯语。

步骤2:小规模试验。在真正开始项目的实质操作步骤之前,曾经做过小规模试验,就是以单个字母的一部分为样本,以词典体例为照,进行切割加工,除去冗余信息,重新排列位置和顺序,检测软件对汉字排列的特点和依据,熟悉软件、程序和操作,绘制工作路线图。

步骤3:词条表格化。因为《斯汉速查手册》最终的存在形式是一个WORD文件,但由于Word文件里不容易进行单个词条操作编辑,而且增删排序不易,因此为了便于后期编辑与分工,我们设想的操作平台是EXCEL,并把每一个字母的词条单独制成一个EXCEL文件(A.xls,B.xls…Z.xls),单独放到一个文件夹待处理。操作方法是先选择-复制《斯汉速查手册》WORD文档里的表格,然后把光标放到新建EXCEL表格的左上角,点击鼠标右键,出现一个菜单,选择点击粘贴,调整列宽到合适宽度,由于单个词条的内容有可能很长,为了让内容显示完整,选择所有词条,点击右键,选择点击“设置单元格格式”-“对齐”-自动换行。

步骤4:词条义项分割。这里又分为两步,首先,把词条列复制粘贴。这里要求两列词条对应,然后,按照体例要求除去冗余信息,左列只留下词条、词性和例句,右列只留下义项。由于《斯汉速查手册》中的一些词条一般都有多个义项,或多种词性,因此,对于每一个词条切割是以义项为准,切到具体词。但是切割之前,按照义项的数量在该行下方插入相应数量的空行,然后再切割,最终结果需要保证右列词与左列词性及例句对应。大致包括七步,第1步:复制为两列。第2步:加工两列(左斯语+例子;右中文)。第3步:插入空行(以义项词数为准)。第4步:复制文字行+粘贴填充。第5步:切义项第6步:去除冗余信息。第7步:双列转向。

步骤5:文件合并。把所有的文件合并到一个文件上,具体方法是把所有字母之下的词条两列合并,依旧为两列。这里面需要注意的是拷贝的过程中,因为要进行多次,极有可能会在拷贝过程中,出现漏拷、错行的情况,所以在选择表格的时候,一定要选全、对齐。

步骤6:斯汉转向。对已经排列好的两列词条变换位置,把汉语部分通过粘帖调整到左边,从而实现斯汉转向。斯汉转向看似简单,实际上,能做到这一步,前面已有两年时间的准备,这一步的完成基本上表明工程完成了三分之二。

步骤7:词条排序。词条排序主要是通过机器排序加人工调序两个环节进行,机器排序选择升序,然后,把不同拼音段分开成独立文件。在这过程中使用的软件是Microsoft Office的EXCEL组件,选择需要排序的列(汉语列),选择升序排列,根据提示选扩展选定区域,这样虽然前面只选了一列,另一列的内容(斯语列)最终会与选定列调序后内容对应。

步骤8:人工调序。由于微软办公软件组件EXCEL本身拼音识别能力缺陷,有些多音字如:调diào,tiáo,都归到一个字母之下,需要人工将其挑出分开,放回相应字母的特定位置,因为这个的情况还比较多,因此,这项工作也比较复杂琐碎。此外,还有字母组合相同而音调不同的多音字,对于它们,为了我们没有调整,原因是为了方便查找,虽然不完全符合语音排序,但却避免了字形不同的干扰,字形却统一了,这在查找时也是一种便利。

步骤9:义项合并。这一项工作是到中期检查时开始进行的,后面的工作目标比较明确,方法也非常清晰,我作为项目负责人,就把上面独立后的不同字母文件进行任务分配,因为总共四人,而总共处理词条(行数)达到36169条,所以,平均每个人做9千多条。任务开始之前,先对参研的三位学生进行线上培训,三位学生能够认真学习,然而由于语言隔阂(三位学生没有斯语基础),加上学生学习任务重、毕业论文、考研等事情干扰,难以完全专注,开展工作时遇到不少困难,但因为这阶段任务难度不大,程序性强,单调琐碎,借助寒假时间,把所有文件处理完毕。至2021年3月,词条义项合并完成。

步骤10:整体编辑。把所有文件拷贝到Word文档上,对格式进行调整。虽然仍然是一个隐形表格,但是这里操作难度较大,在发现问题时,需要回到EXCEL修改。比如:在把表格复制到WORD文件中时,分两栏时,发现有些行没完全显示,左栏被遮挡,这是因为分栏时,表格宽度大于栏宽,两个表格出现了重叠,这样,即便是选用自动换行,依然不起作用,只能采用别的方法。

步骤11:完善成书。在文件添加页码,在前面加添目录、前言、体例说明、符号说明。

书稿完善之后,本人仔细阅稿,还有专人审校。

以上是《汉斯反查词典》具体编纂过程,事实上,部分环节在实施过程中并不那么清晰,经过反思,总结时重新调序,如步骤8,原本在步骤9之后,由于多音字问题没有事先预见,是在文件分立义项合并完后才发现,因此,处理时就在现有基础上修改,然而,最佳时机是在整个汉斯词汇对照表按音序排列完之后对照多音字表细细甄别调整。

结语

《汉斯反查词典》中文词条总数21000多条,条数最多的字母为S,达到1900多条,少的为O,27条,由于汉语拼音自身特点,Ii,Uu,Vv几个字母之下没有词条,根据1988年出版的《现代汉语常用字表》,常用字2500字,次常用字1000字,共3500字,利用语料库在线网站 字词频率统计工具,统计《汉斯反查词典》包含3754個汉字和6112个词,因此,也能满足一般汉语词汇的语义查询。本项目反映了使用一般的双语词典基础上编制反查词典的一般方法,因此,它的作用和价值不仅仅局限于本项目,对其它类似项目的组织、规划和实施都有借鉴意义。

参考文献

1 Charles W. Rechenbach. Swahili-English Dictionary. The Catholic University of America Press, 1967.

2 Madan, A.C. Swahili English Dictionary. Asian Educational Services. New Delhi,1903.

3 Snoxall, R.A. & H.B. Mshindo. Concise English-Swahili Dictionary. Oxford University Press, 2012.

4 Steere, Edward. A Handbook of the Swahili Language. Society for Promoting Christian Knowledge, 1894.

5 TUKI. Kamusi ya Kiswahili-Kiingereza Dictionary. Chuo Kikuu cha Dar es Salaam, 2001.

6 TUKI. English-Swahili Dictionary. Chuo Kikuu cha Dar es Salaam, 2000.

7 TUKI. Kamusi ya Kiswahili Sanifu. Oxford University Press, 2013.

作者简介:钟磊(1979.3-),男,汉族,安徽省泗县人,讲师,系副主任,硕士研究生,吉林外国语大学吉林外国语大学英语学院翻译系,研究方向为翻译、语料库、词典学。

项目:本论为是2019年度吉林省高教学会科研项目成果,项目编号JGJX2019D332

1.该词典序言中说内部书版,出版社是人民画报和外文出版社,1971年。

2.国内有专业双语词典。

3.http://corpus.zhonghuayuwen.org/resources.aspx

猜你喜欢

方法
变快的方法
学习方法
认识方法用好方法
掌握方法,直面高考
用对方法才能瘦
四大方法 教你不再“坐以待病”!
赚钱方法
捕鱼
上台前,你用什么方法消除紧张