APP下载

科技论文关键词使用中存在的问题及解决方法

2013-01-22王丹丹

中国期刊年鉴 2013年0期
关键词:词表标引科研人员

王丹丹

科技论文关键词使用中存在的问题及解决方法

王丹丹

科研工作者在做项目研究或撰写科技论文时,都会遇到如何确定关键词的问题。例如,若想在检索系统中搜索相关课题材料时,首先需要解决的就是分析课题的主题内容,确定规范、通用、能表达核心概念的关键词,关键词确定得当与否关系到检索结果的全面性和准确性。撰写科技论文时,能够准确地确定关键词可以提高论文的被检率。然而,笔者通过调查水利、农业、医学、化学、电子工程、生命科学和机械制造7个专业的84位科研人员,发现占被调查者67%的高级职称的科研人员都比较了解本专业的叙词表或专业名词表,知道如何去使用这些主题标引工具;但其中只有32.1%的高职称人员表示在确定关键词时会查阅叙词表或专业名词表。而占被调查者33%的中级职称人员之中只有14.3%的科研工作者了解主题标引工具,并使用这些工具确定关键词。所以,总体计算之后,只有26.2%的被调查者会使用受控标引方式来处理关键词确定问题,那么余下的73.8%的科研人员在确定关键词时都会遇到困难或出现各种问题以及错误。

一、关键词使用中存在的问题

笔者通过调查中国期刊网(CNKI)上的7个专业的210篇文章,发现了以下三个普遍存在的问题。[1]

(一)主题标引不够深入,关键词外延过于宽泛

对于科技论文的检索者而言,首先,他们希望有效地提高查全率,因为深入研究某一课题时,积累大量的相关主题文献是必要的。然而,由于一部分科技论文的撰写者在确定关键词时,仅对表达论文基本主题内容的检索点进行了揭示,而忽略了论文中某些组成部分里具有重要检索价值的细小主题概念,所以检索者如果使用关键词为限定检索字段,以细化专深的主题概念进行检索,则会漏检。

因此,为了能够提高论文的被利用率,科技论文的撰写者在确定关键词时,应认真分析论文构成单元中所包含的各种主题概念,将那些能够揭示论文主题又具有重要检索价值的词条逐一加以标引和揭示。但是在标引过程中也要注意不能过度标引,因为如果将一些文章中论述的回溯性内容的主题概念提炼为关键词,将造成检准率的降低,此外,在分析主题概念时应注意将表述的字面意思转换为专业化的隐性概念,以使检索系统能够在统一的专业概念之下有序地集合与组织各种从不同角度论述同一主题的论文资源。如在《奶制品中三聚氰胺含量检测的方法》与《辣椒制品中苏丹红含量检测的方法》两篇文章中,都隐含着一个共同的主题,即食品安全。因此,准确地提炼出字面含义之外的隐含概念,并将其确定为关键词,对于检索者把握某一领域的整体情况是具有重要意义的,而且还可以大大缩短检索时间和检索成本。

(二)关键词之间的关系以及内涵表述不清

以“病毒对体弱儿童的侵袭原理分析”为例,若拟定“病毒”作关键词,则计算机领域里的科研人员也有可能误检到这篇文章。所以针对这种情况,不同学科专业的科技论文撰写者应在关键词项,将一些容易误解的词汇或词组用“限定词”的方式,加以明确的说明,如上述的例子就可以将其转换为“病毒(医学)”的方式,这样就可以避免内涵表述不清的现象,提高论文检索的查准率。

现在,学科之间的交叉融合现象较多,而交叉领域里的科技论文数量也与日俱增,由于其科技含量高,所以对这类论文的需求利用率也在逐渐攀升,然而对有关学科的关键词确定时,却经常出现字面分拆的现象,如在《生物制药学里的不明成分检测》一文中,如果作者将学科关键词确定为“生物”和“制药学”,那么当检索者使用这两个词查检时就有可能误检到有关“制药学中药物成品的生物活体实验”的论文。从上述检索案例中可以看到关键词之间的关系需要用概念分解的方法加以表述,才能避免误检现象,因此,通过概念分析可知上例中的学科关键词应确定为“生物学”和“制药学”。

(三)关键词的组配结果具有二义性,易造成误检

以“工业酒精制造工艺的发展研究”为例,如果作者将关键词定为“工业”“酒精”和“制造工艺”,那么当查检者使用“工业”和“酒精”在关键词限定字段内进行检索时就会同时将有关“酒精工业发展”方面的论文检出,但是显而易见,酒精工业里的酒精是乙醇的成分,而工业用酒精的成分则是甲醇,二者有明显区别,所以为了避免这种误检现象的发生,应该使用不容易误解的完整概念直接作关键词,或是使用说明语的方式,将其表述清楚,例如:上例中就可以直接使用“工业酒精”或“酒精,工业用”或“甲醇”作为关键词。

二、提高主题标引质量的策略

(一)对于科研人员、编辑人员要加强主题标引教育

教育活动可以从不同角度分别展开。首先,为了全面提高科技论文写作质量以及科研论文的利用率,各高校从学生本科阶段就应当开设信息组织以及信息检索课程,使他们在从事科研事业或开展科研活动之前,就能够详细地了解各种分类体系以及主题标引工具;通过大量实践使他们具备扎实的分类基础和较强的主题标引能力,并掌握利用多种综合性或专业性数据库的方法,从根本上解决科研论文写作不规范的问题,当然,关键词的确定问题也就迎刃而解了。

其次,对于那些已经开展科研工作的学者而言,应该寻求一定的途径使之了解使用规范叙词的重要性,尽量避免使用自由标引的方式。然而,如何指导这类人群学会使用词表或相关工具为文章确定检索标志?笔者认为最有效的教育应该由各专业领域里的核心期刊编辑部共同完成。目前,各高校以及科研院所在评定科研人员等级或发放科研奖励时,都普遍重视SCI来源期刊、EI来源期刊、中文核心期刊、CSCD来源期刊、CSSCI来源期刊发文,所以科研人员都在积极地按照各来源期刊的《征稿简则》,撰写符合期刊格式要求和内容要求的文章并投稿,所以如果各刊都能在《征稿简则》里规定“作者需按照某专业叙词表或使用某工具转换自然语词为规范叙词,如不转换,稿件不予录用”,那么这些科研人员必定会严格按照要求自学叙词表等工具的使用方法。此外,各专业的核心期刊也可以共同推举一位资深编辑,详细地讲解关键词的确定方法和注意事项,并将此类讲解刊登在学术期刊上,或形成教学录像,放置于各专业领域里的知名网站上,或整合各专业的讲解内容集中放置于CNKI、万方、维普、龙源或CALIS等综合性文献数据库中,以供科研人员根据自己专业领域的特点进行选择性学习。这种强制性的方式可以迅速地指引科研人员通过恰当的途径学会如何做好主题标引。

最后,对专业期刊的编辑也要进行必要的岗前培训。目前的各个学刊在招聘编辑时,大多只考虑专业背景和学历要求、是否有能力编校加工专业稿件,而较少考虑应聘人员的分类、主题标引能力。例如一些科技期刊的编辑人员就分别来自于物理、数学、化学等专业,而没有一个是来自于图书、情报、档案专业或编辑出版学专业的。从专业素养的角度而言,后者的审稿能力较强,然而就标引能力而言,则大多不了解分类以及主题标引的相关规则以及工具。所以,为了提高各刊稿件的标引质量,编辑人员进入岗位之前,应该到图书馆的编目部门参加一段时间的编目工作实际训练,以便掌握各种标引工具的使用方法。如果没有条件进行此类实训,也要通过社内“一带一”的方式,使这些新进编辑在老编辑的教导下,迅速了解本刊的主题标引规则或方法。

(二)编辑以及检索系统应逐层、深入地加工关键词项

以上的分类、主题、检索的普及性教育以及强制性的征稿规范,可以在很大程度上帮助潜在或显在的科研人员学会正确的主题标引规则,然而,毕竟在确定叙词时可能会出现选词错误、词间关系处理不恰当、某些基本主题因素缺失等现象。所以,编辑首先应严格依照综合性叙词表或专业性叙词表以及相关的科技名词规范,对作者所提供的中英文关键词项进行核对,并给出修改意见。

其次,检索系统应在录入科技论文时,对期刊社编辑加工过的关键词进行更深入的加工。因为大多机检系统是按照后组式方式进行主题标引的,所以组配时可能会出现并列主题因素的错误组合,如在《中国锻钢制动盘和美国粉末冶金闸片的研制工作综述》一文中,如果简单地将“锻钢制动盘”“中国”“粉末冶金闸片”“美国”直接作为关键词输入机检文档,那么该文献除了可以以“锻钢制动盘—中国”“粉末冶金闸片—美国”检出外,还可以以“锻钢制动盘—美国”“粉末冶金闸片—中国”检出。后者是该文献内容里所没有的虚假信息。因此,在输入多主题文献里表示不同成分的关键词时,可以在相应的检索标志之后加联号,[2]以表示不同成分之间的关系,如果以数字1、2为联符,则该文献可以标引为“锻钢制动盘1”“中国1”“粉末冶金闸片2”“美国2”。这样就可以根据联号,将有关文献检出,排除多主题因素的虚假组配可能。

此外,检索系统还可以通过加职号的方式对关键词进行深入加工。职号可以使主题标志的关系更清晰,因为加入职能符号之后,文献主题标志中的施动者、动作对象、部分、性质以及操作因素就可以用“E、A、B、C、D”5个字母确定下来,避免误检现象发生。[3]例如,在《成纤维细胞激活蛋白对卵巢癌细胞增殖、迁徙和侵袭的影响》一文中,主题标志里的“成纤维细胞激活蛋白”是施动者,“卵巢癌细胞”是动作对象,“影响”是与主体因素密切联系但没有独立检索意义的通用因素,即操作因素。如果在后组式检索系统中简单地使用“成纤维细胞激活蛋白”“卵巢癌细胞”“影响”三个主题词进行标引,检索时,就有可能检出“成纤维细胞激活蛋白对卵巢癌细胞的影响”和“卵巢癌细胞对成纤维细胞激活蛋白的影响”两种文献。所以在将论文输入检索系统时,最好可以对上述三个主题词进行深入加工,即将其标引为:成纤维细胞激活蛋白E、卵巢癌细胞A、影响D。这样在检索时就可以避免因为逻辑关系错误而造成的误检。虽然这种方法会增加检索系统工作人员的标引难度,但是如果能有效地使用,将会提高系统的检准率,帮助检索用户节省排除非相关结果的时间。

三、结语

通过各种方式、方法提高科研工作人员受控主题标引的能力,培养他们规范主题标引活动的意识,对于信息检索系统按照关键词项有效组织与聚类相似主题文献具有重要意义,同时,规范的主题标引也有利于提高论文的检全率或检准率。一些科研工作者知道使用综合性、专业性叙词表的益处,但有时也是迫于没有途径获取这些主题词表,而无法使用做主题标引。毕竟高校图书馆对于《汉语主题词表》《中国分类主题词表》《社会科学检索词表》以及一些专业叙词表的藏书复本量较少,所以相对于数量颇多的科研工作者而言,它们的作用显得很小;而且印刷版体积大,也不方便使用,相应的电子版则收费较多,不利于这些工具的广泛普及,所以建议国内的这些主题词表能够像美国的《医学标题表》(MeSH)一样进入公共领域,免费提供下载,以鼓励广大科研人员积极地使用。

[2][3]马张华.信息组织[M].北京:清华大学出版社,2008:263-264.

(作者单位:黑龙江大学信息管理学院)

方.中国学术期刊

总库[DB/OL].(2011-09-01) http://www.cnki.net,2011-09-01.

猜你喜欢

词表标引科研人员
科技部等五部门联合发文开展减轻青年科研人员负担专项行动
基于VOLT的藏汉双向机器翻译
科研人员揭示油桃果实表皮不长毛的奥秘
中医古籍医案知识元标引方法的思考及对策
科研人员破译黑猪肉特征风味物质
A Chinese-English List of the Sports Programmes in Winter Olympics 冬奥会项目名称汉英对照词表
档案主题标引与分类标引的比较分析
近十年国内外专业学术词表建立文献综述*
企业科研人员激励问题及对策研究
常用联绵词表