APP下载

基于大数据环境下大学生同题英文写作维度研究

2016-11-01

兴义民族师范学院学报 2016年2期
关键词:连词贵州省词汇

周 丽

(贵州理工学院, 贵州 贵阳 550002)

基于大数据环境下大学生同题英文写作维度研究

周 丽

(贵州理工学院, 贵州 贵阳 550002)

以贵州省大学生“百万同题英文写作”活动数据为研究对象,通过大数据平台分析工具,展示英文写作维度提升的重要性与必要性,通过数据来表现出贵州省大学生英语写作现状,存在的问题,力求找到解决的途径,从而为提高西部地区大学生英语写作水平提供一定程度上参考,为大学生英文写作提升研究提供借鉴。

大数据;在线写作;同题作文

众所周知,大学生英文写作能力的提升,与其个人词汇量、正确使用、修改次数都有一定的关系,但其中最为重要的是在写作中维度上的提升。维度提升一般包括词汇维度提升、句子维度提升以及篇章维度提升,本文将以贵州省大学生“百万同题英文写作”活动数据为研究对象,通过大数据平台分析工具,展示英文写作维度提升的重要性与必要性,通过数据来表现出贵州省大学生英语写作现状,存在的问题,力求找到解决的途径,从而为提高西部地区大学生英语写作水平提供一定程度上参考,为大学生英文写作提升研究提供借鉴。

一、研究背景

2015年4月16日至5月31日,第二届“同题英文写作活动”线上活动举行。来自全国31个省市地区的2,792所学校的老师引用布置题目17,662次,共计收到学生作文1,093,126篇。其中,贵州省大学生共参与提交作文15,255篇,教师引用布置题目124次,累计修改作文97,492,平均每人每篇作文修改6.4次。共收到211院校(贵州大学)作文3368篇,一般本科院校作文11,887篇,参与活动的9所院校均为本科院校。具体情况如下表1所示:

表1 贵州省参与2015年“同题英文写作活动”院校一栏表

二、研究对象及可行性分析

本次百万“同题英文写作活动”,是基于同一时间、同一题目、同一标准的活动。所有数据来自于第三方平台,通过大数据分析统计;其数据量大,且真实有效,具有极强的可信度与可分析价值。

三、研究内容

1.词汇维度分析

词汇是英语写作必不可少的基本要素,要写好一篇作文首先面临的就是词汇问题。一般来说,词汇的词长、丰富度以及平均难度,是词汇维度中最为重要的三要素,我们利用大数据后台针对上述进行了分析,具体如下所示:

(1)平均词长平均词长是指作文中平均词汇的长度,一般可以用sum(单词长度)/单词频数来进行计算。具体如下图1所示:

图1 全国高校与贵州省高校大学生平均词长对比图

结果分析:在参加“同题英文写作活动”中所提交的全国1,093,126篇、贵州省15,255篇文章中,通过大数据后台统计计算我们可以清楚看到以下两个基本特征:

第一,无论从全国高校平均词长统计来看还是从贵州省高校平均词长统计来看,都显示出一定的共性趋势。即二者在1.0-3.6词长上和5.2-5.4词长上,所占比例都较低,大概只占2%以下,差距并不明显;

第二,平均词长在4.0-4.2的范围上,体现出较为明显的差异,全国这一指标的平均值在50%以上,但是贵州省的这一指标只达到25%左右。显然,贵州省英语写作当中,在平均词长中的中等比例是远低于全国标准的。反映出贵州省英语写作中出现中等长度词长的比例偏低这一现象。而两者对比的数据情况,也比较明显。

(2)词汇丰富度

一般说来,词汇丰富度可以用类符形符比(Type/Token Rotion,TTR)来表示,其比值越高,该文本用词越丰富,其计算公式为:词汇丰富度(TTR)=形符频数/sqrt(2*类符频数)。具体如下图2所示:

图2 全国高校与贵州省高校大学生词汇丰富度对比图

结果分析:通过两根词汇丰富度参数曲线的对比,全国高校平均词汇丰富度在整体上都高于贵州省高校平均词汇丰富度,但超出的量值并不明显。两者的峰值都出现在5.5左右,而这一数据的平均值,在2014年同题写作大数据后台给出的是5.99,较2014年有明显的下降,体现出全国高校大学生在写作当中,平均词汇丰富度上的平均值有下降的趋势。

2.句子维度分析

句子是写作当中更为重要的组成部分,对文章的流畅性及结构性起着重要作用。而通过大数据可对句子维度进行分析,尤其是对句子维度中的平均句长、从句密度等的分析,可以看出学生在写作当中,对于句子熟练应用和掌握的能力,具体分析如下:

(1)平均句长

平均句长是指文本中句子的平均长度,句子的长短在一定程度上反映了句子的复杂程度。具体如下图3所示:

图3 全国高校与贵州省高校大学生平均句长对比图

结果分析:通过对两根平均句长的对比,我们可以明显看出,全国高校平均句长与贵州省高校平均句长值较为接近。说明在用词构句方面,贵州省学生已经和全国高校学生的能力比较接近。二者的峰值都出现在15左右,基本和2014年同题写作大数据后台给出数据15.32持平,变化不大。

(2)从句密度

从句密度是指长度单位内使用从句的量。从句密度在一定程度上反映了句法的复杂程度。其计算公式为:从句密度=作文从句数/作文句子数。具体如下图4所示:

图4 全国高校与贵州省高校大学生平均从句密度对比图

结果分析:通过对两根从句密度的对比分析,我们可以明显看出,全国高校平均句长与贵州省高校平均句长值十分接近。说明在运用从句方面,贵州省学生进一步与全国高校学生能力接近。二者的峰值都出现在1.2左右,而2014年同题写作大数据后台给出数据是0.99,在这一项数据上,较2014年略有提升,体现出大学生更加重视从句的运用。

3.篇章维度分析

(1)平均文章长度

平均文章长度是指作文平均包含的单词个数。其指标的大小从一定程度上,能够反映出作文作者运用词汇、句子以及段落的能力,与作文质量有一定的相关性。具体如下图5所示:

图5 全国高校与贵州省高校大学生平均文章长度对比图

结果分析:通过对两根文章长度的曲线对比分析,我们可以看出,全国高校平均文章长度与贵州省高校平均文章长度参数值进一步接近。说明在文章中的平均长度(字数),贵州省学生与全国高校学生平均水平更进一步接近,二者的峰值都出现在170左右。而2014年同题写作大数据后台给出数据是213,在这一项数据上,较2014年有较大下降,体现出大学生在整体写作中,有忽视文章字数的趋势。当然,亦不排除不同题目之间的差异性问题

(2)篇章连词数

篇章连词数是指一篇文章中连词的数量,其在文章中出现的多少,决定了一篇文章的衔接、递进以及转折的能力。具体如下图6所示:

图6 全国高校与贵州省高校大学生平均篇章连词数对比图

结果分析:通过对两根篇章连词数曲线对比分析,我们可以看出,全国高校篇章连词数参数指标比贵州省高校篇章连词数明显偏高。说明在篇章连词数方面的运用,贵州省大学生比全国高校大学生平均值明显偏低。该值峰值出现在11,而2014年同题写作大数据后台给出数据是10.3,在这一项数据上,较2014年有一些提升下降,体现出大学生在整体写作中,有提升连词数量的趋势。

四、结论

通过此次大数据平台对2015年全国100多万篇、贵州省10多万篇的同题写作作文维度分析,我们发现:学生普遍在词汇维度上的问题比较严重,横比都有下降的趋势,在此方面,贵州省大学生问题尤为突出;相对于句子维度及段落维度方面的表现,全国学生普遍都要好于在词汇维度上的表现,在这两个方面上,贵州省大学生与全国平均水平差距并不显著。总体来说,贵州省学生主要问题是缺乏对词汇的合理运用,词汇平均词长普遍较短、词汇丰富度普遍不够、词汇平均难度普遍偏易,重复词汇出现偏多等特性问题亟待提升。贵州省学生在句子维度及段落维度方面的表现,要优于在词汇维度方面的表现。分析其原因,句子维度和段落维度可以通过写作态度和写作方法来进行短期训练,加以提升。

通过此次大数据平台分析,可以很好地指引英语教师的教学方向,尤其是针对贵州省薄弱的基础词汇维度方面的教学,具有较强的指导意义,也希望能够为将来更多的学者,提供这方面的借鉴,指导英语写作,提升学生写作能力。

[1]2015年中国高校写作教学联盟百万同题英文写作大数据分析报告[R].2015.

[2]周丽.英语在线写作平台对大学生写作句法能力的影响[J].上海:外语电化教学,2015.

[3]葛诗利,陈潇潇.国外自动作文评分技术研究[J].外语电化教学,2007.

[4]梁茂成,文秋芳.国外作文自动评分系统评述及启示[J].外语电化教学,2007.

责任编辑:彭雁萍

Dimensional Analysis of College Students’Same Title Composition Based on Large Data Environment

ZHOU Li
(Guizhou Institute of Techhology,Guiyang,Guizhou 550002,China)

The paper uses bigdata plat for mtoanalyze the writingdata of university students in Guizhou province whoenter a national writingcontest sponsored bya prestigious writing website.The analytical data present the status quoand existing problems of undergraduate’s writingin Guizhou province.And the research result shows the importance and necessity of strengthing writing skills.The paper aims tofind a waytohelp undergra duates in western China improve their writing a bility.

bigdata;on-line writing;same title composition

1009—0673(2016)02—0056—06

H319.3

A

2016—02—12

周丽(1971—),女,湖南长沙人,贵州理工学院副教授,研究方向:话语分析、翻译、英语教学。

猜你喜欢

连词贵州省词汇
贵州省种公牛站
连词that引导的宾语从句
本刊可直接用缩写的常用词汇
一些常用词汇可直接用缩写
本刊可直接用缩写的常用词汇
不动产登记地方立法的思考——以贵州省为例
表格大团圆,连词学得全
贵州省党代会开得最成功
西夏语中的对比连词 djij2
贵州省高速公路养护管理信息系统