APP下载

基于机器学习的铁路工程生态风险管理研究

2023-06-09宋瑞震陈宏权曾赛星

预测 2023年1期
关键词:主题词铁路文本

宋瑞震, 高 鑫, 陈宏权, 曾赛星

(1.上海交通大学 安泰经济与管理学院,上海 200030;2.上海交通大学 中美物流研究院,上海 200030)

1 引言

铁路工程是我国基础设施建设的重要组成部分,处于我国综合交通运输体系中的骨干地位。截至2020年底,我国铁路营业里程达14.6万公里,其中高速铁路3.8万公里,极大地促进了我国经济增长[1]。铁路工程具有建设规模大、地区跨度大、生态环境影响显著等特点,极易对生态环境脆弱地区产生不可逆的生态影响。因此在工程设计阶段,就必须充分考虑工程建设可能带来的生态环境影响。例如,青藏铁路横贯青藏高原,工程建设会对动植物的生存环境以及生物多样性产生显著影响。为保护青藏高原的生态环境,我国政府投入了约15.4亿元用于沿线的环境保护和生态恢复[2],在青藏铁路沿线设计建设了33座“生态走廊”,解决了铁路工程所引发的动物生存栖息地分割问题[3];采用48台最先进的旋挖式钻机修建青藏铁路清水河特大桥,避免了钻孔产生泥沙所引发的水体污染[4];采用湿钻法施工,降低隧道施工中粉尘带来的大气污染问题等[5]。

铁路工程生态风险的复杂性早已备受关注,在铁路建设期间可能会对沿线动植物、自然景观和生态系统造成不同类型和程度上的影响,在不同铁路工程特殊的施工条件和自然环境下,生态风险的复杂性将进一步提高[6]。对铁路工程具体生态风险类型的研究,国内外学者主要从生态风险受体、生态影响范围和影响程度等方面展开。生态风险受体主要包括铁路工程沿途影响的动植物生活[7]、景观格局[8]、人类活动[9]等方面,通过对风险受体的识别和分析能够直接为铁路建设的环境保护提供指导。对铁路工程生态影响范围和程度的研究,学者们主要将工程实践与遥感图像、GIS技术和生态学的理论方法相结合[10],确定铁路工程生态影响的范围和大小,及其随时间和空间的变化情况,从宏观的角度评估和预测生态风险[11]。整体来看,现有研究从多个角度探讨了铁路工程的主要生态风险受体和受影响程度,大多风险识别是基于某一确定视角下的主要风险类型,再结合过去相关的设计规范和主观的经验判定确定,能够有重点地突出各种生态风险类型,但忽视了生态风险管理的客观性和全面性。因此,需要使用更加客观、系统的技术方法,全面地识别和梳理铁路工程的生态风险类型。

机器学习(machine learning,ML)是一类算法的总称,这类算法可以从大量的历史数据推断出数据隐含的规律,并利用这种规律进行判断或预测[12]。主题模型是无监督机器学习模型中的一个重要分支,广泛应用于自然语言处理(natural language processing,NLP)中。主题模型的发展基于早期的向量空间模型(vector space model,VSM)中存在的“一词多义”和“一义多词”问题,先后有学者提出了潜在语义分析(latent semantic analysis,LSA)模型和概率潜在语义分析(probabilistic latent semantic analysis,PLSA)模型。在此基础上,Blei等[13]提出著名的隐含狄利克雷分布(latent dirichlet allocation,LDA)模型,因其广泛的适用性和良好的拓展性,国内外学者将LDA模型应用于潜在风险挖掘、计算机视觉和舆情监控等领域[14,15]。LDA模型在训练时不需要人工标注训练集,所以十分适合对未知类型的主题进行识别和分类,如铁路工程中存在的潜在生态风险类型。

然而,由于LDA是基于词袋(bag of words)模型构建的,使模型得到的每个主题之间的关键词的关系割裂[16],而Word2Vec模型可以通过构建三层神经网络用词嵌入(word embedding)的方式将文本词向量化,通过结构化的词向量分析关键词间的语义关系[17]。Word2Vec模型包含两种模型,分别是利用上下文预测中心词的CBOW(continuous bag of words model)模型与通过中心词预测上下文的Skip-Gram(continuous skip-gram model)模型。近年出现了将LDA与Word2Vec结合的研究[18],使主题和词嵌入取得更准确的结果。经过Word2Vec模型处理后,将词表示为低维空间上的语义向量,但仍然不够直观。所以可以进一步利用主成分分析法(principal component analysis,PCA)提取词向量中的重要特征并对特征降维,得到更加直观的关键词语义关系[19]。

基于以上分析,本文将LDA、Word2Vec和PCA三种无监督机器学习模型整合使用,其优势在于利用LDA模型得到更加客观、全面的风险主题词的基础上,借助Word2Vec解决LDA中主题词的语义关系不明问题,再利用PCA解决Word2Vec中词向量维度高不直观问题,最终更加全面、系统和直观地得到铁路工程的生态风险类型和风险间的相关关系。

综上,铁路工程带来的生态风险管理异常复杂,而现有的研究中,并没有客观、系统地对生态风险类型、风险源和应对策略进行梳理和归纳。为了建设环境友好的绿色铁路工程并降低工程建设对生态环境的影响,首先,识别铁路工程在建设期存在的主要生态风险类型,这为项目的生态风险管理指明了方向;其次,针对各类风险,进一步挖掘对应的主要风险源,这为应对生态风险提供了具体目标;最后,根据生态风险和风险源,匹配应对策略,这为生态风险管理提供了具体的治理措施。基于此,本文基于三种机器学习模型,以铁路工程建设阶段存在的生态风险为研究对象,通过对大量历史文本数据的分析,提出了基于机器学习的铁路工程风险识别与应对的模型方法,形成了“风险识别—风险溯源—风险应对”的研究架构。

本文的创新点在于:在理论上,形成铁路工程生态环境“风险识别—风险溯源—风险应对”的研究架构,丰富了铁路工程生态风险管理和保护的理论内涵,为研究和分析工程风险提供了新思路;在实践上,提出了一种基于机器学习的铁路工程生态风险管理的模型方法,补充了现有研究的方法体系,也为铁路工程实践中的生态风险识别、管理和修复提供决策参考。

2 理论框架与模型构建

2.1 理论框架

本文以铁路工程生态风险相关的历史文本为数据,利用三种机器学习模型的互补优势,提出基于机器学习的铁路工程生态风险识别与应对模型(如图1)。该模型包括四个主要步骤:文本收集与预处理、样本筛选、机器学习模型训练与可视化和生态风险、风险源及应对策略提取,最终得到铁路工程生态环境“风险识别—风险溯源—风险应对”框架。该模型的优势在于:(1)针对大量的文本数据,只需对机器学习模型输出的主题相关词进行标注即可得到系统且全面的铁路工程生态风险类型。(2)使用的LDA、Word2Vec和PCA均属于无监督机器学习模型,有效地避免了人为梳理聚类的主观性问题。(3)通过对生态风险关键词表的调整,本文提出的模型方法还能被应用于识别其他工程的各类风险,具有一定的推广价值。

图1 基于机器学习的铁路工程生态风险识别与应对模型流程图

2.2 模型构建

2.2.1 文本收集与预处理

本文选择提取WebofScience和Scopus两个数据库中已经正式发表的铁路工程生态环境风险相关文本全文数据。同时,考虑到铁路工程施工技术和装备水平的不断提升,部分过去存在的生态风险问题已经在工程中得到解决,所以选择数据库中2010—2021年间的文本数据。根据关键词使用:railwayAND(“environment*risk*”OR“ecolog*risk*”OR“environment*issues”OR“ecolog*issues”OR“environment*problem*”OR“ecolog*problem*”)在文本的标题、摘要或关键词中搜索,各数据库得到的文本结果如表1所示。

表1 数据收集与预处理结果

对文本预处理的步骤主要分为:全文PDF解码、分词、去停用词和特殊符号。由于文本标题、摘要和关键词中信息有限,作为数据输入主题模型训练可能无法得到详尽的风险类型,所以提取全文构建样本数据。

2.2.2 样本筛选

样本得分的计算和筛选步骤如下:第1步,设定铁路工程生态风险相关的关键词KEYi(i=1,…,n),并根据关键词在文本数据标题中的词频分为高度相关、中度相关和低度相关三类。再根据相关程度对关键词组赋权,经过多次取样试验后调整赋值范围,确定从低到高的关键词赋权为[1,4]、[4,7]、[7,10]范围内的随机整数WEIGHTj(j=1,…,m),如表2所示。第2步,分别统计上一步处理好的每个文本数据中相关关键词表的各关键词出现的频次Ki(i=1,…,n)。第3步,运用公式(1)计算每个文本的相关性得分,选择得分排序前50%的文本作为后续机器学习模型的训练样本。第4步,将各关键词在权重范围内多次取值,重复计算文本相关性得分,并取每次得分前50%文本的并集作为初始样本。

表2 铁路工程生态风险关键词优先级及权重取值范围

2.2.3 机器学习模型训练与结果提取

通过结合三种机器学习模型的互补优势,实现对铁路工程生态风险系统性地识别,主要步骤为:(1)LDA与Word2Vec模型参数计算,包括:构建语料库和困惑度计算;(2)基于LDA“主题—单词”分布的风险识别,包括:LDA模型建模与训练;(3)基于Word2Vec和PCA的铁路工程生态风险溯源与应对,包括:Word2Vec模型训练和PCA降维与可视化。

(1)LDA与Word2Vec模型参数计算

首先,为了将词语中的语义处理为机器学习模型能够识别和训练的信息,需要基于词袋模型构建语料库。词袋模型中利用词频表示词向量,但词频多的词并不一定是重要的风险分类词,所以通过TF-IDF(term frequency-inverse document frequency)算法修正词向量的特征权重。具体是通过公式(2)和(3)分别计算词频TF和逆向文本频率指数IDF,再基于公式(4)得到TF-IDF权重值。

其 中xi,j表示词 在文本dj中出 现的次 数;∑kxk,j表 示文本dj中所有词出现的次数;|D|表示语料库中文本总数;|{j:ti∈dj}|表示包含词ti的文本数。为了避免不在语料库中的词计算IDF值时|{j:ti∈dj}|为零的情况,所以使用|1+{j:ti∈dj}|。

此外,在进行LDA模型训练之前,需要确定语料库的隐含主题数作为模型的输入参数。由于事先并不确定铁路工程的生态风险类型数,无法通过经验确定主题数,所以本文通过计算困惑度(perplexity)确定最优的隐含主题数如(5)式。

(2)基于LDA“主题—单词”分布的风险识别

铁路工程生态风险识别的具体识别过程是:根据LDA输出的“主题—单词”分布,得到各类生态风险主题下相关系数最大的15个主题词,再分别对不同主题下的15个主题词进行人工识别与标注,得到铁路工程生态风险分类结果。

在LDA模型中,每一篇文档代表了一些主题所构成的一个多项式分布,每一个主题又代表了很多单词所构成的一个多项式分布,而Dirichlet分布是这两个多项式分布的共轭先验分布,因此可以通过多项式分布中的数据更新Dirichlet分布的参数(LDA模型中的α和β),从而获得更准确的估计。基于此,本文构建了LDA模型求解中的损失函数如(6)式所示。

其中D表示语料库,也就是M篇文章的集合;α表示生成每篇文章主题的多项式分布的Dirichlet分布的参数;β表示生成文章中某个单词的多项式分布的Dirichlet分布的参数;θd表示第d篇文章的主题分布,也是多项式分布的参数;zdn表示第d篇文章的第n个单词的主题;wdn表示第d篇文章的第n个单词。

根据TF-IDF算法得到的语料库与困惑度计算得到的LDA模型的隐含主题数,LDA主题模型训练求解基于变分推断EM算法,该算法是将变分推断和EM 算法(expectation-maximization algorithm)结合得到LDA模型中的“文档—主题”和“主题—单词”分布。

(3)基于Word2Vec和PCA的铁路工程生态风险溯源与应对

在LDA模型得到的“文档—主题”分布的基础上,结合上一步由“主题—单词”分布识别的生态风险分类,得到每个文档最大概率归属的生态风险类型。再将每类风险主题下的相关文本先后输入到Word2Vec和PCA模型中,训练得到不同生态风险下的最大相关词,并将相关词标注和归纳,最终确定各类生态风险的溯源与应对策略。

运用Word2Vec中的Skip-Gram模型计算各类风险主题词的词向量,来进一步分析风险主题词的相关关系。Skip-Gram模型每次选择文中的一个词作为中心词,再通过计算该中心词的上下文词的准确性来调节模型中的参数,经过多次迭代使模型的损失函数最小化如(7)式,求解得到风险主题相关词的词向量。从相关程度高的相关词中进行各类生态风险源头和策略的标注,匹配得到各类生态风险的源头和策略。

其中T表示语料库中的所有词;t表示中心词的位置;m表示中心词上下文取词范围;p(xt+i│xt)表示中心词取xt时,在其上下文中的第i个词xt+i出现的条件概率。

为了进一步完善生态风险之间的相关关系,并且更加直观地表示出各生态风险主题词的语义关系,本文基于SVD分解协方差矩阵实现PCA模型,通过提取高维词向量中的主要特征,实现对高维主题词向量的降维,并作可视化处理,以验证LDA模型结果并进一步发现各类生态风险的相关关系。

3 结果分析

3.1 模型训练结果与可视化

利用公式(1)进行10次文本相关性得分计算后,筛选得到637个文本构建语料库。在进行机器学习模型训练之前,通过计算困惑度选择最优隐含主题数,得到不同主题数情况下的困惑度结果(图2)。从图中可以看出,LDA模型的困惑度值前期随着主题数的增加明显下降,说明模型能够很好地将不同主题分类。随着主题数的增加,困惑度下降的趋势在主题数为35之后逐渐平缓,为了避免过模型拟合的情况,选择隐含主题数为35。

图2 不同主题数下的模型困惑度

隐含主题数确定后,通过变分推断EM算法求解得到“主题—单词”分布,设置EM 算法的最大迭代次数为100,得到每个主题输出最相关的前15个单词。然后对35个主题的主题词进人工标注,抽象出各主题含义。排除主题中安全事故、自然灾害和工程主体建筑损坏等铁路建设中的其他非生态风险,得到与铁路生态风险相关的主体模型聚类结果如表3所示,将生态风险相关的主题词做词云可视化,可以提取归纳出铁路工程建设的生态风险主要有如下8类:栖息地分割(主题词中包含:物种、列车、暴露、扰动、活动、空间、分布等);景观破坏(主题词中包含:地表、坡度、植被、腐蚀、景观、土壤、保护、物种、生态、铁路、植物、损失、覆盖等);大气污染(主题词中包含:排放、温室气体、碳、灰尘、废气、化石等);噪声污染(主题词中包含:噪声、交通、振动、声音、生活、住宅、公共等);土壤污染(主题词中包含:土壤、铅、镉、金属、污染、元素、铜、锌、风险、铬、采样、镍、铅、植物等);隧道涌水(主题词中包含:破坏、洪水、排水、规模、地表、强度、暴露、风险、结构、局部、空间、道路、地下水、损失、隧道等);废水污染(主题词中包含:离子、盐分、硫酸盐、排水、含量、浓度、沉降、液体等);水土平衡破坏(主题词中包含:多年冻土、土壤、干燥、水分、密度、混合、化学、温度、地层、地表、沉降、沙地、隧道、位移、岩石等)。

表3 LDA模型聚类结果

使用语料库训练Word2Vec模型后,得到各风险主题词的词向量,再进行PCA降维得到主题风险词的分布情况,可以看出不同类型风险主题词的空间分布差异,如土壤污染的相关主题词基本分布在{(x,y)│x∈(-2,0),y∈(-1,1)}区域内,噪声污染的相关主题词基本分布在{(x,y)│x∈(1,2),y∈(-1,1)}区域内,空气污染的相关主题词基本分布在{(x,y)│x∈(-1,1),y∈(-2.5,-1)}区域内,说明主题模型对不同生态风险类型的主题词进行了合理地分类,且聚类效果好。同时,根据主题关键词的语义关系的二维分布,可以发现:(1)景观破坏、废水污染和土壤污染三类生态风险存在相关关系,铁路工程产生的废水污染破坏自然水体后,可能会同时导致土壤污染,影响植被生长从而造成景观破坏;(2)噪声污染、栖息地分割和隧道涌水存在部分相关性,这部分主要在于类似的生态风险受体,尤其是对铁路工程沿线野生动物生活和迁徙的影响;(3)水土平衡破坏与废水污染的相关性较强,同时也与土壤污染、隧道涌水等存在一定的相关关系;(4)大气污染相对比较独立,其中关于化石燃料、温室气体排放等关键词空间集中分布。

3.2 铁路工程生态环境“风险识别—风险溯源—风险应对”框架

在提取得到生态风险的基础上,根据LDA模型得到的“文本—主题”分布结果,将每类风险主题下的相关文本先后输入到Word2Vec模型中,训练得到各类风险关键词的相关词。通过对相关词的标注和归纳,得到各类生态风险下的风险源和应对策略,最终形成铁路工程生态环境“风险识别—风险溯源—风险应对”框架(图3)。

图3 铁路工程生态环境“风险识别—风险溯源—风险应对”框架

(1)栖息地分割风险。铁路工程的建设中,铁路主体工程会永久性占用土地,并对沿途地区强制性空间分割,这导致沿途动植物的活动和生长环境产生突变,将严重影响动物迁徙和繁衍。以青藏铁路为例,青藏铁路穿过可可西里自然保护区,该保护区是藏羚羊、野牦牛等珍惜野生动物的重要栖息地,在铁路建设期间藏羚羊的警戒和卧息行为明显上升,觅食时间减少,对繁衍行为产生了明显影响。对此,青藏铁路在沿途设计多个桥梁、涵洞和围栏等供野生动物穿越青藏铁路,调查发现沿途藏羚羊、野牦牛、山地鼬鼠和亚洲獾等动物借助这些“生态走廊”能够有效克服栖息地分割带来的不利影响[20]。因此,铁路工程建设带来的栖息地永久性分割是一类重要的生态风险。

(2)景观破坏风险。铁路建设过程中,沿途会有大量的土石方工程,在桥隧口、临时辅助道路和施工营地等区域的取、弃土会造成施工场地植被和地表形态破坏,影响原有的景观生态。在铁路的运营过程中,由于铁路交通带来了人类活动的扩张,将会进一步对景观环境产生影响[21]。整体上看铁路工程的建设使得沿途生态扰动区内的归一化植被指数(normalized difference vegetation index,NDVI)降低,以丽香铁路为例,铁路廊道破坏了沿线的自然景观,产生了较大的正中切割作用[11],因此铁路工程带来的景观破坏风险不能忽视。

(3)大气污染风险。在工程建设阶段产生的大气污染主要有两类:一是使用大型机械产生的各类温室气体,如COX、NOX和SO2等;二是在土石方运输、临时道路建造和桥隧开挖中产生的粉尘污染,粉尘中可能含有施工过程中产生的有毒气体和金属颗粒污染大气环境。大气污染会对沿途的动植物生长产生不良影响,这种影响在含氧量低、空气稀薄的高原高海拔地区更加严重。

(4)噪声污染风险。现有的铁路工程案例表明,铁路的建设和运营期都存在噪声污染的情况。在工程建设期,包括山体爆破、大型机械的运作以及施工营地的人类活动等都会产生噪声污染,这些活动对沿途人类和野生动物的正常生活产生影响。类似的情况也出现在运营期,比如成兰铁路运行的噪声和振动会减少大熊猫活动。相关研究建议火车应该减少夜间运行以保护大熊猫正常活动[22],对此现有铁路设计了桥梁吸振器、声屏障和吸音材料等一系列措施来降低噪声污染。

(5)土壤污染风险。工程对土壤的污染主要包含施工中产生的弃渣、废液,以及施工营地产生的生活废料,如果不能合理地处理这类废渣和废液,将对工程沿线的土壤造成严重的污染。如青藏铁路沿线土壤中的铅、镉和锌等重金属的浓度与铁路干线的距离呈显著负相关关系,说明铁路工程使土壤中的重金属浓度升高,在铁路20米范围内这几类重金属的富集水平从无污染到显著污染不等[23]。由于青藏高原的土壤中含有丰富的真菌和微生物,重金属等污染物会对土壤中的微生物平衡产生影响,导致土壤肥力下降、高寒草甸退化[24]。因此,妥善处理生产生活的废料,避免土壤污染是铁路工程建设中一项十分重要的工作。

(6)隧道涌水风险。铁路工程一般地理跨度大,时常要穿过山岭重丘地区,施工方式以隧道为主,隧道工程开挖过程中开挖、爆破、支护等极易破坏原有的地下水分布,致使大量的地下水涌出,这不仅改变了原始的自然水系,也给隧道中的施工人员带来巨大的风险。在云南、河北等地区的铁路工程建设中,部分隧道施工区的断面日排水量达到2万立方米,大量的涌水造成山体岩下水资源大量流失,使得施工后进行生态恢复的成本高、难度大,山体中排出的水也对周边的工农业生产造成影响。针对涌水问题,我国的《铁路隧道设计规范》中明确提出“防、排、截、堵结合,因地制宜,综合治理”的防排水原则,可见隧道涌水带来的生态影响在铁路工程施工中需要格外重视。

(7)废水污染风险。铁路工程建设中产生的污染废水主要有:施工营地的生活废水、爆破后的降尘用水、使用混凝土浇筑时的废水、施工设备工作时产生的废水等。施工中的含污废水会对地表水体和周边水体产生影响,如隧道开挖过程中掘进机产生的油污和重金属颗粒会混在涌水中排出,破坏地下水环境的同时污染其他水体。一般铁路工程时空跨度大,可能途经多个自然保护区和水源保护区,如天目山隧道工程靠近千岛湖风景区,建设期产生的工程废水中悬浮物、重金属和酸碱度超标,必须经过多项工艺处理后才能排放[25]。

(8)水土平衡破坏风险。工程建设中频繁地取弃土可能会导致区域水土流失。取土一般会破坏土层上的植被,使得土壤保水能力减弱。如果对取土区的裸露地面不进行生态修复,会导致土壤水分流失。由于弃渣的力学性质与原土不同,弃土难以与原有土壤融合,甚至可能导致山体滑坡、泥石流等地质灾害,造成水土流失的恶性循环。这一风险在复杂艰险的施工环境中尤为突出,比如青藏铁路穿过多年冻土区,若在施工后不及时采取水土保持措施,将加剧工程沿线的水土流失。因此,工程采用“绕、护、挡、防、拦、排、整、植”的模式进行系统生态恢复,制定了具有青藏高原特色的水土保持方案[26]。

4 结论与启示

本文综合使用LDA、Word2Vec和PCA三种机器学习模型,根据“生态风险识别—风险源挖掘—风险应对策略”构建的逻辑主线,提出“风险识别—风险溯源—风险应对”的铁路工程生态风险框架。利用LDA模型训练得到的“主题—单词”分布得出铁路工程存在的8类主要生态风险,分别是:栖息地分割、景观破坏、大气污染、噪声污染、土壤污染、隧道涌水、废水污染和水土平衡破坏。进一步,根据“文本—主题”分布,通过Word2Vec和PCA模型实现各类生态风险的溯源与应对,并将各类生态风险主题词的关系可视化。最后,结合青藏铁路、丽香铁路等工程生态风险识别与应对的案例,对各类重大生态风险、风险源和应对策略进行讨论,验证和完善了铁路工程生态风险框架。通过研究得到如下启示:

(1)“风险识别—风险溯源—风险应对”的研究架构对铁路工程生态风险管理和保护具有重要意义。本文从主要生态风险的识别到风险源的追溯,再根据风险源匹配应对策略,形成铁路工程生态风险“识别—溯源—应对”的闭环研究架构,这丰富了铁路工程生态风险管理和保护的理论内涵,也为研究和分析工程风险提供了新思路。

(2)有效地融合机器学习模型能够客观、系统、高效地解决铁路工程生态风险识别等研究问题。本文在大量文本数据的基础上,利用三种机器学习模型的互补优势,提出了一种铁路工程生态风险识别与应对的模型方法。这不仅保证了风险识别结果的客观性和系统性,也显著地缩减了分析时间,能为铁路工程实践中的生态风险识别、管理和修复提供及时可靠的决策参考。

本文基于大量文本数据研究铁路工程生态风险问题,但并未考虑文本数据的时间因素。因此未来可以加入更加丰富的数据,在时间维度上研究铁路工程生态风险变化情况,进而识别生态风险管理在不同建设阶段的重难点领域。此外,本文提出了生态风险“识别—溯源—应对”的研究架构,并利用铁路工程相关数据进行分析,但并未在其他类型的重大工程中进行验证。所以未来的研究可以在此架构的基础上,通过考虑加入不同工程的特性,不断丰富重大工程生态风险管理理论体系。

猜你喜欢

主题词铁路文本
沿着中老铁路一路向南
在808DA上文本显示的改善
基于doc2vec和TF-IDF的相似文本识别
铁路通信线路维护体制改革探索与实践
无人机在铁路工程建设中的应用与思考
GSM-R在铁路通信中的应用
文本之中·文本之外·文本之上——童话故事《坐井观天》的教学隐喻
我校学报第32卷第5期(2014年10月)平均每篇有3.04个21世纪的Ei主题词
我校学报第32卷第6期(2014年12月)平均每篇有3.00个21世纪的Ei主题词
2014年第16卷第1~4期主题词索引