APP下载

基于术语间本体关联度的文档相关度研究

2014-11-06吴树芳刘畅徐建民

现代情报 2014年9期
关键词:本体

吴树芳+刘畅+徐建民

〔摘要〕提出了一种基于术语间本体关联度的文档相关度计算方法,该方法利用树状本体结构计算术语间基于本体的关联关系,通过术语组间的本体关联度得到两组词语的本体关联关系,最后结合文档标引词的权重计算两个文档的相关度。新方法从本体的角度将语义信息融入传统向量空间模型,提高了文档相关度计算的准确性。实验选取计算机领域本体作为实验数据,对新方法和传统方法进行综合对比评测,实验结果验证了新方法的有效性和合理性。

〔关键词〕本体;术语关系;文档相关度

文档相似度或相关度的计算早已成为数据挖掘和信息提取领域中的基本问题,是文本处理的核心[1-3]。传统的文档相似度计算方法主要包括基于向量空间模型方法,基于集合运算模型方法[4],基于文档结构方法[5]和基于引文图方法[6]等,其中以向量空间模型方法最为常见,后两种方法偏重于研究文档间结构的相似程度。

4结语

舆情强度评测指标体系对于高校舆情工作来说,具有预警、参考、统计3个方面的作用。首先,高校可以将本体系的最终得分进行分段,在日常舆情监测过程中,按照以上体系通过软件进行舆情自动化分析,一旦发现舆情热度指数达到相应数值就启动蓝色、黄色、橙色、红色预警,并随之启动相应的应急预案。其次,高校可以通过分析该体系的每一项指标得分和走势,根据第二部分提出的建议予以针对性的应对,以提高舆情应对的及时性和科学性。最后,高校还可以通过该体系定期统计涉及本校的舆情走势,从中发现规律,增强舆情应对的预见性。当然,本研究也有很多不足,如评测指标的确立,以及指标分值的设置都有值得商榷的地方,如随着信息技术和网络技术的发展,新兴媒介层出不穷,它们对于舆情热度的影响还尚待研究;此外,媒介激烈竞争造成不同类型媒介影响力的此消彼长,需要高校经常更新相关指标权重数据,才能做到尽可能准确。这些问题都有待进一步研究加以改善。

参考文献

[1]张元龙.关于“舆情”及相关概念的界定与辨析[J].浙江学刊,2009,(3):183.

[2]吴绍忠、李淑华.互联网络舆情预警机制研究[J].中国人民公安大学学报:自然科学版,2008,(3):38-42.

[3]戴媛,姚飞.基于网络舆情安全的信息挖掘及评估指标体系研究[J].情报理论与实践,2008,(6):873-876.

[4]谢海光,陈中润.互联网内容及舆情深度分析模式[J].中国青年政治学院学报,2006,(3):95-100.

[5]钱爱兵.基于主题的网络舆情分析模型及其实现[J].现代图书情报技术,2008,(4):49-55.

[6]王青,成颖,巢乃鹏.网络舆情监测及预警指标体系构建研究[J].图书情报工作,2011,(4):55-56.

[7]何绍华,方清华.信息传递中的信息损失认知与技术分析[J].情报理论与实践,2006,(6):764-765.

[8]张一文,齐佳音,方滨兴,等.非常规突发事件网络舆情指标体系建立初探[J].北京邮电大学学报,2010,(4):10.

[9]梁睴,熊立,王国华.一种群决策中确定专家判断可信度的改进方法[J].系统工程,2004,(6):91-94.

[10]薛耀文,杨根科.算术平均和几何平均在群组决策中献比较研究[J].太原重型机械学院学报,1994,(1):91-96.

[11]查先进.信息分析与预测[M].武汉:武汉大学出版社,2000:187-192.

(本文责任编辑:孙国雷)endprint

〔摘要〕提出了一种基于术语间本体关联度的文档相关度计算方法,该方法利用树状本体结构计算术语间基于本体的关联关系,通过术语组间的本体关联度得到两组词语的本体关联关系,最后结合文档标引词的权重计算两个文档的相关度。新方法从本体的角度将语义信息融入传统向量空间模型,提高了文档相关度计算的准确性。实验选取计算机领域本体作为实验数据,对新方法和传统方法进行综合对比评测,实验结果验证了新方法的有效性和合理性。

〔关键词〕本体;术语关系;文档相关度

文档相似度或相关度的计算早已成为数据挖掘和信息提取领域中的基本问题,是文本处理的核心[1-3]。传统的文档相似度计算方法主要包括基于向量空间模型方法,基于集合运算模型方法[4],基于文档结构方法[5]和基于引文图方法[6]等,其中以向量空间模型方法最为常见,后两种方法偏重于研究文档间结构的相似程度。

4结语

舆情强度评测指标体系对于高校舆情工作来说,具有预警、参考、统计3个方面的作用。首先,高校可以将本体系的最终得分进行分段,在日常舆情监测过程中,按照以上体系通过软件进行舆情自动化分析,一旦发现舆情热度指数达到相应数值就启动蓝色、黄色、橙色、红色预警,并随之启动相应的应急预案。其次,高校可以通过分析该体系的每一项指标得分和走势,根据第二部分提出的建议予以针对性的应对,以提高舆情应对的及时性和科学性。最后,高校还可以通过该体系定期统计涉及本校的舆情走势,从中发现规律,增强舆情应对的预见性。当然,本研究也有很多不足,如评测指标的确立,以及指标分值的设置都有值得商榷的地方,如随着信息技术和网络技术的发展,新兴媒介层出不穷,它们对于舆情热度的影响还尚待研究;此外,媒介激烈竞争造成不同类型媒介影响力的此消彼长,需要高校经常更新相关指标权重数据,才能做到尽可能准确。这些问题都有待进一步研究加以改善。

参考文献

[1]张元龙.关于“舆情”及相关概念的界定与辨析[J].浙江学刊,2009,(3):183.

[2]吴绍忠、李淑华.互联网络舆情预警机制研究[J].中国人民公安大学学报:自然科学版,2008,(3):38-42.

[3]戴媛,姚飞.基于网络舆情安全的信息挖掘及评估指标体系研究[J].情报理论与实践,2008,(6):873-876.

[4]谢海光,陈中润.互联网内容及舆情深度分析模式[J].中国青年政治学院学报,2006,(3):95-100.

[5]钱爱兵.基于主题的网络舆情分析模型及其实现[J].现代图书情报技术,2008,(4):49-55.

[6]王青,成颖,巢乃鹏.网络舆情监测及预警指标体系构建研究[J].图书情报工作,2011,(4):55-56.

[7]何绍华,方清华.信息传递中的信息损失认知与技术分析[J].情报理论与实践,2006,(6):764-765.

[8]张一文,齐佳音,方滨兴,等.非常规突发事件网络舆情指标体系建立初探[J].北京邮电大学学报,2010,(4):10.

[9]梁睴,熊立,王国华.一种群决策中确定专家判断可信度的改进方法[J].系统工程,2004,(6):91-94.

[10]薛耀文,杨根科.算术平均和几何平均在群组决策中献比较研究[J].太原重型机械学院学报,1994,(1):91-96.

[11]查先进.信息分析与预测[M].武汉:武汉大学出版社,2000:187-192.

(本文责任编辑:孙国雷)endprint

〔摘要〕提出了一种基于术语间本体关联度的文档相关度计算方法,该方法利用树状本体结构计算术语间基于本体的关联关系,通过术语组间的本体关联度得到两组词语的本体关联关系,最后结合文档标引词的权重计算两个文档的相关度。新方法从本体的角度将语义信息融入传统向量空间模型,提高了文档相关度计算的准确性。实验选取计算机领域本体作为实验数据,对新方法和传统方法进行综合对比评测,实验结果验证了新方法的有效性和合理性。

〔关键词〕本体;术语关系;文档相关度

文档相似度或相关度的计算早已成为数据挖掘和信息提取领域中的基本问题,是文本处理的核心[1-3]。传统的文档相似度计算方法主要包括基于向量空间模型方法,基于集合运算模型方法[4],基于文档结构方法[5]和基于引文图方法[6]等,其中以向量空间模型方法最为常见,后两种方法偏重于研究文档间结构的相似程度。

4结语

舆情强度评测指标体系对于高校舆情工作来说,具有预警、参考、统计3个方面的作用。首先,高校可以将本体系的最终得分进行分段,在日常舆情监测过程中,按照以上体系通过软件进行舆情自动化分析,一旦发现舆情热度指数达到相应数值就启动蓝色、黄色、橙色、红色预警,并随之启动相应的应急预案。其次,高校可以通过分析该体系的每一项指标得分和走势,根据第二部分提出的建议予以针对性的应对,以提高舆情应对的及时性和科学性。最后,高校还可以通过该体系定期统计涉及本校的舆情走势,从中发现规律,增强舆情应对的预见性。当然,本研究也有很多不足,如评测指标的确立,以及指标分值的设置都有值得商榷的地方,如随着信息技术和网络技术的发展,新兴媒介层出不穷,它们对于舆情热度的影响还尚待研究;此外,媒介激烈竞争造成不同类型媒介影响力的此消彼长,需要高校经常更新相关指标权重数据,才能做到尽可能准确。这些问题都有待进一步研究加以改善。

参考文献

[1]张元龙.关于“舆情”及相关概念的界定与辨析[J].浙江学刊,2009,(3):183.

[2]吴绍忠、李淑华.互联网络舆情预警机制研究[J].中国人民公安大学学报:自然科学版,2008,(3):38-42.

[3]戴媛,姚飞.基于网络舆情安全的信息挖掘及评估指标体系研究[J].情报理论与实践,2008,(6):873-876.

[4]谢海光,陈中润.互联网内容及舆情深度分析模式[J].中国青年政治学院学报,2006,(3):95-100.

[5]钱爱兵.基于主题的网络舆情分析模型及其实现[J].现代图书情报技术,2008,(4):49-55.

[6]王青,成颖,巢乃鹏.网络舆情监测及预警指标体系构建研究[J].图书情报工作,2011,(4):55-56.

[7]何绍华,方清华.信息传递中的信息损失认知与技术分析[J].情报理论与实践,2006,(6):764-765.

[8]张一文,齐佳音,方滨兴,等.非常规突发事件网络舆情指标体系建立初探[J].北京邮电大学学报,2010,(4):10.

[9]梁睴,熊立,王国华.一种群决策中确定专家判断可信度的改进方法[J].系统工程,2004,(6):91-94.

[10]薛耀文,杨根科.算术平均和几何平均在群组决策中献比较研究[J].太原重型机械学院学报,1994,(1):91-96.

[11]查先进.信息分析与预测[M].武汉:武汉大学出版社,2000:187-192.

(本文责任编辑:孙国雷)endprint

猜你喜欢

本体
Abstracts and Key Words
灰铸铁缸体本体抗拉强度提升的研究
眼睛是“本体”
对姜夔自度曲音乐本体的现代解读
领域本体的查询扩展和检索研究
基于本体的机械产品工艺知识表示
本体在产品设计知识管理中的应用研究
《我应该感到自豪才对》的本体性教学内容及启示
一种基于本体的语义检索设计与实现
媒介生存:关于新闻史研究本体的思考