基于改进的K—Means视频分类

2017-07-29查日盼彭太乐

电脑知识与技术 2017年12期

关键词：镜头

查日盼　彭太乐

摘要：针对视频分类准确率低的难题，文中提出一种改进的K-Means算法，并以此算法为分类器来实现视频分类。首先提取视频的颜色特征、SIFT特征及纹理特征；改进传统的K-Means聚类算法，以标签视频样本形成初始聚类值，进一步优化距离函数，实现视频分类。通过实验表明：该文提出的分类算法具有较高的分类准确率。

关键词：镜头；K-Means聚类；视频分类

视频是重要的多媒体数据表达形式之一，也是移动通信平台、互联网络中主要的数据存在形式之一。随着网络技术的高速发展，网络视频的数量呈爆炸式急剧增长，同时产生了大量的视频应用，如视频分类、视频索引、视频搜索等应用。视频是一类结构复杂、数据量庞大的多模态数据。从语义角度出发，同一领域的视频之间总有一定的关联。领域专家利用视频的多种属性来建立视频之间的关联，这对于视频分类、索引是非常重要的，对视频数据过滤和视频检索等应用也具有重要意义。

视频是具有多种视觉特征的多媒体数据，许多视频还具有音频特征、文本特征等。利用视频的视觉特征来实现视频分类是常见的视频分类方法。很多文献利用视频的一种或多种视觉特征來实现视频分类。比如文献中，孟丽等人基于直方图差分法实现了视频分类方法。文献中，Huang等人提出一种以文本特征实现视频分类的算法。由于视频视觉特征的多样性，利用一种视觉特征进行分类往往得不到较好的分类效果。很多文献利用多种视觉特征及音频特征实现视频分类，收到了较好的分类效果。Yang等人从视频的视觉特征、语义特征、音频特征及附加文本等进行分类，提出利用多模态分类效果优于单模态分类效果。也有很多文献从改进分类器出发，也提高了分类效果。比如YUAN等人利用决策树实现了视频分类，朱映映等人提出以词袋模型实现体育视频分类。

综合利用视频的多种物理特征，可以有效地提高视频分类准确度。本文在提取视频的颜色特征，SIFT特征、纹理特征的基础上，以改进的K-Means聚类算法为分类器对视频进行分类。算法过程：对于给定的视频Video，首先提取其颜色特征及SIFT特征；改进分类器，最后实现视频分类。

猜你喜欢

从文化类纪录片的共同模式探究传统文化的传播方式

立体视频资源存储入库研究

电脑知识与技术

2017年12期

基于改进的K—Means视频分类

猜你喜欢

杂志排行

电脑知识与技术的其它文章