APP下载

基于改进的K—Means视频分类

2017-07-29查日盼彭太乐

电脑知识与技术 2017年12期
关键词:镜头

查日盼 彭太乐

摘要:针对视频分类准确率低的难题,文中提出一种改进的K-Means算法,并以此算法为分类器来实现视频分类。首先提取视频的颜色特征、SIFT特征及纹理特征;改进传统的K-Means聚类算法,以标签视频样本形成初始聚类值,进一步优化距离函数,实现视频分类。通过实验表明:该文提出的分类算法具有较高的分类准确率。

关键词:镜头;K-Means聚类;视频分类

视频是重要的多媒体数据表达形式之一,也是移动通信平台、互联网络中主要的数据存在形式之一。随着网络技术的高速发展,网络视频的数量呈爆炸式急剧增长,同时产生了大量的视频应用,如视频分类、视频索引、视频搜索等应用。视频是一类结构复杂、数据量庞大的多模态数据。从语义角度出发,同一领域的视频之间总有一定的关联。领域专家利用视频的多种属性来建立视频之间的关联,这对于视频分类、索引是非常重要的,对视频数据过滤和视频检索等应用也具有重要意义。

视频是具有多种视觉特征的多媒体数据,许多视频还具有音频特征、文本特征等。利用视频的视觉特征来实现视频分类是常见的视频分类方法。很多文献利用视频的一种或多种视觉特征來实现视频分类。比如文献中,孟丽等人基于直方图差分法实现了视频分类方法。文献中,Huang等人提出一种以文本特征实现视频分类的算法。由于视频视觉特征的多样性,利用一种视觉特征进行分类往往得不到较好的分类效果。很多文献利用多种视觉特征及音频特征实现视频分类,收到了较好的分类效果。Yang等人从视频的视觉特征、语义特征、音频特征及附加文本等进行分类,提出利用多模态分类效果优于单模态分类效果。也有很多文献从改进分类器出发,也提高了分类效果。比如YUAN等人利用决策树实现了视频分类,朱映映等人提出以词袋模型实现体育视频分类。

综合利用视频的多种物理特征,可以有效地提高视频分类准确度。本文在提取视频的颜色特征,SIFT特征、纹理特征的基础上,以改进的K-Means聚类算法为分类器对视频进行分类。算法过程:对于给定的视频Video,首先提取其颜色特征及SIFT特征;改进分类器,最后实现视频分类。

猜你喜欢

镜头
“微时记”:学生习作的助跑器
丁东亚的“镜头”
三维场景浏览中建筑造型的特点及镜头运用
电视画面编辑技巧
从文化类纪录片的共同模式探究传统文化的传播方式
立体视频资源存储入库研究