APP下载

图像识别技术在广播电视节目内容监播中的应用

2024-05-02

电视技术 2024年1期
关键词:图像识别电视节目广播

王 贤

(肥东县融媒体中心,安徽 合肥 231600)

0 引言

随着智慧电视、交互式技术等的发展,内容安全、知识产权、播出安全及播出质量等问题日益凸显,给广播电视节目内容的监播带来更大的考验[1]。传统的广播电视节目内容监播主要有人工监播、录像监播及音频监播等方式,但存在监播工作量大、成本高、操作复杂以及监播不全面等问题,难以满足现代广播电视内容监播需要。虽有部分先进的智能监播系统实现了对静帧、黑场等播出异态的智能监播,但在内容安全方面的智能监播能力较弱。当前,人工智能图像识别技术已经被广泛应用于交通管理、医疗诊断、安防监控及自动驾驶等领域,具有识别速度快、稳定性高、成本低、准确度高的优点,应用于广播电视节目内容的智能监播时,能以更低的监播成本提高广播电视节目的播出质量和播出安全。

1 图像识别技术

1.1 图像识别技术概述

图像识别技术是人工智能领域的重要技术,是人工智能、深度学习及机器视觉相结合的产物。该技术通过编制计算机程序来模拟人眼识别图像和大脑判断图像内容的机制,通过深度学习算法和人工智能技术学习并理解图像中的主要特征,准确地对图像内容进行识别和分类,从而如同人类一样对图像内容进行解释,以实现图像识别任务的智能化、自动化,代替人工工作并解决人工识别容易出错的问题,提高图像识别的效率和效果。经过多年的发展,目前图像识别技术已经较为成熟,能够满足多种场景下的应用需求,如军事领域、公安刑侦领域和广播电视节目内容监播领域等。

1.2 图像识别技术的分类

图像识别技术有多种分类方法,目前较常用的方法是按学习算法和识别目标进行分类。根据学习算法的不同,图像识别技术可以分为监督学习、无监督学习、自我监督学习3 类。监督学习是人工事先对学习样本图像进行明确的标注分类,指明图像内容所代表的语义,程序对学习样本图像进行学习后提取相应语义和图像特征,从而实现对图像的识别理解。无监督学习是直接将未经人工标注的学习样本赋予图像识别程序,由程序提取图像特征,根据图像特征的相似性或差异性来实现对图像的识别理解。自我监督学习同样使用未经人工标注的学习样本赋予图像识别程序。与无监督学习不同,自我监督学习会由程序给图像创建语义标签,以不太精确的语义表示图像。

2 图像识别技术的工作原理与工作过程

2.1 图像识别技术的工作原理

图像识别技术实质上是利用图像识别算法编制计算机软件程序,以模拟人类识别图像的图像信息收集和分类识别的神经网络过程。图像识别技术同样如此,通过提取图像中的特征信息,与学习经验进行对应,从而对图像内容进行识别、辨认和描述。图像的特征信息是图像识别技术的基础。图像识别技术实质上就是提取图像特征信息,排除多余信息,运用概率与统计方法对图像特征信息进行分类以识别图像内容。

2.2 图像识别技术的工作过程

图像识别技术的工作过程与人类识别图像的工作过程基本相同,可分为模型训练、特征提取、辨识描述3 个过程。模型训练相当于人类通过学习积累经验,这一阶段通过大量的图像进行学习训练,理解不同图像的模式和特征。特征提取是对需要识别的图像进行分析,提取图像的特征信息。辨识描述是根据提取出的特征信息,与学习经验进行匹配,从而完成图像内容的识别和语义描述。在广播电视节目内容的监播中,首先要收集大量的内容安全和质量问题节目图片,输入图像识别模型进行训练,让模型建立内容安全和质量问题节目内容图像经验。监播时,则通过获取节目内容的实时帧,提取实时帧图像上的特征信息,与之前学习的经验进行比对,辨别该帧图像是否存在内容安全或质量问题。

3 图像识别技术的关键算法

图像识别技术常用的有基于统计学习理论的二分类模型支持向量机(Support Vector Machine,SVM),基于图像颜色、纹理、形状等特征的特征提取算法,基于深度学习的卷积神经网络算法等。目前,应用最为广泛的是卷积神经网络算法(Convolutional Neural Networks,CNN)。该类算法综合了SVM 算法和特征提取算法的优点,通过卷积计算和深度前馈神经网络结构来模仿生物视知觉机制,具有运算速度快、可适应图像形态改变、适用范围广的优点。其细粒度类别图像识别能力甚至优于人类,在广播电视节目内容监播中有更高的适用性[2]。文章主要对较流行的ResNet101 算法、Faster R-CNN 算法、XGBoost 分类算法进行探讨。

3.1 ResNet101 算法

在广播电视节目内容监播中,文字、黑场、彩条、噪点以及静帧等的图像识别相对简单,但违规内容等安全监播和广告响应则存在多元性和异质性问题,需要更为复杂的运算以提取细节特征。标准的卷积神经网络由输入层、卷积层、池化层、全连接层及输出层构成。图像特征的提取由卷积层完成,通过多个类似于神经元的卷积核进行卷积操作,构建图像特征矩阵,完成对输入图像的特征信息的提取[3]。理论上,卷积层内部的层数越多,提取的图像特征信息就越丰富,但过多的层数会导致梯度消失和梯度爆炸问题,增加计算难度并出现网络退化问题,导致识别能力下降。

ResNet 又称残差网络算法。该算法将残差块引入卷积神经网络,构建了一种深度残差卷积神经网络算法。ResNet101 是ResNet 算法的一种,其网络结构共有101 层。该算法在Conv1 首先对输入图像进行卷积核为7×7 的卷积操作,提取图像的全局特征,再接入Conv2_x、Conv3_x、Conv4_x、Conv5_x 逐层提取图像特征。Conv2_x、Conv3_x、Conv4_x、Conv5_x 分别由3、4、23、3 个残差块构成,每个残差块包含两个3×3 的卷积层和一个跳跃连接层,共99 层。经过99 层的残差卷积操作,提取图像的小尺寸局部特征后,对最后一个残差块输出的图像特征矩阵进行全局池化,输出1×1×2 048的特征图,以提高图像特征的语义解释能力。通过浅层特征和深层特征的组合,使得所提取出的图像特征信息极为丰富,有效提高了图像识别的准确率,在广播电视节目内容监播上,满足了内容安全识别的需要。

3.2 Faster R-CNN 目标检测算法

ResNet101 算法通过多层卷积运算和池化操作,虽然使图像的全局特征和细节特征都得以提取识别,但由于网络层数太深、结构复杂,导致其运算量极为庞大,当计算机性能不足时对图像的识别速度较慢。而广播电视节目内容监播需要在极短的时间内完成对节目内容的识别并作出截播、插播等响应操作,单纯依靠ResNet101 算法很难满足广播电视节目内容监播的实时响应需求。Faster R-CNN 算法能解决ResNet101 算法识别速度过慢的问题。该算法通过感兴趣区域的检测进行裁剪后进行分类识别,使得计算量大幅度下降,能在200 ms 内完成一张图像的识别,足以满足广播电视节目内容实时监播的需要。

Faster R-CNN算法也是卷积神经网络算法的一种,同样采用了卷积神经网络的卷积层、池化层、连接层结构。但在具体的工作流程上,与ResNet101算法不同,该算法首先通过Conv Layers 提取图像的全局特征,其次生成候选框,根据候选框内包含的全局特征信息来判断是否存在需要识别的目标,并对候选框进行修正以得到更为准确的感兴趣区域,再次对感兴趣区域进行池化操作,最后对感兴趣区域的图像特征信息进行识别和语义描述。由于仅对感兴趣区域进行深层次的图像特征信息提取,使得计算量大幅下降,识别速度远快于ResNet101 算法。

3.3 XGBoost 分类算法

在广播电视节目内容监播中,除了要识别节目内容的安全性、质量,还需要进行语义描述,作为截播系统的响应函数,供监播人员参考。内容安全问题较为复杂,需要更高精度的分类运算。ResNet101算法和Faster R-CNN 算法虽然能提取出丰富准确的图像特征信息,但在分类识别和语义描述上较弱,还需要结合XGBoost 分类算法来提高分类精度和语义描述能力[4]。

XGBoost 算法通过串行多个弱分类器整合为一个强分类器,采用梯度提升决策树的方法,经过大量的反复迭代运算和交叉验证,从而提高分类计算精度。在计算中,多棵决策树共同参与分类决策,每棵决策树的结果是目标值与所有树的预测结果之差,将所有决策树的结果进行累加从而得到最终结果[5]。通过梯度提升决策树集成学习计算,XGBoost 分类算法不仅能快速准确地分类决策多数据问题,还可以解决示例之外的问题。其分类示例可达到上亿个,具有极高的分类精度和极准确的语义描述能力。

4 结语

人工智能技术在图像识别领域已经得到广泛应用,表现出极高的实用性。相较于医疗、安防、交通等领域图像识别需求,广播电视节目内容的违法违规、内容安全、播出安全、播出质量有更突出的图像特异性,在广播电视节目内容监播上应用人工智能图像识别技术有极大的可行性。但广播电视节目内容监播需要极高的图像识别速度,过深的图像特征提取计算需要更多的运算时间。ResNet101 算法可以提取更丰富的图像特征信息但运算速度较慢,Faster R-CNN 算法计算速度快但只对感兴趣区域进行识别。在具体应用中,可以将两种算法结合,同时满足识别精度和识别速度的需要。XGBoost 分类算法则具有更快速准确的分类能力和精确的语义描述能力,可以将分类和语义描述功能交由XGBoost分类算法来完成。

猜你喜欢

图像识别电视节目广播
STK及IGS广播星历在BDS仿真中的应用
基于Resnet-50的猫狗图像识别
高速公路图像识别技术应用探讨
图像识别在物联网上的应用
图像识别在水质检测中的应用
广播发射设备中平衡输入与不平衡输入的转换
周五广播电视
电视节目
关于电视节目创新的几点思考
网络在现代广播中的应用