APP下载

标清硬盘播出系统的维护及故障判断处理

2016-03-01杜小东

西部广播电视 2016年12期
关键词:工作站硬盘服务器

杜小东

(作者单位:和田地区广播电视台)

标清硬盘播出系统的维护及故障判断处理

杜小东

(作者单位:和田地区广播电视台)

和田电视台于2013年完成了新硬盘播出系统的改造任务,新系统承担6套标清播出频道的播出任务。由播出服务器系统、总控及播出切换系统、上载/控制系统、播出内容管理系统、播出周边系统等设备组成。主要硬件系统有:播出上载视频服务器系统、相关播出控制的计算机系统、播出管理计算机系统、视音频系统、播出切换系统及各类应用服务器等。主要应用软件有:播控软件、应急上载软件、技审平台软件、FTPServer软件、系统监控软件、播出内容管理软件等。系统运行三年来,比较安全、平稳。下面根据本台硬盘播出系统的安全措施分析及维护实践中遇到的故障处理进行浅析。

硬盘播出系统;和田电视台;故障判断

1 数据库维护

确认数据库维护计划是否执行:主要是看备份文件是否定期备份和删除。数据库硬盘存储空间:查看数据库文件占用硬盘空间大小,一般80%为警戒线,超过80%就必须第一时间清理。如果发现数据文件过大(日志文件),就要做分离操作。掌握数据库服务器运行时资源占用情况:主要查看CPU和内存的使用情况,如果内存占用率过高,可重启服务器释放内存。各播出、上载、字幕及编单等工作站重启:重新初始化播出工作站状态,消除系统隐患。删除7天前的节目单list。删除1个月前的系统log日志。各播出工作站保存本地配置:一旦网络或数据库出现故障,可以本地启动工作站。检查播控系统各种日志是否存入日志归档数据库。总控矩阵管理机:由于是Windows系统,要定期对其运行状态进行检查,重启系统。

每6个月全系统重启或重启核心应用服务器,使Windows操作系统释放内存和重新初始化系统状态,消除系统长期运行产生的冗余,避免这些产生死机或运行变慢。每次维护须做维护日期标志悬挂在指定位置。

2 系统应急故障判断及处理

故障处理原则:当出现故障时,必须以最短的时间将信号切换到备播系统或者应急播出系统,之后进行故障的排查、处理、汇报。判断方法:利用各监视器和监听系统,迅速判断出故障的大致部位,并采取有效地应急措施,以最快的速度查找出问题所在点,立即处理,尽快恢复播出。报告原则:出现播出故障无论是节目还是技术故障均应急播出、迅速判断、排查处理后及时报告科、部领导;如果一时无法解决播出故障,在应急播出后及时电话报告科、部领导,以求技术支持。

2.1 系统通道故障的应急处理

故障现象1:当主输出监视器画面的主信号均出现异常,且PST、PGM异常,但是备播线路正常,且备路PST和PGM都正常。措施:立即将该频道控制台上的应急开关解除锁定,切换到备路键(主切换器PGM切换为EXT),使用备路应急播出。原因:切换台故障。

故障现象2:主输出监视器的画面异常,而备输出监视器画面正常。措施:立即使用切换器切换备路信号,或用跳线将信号跳过主视频分配器输出。原因:主输出视频分配器故障。

故障现象3:主硬盘输出监视异常(主、备监视器,主备视分监视器,PST、PGM以及应急监视器均出现异常)而备硬盘输出监视正常。措施:在切换台切备硬盘播出。原因:主硬盘故障,或其输出视频分配器故障。

故障现象4:台标时钟发生器发生异常。措施:使用切换台内键上台标,启用字幕机作台标播出。原因:台标机故障或其输出两个视频分配器故障。

故障现象5:转播总控外来信号,出现信号不正常时或出现非法内容。措施:切换其他正常的总控外来信号播出并及时向领导汇报。原因:信号源问题或分配器问题或信号源遭受非法攻击。

故障现象6:各总控外来信号均不正常或出现非法内容。措施:切垫片,并与导播、总控、总值班联系,酌情处理。原因:信号源问题或总控问题。

故障现象7:转播开始时或播出中,主、备硬盘输出信号突然同时静帧或黑场。措施:切矩阵播出。原因:该频道上载终端或播控软件问题。

故障现象8:硬盘播出广告或素材组过程中切换下一节目时主、备硬盘突然出现静帧。措施:在播控终端的工具栏操作按钮下拉菜单中点击“播放”一般能解决问题(注:如此时用“TAKE”功能键时会跳过下一条素材造成漏播)。原因:多半是因为前一条素材长度太短(如小于6秒)造成服务器没有准备好下一节目引起。

故障现象9:播出中字幕机死机或者切换台上对应的键源按键变红。措施:重启字幕机。原因:字幕机故障。

故障现象10:播出中发现切换台所有按键失效。措施:立即将该频道控制台上的应急开关面板解除锁定,按下备路键(主切换器上的PGM切到EXT),使用备路播出,或使用机房的切换器进行切换;按一下切换面板内的复位开关,若仍不能解决则将该切换台主机内的复位开关复位一下,或重新导入配置,待切换台恢复正常后,切回主路播出。原因:该切换台故障。

故障现象11:主视频服务器工作不正常。措施:切备视频服务器进行播出。原因:视频服务器故障或素材问题导致视频服务器故障。

故障现象12:素材在制定时间内没有传输到播出。措施:检查策略服务和同步软件是否正常,如果紧急,则手动发起传输。原因:策略服务或同步软件问题。

故障现象13:OMNEON视频服务器或OMNEON存储硬盘亮红灯。措施:拨打厂商400电话或联系厂商工程师。原因:硬盘故障。

故障现象14:所有工作站无法访问数据库。措施:手动切备数据库并重启主数据库。原因:数据库故障。

2.2 同步系统故障

故障现象1:播出中出现时钟、台标、字幕漂移或无法上键。措施:查询同步系统图,分析出同步信号的来源,并对上一级同步卡进行更换原因:上一级同步卡故障,或同步线问题。

故障现象2:切换某一信号源时台标或字幕无法正常加上。措施:立即下键并检查该路信号源的同步信号连线情况,是外来信号的与总控联系,检查帧同步机是否已开。原因:信号未同步,或总控的帧同步机没开。

故障现象3:切换某一信号源时台标或字幕颜色不正常,但位置稳定。措施:调整该路信号源的副载波相位和行相位。原因:该信号源副载波相位和行相位不准。

2.3 控制系统故障

故障现象1:主控制机死机或无法控制播出。措施:立即使用备控制机接管播出。原因:主控制机问题或主控软件问题或者是该机的供电问题。

故障现象2:视频服务器无法控制。措施:重置此视频服务器,如果问题依旧则尝试备机接管。原因:控制接口或软件或视频服务器出现故障。

故障现象3:主控电脑中,“切换台故障”红色告警。措施:立即把主切换台的PGM档切换到EXT档,使用备切换器。原因:切换台不受控,控制故障。

故障现象4:某一设备或几个设备同时不受控时(播控终端出红色告警)。措施:先倒换到备播控终端试试,不行再切出能控制的垫片播出(录像机可手动启动),如主切换台不受控则使用“2 选1”应急开关倒换到备路播出,手动控制播出,更换控制线或倒换器。原因:控制线或倒换器没有同步工作。

故障现象5:播控软件中主硬盘或备硬盘状态错误。措施:在播出程序的设备运行状态窗口选择硬盘图标,点击“R”进行“重置服务器”。原因:视频服务器状态检测故障。

2.4 播控工作站故障

故障现象1:主播控工作站对其下游设备,包括视频服务器、VTR、切换台及切换器等其中的某些或全部的控制失效;或者主播控工作站死机。措施:如果备播控工作站没有进行对播出任务的自动接管,必须采用手动控制的方式在备播控工作站执行接管操作,保证播出正常进行;然后,排查主播控工作站的具体故障原因,包括422倒换器的工作状态、主播控工作站Moxa卡的工作状态、主播控工作站控制软件的工作状态以及主播控工作站的供电问题等;待设备恢复正常后,再次改由主播控工作站接管。

故障现象2:主、备播控工作站对视频服务器HDD、VTR、切换台及切换器等设备的控制同时失效;或者出现主、备播控工作站死机。措施:采用手动操作,控制切换台、VTR和垫片信号进行应急播出,并按照下面的顺序进行故障排查,一是检查4倒换器是否出现正常,检查电源是否松动、倒换卡是否损坏、控制线连接是否断开;二是检查主、备播控工作站Moxa卡的状态是否异常。

2.5 数据库服务器故障

故障现象1:播出主数据库服务器瘫痪。措施:通过Autostart将数据库切换至备数据库服务器,并对各个工作站进行重连数据库操作,以保证正常播出;同时重启所有软件,然后恢复瘫痪的数据库服务器。

故障现象2:播出主备数据库服务器同时瘫痪。措施:此时,播控软件自动从保存在本地的配置文件读取设备控制信息,可以利用LINE和垫片信号进行应急播出;然后恢复瘫痪的数据库,并将各工作站重新指向恢复的数据库。

故障现象3:主数据库服务器无法启动;或者操作系统报错,如磁盘空间已满、内存不足等。措施:此时备数据库服务器应该已经自动接管了数据服务业务;在播控工作站上执行“重连数据库”操作,恢复正常播出;对于其他受影响的工作站可重启软件并重连数据库;恢复主数据库服务器;最后,手动控制主数据库服务器上线和备数据库服务器下线,使数据库备份机制恢复正常。

2.6 以太网络故障

故障现象1:播控系统中所有工作站、视频服务器和数据库服务器的网络连接同时出现异常。无法进行素材同步、迁移和回迁等操作。措施:此时播控软件可以从保存在本地的配置文件读取设备控制信息,可以利用LINE和垫片信号进行应急播出;然后,检查以太网交换机,如果交换机出现故障,必须立即维修或更换。待交换机故障排除后,恢复正常播出。

故障现象2:播控系统中的个别工作站无法连接数据库服务器,无法从播出数据库读取素材信息和控制信息。措施:检查该工作站任务栏中网络图标、网线连接和网卡状态是否正常,如果主播控工作站无法连接播出数据库,采用手动方式由备播控工作站进行接管,保证正常播出。

故障现象3:以太网交换机端口故障,当链接设备的以太交换机端口发生故障时,该故障端口链接的工作站将表现为网络连接断开,不能正常登录域,无法使用。措施:应关闭故障端口链接的工作站,将该工作站链接到以太交换机的正常端口,重新启动该工作站投入正常使用即可。

故障现象4:当链接设备的以太交换机发生故障时,该故障设备链接的工作站将表现为网络连接断开,不能正常登录域,无法使用。措施:交换机为3台H3C交换机,使用堆叠结构。任意一台出现故障,全网均可能出现故障。此时请联系公司售后部门,进一步解决问题。

故障现象5:当多台或所有交换机发生故障时,以及无法给交换机供电时,则为整个网络发生故障,网络中的大部分设备无法相互通信。

措施:1)请不要关闭播控工作站上的播控软件,播控软件按节目单正常播出;2)修改节目单时,只能添加线路类型信号节目;3)使用矩阵控制工作站中的矩阵控制软件修改矩阵路由;4)字幕机请使用本地方式进行字幕的制作和播出;5)系统业务稳定后,之后请联系售后部门,进一步解决问题。

2.7 字幕机工作站故障

故障现象1:正常开启的字幕机无法接收到播出节目单。措施:检查字幕机数据库的消息服务是否开启

3 节目和素材造成的问题

情况1:播出过程中出现主、备硬盘信号同时静帧。措施:在播控终端处点开“操作”菜单,按“HDD1同步播放”“HDD2同步播放”,如无效则切垫片。原因:素材在上载时出了问题。

情况2:硬盘播出过程中发现主备硬盘的画面或伴音均不正常。措施:切垫片或用信号线路播出。原因:该素材在上载过程中出了问题。

情况3:播出过程中发现素材内容与要求不符。措施:切垫片或使用外来信号播出。原因:节目上载错误。

4 视频服务器故障的判断和处理

视频服务器的故障有硬盘故障、网络故障、I/O模块故障、文件系统故障及电源故障。若服务器前面板状态指示灯都正常,则表明服务器工作正常,此时不需特殊操作。若发现服务器工作不正常时,可结合状态指示灯及系统管理软件来判断具体故障原因,并针对不同故障执行不同的处理方法。

4.1 硬盘故障

硬盘故障是服务器存在的主要故障,查看RAID状态指示灯,呈浅蓝常亮的话,RAID正常。若状态指示灯呈黄色闪烁,则说明系统内有故障硬盘。登录SystemManager软件,进入DiskUtilities页面,查看物理硬盘及RaidSet的状态,故障硬盘的状态应该是Dead或者Failed,进入故障硬盘属性页面,查看硬盘所在位置,点击RemoveDrives按钮,等待30秒后,将故障硬盘取出,插入一块新的硬盘,系统将自动进行RAID重建。要注意收集故障硬盘的信息,如故障时间、故障描述、硬盘序列号、硬盘唯一标识及故障时段的系统日志等。

4.2 处理器模块故障

处理器模块是服务器核心模块,而且没有热备份。处理器模块的工作异常,就意味着整台服务器的工作状态会出错。处理器模块上有两个网络端口,一个负责文件传输,一个负责编、解码的控制;有两个同步信号端口,为服务器内部编、解码提供同步信号。而处理器模块的故障一般包含以下几个方面。

4.2.1 网络故障

网络故障的判断过程中,若以太网状态指示灯呈蓝色闪烁则表示网络存在故障问题,这时外部设备不能正常访问服务器。网络故障的原因可能是系统内交换机和连接的线缆故障造成的,这时更换网线及交换机端口即可解决。

4.2.2 同步信号故障

对同步信号故障,其状态指示灯呈深蓝色,则表示没有同步信号接入。此时可认为是同步信号故障。同步信号丢失会导致服务器编、解码信号间断性闪黑。这时更换同步信号源,若问题得以解决,那么说明是外部同步信号源的问题。若是处理器模块内部发生故障,那么只能返厂维修。

4.3 I/O模块故障

查看I/O模块状态指示灯,若是关闭状态,则表示模块故障。这时登录SystemManager软件,进入模块属性页,点击“Winkon”按钮打开模块状态灯,找到具体模块,停止模块上所有播放通道的工作,点击Reboot重启。若故障还不能得到解决,那么返厂维修。

4.4 电源故障

结合服务器背板各个电源模块的指示灯判断电源模块是否故障,发现电源模块故障时,拔除电源线后,直接更换电源模块即可。

5 结语

硬盘播出系统的维护和应急处理,是一个较为系统的工程,涉及到整个系统的方方面面,一旦某个环节出现问题,就可能导致播出事故甚至是停播,这在电视台的安全播出中是绝对不允许的。所以我们一定要高度重视硬盘播出系统的日常维护,要熟悉整个系统的设计布局,一旦出现问题要及时找出问题的节点,在保证安全播出的情况下,尽快解决问题。此外,要有完善的应急预案,通过日常维修,把可能会出现问题的环节提前处理,使安全播出的风险降到最低。

猜你喜欢

工作站硬盘服务器
左权浙理大 共建工作站
戴尔Precision 5750移动工作站
HiFi级4K硬盘播放机 亿格瑞A15
Egreat(亿格瑞)A10二代 4K硬盘播放机
通信控制服务器(CCS)维护终端的设计与实现
PowerTCP Server Tool
得形忘意的服务器标准
建立工作站 力促杂志健康发展
——《行政科学论坛》杂志工作站挂牌运行
计算机网络安全服务器入侵与防御
我区电视台对硬盘播出系统的应用