APP下载

直升机某显示系统蓝屏故障的研究

2020-02-03江忠英

电子技术与软件工程 2020年19期
关键词:蓝屏看门狗机上

江忠英

(海装驻南昌地区军事代表室 江西省景德镇市 333000)

1 引言

某显示系统作为直升机航电系统重要组成部分,通过多功能显示器显示飞行状态信息、综合态势信息等重要飞行信息。显示器蓝屏故障是某显示系统常见故障之一,对显示器蓝屏故障进行研究和梳理,可提高排故效率,保证载机的完备率。

2 故障现象

某型机飞行过程中,某显示系统出现“蓝屏”故障,现象为多功能显示器“蓝屏”,持续约20s 后恢复正常画面,在之后两次试验中,数次出现“蓝屏”现象。第一次试验发生“蓝屏”现象17 次,其中左屏发生11 次,右屏发生6 次;第二次试验发生“蓝屏”现象14 次,其中左屏发生12 次,右屏发生2 次。

3 故障定位

3.1 故障原因

某显示系统组成主要包括:1 台处理机、2 台多功能显示器、1台多功能键盘和1 个光标控制器。针对蓝屏现象,对某显示系统中各组成逐级进行定位分析,可以形成如图1、图2、图3所示的故障树。

高速直升此次某显示系统出现“蓝屏”故障表现为多功能显示器“蓝屏”,此次故障首先定位为多功能显示器故障。多功能显示器的原理框图见图4。

通过故障树以及原理框图对多功能显示器蓝屏故障进行分析,得到多功能显示器“蓝屏”可能原因如下:

头部显示组件故障,具体故障原因包括:

(1)LVDS 接收故障;

(2)FPGA 逻辑故障;

(3)5V 不稳引起复位。

电源板组件故障,具体故障原因包括:

(1)5V 受到干扰;

(2)飞机供电短时掉电;

(3)电源块工作异常。

DP 组件异常,具体故障原因包括:

(1)DP 组件视频输出接口电路异常;

(2)SGM 模块视频处理逻辑异常;

(3)SGM 模块复位。

3.2 故障排查

对以上故障可能原因进行分析及排查:

图1:某显示系统故障树

图2:多功能显示器故障树

首先头部显示组件故障中,头部显示组件作为产品的显示终端,接收DP 组件生成的LVDS 视频信号,经过特定的调制转换后以图形的方式呈现在液晶显示屏幕上。当头部显示组件检测到DP 组件发送的LVDS 信号不存在或者不正常时,会自身生成蓝屏显示画面。但是头部显示组件中LVDS 接收部件一旦出现故障,就不会自动恢复,一直保持故障状态,机上蓝屏发生后会在约20s 后自动恢复,可判断显示头部组件生成蓝屏画面并非LVDS 接收部件故障,同时观察了视频记录仪(DVR)对多功能显示器的视频输出记录,当多功能显示器出现蓝屏现象时,对应的视频记录仪上也显示无视频输出,因此可以确认,多功能显示器出现蓝屏故障是由于头部显示组件未接收到外部LVDS 信号输入而主动生成的蓝屏画面;FPGA 负责对接收到的LVDS 信号进行识别和调制转换,一旦出现故障,就不会自动恢复,应该一直保持故障状态,因此也并非FPGA 逻辑故障;头部显示组件当5V 不稳时,会重新复位,出现黑屏,然后蓝屏3 秒左右开始正常,与机上蓝屏然后20s 后恢复正常不符,所以也排除5V 不稳引起蓝屏复位。

图3:DP 组件故障树

图4:多功能显示器原理框图

接着关于电源板组件故障,其中产品5V 供电受到干扰后,会引起电源监视芯片产生复位信号,或者芯片由于供电不稳工作异常。干扰分为内部走线干扰和外部信号地受到干扰。产品内部走线是将电源块产生的5V 电压通过软线分别给DP 组件和头部显示组件,测量5V 输出波形如图5,纹波在80mv 左右,未有明显干扰波动,所以排除内部走线干扰。

图5:5V 电源纹波测量

图6:加入延时及异或操作后逻辑时序图

电源板组件将5V 提供给DP 组件和液晶屏组件,信号地和壳体地相互分开,对外交联时,仅DP 组件将信号地引出,作为DVI视频传输的回路地信号。DVI 传输线选用四芯同轴线缆,用屏蔽层作为信号地回路。所以电源板组件的5V 电源被外部干扰的可能是通过DP 组件DVI 传输线上的信号地被干扰;机上蓝屏重启后,首先考虑是否存在机上供电掉电现象,通过与飞行员了解蓝屏重启发生时,未进行任何操作,同时其他供电设备未出现掉电现象,如果是长时间掉电,液晶屏会出现黑屏现象。通过监控,蓝屏时未出现掉电现象,所以排除机上供电短时掉电引起蓝屏故障;产品5V 供电是通过DC-DC 电源模块将28V 转为5V 进行供电,电源块选用VICOR 电源块V28C5M50BL,该电源块输出功率为50W,工作温度-55°C ~100°C,通过贴合在电源板组件壳体进行散热。而产品5V 所需功耗不大于35W,产品经高温工作(70℃)长时间工作4 小时以上摸底,未出现性能下降引起蓝屏重启现象,机上蓝屏重启故障发生时间早、中、晚和起飞前后都出现过,和工作温度无关,所以排除工作温度过高和老化性能下降引起的蓝屏故障。

最后关于DP 组件异常,产品蓝屏20s 后恢复显示,时间上与DP 组件复位的时间比较吻合,同时观察产品发送给视频记录仪上记录的产品蓝屏时的显示画面,记录仪上显示黑屏(即没有视频输出),证明在蓝屏期间,DP 组件工作异常。通过监控软件监控发现,在蓝屏发生时,DP 组件响应了复位信号,DP 组件在复位期间无视频输出。由此可以判断多功能显示器蓝屏故障是由于DP 组件复位重启无视频输出引起。

3.3 故障确认

由于具体分析DP 组件复位重启无视频输出的原因:

3.3.1 DP 组件视频输出接口电路损坏排查

DP 组件视频输出接口电路为功能电路,通路上无任何逻辑电路,若视频输出接口电路损坏,则表现为视频持续无输出,与机上约20 秒时间后视频恢复现象不符,因此排除DP 组件视频输出接口电路损坏原因。

3.3.2 SGM 模块视频处理逻辑异常排查

可造成DP 组件无视频输出的FPGA 功能电路异常主要包括:FPGA 异常重启或复位、FPGA 译码解码出现错误、FPGA 部分Logic Cell 损坏或不能正常工作。如果FPGA 异常重启或复位,则会快速启动(复位重启时间约为700ms),而蓝屏现象持续时间为20s 左右,远远大于FPGA 重启或复位的时间。如果FPGA 译码解码出现错误,则伴随视频分辨率错误、或出现丢帧的情况发生,现象为显示器黑屏、或显示器闪屏。如果FPGA 部分Logic Cell 损坏或不能正常工作,则表现为稳定出现某一现象,因此可排除SGM模块视频处理逻辑异常原因。

3.3.3 SGM 模块复位排查

通过机上监控软件采集的故障信息显示,在产生蓝屏的飞行架次,DP 组件中的SGM 模块均产生了复位,在未产生蓝屏现象的飞行架次无任何复位信息记录。在试验室环境测试,SGM 模块产生一次复位并重启过程会产生一段近20 秒的视频无输出时间,与机上蓝屏时间吻合,故定位视频无输出故障与SGM 模块复位直接相关。

通过初步排查得到结果为DP 组件故障中的SGM 模块复位问题,进一步分析,SGM 模块出现复位问题原因如下:

(1)二次电源掉电;

(2)外部复位源复位;

(3)看门狗复位。

通过机上监控软件采集的故障信息显示,在任何飞行架次,都未产生任何二次电源掉电记录;同时,在试验室环境下对二次电源芯片供电能力进行测试,测试结果为二次电源芯片可满足二次供电需求且留有充足余量,在主供电正常的情况下,不会产生异常掉电。因此可排除二次电源异常掉电原因。通过将外部复位源全部禁用,并对外部复位源信号进行监控,在任何飞行架次,都未产生任何外部复位触发记录,且在禁用所有外部复位后,依然有蓝屏现象发生。因此可排除外部复位源复位原因。通过机上监控软件采集的故障信息显示,在产生蓝屏的飞行架次,DP 组件中的SGM 模块均产生了看门狗复位记录,复位次数与蓝屏次数吻合,在未产生蓝屏现象的飞行架次无任何复位信息记录,结合飞机转三亚试飞后,应用软件才开启看门狗功能,故定位视频无输出故障与SGM 模块触发看门狗复位直接相关。产生SGM 模块看门狗复位的直接原因可归类为:软件异常未喂狗、复杂环境误触发看门狗、看门狗逻辑内部误触发。

(1)软件异常未喂狗排查。通过机上监控软件采集的故障信息显示,在任何飞行架次,都未产生任何软件喂狗信号超时记录;同时,分析应用软件代码,若产生软件运行异常状态导致看门狗的情况下,应在蓝屏故障发生前视频画面会有持续1.65 秒的卡顿,通过回看视频记录仪视频,蓝屏故障发生前并未有任何卡顿现象。因此可排除软件异常未喂狗原因。

(2)电磁干扰误触发看门狗排查。在蓝屏故障发生后,多功能显示器有针对性的又进行了CS114、CS115、CS116、静电、EFT等试验,并在试验标准基础上加强试验条件,试验结果表明只有在静电试验中,使用静电枪将冲击电压提高到16kV 后连续对视频口和测试口的航插放电,会出现蓝屏现象,此蓝屏现象为高强度静电冲击导致PCIe 传输链路中断,是CPU 内部自检机制报错,由CPU发起硬件复位。在正常的静电试验条件下无法产生蓝屏现象,且在三亚现场对机上产品进行静电放电试验,无法复现蓝屏现象,因此,此种蓝屏现象与机上蓝屏故障现象不一致,排除电磁干扰触发看门狗原因。

(3)看门狗逻辑内部误触发定位。通过机上监控软件采集的故障信息显示,在产生蓝屏的飞行架次,DP 组件中的SGM 模块均产生了喂狗逻辑产生输出信号记录,产生信号次数与蓝屏次数吻合,在未产生蓝屏现象的飞行架次无任何复位信息记录,故定位视频无输出故障与看门狗逻辑内部直接相关。

通过在试验室环境下,对喂狗逻辑逐条操作进行监控,发现看门狗逻辑会产生采集软件喂狗信号丢失的情况,而丢失喂狗信号达到看门狗门限时间后,即会触发看门狗复位,导致SGM 模块复位,视频无输出。因此定位看门狗逻辑喂狗信号采集代码缺陷导致视频无输出故障。

综上所述,多功能显示器蓝屏故障是SGM 板看门狗逻辑喂狗信号采集代码缺陷导致DP 组件复位、视频无输出故障,进而表现出产品蓝屏故障。

4 故障解决方法

本文为解决因SGM 板看门狗逻辑喂狗信号采集代码缺陷引起的多功能显示器蓝屏故障,修改看门狗喂狗信号采样逻辑代码,将喂狗信号WDI 延时两个时钟周期,并将延时后的信号与演示前的信号做异或操作,通过此一系列操作,重新构造出一个稳定的且持续时间超过两个时钟周期的高电平信号WD_WDI_DELAY,以此信号作为采样源进行喂狗信号采样,保证每个喂狗信号都可以被正确采样,避免丢失喂狗信号,进而修复看门狗复位导致视频无输出,出现蓝屏故障。

如图6所示,经过两个时钟周期延时后重构出的WD_EDGE信号产生了足够的高电平脉冲宽度。在T2 时刻、T3 时刻及T4 时刻三个时钟上升沿处处于建立时间充足的稳定状态,可被正确采集,保证了喂狗信号采样不丢失。纠正措施不改变看门狗喂狗信号周期,针对对喂狗信号进行采样时,进行时钟脉宽补充,来防止采样建立时间不足的问题,由于看门狗喂狗信号周期远大于采样周期,因此此项纠正措施不会影响看门狗功能的正常工作,对其他逻辑功能也无任何影响,不影响产品功能。

5 结束语

某显示系统蓝屏属于重大技术问题,此故障会直接影响直升机的普通飞行、执行任务等工作。本文以 “某显示系统蓝屏”现象为例进行分析,对较为常见的蓝屏故障进行了定位分析,蓝屏故障是由于多功能显示器中的DP 组件内部的SGM 模块看门狗逻辑软件设计缺陷引起视频无输出进而表现为蓝屏。更改某显示系统逻辑之后,蓝屏问题得到解决。

猜你喜欢

蓝屏看门狗机上
无惧死机 看懂蓝屏背后的秘密
把他叫醒
如何鉴别正版Windows
机上上网,开启乘机新时代
基于PLC的变频器控制系统在甩干机上的研究
自作聪明
一种采用FPGA实现的通用看门狗电路