APP下载

航天器单粒子效应的防护研究

2010-03-20刘必鎏杨平会蒋孟虎王雯雯

航天器环境工程 2010年6期
关键词:抗辐射航天器器件

刘必鎏,杨平会,蒋孟虎,王雯雯,张 磊

(中国人民解放军某部队, 北京 100094)

0 引言

单粒子效应(SEE)是指高能带电粒子在穿过微电子器件时,在器件内部敏感区产生电子-空穴对,这些电荷被灵敏器件电极收集后,造成器件逻辑状态的非正常改变或器件损坏。由于这种效应是单个粒子作用的结果,因此称为单粒子效应或单粒子事件[1]。空间辐射环境中的高能质子、中子、α粒子、重离子等都能导致航天器电子系统中的半导体器件发生单粒子效应,严重影响航天器的可靠性和寿命[2-3]。除了空间高能粒子以外,各种核辐射、电磁辐射环境也是造成单粒子效应的重要原因。由于单粒子效应对航天器的严重威胁,国内外对单粒子效应的发生机理、模拟计算、辐射源模拟实验和飞行实验开展了广泛而深入的研究,提出了各种抗辐射加固措施。

1 单粒子效应的分类

根据出现的故障及其发生机理的不同,单粒子效应分为单粒子翻转、单粒子闭锁、单粒子烧毁、单粒子栅穿等十几种,如表1[1,4]所示。在这些效应中,单粒子烧毁、单粒子栅穿、单粒子位移损伤和单粒子位硬错误是永久损伤,也称为硬错误,即通过重新写入或断开电源,被辐射器件不能恢复正常状态,器件彻底损坏。单粒子闭锁在不采取保护措施的情况下,也会导致永久损伤。其他效应均为软错误,器件可以恢复正常状态,而且都是由粒子入射产生的瞬态电流引起,与单粒子翻转有密切的关系[1]。

表1 单粒子效应的分类和描述Table 1 Classification and description of single event effects

2 单粒子效应的研究方法

目前国内外主要从模拟计算、辐射源模拟实验和飞行实验 3个方面深入研究单粒子效应的发生机理、规律,测试各种星载电子元器件和集成电路的辐射敏感参数,评价其抗单粒子效应的水平和故障风险,从而为器件选型和抗辐射加固措施提供依据。

模拟计算是通过构建物理模型、仿真计算得到目标位置的辐射剂量,预测可能的辐射损伤,这涉及到物理模型的构建和仿真计算两部分。辐射源模拟实验是通过建立简化的实验室环境来模拟实际的空间辐射环境,获得辐射参数与器件受损之间的准确关系。辐射源模拟实验可以分为辐射环境设置(辐射源选取、实验标准)、器件受损参数测定和后续数据分析3个环节[5]。常见辐射源包括脉冲激光、高能离子源(锎、镅、锶等)、中子模拟源、质子直线加速器和重离子加速器等,这些辐射源的实验成本和实验复杂度大致呈递增趋势[1,4-5]。飞行实验是通过测量实际空间辐射环境下星载电子设备发生单粒子效应的几率,分析单粒子效应的发生规律、影响因素和电子设备真实的抗单粒子效应水平,从而为星载电子设备的抗单粒子效应设计提供可靠支持。到目前为止,美英等国已经开展了大量的单粒子效应飞行实验,如英国的UoSat系列小卫星、美国的APEX(高级光电子试验)卫星[4,6]。国内的空间辐射单粒子效应飞行实验主要在“实践四号”、“实践五号”卫星上进行[4]。

3 单粒子效应的防护技术

到目前为止,国内外对单粒子效应的防护开展了卓有成效的研究,从材料/元器件的选择、制作工艺、电路/程序设计、屏蔽封装等方面提出了许多防护措施,主要可以分为硬件加固技术和软件加固技术两大类。

3.1 硬件加固技术

3.1.1 避错设计

避错设计主要从工艺上提高航天器电子元器件的可靠性,通过对元器件的严格筛选,对系统进行屏蔽加固,提高航天器抗单粒子效应的能力。

按照国际通用的分类方法,电子元器件等级一般可分为宇航级或883B级、军品级、工业级、商业级[7]。航天器设计时对电子元器件的选择通常有2种途径[1,7]:1)优先选择经过抗辐射加固、可靠性高的宇航级器件或 883B级器件;2)在没有可供选择的宇航级或883B 级器件情况下,或为了满足系统的高性能要求,可以有控制地使用商用器件。当然,商用器件的选用必须经过严格的筛选测试,剔除具有早期失效危险和固有缺陷的器件,提高器件的可靠性。

随着空间技术的发展,新材料的开发非常重要。例如,与传统的体Si材料制作的集成电路相比,使用SOI材料制作的集成电路在抗单粒子效应方面具有显著的优势。SOI的技术优势来源于在顶层 Si膜与 Si衬底之间引入绝缘层作为介质隔离层,称为埋氧层。埋氧层一方面使器件的P-N结面积减小,从而降低了其收集电离电荷的能力,另一方面也使埋氧层以下的衬底中的电离电荷不能进入器件的结区被收集[8]。

抗辐射的一个传统的方法是进行屏蔽加固,即利用卫星蒙皮、设备机箱或加局部屏蔽(如铝、钽、钨)的方法提高器件的抗辐射水平。但是,屏蔽对高能粒子的作用有限,而且屏蔽材料的厚度受到卫星体积和质量的制约。“实践五号”卫星针对空间单粒子事件效应的研究结果表明:屏蔽可以减少单粒子翻转的概率,但不能完全避免。

3.1.2 容错设计

容错设计是利用外加资源的冗余技术屏蔽故障的影响,使局部的故障不会扩散到全局。冗余的方法通常有硬件冗余、软件冗余、时间冗余和信息冗余等[9],其中硬件冗余是一种重要的硬件加固技术。

硬件冗余通过增加额外的单元器件,利用额外的硬件掩盖故障造成的影响,这样即使系统中的一部分硬件出现故障,整个系统仍能正常工作。按照工作机理,硬件冗余可以分为工作冗余(并联和表决系统)和非工作冗余(备份系统),其中应用最为广泛的是三模冗余(TMR: Triple Module Redundancy)技术[9-11]。多数表决器的实现可以用一组“与或”门来实现,典型的三模冗余结构如图1[9]所示。

图 1 三模冗余结构Fig. 1 Triple Module Redundance (TMR) structure

TMR技术的优点在于速度快,在一定程度上提高了系统的可靠性;缺点是需要3倍硬件备份,所以质量、面积、功耗都会增加,特别是当三模选举电路本身出现故障时就会产生错误的表决结果,导致整个系统的错误。因此,有必要对TMR技术进行改进。目前已经提出了多种改进方案,如筛选型三模冗余结构和基于演化硬件的TMR表决机制设计[9]。

3.1.3 硬件重构

对于不能通过容错技术进行多数表决的数据,如果系统判定为硬件故障,可以采用硬件重构的方法恢复系统的正常工作。其中,动态重构方法(图2)可以在星上总控单元的控制下,实时地检测错误并自主地修复错误,或者接受地面控制系统的重构指令进行动态重构并修复错误,目前这种方法被星上平台广泛采用[9]。动态重构可以利用有限的资源来实现超大规模的系统时序功能,即时分复用的设计思想;也可以动态修复由于单粒子效应而造成的系统暂态故障,恢复系统正常工作。动态重构大致可以分为基于模块的动态重构、基于差异的动态重构和基于Bitstream的动态重构3种。通过硬件的动态重构,可以及时地恢复系统的正常工作,并且利用N∶M的备份方式在冗余保护和体积功耗之间找到一个理想的平衡点[9]。

图2 硬件动态重构流程Fig. 2 Hardware dynamic reconfiguration process

3.1.4 若干实用技术[4-6,9-13]

在实践的基础上,国内外研究人员提出了许多实用的抗单粒子效应的措施,其中许多都已经应用到航天器中。

1)监测报警:作为一种抗辐射加固措施,对电子设备遭受的空间辐射强度进行适时监测,并采取适当而有效的控制措施,如及时切断电源,这对提高卫星寿命和可靠性具有十分重要的意义。

2)擦洗的方法:FPGA在单片机或者自身内部程序控制下,定期对其片内RAM进行擦洗或重写,保证SRAM中数据的正确性,消除单粒子翻转现象对系统影响。这种方法的优点是无需额外的硬件逻辑资源,实现简单;缺点是无法对擦洗数据进行校验,不能判断是否发生过单粒子事件,而且只能恢复暂态故障。

3)设置检错纠错功能模块:对关键部位要有修正电路,修正RAM 的1位翻转,检出RAM的2位翻转。修正电路内部不允许有存贮元件,防止发生软错误。

4)设置硬件计数器:在软件进入死循环、时间计数器不起作用时,由硬件计数器复位,即计数器在规定时间内不被清除时就发出复位信号,重新启动机器,从死循环中解脱。

5)正确设置看门狗(WDT):为系统正常/故障起动提供识别标志,再由软件按不同标志进行不同初始化处理。设置合适的IC 保护电路,对读取时间、传递时延、电流门限等应留有足够的余地。

6)限流技术:抗锁定电阻的选取应折衷考虑,即尽量使电阻大些,让锁定的可能性最小,而且不干扰正常工作。限流技术对大系数CMOS器件型号有明显效果,但不是对所有的都有效。

3.2 软件加固技术

3.2.1 信息冗余

几乎所有卫星都会采用信息冗余的方法,通过在数据中附加冗余的信息以达到故障检测、故障掩蔽或容错的目的。与硬件冗余技术相比,信息冗余能够节省很大的存储空间,其主要途径是利用检错码和纠错码。

在星载固态存储器领域,目前最常用的存储区检错纠错编码方式主要有汉明(Hamming)码、R-S(Reed-Solomon)码。例如,太阳日光层观测卫星OSHO的大容量固态存储器上使用了汉明码,地球观测卫星EOS的大容量固态存储器上使用了R-S码,TWR公司在CASSIM航天器和NMMP计划中则使用了改进的汉明码[14]。汉明码是基本奇偶校验的扩展,成本较低,一般只需要110%至140%的冗余度,可以减少存储器的使用空间,从而减小系统的功耗与体积;应用比较灵活,可以针对8位、16位、32位数据进行纠错,并且有现成的商用器件可供使用,对于内存访问时间要求不苛刻的场合均可以适用,其代价是冗余硬件资源和处理延时[15]。在同样的开销和输入误码率条件下,R-S纠错编码具有更高的性能,具有同时纠正突发错误和随机错误的能力,被广泛地应用于数据通信和数据存储系统的差错控制中[14]。

3.2.2 软件冗余

软件冗余是为了纠正软件本身及硬件偶然失效所产生的错误,可以分为静态冗余和动态冗余两种。静态冗余用来屏蔽故障的影响,使系统或部件环境看不到故障的影响;动态冗余在运行过程中指示系统或部件输出有错,并对错误进行处理。常用的软件冗余方法有软件N版本设计技术、软件恢复技术和软件三模表决系统[11]。

软件冗余在理论上简单,但是由于把容错汇总到软件程序中需要大量的时间和精力,因此在实际操作中有很大难度。随着处理器性能的提高、存储器容量的增大以及嵌入式系统的发展和应用,软件冗余将得到进一步的发展。

3.2.3 时间冗余

时间冗余的基本思想是重复进行计算以检测故障,按照重复计算是在指令级还是在程序段级,可以分为指令复执和程序卷回[11]。时间冗余相对于硬件冗余和信息冗余受硬件资源的限制较小,具有高度的反复性,占用时间较长,适用于硬件资源短缺而时间资源充裕的场合,但不适合微小卫星。

3.2.4 若干实用技术[5-6,10-13]

1)程序模块化:把程序固化在PROM中使信息不受SEU影响。

2)对模块输入、输出口标签值进行预置、检查和复位:每一个模块入口的标签值已初始化,出口有约定标志;对只执行一次指令码,仅在退出该模块之前检查一次标签值;对循环指令码,标签值在每次循环迭代时都检查一次;程序退出该模块,标签值复零;使所有输入/输出指令至少执行两次后生效;两次指令放在不同模块的边界处。

3)把由地面随机参数的确定减少到最低限度:将尽量多的注数和修正数固化在 PROM,减少RAM因SEU使数据变化的可能性。

4)三取二表决法:对关键数、需修改数和中间数,同时将其存入在分割开的3个不同的RAM中,实行周期性最优刷新法。

5)输出数据实行双机或单机时间差比对:对输出数据通过比对问题再3取2表决;若仍然不能解决问题,交系统管理软件分析,确定是硬件故障还是软件错误,若属前者则通过硬件重构,然后返回应用软件继续进行。

6)模式间转换采用直跳式而不用存储器跳转方式。

7)数据区与程序区必须隔离,避免程序进入RAM区而冲毁其中数据。

8)段存贮器置初值:由中断服务程序执行给段存贮器置初值,若段存贮器出现SEU使程序出错,可恢复段存贮器的值。

9)对CPU、PROM、RAM空闲区全部填充HLT指令或其他指定内容。若程序一旦跳入空闲区就进行跑飞程序处理,将程序拉回。

10)设置软件看门狗(WDT):当程序按正常路径执行时,不断清除WDT。如果程序进入死循环,则WDT在规定的时间内不被清除,发出计算机复位信号,进行初始化处理,使计算机重新开始运行,从死循环中解脱出来。

3.3 轨道优化设计

航天器的单粒子效应防护措施还必须考虑空间环境的影响。因为不同空间环境下,高能粒子、高能射线等的分布不同,航天器发生单粒子效应的风险也就不同,而航天器所处的空间环境与其运行轨道及飞行期间太阳活动情况密切相关[10,15-16]。“实践五号”卫星的飞行实验表明,对于近地轨道,单粒子翻转的发生概率约是1×10-7/(bit·d)的量级,而在南大西洋辐射异常区和太阳活动高峰期发生概率可能提高一个或数个量级[10]。因此,在航天器的抗单粒子效应设计中,必须结合航天器的任务需求及其工作期间的太阳活动情况,优化轨道设计,降低航天器发生单粒子效应的风险,这也有利于降低抗单粒子效应加固的成本。

4 结束语

恶劣的空间环境使得航天电子器件面临发生单粒子效应的风险,尤其是随着半导体器件集成度的不断提高,单粒子效应越来越严重,已经成为影响航天器可靠性和运行寿命的重要因素。目前,国内在单粒子效应的发生机理、航天器的抗单粒子效应加固方面已经开展了比较深入的研究,进行了一系列的地面模拟实验甚至是飞行实验,但是与航天发达国家的研究水平相比还存在较大的差距,在单粒子效应模拟实验的设备研制、实验标准和评估方法、地面模拟实验和空间飞行实验的相互验证、商用器件的抗辐射性能研究、新型材料和器件的开发等方面有待进一步改进和提高。

[1] 刘征. 单粒子效应电路模拟方法研究[D]. 国防科技大学硕士学位论文, 2006: 6-13

[2] 周旸. 星载电子设备抗辐照分析及器件选用[J]. 现代雷达, 2008, 30(9): 25-28

[3] 王同权, 戴宏毅, 沈永平, 等. 宇宙高能质子致单粒子翻转率的计算[J]. 国防科技大学学报, 2002, 24(2): 11-13

[4] 丁义刚. 空间辐射环境单粒子效应研究[J]. 航天器环境工程, 2007, 24(5): 283-290

[5] 冯彦君, 华更新, 刘淑芬. 航天电子抗辐射研究综述[J]. 宇航学报, 2007, 28(5): 1071-1080

[6] 华更新, 王国良, 郭树玲. 星载计算机抗辐射加固技术[J]. 航天控制, 2003(1):10-15;21

[7] 姜秀杰, 孙辉先. 航天电子系统中电子元器件选用的途径分析[J]. 电子器件, 2005, 28(1): 40-43

[8] 何玉娟, 刘洁, 恩云飞, 等. SOI MOSFET抗辐射加固的常用方法与新结构[J]. 半导体技术, 2008, 33(3) : 223-226

[9] 李志刚, 张彧, 潘长勇, 等. 抗单粒子翻转的可重构卫星通信系统[J]. 宇航学报, 2009, 30(5): 1752-1776

[10] 张钰, 郑阳明, 黄正亮, 等. 皮卫星星载计算机存储模块的容错结构设计[J]. 宇航学报, 2008, 29(6): 2057-2061

[11] 宋丹, 杜刚, 田贺祥. 容错设计在微纳卫星上的应用[J].中国航天, 2007(12):16-18

[12] 范景德. 对卫星抗辐射加固保证大纲的探讨[J]. 原子能科学技术, 1997, 31(3): 272-277

[13] 宋明龙, 朱海元, 章生平. 卫星抗辐射加固技术[J].上海航天, 2001(2): 56-60

[14] 张宇宁, 杨根庆, 李华旺, 等. 星载高速海量存储系统的并行RS纠错方法[J]. 航天控制, 2009, 27(3): 86-89

[15] 侯睿, 赵尚弘, 胥杰, 等. 卫星光通信系统中SRAM/MOS器件的单粒子翻转率分析[J]. 光学技术, 2009, 35(2): 244-247

猜你喜欢

抗辐射航天器器件
2022 年第二季度航天器发射统计
2019 年第二季度航天器发射统计
每天面对电脑必吃的的七种抗辐射食物
2018 年第三季度航天器发射统计
2018年第二季度航天器发射统计
雪莲培养物保健品制备及其功效研究
旋涂-蒸镀工艺制备红光量子点器件
一种加载集总器件的可调三维周期结构
高分辨率遥感相机CCD器件精密热控制
电子新闻