APP下载

半导体设备AMAT P5000死机故障分析及处理

2012-09-05郭晶磊

电子与封装 2012年5期
关键词:死机制程板卡

郭晶磊,顾 吉

(中国电子科技集团公司第58研究所,江苏 无锡 214035)

1 引言

P5000设备由全球著名半导体设备厂商美国应用材料公司(Applied Materials)生产,P5000系统是世界上第一台成功的以单晶片、多反应室理念而设计的量产与研发均适用的半导体制程设备。P5000系统具有绝佳的制程整合、量产制造等优点,并在不破真空的状况下,最多有四个相同或不相同的制程反应室同时进行生产,更富有弹性和整合能力。反应原理为:材料源以气体形式进入工艺腔体内,在RF加功率的情况下,材料源(反应气体)从辉光放电(Plasma:等离子场)中获得激活能,激活并增强化学反应,从而实现化学气象淀积。在实际使用过程中,P5000平台经常会出现各种各样的死机现象,本文就针对具体的各种死机现象进行分析,并提供相关的解决方案。

2 死机代码查询方法

P5000系统软件能够自动保存最后一次死机信息,具体查看方法为:

(1)在主界面用光笔点击Service菜单,如图1;

(2)在Service下拉菜单中选择Diagnostics菜单,如图2;

(3)在Diagnostics下拉菜单中选择Last Exception Report菜单,如图3。

图1 死机代码查询界面1

图2 死机代码查询界面2

图3 死机代码查询界面3

图4 死机代码查询界面4

该死机信息同时被保存在FAULT.LOG文件中,从死机信息报告界面中我们可以得到相关信息,见图4和表1。

在表1所述信息中,最重要的是第4条(Exception number),根据该代码可以对死机原因进行分析排查,最终解决死机问题。

表1 死机信息报告内容

3 死机代码分析

3.1 Exception 2

例如Exception number 2,Bus error-FFFF4818,此类死机原因一般是因为硬件问题引起(典型的是DIO或AIO板故障),但偶尔也会是软件、VME电压和VME接地问题引起。其中FFFF4818是导致死机硬件的内存地址,从表2硬件内存地址表中我们可以查出引起此次死机的是AIO#3电路板,更换AIO #3电路板即可解决此次死机问题。

如果每次出现Exception number 2,Bus error的硬件内存地址都不相同,那么最大的可能就是VME电压被瞬间拉低,此时应该着重检查VME电压。

3.2 Exception 3

Exception 3-Address Error,软件、硬件、接地、电磁干扰均会引起地址错误死机,出现该死机问题时一般先从防电磁干扰方面着手:

(1)检查VME总线架上所有板卡上下螺钉是否拧紧;

(2)空余的插槽是否用铝合金盲板封住;

将资产管理和预算管理进行相互结合,能够对资产增量和资产存量进行有效结合,实现资产相关信息的共享。能够避免出现资源浪费现象,可以对资源进行最佳配置,有效降低资产配置不合理现象,构建鸽鸽合理高效的社会保障。

(3)设备各部件之间EMC接地线(P/N:1390-01554)是否安装;

(4)EMC接地线与设备地线间阻值是否小于2Ω。

如果电磁干扰检查没有问题,那么再从软件方面着手(格式化硬盘、重新安装系统软件等)。

3.3 Exception 4

Exception 4-Illegal Instruction,非法指令引起的死机原因(如系统软件执行了680X0机器代码之外的指令),与Exception 3相似,参照其解决方案。

表2 硬件内存地址表

3.4 Exception 5

Exception 5-Divide by Zero,引起该死机的原因是系统软件BUG,所以,从软件方面着手(如格式化硬盘、重新安装系统软件等)可以解决该死机问题。

3.5 Exception 7

Exception 7-TrapCC,该死机类型具体又分为三小类,分别是Exception 7-TRAPCC(Instruction)、Exception 7-TRAPCC(Failed to Send Software Heartbeat)和Exception 7-TRAPCC(Other)。

Exception 7-TRAPCC(Instruction),引起该死机的原因是日期或时间冲突,一般指千年虫问题,可通过系统升级的方法来解决该问题。

Exception 7-TRAPCC(Other),一般可通过重启解决该问题。

3.6 Exception 24

Exception 24-Spurious Interrupt,引起该死机的原因是VME系统总线IACK信号跳线设置错误,检查每个VME系统总线插槽,如果有板卡那么插上的IACK信号跳线应该为断开,如果没有板卡那么插上的IACK信号跳线应该为短路。

3.7 Exception 31

该死机类型具体又分为三小类,分别是Exception 31-Sys-Fail、Exception 31-Abort Unknown和Exception 31-Memory Parity Error。

Exception 31-Sys-Fail,引起该死机问题一般比较典型的是VME系统总线电源系统和接地问题,可以从以上两方面去解决问题。

Exception 31-Abort Unknown,引起该死机问题一般比较典型的是VME系统总线接地问题或不小心碰了SBC主板上的“abort”按钮,对于后者,只需重新启动系统就行了。

Exception 31-Memory Parity Error,引起该死机问题一般是由于V440型号的SBC主板运算时奇偶校验错误,对于此问题,必须将SBC主板升级至MA3版本。

3.8 Exception 39

该死机类型具体又分为三小类,分别是Exception 39-Failed to Send Software Heartbeat、Exception 39-Message Pool Full和Exception 39-Memory Pool Full。

Exception 39-Failed to Send Software Heartbeat,引起该死机问题的类似于Exception 7-TRAPCC(Failed to Send Software Heartbeat),可参照其解决方案。

Exception 39-Message Pool Full,引起该死机问题的原因是系统执行两个任务的时候信息量过载,当信息量大于255条时会导致死机,重新启动系统可解决该问题。

Exception 39-Memory Pool Full,一般系统软件会自动填充和清空内存地址,当系统只填充不清空内存地址时就会导致该内存池出错死机,一般重启可解决。3.9 Exception 46

Exception 46-Array Range Error,一般是因为软件问题引起的死机,可参照Exception 5-Divide by Zero解决该问题。

4 小结

除上述死机代码之外,有些机台可能还会出现一些其他类型的死机代码,也需要用相应的方法来解决,在一时查不出问题的时候可以尝试着从接地、电源、硬盘、软件等方面入手,往往可以取得意想不到的效果。

猜你喜欢

死机制程板卡
提醒
台积电又推先进制程增强版本N7P和N5P
基于PCI9054的多总线通信板卡的研制
基于FPGA的多通道模拟量采集/输出PCI板卡的研制
焊接式轴流风叶的制程与工艺装备保障
脸死机了
一种基于光纤数据传输的多板卡软件程序烧写技术
一种通用模拟量及开关量信号采集板卡的设计
计算机“死机”故障原因与排除
计算机“死机”故障原因与排除