才看到知乎上有人討論這個話題。之前有很多人介紹過單粒子效應的基本概念了,不再重復。在這裏澄清幾點:
1. Cisco 公告的摘要說,軟錯誤問題的可能原因是單粒子效應(single event effect),並沒有提到宇宙射線。我沒有cisco賬號,沒看到報告的全文,但猜測在全文裏也沒有提宇宙射線。對於地面套用,引起單粒子效應的輻射源,更有可能是芯片封裝材料裏的放射性同位素在alpha 衰變中放出的alpha粒子,而不是宇宙射線。在沒有充分證據的情況下怪罪老天,會遭天遣的。
2. 地面器材因為單粒子效應出現軟錯誤,並不是什麽新鮮事。2001年底,Sun 公司的 UltraSparc 高端伺服器出現無規律的當機,就是緩存芯片裏的軟錯誤造成的。等到幾個月後 Sun 公司找到原因並更開始換出問題的緩存時,這個事件已經對 Sun 的信譽造成了無可挽回的負面影響。2004年,Xilinx 公司的部份 FPGA 芯片也出過類似的單粒子效應問題。這兩次事件都是由於芯片封裝材料中的放射性同位素引起的,和宇宙射線沒啥關系。如下圖所示,出問題的 Xilinx FPGA 芯片采用了倒封裝工藝,Flip-Chip焊球距離晶片上的晶體管有源區只有幾個微米的距離。焊錫(鉛錫合金)中的微量放射性同位素會發生alpha衰變。例如,同位素釙210 (鉛210的衰變產物)會發射 5.3 MeV 的 alpha 粒子,並衰變成鉛206。這個alpha粒子會在電路中產生單粒子效應,引起軟錯誤。