
Une bonne nouvelle pour les programmeurs : en présence d’un bug aléatoire et difficilement compréhensible, ils pourront lâcher : « c’est à cause des rayons cosmiques ! ! ! ». Élucubrations, aberrations, … NON, le phénomène est bien connu et depuis longtemps : dans l’espace, satellites et véhicules spatiaux doivent résister aux bombardements incessant de
particules et
rayonnements en tout genre. Au fil du temps on c’est aperçu qu’un certain nombre de ces rayonnements et d’autres anomalies pouvaient produire sur notre sol, des dysfonctionnement dans les circuits intégrés. Au niveau du Silicium des circuits intégrés ces dysfonctionnements appelés aussi
SEE (
Single Event Effect ) se classent en deux catégorie : les «
hard errors » et les «
soft errors ». Sans s’attarder sur la première, il s’agit du phénomène bien connu du « Latch-up ».
On va donc s’intéresser à la catégorie des « soft errors » appelées aussi
SEU (
Single Event Upsets ). Les SEU sont provoquées par des
radiations externes, entraînant une anomalie transitoire dans un circuit intégré numérique, suffisante pour générée une erreur sur 1 bit ou plusieurs bits. Ces anomalies sont aléatoires et rarement catastrophiques, tout dépend du système et des moyens de détection et de correction d’erreurs.
Petit rappel de physique nucléaire : les
Neutrons et les
Protons sont des Nucléons ( particule sub-atomique ), qui forment le noyau de l'atome.
On trouve trois sources externes de rayonnement susceptible de causer des SEUs : des
particules Alpha à faible énergie, des
particules cosmiques à haute énergie et des
neutrons.
Les particules Alpha sont émise à partir de matériaux radioactifs tels que l’uranium 238, le Thorium 232 ou le Polonium 210 : des traces de ces matériaux sont présentes ( par pollution ) dans certains boîtiers d’encapsulation des micro-circuits. La particule Alpha pénètre dans le substrat silicium en créant un canal ionisé d’électrons, suffisant pour créer un courant perturbateur pouvant faire basculer un transistor d’un état à un autre.
La plupart des rayons cosmiques sont arrêtés par l’
atmosphère terrestre : certains en réaction avec celle-ci, modulés par les rayonnements / particules solaires et des rayonnements cosmiques lointains, vont générer des protons et des neutrons à haute énergie. Certains d’entre eux vont arriver sur terre et pénétrer au cœur des circuit intégrés, au niveau du substrat Silicium : ici le mécanisme est différent des particules Alpha, car ces protons / neutrons à haute énergie vont bombarder les atomes de silicium : cette
nano-réaction nucléaire, produit alors des particules Alpha et des Ions qui vont finir par créer le même processus de Ionisation qu’avec les particules Alpha émises par les matériaux radioactifs. Il faut se rappeler que les Neutrons sont particulièrement pénétrant, même à travers une épaisseur conséquente de béton.
Quand ? Combien ? On mesure ces défaillance en
FIT (
Failures In Time ), qui représente le nombre de défaillances pour 1 billion d’heures de fonctionnement. 1000 FIT correspondent à peu près à un temps moyen de fonctionnement avant panne (
MTTF –
Mean Time To failure ) de 114 ans. Pour mesurer l’impact, plusieurs exemples : un téléphone portable avec une mémoire de 4-Mbits avec taux d’erreur soft ( SER - Soft Error Rate ) de 1000 FITs / Mbits peut avoir une erreur soft au bout de 28 ans : pas critique, surtout pour un portable qui est devenu du "consommable". Pour un routeur avec une mémoire de 10 Gbits et un SER de 600 FITs, il pourra se produire une erreur toute les 170 heures : le même routeur avec 100 Gbits de mémoire et on tombe à 17 heures. Un PC portable dans un avion avec une mémoire de 2 Gbits donnée pour 600 FITs, celle-ci monte à 100.000 FITs en altitude avec pour conséquence une erreur potentielle toute les
5 heures ... là ça devient déjà plus critique ! plus on monte en altitude moins les rayonnement sont arrêtés par l'atmosphère.
C'est une société Française,
IRoC Technologies, qui est à la pointe dans ce domaine : implantée à Grenoble, la « Silicon valley » Française, cette start-up est née d'un essaimage du
laboratoire Tima ( CNRS, UJF, INPG ). Sa spécialité, concevoir des circuits intégrés immunisés contre les radiations et conduire des tests de qualification dans des laboratoires très spécialisés. IRoC vise dans un premier temps les applications militaires, le spatial, l'aéronautique, les transports, le médical puis le secteur grand public dans un deuxième temps.
Faut il s’alarmer avec les SEU ? non, mais il fait savoir que cela existe et que cela n'arrive pas qu'aux autres. C’est de plus en plus vrai étant donné la complexité et la densité d’intégration exponentielle des circuits. Autre précision avant l’affolement général, les quantités de matières radioactives polluantes dans les circuit intégrés sont à des quantités « atomiques » et non dangereuses. Idem pour les rayons cosmiques : même si l’on se prends un Neutron sur la tête à la vitesse de la lumière, pas de bosse !
Tags :
ACTEL soft / firm errors -
CISCO SEU error -
Space Micro Inc -
Un excellent article sur le sujet