Are kernel: EDAC MC0: UE page 0x0 indică o memorie defectuoasă, un driver sau altceva? (Unix, Linux, Memorie, Ram)

octopusgrabbus a intrebat.

kernel: EDAC MC0: UE page 0x0, offset 0x0, grain 0, row 7, labels ":": i3200 UE

Dintr-o dată, astăzi, sistemul nostru CentOS versiunea 6.4 (Final) a început să arunce erori EDAC. Am repornit și erorile s-au oprit.

Am căutat răspunsuri, dar acestea se încadrează în două tabere, memorie sau un chipset. Aș dori un sfat despre unde să caut mai departe pentru a restrânge acest lucru la chipset sau memorie.

Comentarii

  • Dacă nu este o mașină de producție, un memtest ar fi de ajutor. –  > Por schaiba.
1 răspunsuri
slm

Ceea ce întâmpinați este un Detectarea și corectarea erorilor eveniment. Având în vedere că eroarea include acest bit: MC0 vă confruntați cu o eroare de memorie. Acest mesaj vă spune unde anume se produce eroarea. MC0 se referă la memoria RAM din primul soclu (#0). Restul mesajului vă spune în mod specific în acel DIMM de memorie RAM în care s-a produs eroarea.

Având în vedere că primești doar una, eu aș continua să o monitorizez, dar nu aș face nimic pentru moment. Dacă aceasta continuă, atunci cel mai probabil vă confruntați cu un modul de memorie defect.

De asemenea, ați putea încerca să testați mai amănunțit folosind memtest86+.

Această întrebare anterioară intitulată: Cum să pun pe lista neagră un sector de memorie RAM defect corect, conform imdocțiunii de eroare MemTest86+? vă va arăta cum să puneți memoria pe lista neagră, dacă vă interesează și acest lucru.

Comentarii

  • Pentru a fi complet, rețineți că există interacțiuni între bug-urile BIOS și kernel în acest domeniu care pot duce la rezultate false pe chipset-urile i32xx: bugzilla.redhat.com/show_bug.cgi?id=564274 –  > Por Adrian Cox.