febrero 23, 2009

Cuestión de memoria

Trás tener problemas en una copia masiva por scp del tipo:
Received disconnect from x.x.x.x: 2: Corrupted MAC on input.

La cosa pintaba a un fallo hardware, ya previamente en la instalación de la máquina había usado el memtest86 sin que revelara problemas en la memoria, pero como no había ganas de conectar monitor etc he encontrado el memtester, que testea la memoria en espacio de usuario, le dices el tamaño que quieres reservar y se dedica a operar sobre el mismo (es conveniente usar el máx tamaño disponible, no pruebes esto en máquinas en producción ;) ). Un análisis satisfactorio daría resultados como el siguiente:
# memtester 1000M
memtester version 4.0.7 (64-bit)
Copyright (C) 2006 Charles Cazabon.
Licensed under the GNU General Public License version 2 (only).

pagesize is 4096
pagesizemask is 0xfffffffffffff000
want 1000MB (1048576000 bytes)
got 1000MB (1048576000 bytes), trying mlock ...locked.
Loop 1:
Stuck Address : ok
Random Value : ok
Compare XOR : ok
Compare SUB : ok
Compare MUL : ok
Compare DIV : ok
Compare OR : ok
Compare AND : ok
Sequential Increment: ok
Solid Bits : ok
Block Sequential : ok
Checkerboard : ok
Bit Spread : ok
Bit Flip : ok
Walking Ones : ok
Walking Zeroes : ok

Loop 2:
Stuck Address : ok
Random Value : ok
Compare XOR : ok
Compare SUB : ok
Compare MUL : ok
...

En la máquina en cuestión, la ram parece un poco podrida, pero solo bajo ciertas circunstancias:

FAILURE: 0x2424242424242424 != 0x2525252525252525 at offset 0x029391e9.
FAILURE: 0x2424242424242424 != 0x2525252525252525 at offset 0x029391ea.
FAILURE: 0x2424242424242424 != 0x2525252525252525 at offset 0x029391eb.

Solución: RAM a la basura...

comentarios: