24.10.2025 - 09:40
|
Actualització: 24.10.2025 - 12:31
Amazon ha revelat que la causa de l’avaria d’AWS d’aquesta setmana —que va deixar hores fora de servei milers de webs i aplicacions— és un error en el programari d’automatització del sistema de DNS, amb conseqüències en cadena arreu del món. Segons que ha explicat la companyia en un informe detallat, el problema es va originar per un “defecte latent” dins el sistema automàtic de gestió del DNS del seu servei de bases de dades DynamoDB, utilitzat per nombrosos clients per emmagatzemar-hi dades.
El sistema manté centenars de milers de registres DNS i utilitza processos automàtics per actualitzar-los, afegir capacitat quan cal, gestionar errors de maquinari i distribuir el trànsit de manera eficient. Tanmateix, un registre buit al centre de dades de la regió nord-americana de Virgínia (US-East-1) va provocar el col·lapse. L’error no es va reparar automàticament i va requerir la intervenció manual d’operadors per corregir-lo.
AWS ha informat que ha desactivat temporalment els mecanismes automàtics de planificació i aplicació del DNS de DynamoDB arreu del món mentre treballa per corregir les condicions que van originar la fallada i afegir-hi més mesures de protecció.
El problema també va afectar altres serveis d’AWS, fet que va agreujar l’abast de la interrupció.