Fastly culpa a error de software por gran caída global de Internet

Información General

La compañía implicada en una importante interrupción global de Internet esta semana, dijo que el incidente fue causado por un error en su software que se desencadenó cuando uno de sus clientes cambió su configuración.

Fastly Inc, la compañía implicada en una importante interrupción global de internet esta semana, dijo el miércoles que el incidente fue causado por un error en su software que se desencadenó cuando uno de sus clientes cambió su configuración.

La caída del martes generó dudas sobre la dependencia en Internet de algunas empresas de infraestructuras. El problema de la empresa tumbó sitios de alto tráfico, incluidos proveedores de noticias como The Guardian y The New York Times, así como los sitios del gobierno británico, Reddit y Amazon.com.

"Esta interrupción fue amplia y severa, y realmente lamentamos el impacto en nuestros clientes y en todos los que dependen de ellos", dijo la compañía en una publicación de blog escrita por Nick Rockwell, su ejecutivo senior de ingeniería e infraestructura. Según indicó, el problema debería haberse anticipado.

Fastly opera un grupo de servidores estratégicamente ubicados en todo el mundo para ayudar a sus clientes a mover y almacenar contenido cerca de sus usuarios finales de forma rápida y segura.

La publicación de la compañía proporcionó una línea de tiempo de los eventos y prometió examinar y explicar por qué la compañía de servicios de computación no pudo detectar el error del software durante su propio proceso de prueba.

En tanto, dijo que el error estuvo en una actualización de software enviada a los clientes el 12 de mayo, pero que no se activó hasta que un cliente no identificado realizó la configuración y provocó el problema, "que hizo que el 85% de nuestra red devolviera errores".

Fastly detectó la caída al minuto de ocurrir a las 0947 Hora media de Greenwich (GMT), y los ingenieros resolvieron la causa a las 1027 GMT. Una vez que deshabilitaron la configuración que desencadenó el problema, la mayor parte de la red de la empresa se recuperó rápidamente.

"En 49 minutos, el 95% de nuestra red estaba funcionando con normalidad", dijo la empresa. Sus redes se recuperaron por completo a las 1235 GMT y comenzó a implementar una solución de software permanente a las 1725 GMT, señaló la firma.

Dejá tu comentario