Cloudflare: Lecciones y mejoras tras la interrupción para fortalecer la resiliencia digital

Cloudflare ha tenido problemas... y sabemos que cuando eso pasa, muchos servicios online suelen tenerlos también. A partir de las 4:00 a.m. PST/PDT, la empresa anunciaba que había comenzado a investigar un problema técnico que podría estar afectando a varios de sus clientes.

Este inconveniente fue reflejado también en plataformas de seguimiento como Downdetector, que comenzaron a reportar un aumento en las incidencias en grandes nombres como Canva, X (Twitter), Movistar, League of Legends y OpenAI, la matriz de ChatGPT, afectada en su servicio web. Los usuarios notaban dificultades para acceder a estos servicios, lo que causó una gran cantidad de quejas y alertas en sitios de monitorización de caídas.

Imagen de error de acceso a Twitter a causa de los problemas de Cloudflare

“Hemos fallado a nuestros clientes”

En un comunicado a mediodía, la empresa explicó que habían detectado “un pico de tráfico inusual en uno de los servicios de Cloudflare a partir de las 11:20 UTC. Esto provocó errores en parte del tráfico que pasaba por la red de Cloudflare. Aún desconocemos la causa de este pico de tráfico inusual. Estamos trabajando intensamente para garantizar que todo el tráfico se gestione sin errores. Posteriormente, nos centraremos en investigar la causa del pico de tráfico inusual.” 

Aunque la situación sigue siendo monitorizada, Cloudflare anunciaba que estaba trabajando en resolver el incidente,9 y explicaba que registraba “Errores 500 generalizados, el panel de control de Cloudflare y la API también están fallando”.

Posteriormente, la compañía daba un poco de esperanza a los usuarios: “Estamos viendo una recuperación de los servicios, pero los clientes podrían seguir observando tasas de error más altas de lo normal mientras continuamos con los esfuerzos de remediación”. Sin embargo, poco después, los problemas volvían a repuntar, aunque hacia las 14:42 UTC por fin Cloudflare explicaba que “una solución había sido implementada” y creían que el incidente ya estaba resuelto.

Poco después, las incidencias en las distintas plataformas comenzaban a caer de forma acelerada y todo parecía volver a la normalidad.

Finalmente, el CTO de la compañía, Dane Knetch, publicaba en X un comunicado en el que admitía las culpas y pedía perdón por lo sucedido:

“No me andaré con rodeos: hoy mismo fallamos a nuestros clientes y a internet en general cuando un problema en la red afectó a un gran volumen de tráfico que depende de nosotros. Los sitios web, las empresas y las organizaciones que confían en Cloudflare dependen de nuestra disponibilidad y les pido disculpas por las molestias ocasionadas.

Es fundamental que hayamos aclarado lo sucedido, y en unas horas publicaremos un informe detallado. En resumen, un fallo latente en un servicio que sustenta nuestra capacidad de mitigación de bots comenzó a fallar tras un cambio de configuración rutinario. Esto provocó una degradación generalizada de nuestra red y otros servicios. No se trató de un ataque.

Ese problema, el impacto que causó y el tiempo que tardó en resolverse son inaceptables. Ya estamos trabajando para que no vuelva a ocurrir, pero sé que hoy causó verdaderos inconvenientes. La confianza que nuestros clientes depositan en nosotros es lo que más valoramos y haremos todo lo posible para recuperarla”.

I won’t mince words: earlier today we failed our customers and the broader Internet when a problem in @Cloudflare network impacted large amounts of traffic that rely on us. The sites, businesses, and organizations that rely on Cloudflare depend on us being available and I…

Por qué es tan importante Cloudflare para Internet

Cloudflare es uno de los pilares fundamentales de la infraestructura de Internet moderna. Aunque muchas personas no lo conocen directamente, sus servicios impactan a miles de millones de usuarios a diario, sin que se den cuenta. Cloudflare actúa como un escudo de protección para los sitios web. Su red de distribución de contenido y su firewall de aplicaciones web ayudan a proteger los sitios de ataques maliciosos. Esto significa que, sin importar el tamaño de un sitio web, puede estar protegido contra ciberataques que busquen desbordar sus recursos y hacer que deje de funcionar.

Otro de los grandes beneficios de Cloudflare es su red de servidores distribuidos por todo el mundo. Esto permite que los contenidos de los sitios web se carguen más rápido, ya que las solicitudes de los usuarios se redirigen al servidor más cercano. Así, las páginas web no solo se ven más rápido, sino que también tienen mejor rendimiento, lo cual es crucial para una buena experiencia de usuario.

En los últimos meses, Cloudflare ha adquirido una notoriedad inusual para una marca como la suya, a raíz del conflicto vivido con LaLiga, alrededor de la protección de los derechos de autor en las retransmisiones deportivas. Según LaLiga, servicios como Cloudflare permiten que plataformas ilegales escondan su identidad, dificultando su cierre y facilitando la emisión no autorizada de partidos de fútbol. Pero el bloqueo de direcciones IP relacionadas con Cloudflare impulsado por LaLiga no solo afectó a páginas piratas, sino también a sitios web legítimos que utilizan sus servicios para mejorar su seguridad y velocidad. Esto provocó un “apagón digital” que dejó a muchos usuarios sin acceso a diversas plataformas en internet, despertando críticas sobre la efectividad y proporcionalidad de las medidas adoptadas.

Marketing4ecommerce

 

InternetNCCloudflare, Markting4ecommerce