Si algo dejó al descubierto el apagón de Facebook, WhatsApp e Instagram de este 4 de octubre de 2021 fue la gigantesca infraestructura qué hay detrás para que las personas puedan enviar a diario fotos, videos, mensajes y más.
Y es que mire el tamaño del gigante: Facebook tiene alrededor de 2 mil 900 millones de usuarios activos cada mes, mientras que WhatsApp tiene otros 2 mil millones, Facebook Messenger unos mil 300 millones, e Instagram mil 221 millones. ¿No le parece una locura?
Tras siete horas de apagón, Santosh Janardhan, vicepresidente de Infraestructura en Facebook decidió salir a contarnos qué fue lo que sucedió y a mostrarnos un poco de lo qué hay detrás de sus servicios.
El fallo se debió, dijo, a una falla en el sistema que administra la capacidad de su red troncal global, y señaló que consta de miles de millas de cables de fibra óptica que cruzan el planeta para conectar todos sus centros de datos.
Su explicación nos dejó asomar a las entrañas de la compañía, que es precisamente su infraestructura: “algunos son edificios masivos que albergan millones de máquinas que almacenan datos y ejecutan las cargas computacionales pesadas que mantienen nuestras plataformas en funcionamiento, y otros son instalaciones más pequeñas que conectan nuestra red troncal a Internet en general y a las personas que usan nuestras plataformas”.
Difícilmente un usuario regular de Facebook, WhatsApp o Instagram se imagina o se pregunta siquiera qué es todo lo que tiene que ocurrir detrás, en cables de fibra óptica o centros de datos, para poder subir un Reel o mandar los stickers de la niña coreana por WhatsApp.
Un apagón masivo como el de esta semana sucede cuando las empresas y la infraestructura es masiva, y es increíble cuánto ha ampliado su reino Mr. Mark Zuckerberg.
En resumen, Santosh Janardhan explicó que pasa lo siguiente: “cuando abres una de nuestras aplicaciones y cargas tu feed o mensajes, la solicitud de datos de la aplicación viaja desde tu dispositivo a la instalación más cercana, que luego se comunica directamente a través de nuestra red troncal a un centro de datos más grande. Ahí es donde la información que necesita tu aplicación se recupera y procesa, y se envía de vuelta a través de la red a su teléfono”.
Y cómo dije, una empresa masiva, con infraestructura masiva, necesita también un trabajo de mantenimiento masivo, que a decir del jefe de infraestructura de la empresa, realizan por etapas.
Explicó que durante uno de estos trabajos de mantenimiento de rutina, se emitió un comando con la intención de evaluar la disponibilidad de la capacidad de la red troncal global, que accidentalmente cortó todas las conexiones en su red troncal, lo que desconectó los centros de datos de Facebook a nivel mundial.
También explicó que sus sistemas son inteligentes y auditan comandos como el mencionado para evitar apagones como el ocurrido, pero eso también les falló y todo empeoró conforme pasó el tiempo.
No es mi intención hablar de tecnicismos pero detrás del apagón hubo errores de algoritmos, de consultas de DNS, conexiones, protocolos de enlaces, y mucho más, mientras en Twitter nos quejábamos de la caída o compartíamos memes, y mientras otros muchos millones descargaron otras apps como Telegram (70 millones de usuarios nuevos a raíz del apagón del 4 de octubre) en sustitución de WhatsApp.
El responsable de la infraestructura de Facebook reveló que realizan “simulacros de tormenta” regularmente para prepararse ante eventualidades como la ocurrida, sin embargo, como dicen, los fierros no tienen palabra de honor, y menos si éstos son masivos.
Así es que por lo pronto ya nos explicaron un poco de lo que ocurre detrás de nuestras pantallas, a través de millones de cables y computadoras poderosas, para simplificar nuestro día a día.
La próxima vez que ocurra un apagón, porque puede estar seguro de que así será, piense en todo este mundo desconocido, para la mayoría, que hay detrás.
C$T-GM