La semana pasada lo vimos todo. Vuelos estadounidenses bloqueadosgente atrapado en un tren Amtrak frío y oscuro durante 29 horas y todos los clientes de Twitter de terceros dejar de trabajar al mismo tiempo.
Obviamente, una de estas cosas es más terrible que las otras, pero todas comparten una cosa en común: fueron derribadas porque la tecnología detrás de ellas se “rompió”. Ninguno de nosotros debería sorprenderse.
No estoy criticando a las personas responsables de mantener bien engrasada la maquinaria. Estoy seguro de que es un trabajo difícil y en su mayoría desagradecido trabajar detrás de escena para asegurarse de que todos los parches se mantengan y que nada crítico falle. Pero tenemos que darnos cuenta de que la mayoría de las veces la tecnología es como una gran torre Jenga en la que solo se necesita un movimiento en falso.
Lo has experimentado de primera mano, al igual que yo. Los proveedores de servicios de Internet quiebran. Los operadores telefónicos tienen cortes. Instagram y todos los demás servicios que muchas personas usan y les gustan pueden dejar de funcionar al azar y siempre estarán sujetos a interrupciones aleatorias. Por lo general, se solucionan rápidamente. En general (se abre en una nueva pestaña).
Odiamos que nos moleste todo esto. Cuando WhatsApp o Twitter fallan, los sitios web de tecnología como Android Central se inundan con informes de problemas para que podamos correr la voz, así que sé cuánto odia la gente cuando el software o el servicio que quieren usar deja de funcionar, aunque sea por un tiempo. ‘ .
Lo que muchos de nosotros, a menudo soy culpable aquí también, olvidamos es lo complicado que puede ser incluso lo más simple. Estamos por grabar nuestro podcast semanal. Esto se debe a cuatro servicios diferentes que se ejecutan en nuestras computadoras individuales y un servicio de comunicación basado en la nube que funciona según lo previsto. Cuando llega el momento de cambiarlo, esos servicios también deben funcionar bien. Finalmente, el servicio que usa para escucharlo y cómo accede a Internet deben funcionar. Un error en el sistema significa que todo se detiene.
Si algo tan simple como grabar un podcast de una hora puede depender de tanta tecnología, imagine lo que se necesita para mantener la industria de las aerolíneas en funcionamiento. Sistemas para alimentar la parte delantera para que pueda obtener un vuelo, métodos para realizar un seguimiento de dónde están los aviones para que el avión correcto esté en el lugar correcto en el momento adecuado, técnicas para realizar un seguimiento del equipaje de los pasajeros, etc. todos deben funcionar perfectamente.
Todo esto, más la tecnología crítica que mantiene a los aviones volando y a los pasajeros seguros, depende de los servidores, el software y las personas. Cuando falta una pieza de este rompecabezas tecnológico, todo tiene que detenerse hasta que se “arregle”. Redundancia, donde tiene copias de seguridad de partes críticas de la infraestructura en funcionamiento en caso de que uno se dañe, ayuda y es bueno, pero a veces no es suficiente y tiene vuelos en tierra durante 12 horas o personas atrapadas en un tren porque un tren en otra vía está roto o incluso API rotas que matan a clientes de Twitter de terceros al mismo tiempo.
Es fácil, ya menudo divertido, culpar a alguien. ¿Han fallado los sistemas de la FAA? El alcalde Pete lo hizo. ¿Todos los clientes de Twitter están rotos? Elon debe haber despedido a alguien otra vez. ¿Tiene Instagram un apagón? El robot Zuckerberg necesita ser desenchufado y luego vuelto a enchufar. En realidad, sin embargo, no es así como funciona.
Sí, el secretario Buttigieg podría haber intentado sabotear la industria de las aerolíneas, pero todos sabemos que no lo hizo. Musk ha encontrado formas creativas de ahorrar dinero en Twitter, por lo que tal vez esté eliminando el acceso de terceros. Es posible pero muy improbable. Zuckerberg probablemente necesite un reinicio de vez en cuando, por lo que el modo matar a todos los humanos no se activa, pero no es así como arreglas Instagram.
Lo estamos viendo como es. Si parece estar empeorando, es porque usamos más servicios que dependen de tecnología complicada, y cada falla es magnificada hasta el enésimo grado por los sitios y los usuarios de tecnología.
Tu cable siempre ha tenido roturas. Su operador siempre ha tenido problemas. Twitter siempre ha tenido una gran ballena azul. Incluso la FAA ya ha dejado en tierra los aviones debido a problemas técnicos. Va a seguir sucediendo, y lo único que la tecnología no puede solucionar es evitar que la tecnología se averíe y necesite reiniciarse, repararse o reemplazarse.
Esto no es realmente un problema y existen sistemas para mantenerlo así. Ya sea que se trate de políticas de seguridad como las que hemos visto con la FAA o la redundancia del servidor para que WhatsApp pueda volver a funcionar lo antes posible, las personas que construyen el siglo XXI saben que el castillo de naipes puede derrumbarse y planificarlo. Pero apesta cuando sucede en un momento en que usted quieres jugar en tu teléfono o hacer algo productivo.
Estoy seguro de que las formas de reparar la tecnología cuando se rompe son parte del movimiento para implementarla en primer lugar. Si no, ChatGPT puede decirnos cómo solucionarlo, apuesto.