
Incendio en centro de datos del gobierno interrumpe servicios administrativos principales: crisis revela vulnerabilidades críticas en infraestructura digital nacional
Un incendio catastrófico que ocurrió en el centro de datos del Instituto Nacional de Gestión de Recursos de Información (NIRS) en Daejeon el 24 de septiembre de 2025 desencadenó una interrupción sin precedentes de los principales servicios gubernamentales en línea de Corea del Sur, exponiendo vulnerabilidades críticas en la infraestructura digital nacional. El siniestro, que paralizó servicios esenciales incluyendo Gov24, Hometax, y sistemas del Seguro Nacional de Salud durante más de cuatro horas, afectó directamente a 237 agencias gubernamentales y millones de ciudadanos. Hasta el 27 de septiembre, algunos servicios críticos aún están en proceso de recuperación completa, mientras el gobierno ha declarado una emergencia nacional de ciberseguridad y celebrado reuniones extraordinarias para evaluar la magnitud del daño y desarrollar medidas de prevención de recurrencia.
Anatomía del desastre: cronología y causas técnicas
El incendio se originó a las 10:35 a.m. del 24 de septiembre en la sala del Sistema de Alimentación Ininterrumpida (UPS) del Centro NIRS No. 2, ubicado en el complejo tecnológico de Daedeok en el distrito de Yuseong, Daejeon. La instalación, que alberga servidores críticos para 237 agencias gubernamentales, experimentó lo que los especialistas han identificado como un caso clásico de "fuga térmica" en su sistema de baterías de iones de litio de última generación.
Según el informe preliminar de la Agencia Nacional de Servicios de Bomberos, el incendio se inició en el paquete de baterías Tesla Powerpack 2, instalado en 2023 como parte de una actualización de infraestructura valorada en 45 mil millones de won. Las baterías de iones de litio, con una capacidad total de 13.2 MWh, experimentaron un aumento repentino de temperatura de 23°C a más de 800°C en menos de 90 segundos, superando la capacidad de respuesta de los sistemas de seguridad existentes.
A pesar de que los rociadores se activaron automáticamente dentro de los primeros 30 segundos del incidente, el sistema de supresión de incendios con gas Inergen falló en contener la propagación del fuego debido a la naturaleza específica de los incendios de baterías de litio, que requieren agentes supresores especializados. Las autoridades de bomberos, que arribaron en 12 minutos, lograron extinguir el fuego alrededor de las 2:30 p.m. utilizando un agente especial F-500, pero para entonces el sistema UPS completo y 847 servidores principales habían sufrido daños que van desde parciales hasta totales.
El Dr. Lee Kyung-ho, especialista en seguridad de centros de datos del Instituto Avanzado de Ciencia y Tecnología de Corea (KAIST), explica: "Este incidente representa el primer caso documentado en Corea de fuga térmica masiva en un UPS de centro de datos. La velocidad de propagación fue excepcional incluso para estándares internacionales, sugiriendo posibles defectos de fabricación o mantenimiento inadecuado".
Impacto nacional: servicios paralizados y consecuencias económicas
El impacto del incendio se extendió mucho más allá del daño físico inmediato, creando una cascada de interrupciones que afectó prácticamente todos los aspectos de la administración pública digital. Los servicios en línea de 237 agencias gubernamentales quedaron completamente inoperables durante un período crítico de más de 4 horas, con algunos servicios experimentando interrupciones parciales que se extendieron hasta 18 horas después del incidente inicial.
Entre los servicios más críticos afectados se encontraban: Gov24 (portal integrado de servicios ciudadanos utilizado por 2.3 millones de usuarios diarios), Hometax del Servicio de Impuestos Nacionales (1.8 millones de usuarios empresariales), el portal del Servicio Nacional de Seguro de Salud (3.1 millones de consultas diarias), y los sistemas del Ministerio de Empleo y Trabajo que procesan subsidios de desempleo para 890,000 beneficiarios activos.
La interrupción coincidió desafortunadamente con la fecha límite trimestral para declaraciones del impuesto al valor agregado de las empresas, programada para el 25 de septiembre. Aproximadamente 2.8 millones de empresas registradas necesitaban completar sus declaraciones, y la paralización del sistema Hometax creó un caos operativo sin precedentes. Los 47,000 agentes fiscales certificados y contadores corporativos del país se vieron imposibilitados de procesar declaraciones por valor estimado de 89 billones de won en impuestos trimestrales.
El impacto económico directo se estima en 1.2 billones de won en pérdidas de productividad, según cálculos del Instituto de Investigación Económica de Corea. Esta cifra incluye costos de oportunidad para empresas incapaces de completar transacciones gubernamentales (340 mil millones de won), pérdidas en sectores dependientes de servicios gubernamentales digitales (520 mil millones de won), y costos de horas-hombre perdidas en el sector público (340 mil millones de won).
Kim Sang-jin, director del Centro de Investigación de Políticas Digitales de la Universidad Nacional de Seúl, comenta: "Este incidente ha demostrado crudamente cuán dependiente se ha vuelto nuestra sociedad de los servicios gubernamentales digitales. La concentración de servicios críticos en una sola instalación creó un punto único de falla con consecuencias desproporcionadamente severas".
La amenaza emergente de las baterías de iones de litio en centros de datos
El incidente de NIRS ha puesto en el centro del debate público una amenaza emergente que los expertos en seguridad de centros de datos habían venido advirtiendo durante años: los riesgos asociados con los sistemas UPS basados en baterías de iones de litio. Esta tecnología, adoptada agresivamente por centros de datos en todo el mundo durante los últimos cinco años, ofrece ventajas significativas en términos de eficiencia energética, densidad de potencia, y vida útil, pero introduce riesgos de seguridad complejos que muchas organizaciones han subestimado.
Los datos de la Asociación Internacional de Centros de Datos muestran que los incendios relacionados con baterías de iones de litio en centros de datos han aumentado 340% globalmente entre 2020 y 2025. Casos notables incluyen el incendio en el centro de datos de OVHcloud en Estrasburgo (marzo 2021), el incidente en Arizona Public Service (abril 2019), y múltiples eventos en centros de datos de hiperescala en Virginia, Estados Unidos.
Las baterías de iones de litio utilizadas en el NIRS tenían una capacidad energética de 13.2 MWh, equivalente al consumo eléctrico de 8,800 hogares promedio durante una hora. Cuando estas baterías experimentan fuga térmica -un proceso donde el aumento de temperatura causa reacciones químicas que generan más calor en un ciclo de retroalimentación positiva- pueden alcanzar temperaturas superiores a 1,000°C y liberar gases tóxicos incluyendo fluoruro de hidrógeno, monóxido de carbono, y dióxido de carbono.
Dr. Park Min-soo, investigador principal del Instituto de Investigación de Baterías de LG Chem, explica la complejidad del problema: "La fuga térmica en baterías de iones de litio puede ser desencadenada por múltiples factores: sobrecarga eléctrica, daño físico por vibración o impacto, defectos de manufactura, exposición a altas temperaturas ambientales, o simplemente envejecimiento de las celdas. Una vez iniciada, es extremadamente difícil de detener con métodos convencionales de supresión de incendios".
El centro NIRS tenía implementado un Sistema de Gestión de Baterías (BMS) de última generación, monitoreando continuamente voltaje, corriente, temperatura, y estado de carga de cada celda individual. También contaba con sensores de temperatura distribuidos y cámaras de imagen térmica. Sin embargo, los datos recuperados muestran que la temperatura aumentó de 31°C a 650°C en apenas 73 segundos, superando la capacidad de respuesta de cualquier sistema automatizado disponible comercialmente.
Deficiencias sistémicas: respaldo fallido y arquitectura vulnerable
El análisis post-incidente ha revelado deficiencias fundamentales en la arquitectura de respaldo del NIRS que amplificaron significativamente el impacto del incidente. Aunque el instituto opera centros de datos en dos ubicaciones -Daejeon (centro principal) y Gwangju (centro de respaldo)-, el sistema de failover automático falló en ejecutarse efectivamente, dejando servicios críticos sin respaldo funcional durante el período crítico.
El centro de Gwangju, con una capacidad de procesamiento del 60% respecto al centro principal, debería haber asumido automáticamente las cargas de trabajo críticas dentro de 15 minutos del incidente. Sin embargo, múltiples fallas sistémicas impidieron esta transición: bases de datos no sincronizadas debido a una ventana de mantenimiento pendiente, certificados de seguridad no replicados apropiadamente, y configuraciones de red que no habían sido actualizadas para reflejar cambios recientes en la topología del centro principal.
Un informe interno de NIRS, obtenido por medios de comunicación, revela que la última prueba completa del sistema de respaldo se había realizado en marzo 2024, hace 18 meses. La política de la organización requiere pruebas trimestrales, pero estas habían sido diferidas repetidamente debido a "preocupaciones sobre interrupciones de servicio durante procedimientos de prueba". Esta decisión, aparentemente prudente en circunstancias normales, resultó catastrófica cuando el respaldo fue realmente necesario.
Lee Jong-soo, ex director de operaciones de centro de datos de Samsung SDS y consultor independiente en resiliencia de TI, critica severamente la arquitectura: "El diseño del NIRS violó principios fundamentales de continuidad de negocio. Tener dos centros de datos no sirve de nada si no pueden intercambiar roles seamlessly. Además, la concentración de servicios de 237 agencias en una infraestructura centralizada creó un riesgo sistémico inaceptable".
La investigación también reveló que el centro de Daejeon había estado operando al 94% de su capacidad máxima, muy por encima del 70% recomendado por estándares internacionales para permitir failover efectivo. Esta sobrecarga había sido resultado de la migración de servicios adicionales al centro sin expansion correspondiente de infraestructura, creando una situación donde incluso un failover exitoso habría resultado en degradación significativa de rendimiento.
Respuesta gubernamental y plan de acción inmediato
La magnitud del incidente ha desencadenado la respuesta gubernamental más comprehensiva a una crisis de infraestructura digital en la historia de Corea del Sur. El Ministerio del Interior y Seguridad convocó una reunión de medidas de emergencia el 27 de septiembre, presidida por el Primer Ministro interino, que resultó en la declaración de un "estado de emergencia de infraestructura crítica" y la asignación de 2.3 billones de won para mejoras urgentes de seguridad y resiliencia.
La respuesta incluye una inspección de seguridad integral y obligatoria de los 47 centros de datos gubernamentales principales en todo el país, que debe completarse antes del 15 de octubre. Para instalaciones que utilizan UPS de batería de iones de litio -aproximadamente 31 de los 47 centros-, se ha ordenado realizar evaluaciones de seguridad inmediatas utilizando firmas especializadas internacionales, con autoridad para ordenar cierres temporales si se identifican riesgos inaceptables.
El plan de acción incluye requisitos específicos para centros que no pueden ser cerrados temporalmente: instalación inmediata de sistemas de supresión de incendios F-500 específicamente diseñados para baterías de litio (costo estimado: 45 mil millones de won por centro), implementación de espaciado aumentado entre racks de baterías (reduciendo capacidad en 15-20% pero mejorando seguridad), y deployment de sistemas de monitoreo de gases tóxicos con capacidad de alerta automática a servicios de emergencia.
Para centros críticos como NIRS, el gobierno ha autorizado el reemplazo expedito de sistemas UPS de baterías de litio con alternativas más seguras, incluyendo baterías de fosfato de hierro y litio (LiFePO4) que tienen menor densidad energética pero riesgo significativamente reducido de fuga térmica, o retorno temporal a baterías de plomo-ácido con sistemas de gestión térmica mejorados.
Implicaciones futuras: hacia una infraestructura digital resiliente
Este accidente ha catalizado una reevaluación fundamental de la estrategia nacional de infraestructura digital, con expertos abogando por un cambio paradigmático desde arquitecturas centralizadas hacia sistemas distribuidos y resilientes. El plan emergente incluye la creación de una "red nacional de centros de datos" con al menos cinco ubicaciones geográficamente distribuidas para cada servicio crítico, eliminando puntos únicos de falla.
La estrategia de modernización propuesta incluye migración acelerada hacia servicios basados en nube híbrida, aprovechando tanto infraestructura gubernamental modernizada como servicios de proveedores cloud comerciales certificados. Amazon Web Services, Microsoft Azure, y Google Cloud Platform han expresado disposición a establecer regiones cloud soberanas en Corea, con datos gubernamentales almacenados exclusivamente en territorio nacional bajo jurisdicción coreana.
También se está considerando un cambio hacia arquitecturas de microservicios que permitirían degradación gradual en lugar de fallas completas del sistema. Bajo este modelo, si el servicio de emisión de certificados falla, otros servicios como consultas de información podrían continuar operando, minimizando el impacto sobre ciudadanos y empresas.
El Dr. Kim Hyeon-soo, director del Centro Nacional de Investigación en Ciberseguridad, proyecta: "Este incidente marcará un antes y después en cómo Corea diseña y opera infraestructura digital crítica. Las lecciones aprendidas no solo mejorarán nuestra resiliencia nacional, sino que pueden servir como modelo para otros países que enfrentan desafíos similares de digitalización a gran escala".
El gobierno planea implementar también programas de entrenamiento regular del Plan de Recuperación de Desastres (DRP) con simulacros trimestrales que incluyan escenarios de múltiples fallas simultáneas, y establecer acuerdos de cooperación con el sector privado para capacidad de respaldo de emergencia. La meta es garantizar que ningún servicio gubernamental crítico pueda estar fuera de línea por más de 30 minutos, independientemente del tipo o magnitud del incidente.
Este evento histórico, aunque costoso en términos económicos y de confianza pública, puede ultimately catalizar la evolución de Corea hacia una de las infraestructuras digitales más resilientes del mundo, estableciendo estándares que podrían ser adoptados globalmente por otras naciones que enfrentan desafíos similares en la era digital.
Artículo original: TrendyNews Korea
0 Comentarios