Na manhã desta segunda-feira (7), o rompimento de uma canalização que abastece de água as torres de resfriamento no data center que hospeda a IBM Cloud (SAO 01) causou a elevação de temperatura de servidores e de equipamentos de armazenamento de dados, dando origem a instabilidades de conexão e afetando, também, a internet brasileira, já que muitas empresas dependem dos serviços desta nuvem.
Caixa, Itaú, Vivo, Correios, Banco Inter, TIM, NuBank, Mercado Livre, WhatsApp, FreeFire e até a Polícia Federal brasileira sentem os efeitos do incidente, que, por enquanto, não tem hora definida para ser resolvido. Diversos boletins já foram divulgados pela IBM, com intervalos de 30 a 60 minutos, informando clientes sobre o andamento da situação.
“A fratura já foi consertada e a água de reposição está chegando ao local para reabastecer os tanques. Com base nas temperaturas elevadas atuais e sustentadas, a suíte Sao01 Server Room 01 será desenergizada para reduzir a carga e mitigar o aumento da temperatura”, diz um deles.
“Todos os dispositivos em Sao01 Server Room 01 perderão energia como resultado desta ação e permanecerão offline até que o problema raiz com o incidente de resfriamento seja resolvido e as temperaturas sejam estabilizadas. No momento, há relatórios de impactos nas ofertas de armazenamento (arquivo, bloco e VSI-SAN), Bare Metal e VSI. Como resultado da desenergização de Sao01 Sr01, Sao01 Sr02 experimentará uma queda de conectividade de rede e serviços”, complementa.
Mitigando efeitos
Em outros documentos, é possível encontrar detalhes a respeito do disparo de vários alarmes de aquecimento excessivo do sistema e trabalhos constantes para “mitigar quaisquer efeitos que o problema possa ter sobre os serviços ao cliente IBM Cloud”. Às 7h30 (horário de Brasília), havia relatórios de impactos nas ofertas de armazenamento (arquivo, bloco e VSI-SAN), Bare Metal e VSI.
Por enquanto, a situação mais recente é esta: “Com base nas temperaturas elevadas atuais e sustentadas, o IBM Cloud está decidindo desligar os hosts bare metal como um esforço adicional de mitigação. Esta decisão está sendo tomada com base no ETA atual do provedor do local e nos comportamentos observados dos equipamentos.”
Dia conturbado
Paralelamente ao caso do superaquecimento, a Amazon Web Services (AWS) também sofreu uma instabilidade durante o período da manhã. Apesar de o problema da IBM não ter afetado a AWS, os serviços que dependem da nuvem da Amazon também ficaram instáveis, o que aumentou o impactou na internet nacional.
Fontes: TecMundo, Ciso Advisor, Twitter