WhatsApp caiu? O Pix parou de funcionar? O Instagram saiu do ar? Quando algum serviço digital apresenta instabilidade, milhões de pessoas recorrem ao Downdetector para descobrir se o problema é geral ou apenas local. A plataforma se tornou uma das principais referências para acompanhar interrupções em tempo real — inclusive nas redações, como a do Olhar Digital, onde costuma ser uma das primeiras ferramentas consultadas quando surgem relatos de falhas em serviços online.
Mas existe uma etapa que quase ninguém vê. Antes de um pico aparecer nos gráficos do Downdetector, o sistema precisa responder a uma pergunta que parece simples, mas está longe de ser: aquelas reclamações indicam que um serviço realmente saiu do ar ou são apenas parte do ruído diário da internet?
Ao Olhar Digital, Lourenço Garcia, gerente de Soluções para Clientes da Ookla na América Latina, mostrou os bastidores dessa decisão. A plataforma não recebe informações diretamente das empresas que monitora. Em vez disso, reúne sinais deixados pelos próprios usuários, cruza diferentes fontes de dados e tenta transformar milhões de reclamações espalhadas pela internet em um retrato confiável do que realmente está acontecendo. É justamente esse processo que acontece antes de um serviço aparecer como “fora do ar” na plataforma.
Como o Downdetector sabe que um serviço realmente caiu?
“Sempre tem alguém reclamando de algum serviço.” Parece uma observação casual, mas é justamente assim que Lourenço Garcia resume o maior desafio do Downdetector. Segundo ele, o trabalho da plataforma não começa quando surgem reclamações na internet — elas existem o tempo todo. O complicado é identificar quando esse volume deixa de fazer parte da rotina e passa a indicar que uma falha realmente está acontecendo.
Para isso, o sistema compara a quantidade de relatos com o comportamento histórico de cada serviço. Essa análise leva em conta diferentes janelas de tempo — de 30 segundos a cinco e 15 minutos — para entender se houve uma mudança fora do padrão. Só quando esse desvio é identificado o Downdetector gera um alerta.
Embora a lógica seja simples, Garcia faz questão de destacar que o sistema trabalha apenas com informações públicas. O Downdetector não recebe dados das empresas monitoradas nem acesso aos seus sistemas internos. “São informações que vêm de fora”, explica. Todo o monitoramento é construído a partir dos sinais deixados pelos próprios usuários na internet.
Essa característica faz com que a plataforma consiga enxergar problemas sob uma perspectiva diferente da das próprias empresas. Enquanto bancos, operadoras ou plataformas digitais costumam detectar rapidamente falhas em equipamentos ou na infraestrutura, incidentes relacionados a software, roteamento ou serviços de computação em nuvem podem aparecer primeiro no comportamento dos usuários. “A primeira fonte de informação do usuário, antes até de ligar para um call center, ele vai lá colocar uma reclamação na internet“, afirma Garcia.
Uma queda precisa deixar mais de um rastro
Quando explica de onde vêm esses dados, Garcia costuma começar pelo Speedtest. Segundo ele, o aplicativo é utilizado por cerca de 20 milhões de brasileiros e possui um botão que permite aos usuários informar quando acreditam estar enfrentando problemas em algum serviço.
A segunda fonte é o próprio Downdetector. Sempre que alguém acessa o site para verificar se um serviço está instável ou registra uma reclamação, essa interação passa a integrar a análise da plataforma. Dependendo do serviço, o usuário também pode informar detalhes sobre a falha encontrada, como dificuldades com o Pix, aplicativos ou contas bancárias.
A terceira fonte vem das buscas feitas no Google. Pesquisas como “WhatsApp caiu”, “Pix não funciona” ou “Vivo está fora” também funcionam como indicadores de que algo pode estar acontecendo. Sozinha, nenhuma dessas informações é suficiente para confirmar uma interrupção. O que dá força ao sistema, segundo Garcia, é justamente o cruzamento desses diferentes sinais em tempo real.
Garcia começa pelo Speedtest não por acaso. Segundo ele, além de reunir cerca de 20 milhões de usuários brasileiros, o aplicativo também funciona como um termômetro dos incidentes. Quando um serviço apresenta falhas importantes, cresce rapidamente o número de pessoas que fazem um teste de velocidade para descobrir se o problema está na conexão.
Detectar uma falha é só o começo
Quando o Downdetector identifica que um serviço pode estar enfrentando uma instabilidade, o trabalho da plataforma está longe de terminar. Para Garcia, o alerta é apenas o ponto de partida. A partir dali, o sistema começa a reunir informações que ajudam empresas a entender o tamanho da falha e encontrar sua possível origem.
Esses dados aparecem em tempo real no Downdetector Explorer, versão da plataforma voltada para clientes corporativos. Além do alerta inicial, ela mostra onde estão concentradas as reclamações, quais operadoras e dispositivos estão envolvidos, quais tipos de falha os usuários relatam e quais comentários estão sendo publicados naquele momento. “Os comentários às vezes ajudam a entender melhor o que está acontecendo”, explica Garcia.
É justamente nesses comentários que a plataforma muitas vezes encontra pistas que os gráficos, sozinhos, não conseguem mostrar. Garcia cita como exemplo interrupções provocadas por desastres naturais ou quedas de energia. Nessas situações, diversos serviços começam a registrar reclamações ao mesmo tempo, mas a leitura dos relatos ajuda a perceber que o problema não está em um aplicativo, banco ou operadora específica, e sim em um evento externo que afeta toda a região.
Essa capacidade de contextualizar um incidente também permite que empresas reajam mais rapidamente. Garcia explica que, quando uma falha está relacionada a software, roteamento ou a um provedor de computação em nuvem, o aumento das reclamações costuma aparecer antes dos canais tradicionais de atendimento. Enquanto muitos usuários ainda tentam entender o que está acontecendo, o Downdetector já começa a reunir sinais de que algo saiu do normal.
Um trabalho desse tamanho só funciona porque quase tudo é automático
A quantidade de dados analisados pela plataforma torna inviável qualquer tentativa de monitoramento manual. Segundo Garcia, mais de 95% do funcionamento do Downdetector é automatizado. A coleta das informações, a comparação com o comportamento esperado de cada serviço e a geração dos alertas acontecem sem intervenção humana.
A automação também acompanha o surgimento de novos serviços. Quando um nome começa a aparecer com frequência nas reclamações, o sistema identifica esse comportamento e sugere a criação de uma nova página de monitoramento. Em muitos casos, esse processo acontece automaticamente. Os analistas entram em cena apenas quando existe alguma dúvida sobre o que aquele nome realmente representa.
Garcia cita um exemplo simples: “XP”. Dependendo do contexto, o termo pode se referir à instituição financeira ou apenas a uma expressão utilizada por usuários da internet. É justamente esse tipo de situação que ainda exige análise humana. O mesmo acontece com investigações sobre tentativas de manipular os indicadores e com alguns estudos de causa raiz, que dependem de conhecimento sobre o contexto local para identificar a origem de uma ocorrência.
A inteligência artificial também começou a ganhar espaço nesse processo, mas ainda de forma complementar. Segundo Garcia, ela vem sendo utilizada para produzir resumos automáticos sobre incidentes e auxiliar na correlação de informações que ajudam a identificar possíveis causas. A decisão de que um serviço está enfrentando uma falha, porém, continua baseada na metodologia desenvolvida pela plataforma ao longo dos anos.
Nem toda onda de reclamações significa que um serviço caiu
Se detectar uma falha exige analisar milhões de sinais, evitar conclusões erradas é um desafio igualmente importante. Afinal, uma enxurrada de reclamações não significa, necessariamente, que um aplicativo, banco ou operadora esteja enfrentando uma interrupção. Em alguns casos, o problema está na forma como as pessoas pesquisam, comentam ou até tentam manipular essas informações.
Garcia cita exemplos que fazem parte da rotina da equipe. Uma pesquisa por “Oi, tudo bem?” não indicaria que a operadora Oi esteja fora do ar. O mesmo vale para expressões como “Claro que sim” ou até “gol do Santos”, que não têm relação com a operadora Claro nem com a companhia aérea Gol. Antes de considerar essas menções como um indício de falha, a plataforma precisa entender o contexto em que elas aparecem.
Outro cuidado envolve o comportamento dos próprios usuários. Se uma mesma pessoa envia diversas reclamações sobre um incidente, o sistema não contabiliza cada uma delas como um novo problema. Segundo Garcia, esse mecanismo evoluiu ao longo dos anos porque algumas tentativas de manipulação passaram a utilizar diferentes dispositivos para simular que várias pessoas estavam relatando a mesma falha.
É justamente por isso que parte do trabalho continua dependendo de pessoas. Enquanto a maior parte do monitoramento acontece automaticamente, equipes de Quality Assurance revisam continuamente a metodologia para acompanhar novas formas de contornar o sistema. “Sempre aparece uma maneira nova de burlar o sistema”, afirma Garcia.
Esse trabalho ganhou uma dimensão inédita neste ano. Pela primeira vez, segundo o executivo, a Ookla identificou uma tentativa coordenada de prejudicar um concorrente. A investigação mostrou que os comentários eram enviados a partir de diferentes dispositivos e localidades para criar a impressão de que havia uma grande interrupção. “Foi uma análise que não foi fácil, porque foi a primeira vez que a gente viu”, lembra.
A internet muda. O Downdetector também.
Se existe algo que mudou desde o lançamento do Downdetector, foi a própria internet. Para Garcia, o maior desafio da plataforma hoje não é monitorar milhares de serviços ao mesmo tempo, mas acompanhar a velocidade com que o comportamento dos usuários muda. Afinal, todo o sistema depende de entender o que é um comportamento normal para identificar quando algo foge do esperado.
Foi isso que aconteceu durante a pandemia. Horários de acesso mudaram, serviços passaram a registrar novos padrões de uso e os modelos precisaram ser recalibrados. Grandes eventos também provocam mudanças bruscas. Garcia lembra que, durante partidas da Copa do Mundo, muitas reclamações atribuídas às operadoras tinham outra origem: plataformas de streaming que não conseguiam suportar o aumento repentino de audiência.
Outro exemplo é o Pix. Quando o sistema apresenta uma falha ampla, o impacto não fica restrito aos bancos. Aplicativos de transporte, delivery, varejistas e até companhias aéreas podem registrar problemas ao mesmo tempo por dependerem dos pagamentos instantâneos. Para o Downdetector, isso significa interpretar dezenas de alertas relacionados a um mesmo incidente. Garcia conta que a primeira grande interrupção do Pix surpreendeu até a própria Ookla pelo número de serviços afetados simultaneamente.
Às vezes, o gráfico mostra uma história que ninguém conhece ainda
Entre todos os episódios que acompanhou pelo Downdetector, Garcia diz que um dos mais marcantes aconteceu durante as enchentes que atingiram o Rio Grande do Sul em 2024. Os alertas começaram a indicar falhas simultâneas em diferentes operadoras da região — algo incomum. Sem saber o que estava acontecendo, ele entrou em contato com Claro, Vivo e TIM para verificar se havia algum incidente nas redes. Naquele momento, ninguém tinha uma resposta.
A explicação veio pouco depois, quando acompanhou a cobertura das enchentes pela televisão. O desastre havia comprometido a infraestrutura da região e provocado problemas em diferentes serviços ao mesmo tempo. Para Garcia, esse episódio mostrou por que os comentários enviados pelos usuários são tão importantes quanto os gráficos: eles ajudam a distinguir quando uma série de reclamações está relacionada a uma falha específica e quando todos os sinais apontam para uma mesma causa externa.
Os usuários também aprenderam a identificar uma queda
O comportamento das pessoas também mudou ao longo dos anos — e isso alterou a forma como o Downdetector funciona. Garcia lembra que, há alguns anos, quando WhatsApp ou Instagram apresentavam instabilidade, muitos usuários acreditavam que o problema estava na operadora de telefonia. Hoje, esse entendimento é diferente.
“Quando o WhatsApp fica fora, já tem uma grande proporção de usuários que sabe que o problema está no WhatsApp, não está na Vivo, na TIM e na Claro”, afirma. Para ele, essa mudança beneficia diretamente a plataforma. Quanto mais rapidamente as pessoas conseguem identificar onde está a origem de uma falha, maior é a qualidade dos sinais que chegam ao sistema. Afinal, como o próprio executivo resume, o Downdetector é “totalmente dependente, 100% dependente dos usuários”.
O post O que acontece antes de um serviço aparecer como fora do ar no Downdetector? apareceu primeiro em Olhar Digital.






