Padrões de falha
Problemas comuns de disponibilidade na web explicados
Entenda as camadas mais comuns por trás dos incidentes de disponibilidade de sites, desde erros de DNS e falhas de confiança de SSL até portas fechadas, aplicações sobrecarregadas e problemas relacionados a rotas.
A maioria dos incidentes de disponibilidade deixa de ser misteriosa quando é classificada por camada. O difícil é que muitas pessoas os descrevem com a mesma frase: “o site está indisponível”. Em um diagnóstico, isso pode significar uma entrada DNS com problemas, um serviço sem escuta em 443, um certificado expirado, uma origem sobrecarregada devolvendo 503 ou um problema de encaminhamento regional. Uma boa resolução começa colocando o sintoma na família de falhas correta.
Falhas diferentes parecem iguais para quem usa o site
Uma página de erro do navegador, um tempo limite sem contexto adicional e um 503 podem ser descritos como “inativos”, embora venham de camadas diferentes.
Pensar em camadas economiza tempo
Quando sabe se o problema está no DNS, conexão, TLS, HTTP ou rota, a próxima ferramenta e o provável culpado ficam muito mais claros.
Um relatório deve levar a uma única próxima ação
O objetivo do diagnóstico não é reunir todos os dados possíveis, mas reduzir o problema com rapidez suficiente para que o próximo passo seja óbvio.
01
As principais famílias de problemas de disponibilidade
Esses grupos cobrem a maioria dos incidentes práticos observados em alvos públicos.
Problemas de resolução de nomes
O host não resolve corretamente, aponta para o destino errado ou se comporta de maneira inconsistente devido a dados DNS antigos ou incompatíveis.
Problemas de conectividade de serviço
O host pode existir, mas a porta do site esperada está fechada, filtrada, rejeitada ou atinge o tempo limite em um dos locais de teste.
Problemas de confiança TLS
O serviço é acessível o suficiente para iniciar HTTPS, mas a negociação de certificado, host, cadeia ou protocolo impede uma sessão confiável.
Problemas no nível da aplicação
O pedido chega ao site, mas o resultado final do HTTP mostra erro do servidor, sobrecarga, modo de manutenção ou restrição de acesso.
02
Sintoma, camada provável e melhor primeira verificação
Use-o como um mapa de diagnóstico inicial rápido quando o relatório de um cliente ou colega for muito vago.
| Sintoma | Camada provável | Melhor primeira verificação |
|---|---|---|
| Host não resolve ou resolve de forma estranha | DNS | Verificador de sites e, em seguida, Consulta DNS |
| O navegador avisa sobre certificado ou HTTPS | TLS/SSL | Verificador SSL e depois Verificador de sites |
| A conexão com 80/443 foi rejeitada ou expirou | Conectividade de porta ou rede | Verificador de portas, depois Ping ou Traceroute |
| O site responde com 403, 429, 500, 502, 503 ou 504 | Aplicação/borda/upstream | Verificador de sites e, em seguida, Verificador de hosting ou acompanhamento SSL/DNS, se necessário |
| Apenas algumas pessoas ou algumas regiões reclamam | Rota, propagação de DNS, geografia ou diferenças de política | Verificador de sites e revisão metodológica a partir de outro ambiente |
03
Uma sequência de diagnóstico inicial limpa
Dessa forma, evita pular de ferramenta em ferramenta sem aprender nada novo.
Comece com o URL exato que falha
Use o host, o esquema e o caminho reais sempre que puder para que os redirecionamentos e o comportamento do certificado permaneçam relevantes.
Classifique a primeira camada em que a falha aparece
Decida se o primeiro sinal sério aponta para DNS, conexão, TLS ou HTTP ou resposta da aplicação.
Abra uma única ferramenta especializada
Use Consulta DNS, Verificador SSL, Verificador de portas, Ping ou Traceroute somente depois que a primeira execução ampla informar qual camada merece atenção.
Verifique se o resultado pode depender da localização
Se apenas algumas pessoas relatarem problemas ou se o site estiver por trás de uma CDN ou de uma política regional, considere a limitação de uma única visualização antes de fazer afirmações muito amplas.
04
Sinais que geralmente levam ao erro
São observações tecnicamente verdadeiras que ainda levam a um diagnóstico errado.
- “O Ping funciona, então o site tem que estar bem.”
- “O certificado é válido, então HTTPS não pode ser o problema.”
- “O DNS responde, então a falha deve estar dentro da aplicação.”
- “O site falhou em um local ou em ambas as sondas daqui, então deve estar indisponível para todos.”
05
Melhores ferramentas para reduzir problemas comuns de disponibilidade
Escolha a ferramenta que melhor se adapta à família problemática que agora lhe parece mais provável.
É o melhor primeiro passo quando tudo o que sabe é que um URL parece ter problemas e precisa de uma classificação séria e rápida.
Verificador de sitesRespostas DNS analisadasUse a Consulta DNS para problemas de resolução de nomesAbra-a após IP incorreto, respostas vazias, NXDOMAIN ou suspeita de propagação ou delegação.
Consulta DNSInspeção de certificado e TLSUse o Verificador SSL para falhas de confiança HTTPSÉ a melhor opção para analisar o ciclo de vida do certificado, a cobertura do host, os certificados autoassinados e a visibilidade do protocolo.
Verificador SSLConectividade TCPUse o Verificador de portas quando suspeitar da camada TCPIsso é útil quando 80 ou 443 podem estar fechados, filtrados ou simplesmente sem escuta em um dos locais de teste.
Verificador de portas