Padrões de falha

Problemas comuns de disponibilidade na web explicados

Entenda as camadas mais comuns por trás dos incidentes de disponibilidade de sites, desde erros de DNS e falhas de confiança de SSL até portas fechadas, aplicações sobrecarregadas e problemas relacionados a rotas.

A maioria dos incidentes de disponibilidade deixa de ser misteriosa quando é classificada por camada. O difícil é que muitas pessoas os descrevem com a mesma frase: “o site está indisponível”. Em um diagnóstico, isso pode significar uma entrada DNS com problemas, um serviço sem escuta em 443, um certificado expirado, uma origem sobrecarregada devolvendo 503 ou um problema de encaminhamento regional. Uma boa resolução começa colocando o sintoma na família de falhas correta.

Falhas diferentes parecem iguais para quem usa o site

Uma página de erro do navegador, um tempo limite sem contexto adicional e um 503 podem ser descritos como “inativos”, embora venham de camadas diferentes.

Pensar em camadas economiza tempo

Quando sabe se o problema está no DNS, conexão, TLS, HTTP ou rota, a próxima ferramenta e o provável culpado ficam muito mais claros.

Um relatório deve levar a uma única próxima ação

O objetivo do diagnóstico não é reunir todos os dados possíveis, mas reduzir o problema com rapidez suficiente para que o próximo passo seja óbvio.

01

As principais famílias de problemas de disponibilidade

Esses grupos cobrem a maioria dos incidentes práticos observados em alvos públicos.

Problemas de resolução de nomes

O host não resolve corretamente, aponta para o destino errado ou se comporta de maneira inconsistente devido a dados DNS antigos ou incompatíveis.

Problemas de conectividade de serviço

O host pode existir, mas a porta do site esperada está fechada, filtrada, rejeitada ou atinge o tempo limite em um dos locais de teste.

Problemas de confiança TLS

O serviço é acessível o suficiente para iniciar HTTPS, mas a negociação de certificado, host, cadeia ou protocolo impede uma sessão confiável.

Problemas no nível da aplicação

O pedido chega ao site, mas o resultado final do HTTP mostra erro do servidor, sobrecarga, modo de manutenção ou restrição de acesso.

02

Sintoma, camada provável e melhor primeira verificação

Use-o como um mapa de diagnóstico inicial rápido quando o relatório de um cliente ou colega for muito vago.

SintomaCamada provávelMelhor primeira verificação
Host não resolve ou resolve de forma estranhaDNSVerificador de sites e, em seguida, Consulta DNS
O navegador avisa sobre certificado ou HTTPSTLS/SSLVerificador SSL e depois Verificador de sites
A conexão com 80/443 foi rejeitada ou expirouConectividade de porta ou redeVerificador de portas, depois Ping ou Traceroute
O site responde com 403, 429, 500, 502, 503 ou 504Aplicação/borda/upstreamVerificador de sites e, em seguida, Verificador de hosting ou acompanhamento SSL/DNS, se necessário
Apenas algumas pessoas ou algumas regiões reclamamRota, propagação de DNS, geografia ou diferenças de políticaVerificador de sites e revisão metodológica a partir de outro ambiente

03

Uma sequência de diagnóstico inicial limpa

Dessa forma, evita pular de ferramenta em ferramenta sem aprender nada novo.

01

Comece com o URL exato que falha

Use o host, o esquema e o caminho reais sempre que puder para que os redirecionamentos e o comportamento do certificado permaneçam relevantes.

02

Classifique a primeira camada em que a falha aparece

Decida se o primeiro sinal sério aponta para DNS, conexão, TLS ou HTTP ou resposta da aplicação.

03

Abra uma única ferramenta especializada

Use Consulta DNS, Verificador SSL, Verificador de portas, Ping ou Traceroute somente depois que a primeira execução ampla informar qual camada merece atenção.

04

Verifique se o resultado pode depender da localização

Se apenas algumas pessoas relatarem problemas ou se o site estiver por trás de uma CDN ou de uma política regional, considere a limitação de uma única visualização antes de fazer afirmações muito amplas.

04

Sinais que geralmente levam ao erro

São observações tecnicamente verdadeiras que ainda levam a um diagnóstico errado.

  • “O Ping funciona, então o site tem que estar bem.”
  • “O certificado é válido, então HTTPS não pode ser o problema.”
  • “O DNS responde, então a falha deve estar dentro da aplicação.”
  • “O site falhou em um local ou em ambas as sondas daqui, então deve estar indisponível para todos.”

05

Melhores ferramentas para reduzir problemas comuns de disponibilidade

Escolha a ferramenta que melhor se adapta à família problemática que agora lhe parece mais provável.

Perguntas frequentes: problemas comuns de disponibilidade na web

Qual é o primeiro erro mais comum ao diagnosticar uma queda?

Trate todos os sintomas como uma grande interrupção do site, em vez de separar problemas de DNS, conexão, TLS e HTTP ou de aplicação em camadas diferentes.

Se o site devolver 503, ainda devo verificar o DNS ou SSL?

Normalmente, a aplicação ou upstream é o primeiro problema óbvio, mas DNS ou SSL ainda podem ser importantes se redirecionamentos, hosts ou comportamento de certificado suspeito aparecerem no mesmo relatório.

Por que alguns incidentes afetam apenas uma parte do público?

Porque os caches DNS, as fronteiras regionais, o encaminhamento do fornecedor, as restrições geográficas e o comportamento de confiança do cliente podem variar entre as pessoas.

Ferramentas relacionadas

Guias relacionados