Типовые сбои

Типичные проблемы с доступностью сайта

Разберите основные слои, из которых складываются инциденты доступности сайта: ошибки DNS, проблемы SSL, закрытые порты, перегруженные приложения и маршрутные сбои.

Большинство инцидентов с доступностью перестают быть загадкой, если разложить их по слоям. Сложность в том, что пользователи описывают их одной и той же фразой: «сайт лежит». На практике это может означать сломанную DNS-запись, неработающую службу на 443, истёкший сертификат, перегруженный исходный сервер с кодом 503 или проблему маршрута в отдельном регионе. Хорошая диагностика начинается с того, что вы раскладываете симптом по правильному семейству сбоев.

Разные сбои одинаково выглядят для пользователя

Ошибка браузера, пустой тайм-аут и код 503 обычно описываются одной фразой «не работает», хотя относятся к разным слоям.

Разделение по слоям экономит время

Как только ясно, это DNS, соединение, TLS, HTTP или маршрут, следующий инструмент и вероятный владелец проблемы становятся гораздо очевиднее.

Один отчёт должен вести к одному следующему действию

Смысл диагностики не в том, чтобы собрать максимум цифр, а в том, чтобы быстро сузить проблему до понятного следующего шага.

01

Основные семейства проблем с доступностью

Эти группы покрывают большую часть практических инцидентов, которые встречаются у публичных сайтов.

Проблемы разрешения имени

Имя хоста разрешается неправильно, указывает не туда или ведёт себя непоследовательно из-за устаревших или конфликтующих DNS-данных.

Проблемы достижимости сервиса

Хост может существовать, но нужный веб-порт закрыт, фильтруется, отклоняет соединение или уходит в тайм-аут из одной из точек проверки.

Проблемы доверия к TLS

Сервис достижим настолько, что HTTPS успевает начаться, но сертификат, имя хоста, цепочка или согласование протокола не дают установить доверенную сессию.

Проблемы уровня приложения

Запрос доходит до сайта, но итоговый HTTP-результат показывает ошибку сервера, перегрузку, режим обслуживания или ограничение доступа.

02

Симптом, вероятный слой и лучший первый шаг

Используйте эту карту как короткую подсказку для первичной диагностики, когда описание от клиента или коллеги слишком расплывчатое.

СимптомВероятный слойЛучший первый шаг
Имя хоста не разрешается или разрешается странноDNSПроверка сайта, затем Проверка DNS
Браузер ругается на сертификат или HTTPSTLS / SSLПроверка SSL, затем Проверка сайта
Соединение на 80/443 отклоняется или уходит в тайм-аутПорт или сетевая достижимостьПроверка порта, затем Пинг или Трассировка маршрута
Сайт отвечает 403, 429, 500, 502, 503 или 504Приложение / пограничный слой / вышестоящий сервисПроверка сайта, затем Проверка хостинга или уточняющая проверка SSL/DNS при необходимости
Жалуются только часть пользователей или регионовМаршрут, распространение DNS, география или различия политикПроверка сайта плюс аккуратная проверка из другого окружения

03

Чистая последовательность первичной диагностики

Так вы не будете прыгать между инструментами, не получая новой информации.

01

Начинайте с точного URL, который не работает

По возможности используйте реальное имя хоста, схему и путь, чтобы редиректы и поведение сертификата оставались релевантными.

02

Определите первый слой отказа

Поймите, похож ли первый серьёзный сигнал на DNS, соединение, TLS или уже на HTTP-ответ приложения.

03

Откройте один профильный следующий инструмент

Переходите к Проверке DNS, Проверке SSL, Проверке порта, Пингу или Трассировке маршрута только после того, как первый широкий запуск показал нужный слой.

04

Проверьте, не привязан ли результат к локации

Если жалуются не все или сайт стоит за CDN и региональной политикой, держите в голове ограничение одной серверной точки, прежде чем делать широкие заявления.

04

Сигналы, которые часто сбивают с толку

Это технически правдивые наблюдения, которые всё равно уводят к неверному диагнозу.

  • «Пинг проходит, значит сайт точно в порядке».
  • «Сертификат валиден, значит HTTPS ни при чём».
  • «DNS отвечает, значит проблема точно внутри приложения».
  • «Сайт упал из одной точки или сразу из двух здесь, значит он недоступен для всех».

05

Лучшие инструменты для сужения типовых проблем

Выбирайте инструмент по тому семейству проблемы, которое теперь кажется наиболее вероятным.

Частые вопросы о типичных проблемах доступности

Какая самая частая ошибка в первичной диагностике инцидента?

Считать любой симптом одной большой недоступностью сайта вместо того, чтобы разделить DNS, соединение, TLS и HTTP-проблемы по разным слоям.

Если сайт отвечает 503, нужно ли всё ещё смотреть DNS или SSL?

Обычно первая очевидная проблема уже на стороне приложения или вышестоящего сервиса, но DNS и SSL всё ещё могут иметь значение, если в том же отчёте подозрительно выглядят редиректы, имена хостов или сертификат.

Почему некоторые инциденты затрагивают только часть аудитории?

Потому что у пользователей могут отличаться DNS-кэши, региональные пограничные узлы, маршрутизация у провайдера, геоограничения и поведение системы доверия на клиенте.

Связанные инструменты

Сайт и SSLПроверка сайтаПодробный отчёт по URL с общим вердиктом и результатами из России и Финляндии: DNS-тайминг, время TCP-подключения, TLS-рукопожатие, TTFB, цепочка редиректов, итоговый URL, заголовки ответа и найденные IP-адреса.DNS и именаПроверка DNSA, AAAA, CNAME, MX, TXT, NS, SOA, CAA и PTR-записи с нормализованным выводом, сырыми ответами резолвера, понятными пустыми состояниями и сравнением двух серверных точек там, где ответы зависят от резолвера.Сайт и SSLПроверка SSLПроверка издателя, владельца, SAN-имён, срока действия, совпадения имени хоста, цепочки сертификатов и видимой поддержки версий TLS из России и Финляндии.Сетевой путьПроверка портаБезопасная TCP-проверка публичного порта из России и Финляндии: открыт, отклонён, недоступен по тайм-ауту или закрыт, с явной задержкой и деталями попыток.Сетевой путьПингОграниченный серверный пинг из России и Финляндии: потери пакетов, отдельные задержки и среднее время отклика там, где цель отвечает.

Связанные руководства

Сценарий проверки доступностиКак проверить, действительно ли сайт недоступенПошаговый способ отличить реальную недоступность сайта от проблемы DNS, SSL, закрытого порта или ситуации, когда сайт технически отвечает, но всё равно сломан.Сравнение инструментовПинг, трассировка маршрута, проверка порта и проверка сайта: в чём разницаВыберите правильный инструмент под конкретный симптом: что на самом деле доказывают пинг, трассировка маршрута, проверка порта и проверка сайта, и чего они не доказывают.Методология и довериеКак Gitae сравнивает сайты из России и ФинляндииGitae честно может доказать из двух публичных серверных точек, почему результаты расходятся из-за маршрутизации или политики, и почему часть инструментов остаётся одноточечной.Интерпретация HTTPЧто означают HTTP-коды в диагностикеПоймите, как правильно читать HTTP-коды в диагностике сайта: редиректы, клиентские ошибки, серверные ошибки и разницу между настоящим HTTP-ответом и сбоем на более низком уровне.