Типовые сбои
Типичные проблемы с доступностью сайта
Разберите основные слои, из которых складываются инциденты доступности сайта: ошибки DNS, проблемы SSL, закрытые порты, перегруженные приложения и маршрутные сбои.
Большинство инцидентов с доступностью перестают быть загадкой, если разложить их по слоям. Сложность в том, что пользователи описывают их одной и той же фразой: «сайт лежит». На практике это может означать сломанную DNS-запись, неработающую службу на 443, истёкший сертификат, перегруженный исходный сервер с кодом 503 или проблему маршрута в отдельном регионе. Хорошая диагностика начинается с того, что вы раскладываете симптом по правильному семейству сбоев.
Разные сбои одинаково выглядят для пользователя
Ошибка браузера, пустой тайм-аут и код 503 обычно описываются одной фразой «не работает», хотя относятся к разным слоям.
Разделение по слоям экономит время
Как только ясно, это DNS, соединение, TLS, HTTP или маршрут, следующий инструмент и вероятный владелец проблемы становятся гораздо очевиднее.
Один отчёт должен вести к одному следующему действию
Смысл диагностики не в том, чтобы собрать максимум цифр, а в том, чтобы быстро сузить проблему до понятного следующего шага.
01
Основные семейства проблем с доступностью
Эти группы покрывают большую часть практических инцидентов, которые встречаются у публичных сайтов.
Проблемы разрешения имени
Имя хоста разрешается неправильно, указывает не туда или ведёт себя непоследовательно из-за устаревших или конфликтующих DNS-данных.
Проблемы достижимости сервиса
Хост может существовать, но нужный веб-порт закрыт, фильтруется, отклоняет соединение или уходит в тайм-аут из одной из точек проверки.
Проблемы доверия к TLS
Сервис достижим настолько, что HTTPS успевает начаться, но сертификат, имя хоста, цепочка или согласование протокола не дают установить доверенную сессию.
Проблемы уровня приложения
Запрос доходит до сайта, но итоговый HTTP-результат показывает ошибку сервера, перегрузку, режим обслуживания или ограничение доступа.
02
Симптом, вероятный слой и лучший первый шаг
Используйте эту карту как короткую подсказку для первичной диагностики, когда описание от клиента или коллеги слишком расплывчатое.
| Симптом | Вероятный слой | Лучший первый шаг |
|---|---|---|
| Имя хоста не разрешается или разрешается странно | DNS | Проверка сайта, затем Проверка DNS |
| Браузер ругается на сертификат или HTTPS | TLS / SSL | Проверка SSL, затем Проверка сайта |
| Соединение на 80/443 отклоняется или уходит в тайм-аут | Порт или сетевая достижимость | Проверка порта, затем Пинг или Трассировка маршрута |
| Сайт отвечает 403, 429, 500, 502, 503 или 504 | Приложение / пограничный слой / вышестоящий сервис | Проверка сайта, затем Проверка хостинга или уточняющая проверка SSL/DNS при необходимости |
| Жалуются только часть пользователей или регионов | Маршрут, распространение DNS, география или различия политик | Проверка сайта плюс аккуратная проверка из другого окружения |
03
Чистая последовательность первичной диагностики
Так вы не будете прыгать между инструментами, не получая новой информации.
Начинайте с точного URL, который не работает
По возможности используйте реальное имя хоста, схему и путь, чтобы редиректы и поведение сертификата оставались релевантными.
Определите первый слой отказа
Поймите, похож ли первый серьёзный сигнал на DNS, соединение, TLS или уже на HTTP-ответ приложения.
Откройте один профильный следующий инструмент
Переходите к Проверке DNS, Проверке SSL, Проверке порта, Пингу или Трассировке маршрута только после того, как первый широкий запуск показал нужный слой.
Проверьте, не привязан ли результат к локации
Если жалуются не все или сайт стоит за CDN и региональной политикой, держите в голове ограничение одной серверной точки, прежде чем делать широкие заявления.
04
Сигналы, которые часто сбивают с толку
Это технически правдивые наблюдения, которые всё равно уводят к неверному диагнозу.
- «Пинг проходит, значит сайт точно в порядке».
- «Сертификат валиден, значит HTTPS ни при чём».
- «DNS отвечает, значит проблема точно внутри приложения».
- «Сайт упал из одной точки или сразу из двух здесь, значит он недоступен для всех».
05
Лучшие инструменты для сужения типовых проблем
Выбирайте инструмент по тому семейству проблемы, которое теперь кажется наиболее вероятным.
Это лучший первый проход, когда ясно только то, что URL ведёт себя сломанно, а вам нужна быстрая и серьёзная классификация.
Проверка сайтаНормализованный DNS-ответИспользуйте Проверку DNS для проблем с именемОткрывайте её после неправильных IP-адресов, пустых ответов, NXDOMAIN или подозрений на распространение и делегирование.
Проверка DNSСертификат и TLSИспользуйте Проверку SSL для сбоев доверия к HTTPSЭто лучший вариант для жизненного цикла сертификата, покрытия имени хоста, самоподписанных цепочек и видимости версий протокола.
Проверка SSLTCP-достижимостьИспользуйте Проверку порта при подозрении на уровень соединенияИнструмент полезен, когда 80 или 443 могут быть закрыты, фильтроваться или просто не слушать с этой точки.
Проверка порта