Сервис частично деградирован — HTTP 502

nginx 1.25.3

HTTP 502 — ошибки восходящего соединения

Часть запросов завершается ошибкой шлюза. Команда обслуживания работает над восстановлением связи с одним из backend-узлов. Затронуто примерно 8-12% запросов.

502

Сводные метрики инцидента

Код
502
Затронуто запросов
8.4%
502 / 5 мин
184
Длительность
12мин
Retry-After
60сек
Узлов в норме
5/6

Состояние компонентов

edge-04 · amsoperational
edge-07 · fraoperational
gateway-01degraded
gateway-02operational
upstream-app-02down
upstream-app-01operational
upstream-app-03operational
databaseoperational
cacheoperational
message-queueoperational

Хронология восстановления

01:48 UTC — текущее времяИдёт перезапуск службы на узле app-02.lan. Прогноз восстановления — 5-10 минут.
01:46 UTCИдентифицирована корневая причина — отказ службы обработки на узле app-02. Принято решение о перезапуске.
01:42 UTCУзел app-02.lan исключён из ротации балансировщика. Трафик переключен на резервные узлы.
01:38 UTCМониторинг подал сигнал тревоги. Доля ответов 502 превысила порог 5% от общего числа запросов в течение последних трёх минут.
01:36 UTCЗафиксированы массовые ошибки восходящего соединения. Открыт инцидент INC-2026-05-20-014. Уровень: средний.
01:30 UTCШтатная работа сервиса. Все узлы кластера в состоянии operational.

Обновления инцидента

Идентификация причины в работе

Сбой обнаружен на узле app-02.lan — служба обработки запросов остановилась с ошибкой. Запущен автоматический перезапуск через systemd. Параллельно команда обслуживания проверяет логи приложения.

Мониторинг подал сигнал сработал алерт

Доля ответов 502 превысила порог 5% от общего числа запросов в течение последних трёх минут. Автоматический алерт направлен дежурной команде обслуживания.

Инцидент открыт открыт

Зафиксированы массовые ошибки восходящего соединения. Уровень: средний. Создана запись в системе учёта инцидентов под номером INC-2026-05-20-014. Прогнозируемое время до полного восстановления — 10-15 минут.

Что делать посетителю Обновите страницу через минуту. Подобные инциденты обычно устраняются автоматически в течение 10-15 минут. Никаких действий со стороны посетителя не требуется. Если ошибка сохраняется дольше получаса — попробуйте вернуться позднее.

Технические идентификаторы

request id0xe211-9a7c-4488
trace id4f8c1e2a7b09cd4d
span id2c7a01ef
edge nodeedge-04 · ams
upstreamapp-02.lan (down)
методGET /api/profile
protocolHTTP/2 · TLS 1.3
cipherAEAD-AES128-GCM-SHA256
nginx1.25.3
retry-after~ 60 сек
incident idINC-2026-05-20-014
open since2026-05-20 01:36 UTC