Базы данных

Postgres troubleshooting labs

Диагностика database инцидентов в live окружениях.

Практикуйте Postgres incident response на проблемах репликации, производительности и восстановления.

  • Репликация и failover
  • Падение производительности
  • Проверки целостности
  • Live терминал

Теория по БД

  • Без реальных инцидентов
  • Без живых систем
  • Статичные примеры
  • Нет давления времени

Лабы Deadnodes

  • Инциденты как в проде
  • Живой дебаг
  • Тайминг и скоринг
  • Фокус на root-cause

Инциденты Postgres

Разбирайте лаг репликации, проблемы вакуума и нехватку диска.

  • Slow queries
  • Replica drift
  • Disk pressure

Контекст по стеку

База данных влияет на сервисы — диагностируйте инцидент целиком.

  • Симптомы приложения
  • Влияние на сервис
  • Recovery шаги

Для DevOps и SRE

Используйте сценарии для обучения, интервью или оценок.

  • Найм
  • Обучение
  • Командные тренировки