Опыт работы в роли SRE, Technical Support (2-3 линия) или DevOps Engineer
Опыт поддержки высоконагруженных web- и mobile-приложений
Понимание жизненного цикла разработки и эксплуатации ПО
Понимание архитектуры web- и mobile-приложений:
• клиент (Web / Android / iOS)
• backend
• API
• базы данных
Опыт работы с системами мониторинга и логирования (Prometheus, Grafana, ELK, Sentry, Firebase Crashlytics или аналоги)
Навыки анализа логов, метрик и трассировок
Базовые знания сетевых протоколов (HTTP/HTTPS, TCP/IP)
Понимание принципов CI/CD и процессов релиза
Опыт работы с Linux-системами
Требуемые навыки и квалификации
Обеспечение стабильной работы сайта и мобильных приложений (Android, iOS)
Мониторинг доступности, производительности и ошибок клиентских и серверных компонентов
Реагирование на инциденты, участие в локализации и устранении причин сбоев
Контроль соблюдения SLA/SLO для пользовательских сервисов
Инциденты и поддержка
Приём, анализ и обработка технических инцидентов от:
• пользователей
• службы поддержки
• внутренних команд
Эскалация проблем в команды разработки и контроль их решения
Участие в postmortem-разборах инцидентов и подготовка предложений по предотвращению повторных сбоев
Настройка и поддержка систем мониторинга, логирования и алертинга
Анализ метрик (latency, error rate, availability и др.)
Выявление узких мест и потенциальных проблем до их влияния на пользователей