Tinkoff Sage
О продукте
Sage — это
Появившись как замена Splunk, Sage превратился в высоконагруженную распределенную систему с собственным языком запросов, алертингом и визуализацией данных
Платформа обеспечивает прозрачность
Ключевые особенности
Высокие нагрузки
— 150 ТБ логов в сутки
— 3 ГБ логов в секунду в пике
— 13,7 млн уникальных временных рядов
— 12 трлн точек в пике
— 6500 активных триггеров
Собственный язык запросов
—
— Компилируется в запросы к Elastic
— Автодополнение и подсветка синтаксиса
Отказоустойчивость
— Распределенная архитектура
— Retries, CircuitBreakers, Throttling
— Кастомизированный Elastic, в будущем — собственное хранилище
Конфигурация вычислительных ресурсов
— Гибкая настройка доступов
— Интеграция с AD
— Квотирование ресурсов
Визуализация
— Собственный интерфейс
— Плагин для Grafana
Триггеры и алертинг
— Оповещения
— Возможность описать сложную логику в триггерах
Интеграции
— Автоматизация процессов вокруг мониторинга
— Аналитика
— Отчеты
Команда
— Более 30
— В том числе
Использование внутри Тинькофф
Принимаем решения на основе
Создаем дашборды, которые показывают работу конкретного сервиса или процесса целиком
Оперативно реагируем на проблемы
Гибко настраиваем процессы реагирования. Создаем умные уведомления на основе логов и метрик
Минимизируем ущерб от сбоев
Оперативно находим проблемы сервисов и пострадавших от сбоев клиентов по неподготовленным данным
Разбираем проблемы и инциденты
Работаем с логами и метриками, отлаживаем приложения, разбираем сбои и проблемы
Для кого
SRE, DevOps и разработчики приложений
Владельцы
А также техподдержка и департаменты мониторинга
Sage на конференциях
Как работает Sage
Узнайте, как Tinkoff Sage помогает бизнесу