Профессиональная конференция для Go-разработчиков

Как, и главное зачем, мы перевели Рекламные технологии Яндекса на стриминговый процессинг

Архитектура

Распределенные системы
Архитектура данных, потоки данных, версионирование
Выбор стратегии долгосрочного развития, KPI
Хранилища
Обработка данных
YTSaurus

Доклад отклонён

Целевая аудитория

Доклад будет полезен всем, кто стремится изжить тяжеловесные MapReduce-операции в своём продакшене. Если вы хотите расширить своё представление о применимости стримингов в больших системах, этот доклад вооружит вас конкретными примерами историй успеха. Если же у вас уже есть план, но руководство или продакты сопротивляются — мой рассказ покажет, как продать переезд на стриминги бизнесу.

Тезисы

Рекламная система Яндекса — это более 1000 разработчиков, аналитиков и ML-инженеров, 20-летняя история и существенный вклад в выручку компании. А также миллионы RPS, сотни петабайт данных и миллионы CPU. Когда-то наша история начиналась с MySQL и cron-скриптов, затем мы открыли для себя MapReduce. Тем не менее, с ростом бизнеса становилось всё более очевидным, что обрабатывать новые рекламные материалы за многие часы — это преступно долго.

Я расскажу, как мы последовательно переводим на стриминговые процессинги самые разные компоненты этой системы: от статистики до генерации рекламных объявлений и запуска нейросетей. Поделюсь общими советами по ускорению контент-систем, построению реалтаймовых джойнов логов, а также подходами к контролю за надёжностью стриминговых процессингов. Часть рассказа посвящу выбору технологии: почему мы написали что-то своё и как с учётом накопленного опыта видим принятие такого решения в 2024 году.

В итоге мы не только улучшили пользовательский опыт, но и заработали деньги благодаря повышению качества ранжирования, а также сэкономили десятки тысяч CPU. На профите и стратегии остановимся отдельно: обсудим, в чём конкретно может выражаться польза для CPO или CEO и как с оглядкой на это выстраивать долгосрочное целеполагание.

В индустрии с 2013 года. Начинал как разработчик на C++, в 2017 году внедрил в Рекламу первый подход к оптимизации CPU и памяти с помощью ML-модели.
Соавтор «Поясов по C++» на Coursera, вёл лекции на ФКН ВШЭ и семинары в ШАД.
Сейчас отвечаю за инфраструктуру Рекламных технологий в роли заместителя CTO и активно участвую в изменениях процессов найма в компанию.

Яндекс

Строим высоконагруженные сервисы с отказоустойчивой архитектурой, работаем с сотнями тысяч RPS и петабайтами данных, внедряем в продакшен передовые ML‑модели. Всё для того, чтобы поиск и взаимодействие с сервисами в интернете были качественными и надёжными.

Видео

Другие доклады секции

Архитектура