Как с помощью AI в тысячах видео найти нужный кадр

Нейронные сети, искусственный интеллект

Доклад принят в программу конференции

Мнение Программного комитета о докладе

Доклад затрагивает сложную тему комплексного анализа видео и последующего извлечения нужных сущностей. Для решения задачи в короткий срок используется множество нейронных сетей. Как их подружить, прогнать сотни тысяч видео и научиться извлекать полезное — узнаем из доклада Александра!

Целевая аудитория

MLOps-инженеры, ML-инженеры, занимающиеся обработкой видеоконтента.

Тезисы

Я расскажу о пайплайне из 10+ моделей, который позволяет находить нужный фрагмент по произвольному описанию, по произнесенной фразе, цветовой палитре, лицу или действию в кадре.

Какие фичи мы извлекаем для быстрого поиска, какие модели для этого используем. Как комбинирование фич и оптимизация графа вычислений в 10 раз снизили сложность вычислений.

Мы немного коснемся архитектуры на основе Dagster, Celery, живущих в Kubernetes и кейсах у заказчиков.

Занимается машинным обучением в ООО «ГПМ Дата», специализируется на задачах MLOps и NLP. Кандидат технических наук.

ГПМ Дата

Лаборатория Gazprom ID по работе с данными, открывающая возможности цифровой трансформации компаниям. 130 специалистов в области данных и разработки ПО работают с лучшими и привлекают лучших.

Видео