Рецепт идеальной разметки в Computer Vision

BigData и машинное обучение

Распознавание речи, образов / Прикладное ML / Рекомендательные системы

Machine Learning

Google Outlook Apple

Доклад принят в программу конференции

Мнение Программного комитета о докладе

Разметка данных становится новой нефтью 21-го века. Карина и Александр из Сбердевайсов расскажу про свой Open Source-фреймворк, который позволяет им собирать вместе данные, размеченные разными способами, и использовать эти данные для разных проектов.

Целевая аудитория

Data-инженеры, занимающиеся сбором и разметкой данных в области компьютерного зрения (CV); ML-инженеры, занимающиеся обучением моделей в CV; все, кому интересно разобраться, как получить качественную разметку CV-данных.

Тезисы

Скачать презентацию

За последний год мы собрали, разметили и выложили в открытый доступ 3 больших датасета для различных задач компьютерного зрения (Computer Vision, CV): HaGRID, EasyPortrait и Slovo. Использование краудсорсинга платформ для разметки этих данных подвигло нас создать методы агрегации разметки, которые позволили добиться максимальной точности.

Решение обобщить эти методы на другие CV-задачи привело нас к созданию фреймворка агрегации, о котором и пойдет речь в докладе. Мы расскажем о: * самых популярных способах разметки больших данных в CV: о краудсорсинге и нейронных сетях; * необходимости агрегировать разметку на примере HaGRID, EasyPortrait и Slovo; * мотивации создания фреймворка агрегации и о его реализации.

В конце продемонстрируем работу фреймворка для различных типов CV-разметки. Фреймворк доступен в Open Source, и мы планируем его поддерживать и обновлять, в том числе ориентируясь на пожелания комьюнити!

Карина Кванчиани

SberDevices

Computer Vision Engineer.

SberDevices

SberDevices — это компания полного цикла. Мы создаем идеи, самостоятельно разрабатываем продукты, занимаемся прототипированием, конструированием, придумываем дизайн, программные решения, контролируем качество на фабриках и создаем инструменты для аппаратного тестирования. Перед SberDevices стоит амбициозная задача: сделать новейшие технологии максимально доступными в повседневной жизни, помочь им раскрыться и практически, и коммерчески.

Александр Капитанов

SberAI

Руководит исследовательскими ML-командами в SberDevices. В прошлом инженер-железячник в области цифровой обработки сигналов на FPGA и ASIC, в частности, для обработки изображений и звука. Автор топовых лекций по обработке сигналов и регулярный спикер на научно-технических конференциях. Активный контрибьютор в Open Source.

SberAI

SberDevices — российская IT-компания полного цикла. R&D-центр экспертизы в области искусственного интеллекта: речевые технологии, понимание естественного языка, компьютерное зрение, лицевая и голосовая биометрия. Производит умные устройства, разрабатывает высокотехнологичные сервисы для бизнеса, делает масштабные ML-проекты, LLM, высоконагруженные системы и технологии обработки Big Data. В портфолио SberDevices — SberBox, SberJazz, GigaChat, Kandinsky и другие легенды.