Сергей Юдин на GolangConf 2023

YandexGPT: как научить нейросеть сокращать статьи и быть в ней уверенным (на 99%)

Нейронные сети, искусственный интеллект

Продуктовая разработка

Machine Learning

Обработка данных

Доклад отклонён

Целевая аудитория

Data-сайентисты, ML и Data-инженеры

Тезисы

Генеративные большие языковые модели (Large Language Model, LLM) - наша новая реальность, которая становится core-технологиях во многих продуктах. То, для чего раньше требовалось собирать развесистый пайплайн из множества ML-моделей и хитрых алгоритмов обработки данных, теперь делается подбором правильного промпта.

Я расскажу про наш опыт обучения YandexGPT для задачи суммаризации статей в Яндекс Браузере и сервисе 300.ya.ru. О том, какие приемы помогли избегать ручных правил, экономить на GPU и что нас ждет в будущем.

Сергей Юдин

Яндекс

Более 7 лет работаю в Яндексе, в настоящее время являюсь руководителем Службы ML-проектов Браузера.
Преподаю в ВШЭ и курирую образовательные программы в Сириусе.

Яндекс

Яндекс — технологическая компания, создающая инновационные продукты на основе машинного обучения и нейронных сетей. Команда талантливых математиков и программистов разрабатывает одну из самых популярных поисковых систем и другие сервисы, которые помогают людям в их повседневной жизни. Среди его направлений деятельности: поиск, реклама, онлайн-заказ такси и еды, электронная коммерция, видео/аудио и потоковое вещание, автономное вождение и облачные сервисы. Яндекс активно развивает проекты с открытым исходным кодом, такие как CatBoost, DivKit, YDB, userver, YaLM, YTsaurus.