Дани Эль-Айясс на GolangConf 2023

Краткая история NLP: от T9 до ChatGPT

Нейронные сети, искусственный интеллект

Нейронные сети / Языковые модели

27 ноября, 12:20, Зал «Сингапур»

Google Outlook Apple

Доклад принят в программу конференции

Целевая аудитория

Data Scientist'ы и ML-инженеры с большим уклоном в NLP (но это необязательно, так как доклад обзорный).

Тезисы

Скачать презентацию

В рамках доклада хочется осветить историческую хронологию того, как человечество пришло к текущему состоянию NLP-индустрии (появление ChatGPT и других LLM), какие челленджи, сложности и препятствия стояли перед сообществом и что нас может ждать дальше.

Обсудим следующее:
1. Состояние NLP до появления модели трансформера в 2017 году.
2. Что такое языковые модели.
3. Появление GPT-1, BERT, и как transfer learning изменил индустрию.
4. Появление GPT-2 и zero-shot.
5. Появление GPT-3, больших языковых моделей и few-shot.
6. Появление инструктивных моделей Flan-T5, Instruct-GPT, ChatGPT.
7. Их возможности, ограничения и перспективы.

Дани Эль-Айясс

SberDevices

AI-энтузиаст с 5+ годами в Data Science и машинном обучении. Занимается обучением больших языковых моделей в SberDevices, а именно GigaChat. В свободное время делает Open Source-проекты.

SberDevices

SberDevices — дочерняя компания Сбера, которая производит «умные» устройства. Это B2B- и B2C-девайсы для экосистемы с применением речевых технологий и виртуальным ассистентом на борту.

Александр Абрамов

SberAI

Более 9 лет опыта в области AI, ML. Исполнительный директор, руководитель команд ML/AI для b2c в SberAI. Участник команды разработчиков GigaChat, AI-евангелист, автор ruMTEB, FRIDA, ruSBERT, ru-en-RoSBERTa, ruElectra, augmentex, kaggle competitions master. Автор канала @dealerAI.

SberAI

Sber AI — это подразделение компании Сбер, которое занимается разработкой и внедрением технологий искусственного интеллекта.