Попробуйте починить сломанную ML-модель, пройдите квиз, проверьте интеллект Алисы, пообщайтесь с экспертами и погрузитесь в нашу инженерную культуру.
Фиксированные бенчмарки с выбором ответов, арены, строгие side-by-side-оценки экспертами и онлайн-метрики в продуктах — что ближе к истине? Каковы плюсы каждого подхода? Какие сложности и риски в каждом случае?
Цель дискуссии — провести чёткую границу между удобством измерения и реальной пользовательской ценностью.
В индустрии всё чаще звучит вопрос: работают ли scaling laws для рекомендательных систем или это дорогая иллюзия? Правда ли, что «чем больше — тем лучше», или иногда разумнее сосредоточиться не на росте моделей, а на качестве данных? А если масштабирование действительно эффективно, почему в продакшене до сих пор остаются LightFM и Wide&Deep?
Отдельная тема — гибридные модели. На дискуссии поговорим о том, можно ли считать их «золотой серединой» или это скорее компромисс без реального выигрыша. Сравним, как ведут себя разные подходы: классическая рексистема на CatBoost и современная двубашенная нейросеть с трансформером.
Также обсудим, нужны ли трансформеры, когда рекомендательную систему приходится строить с нуля. Становятся ли они «оверкиллом» для стартапов и подходят ли для продуктов, где большинство пользователей остаются «холодными»? Разберёмся, поможет ли в этих случаях реалтайм-инференс.
AI-агенты уже используются для внутренних помощников, сервисных консолей и поддержки. Обсудим, как собрать собственного агента (опенсорс-фреймворки, облачные сервисы), дать ему доступ в веб и голос и встроить в инфраструктуру (MCP, вызов функций, шины событий, управление доступом). А ещë — какие задачи можно делегировать AI уже сейчас.
Отдельный блок посвятим безопасности и эксплуатации: цели по надёжности, наблюдаемость, контроль данных, периметры доступа, аудит действий, ограничение прав и бюджетов.
Рассмотрим кейсы из проектов Yandex Cloud, Сбера, Авито, MWS AI. Поговорим о помощниках разработчиков, автоматизации поддержки, работе с контентом и данными, интеграции с внутренними API и наследованными системами. А также разберём узкие места, такие как задержки, стоимость, управление инструментами и версиями моделей — и как выстроить платформенный подход для быстрых экспериментов без потери надёжности.
AI-агенты сегодня — одна из самых горячих тем в индустрии. E-commerce и смежные направления уже активно экспериментируют с этим инструментом: агентов используют, чтобы привлекать новых пользователей, оптимизировать затраты и освобождать время сотрудников для более интересных задач. Но между быстрым прототипом и стабильной системой в проде — огромная дистанция.
Вместе с возможностями появляются вызовы: как построить надёжную архитектуру и при этом быстро внедрять новинки, как сочетать LLM-ядро с классическим ML-пайплайном, как находить баланс между креативностью и предсказуемостью?
На дискуссии обсудим, что помогает решать такие задачи на практике и куда движется индустрия.
После конференции все зарегистрировавшиеся участники получат полную версию записи трансляции одними из первых, а позже мы поделимся ей в общем доступе в наших соцсетях.