Код, интерфейсы и трафик без воды
lawebbox

Тренды AI-инженерии: выводы с AI Engineer World’s Fair 2026

Прод упал не потому, что модель «тупая». Это уже старая сказка для стендапа. По разбору AI Engineer World’s Fair 2026 на Хабре, главный сдвиг в прикладной AI-инженерии — узкое место уехало с самой…

Максим Воронцов, Хардкорный бэкендер и девопс · обновлено 04 июля 2026 г.

Тренды AI-инженерии: выводы с AI Engineer World’s Fair 2026

Прод упал не потому, что модель «тупая». Это уже старая сказка для стендапа. По разбору AI Engineer World’s Fair 2026 на Хабре, главный сдвиг в прикладной AI-инженерии — узкое место уехало с самой LLM в обвязку вокруг неё: трейсы, песочницы, эвалы, границы, UI и весь тот скучный harness, без которого агент в проде превращается в генератор инцидентов.

Модель больше не главный подозреваемый

В материале разбирается AI Engineer World’s Fair 2026 — ежегодная конференция инженеров, которые строят продукты на моделях, а не обучают сами модели. В расписании было 560 сессий. Автор источника отдельно подчёркивает: смотреть всё подряд бессмысленно, поэтому он собрал навигатор по доступной части записей.

Ключевая мысль там простая и неприятная для тех, кто всё ещё ждёт «модель поумнее»: агент — это не LLM с парой прикрученных функций. Это система исполнения. Модель предлагает следующий шаг, но платформа вокруг должна этот шаг проверить, применить, записать и при необходимости откатить или хотя бы дать инженеру воспроизвести падение.

То есть нормальный агент имеет состояние, правила, журнал действий, ограничения, восстановление после сбоя и тесты. Звучит не как магия, а как обычный backend. Просто теперь внутри ещё сидит модель, которая уверенно генерирует действия. Если вокруг неё нет трассировки и границ — поздравляю, вы не сделали AI-продукт. Вы сделали костыль с красивым UI.

Источник описывает не полный архив конференции, а навигатор по доступным материалам. По его данным, из 560 сессий расписания публично на YouTube к моменту сбора нашлось 82 уникальных видео. Ещё три многочасовые трансляции главной сцены были разобраны на 55 тематических сегментов. Более пятисот сессий как отдельные записи в открытом доступе автор не нашёл.

Сбор был сделан через агентный пайплайн: официальное расписание, метаданные YouTube, субтитры к доступным записям, саммаризация и реестр с темами, ссылками и таймкодами. Отдельно упомянут типичный привет из реального мира: один доклад про RL-агента для ETL-пайплайнов упёрся в HTTP 429 на субтитрах, поэтому пришлось качать аудио и прогонять его через локальный whisper.cpp, пометив качество расшифровки как fallback.

Это важнее, чем выглядит. Даже навигация по конференции про агентов потребовала своего маленького harness: обработка ошибок, запасной путь, маркировка качества данных. Ровно та же история ждёт команды, которые запускают агентов в продукте. Сначала демо. Потом 429, битые субтитры, неполные данные, странный edge case и ночной лог с «почему оно удалило не тот объект».

Автор источника также выложил русскоязычный навигатор в GitHub-репозитории и SPA поверх него на GitHub Pages. Там есть русские саммари, тематическая карта, watchlist и ссылки на оригиналы. Но важная оговорка сохранена: это не замена оригинальным докладам, а карта по доступной части.

Что проверять у себя, пока агент не спалил прод

Для веб-разработки и SEO-пайплайнов вывод прямой: если вы прикручиваете агента к CMS, аналитике, генерации страниц, внутренним тулзам или ETL, вопрос уже не только в выборе модели. Вопрос в том, где у вас журнал действий, как повторить сбой, кто ставит границы и чем вы доказываете, что новая версия стала лучше, а не просто увереннее врёт.

На практике стоит смотреть не на презентационные фразы про «AI-first», а на механику исполнения. Есть ли у агента состояние. Пишется ли каждый шаг. Можно ли поднять конкретный прогон и увидеть, какие инструменты были вызваны. Есть ли песочница до доступа к боевым данным. Есть ли эвалы, а не только «нам понравился ответ в чате». Есть ли recovery после сбоя, или всё держится на надежде и одном промпте в Notion.

Главный сигнал с конференции в пересказе Хабра: прогресс моделей сделал инфраструктурные вопросы не менее важными, а более дорогими. Пока модель ошибалась на каждом втором шаге, спорить про журналы было рано. Когда ей начинают доверять реальные действия, цена ошибки переезжает в прод.

Минимальный инженерный ритуал перед запуском такого костыля: включить трассировку, отделить стейдж от прода, хранить входы и выходы прогонов, завести набор эвалов, ограничить инструменты, проверить fallback-пути. И да, сделать бэкапы. Потому что когда агент впервые «починит» вашу базу без журнала действий, разбирать философию AI-инженерии будет уже поздно.