Код, интерфейсы и трафик без воды
lawebbox

Расходы на ИИ в корпоративном секторе: анализ затрат на инфраструктуру и MLOps

Бюджеты на ИИ растут, но цифры требуют контекста. По данным NV Техно, компании-рекордсмены тратят на ИИ-инфраструктуру порядка 7 500 долларов на сотрудника ежемесячно — это не средний показатель по рынку, а ориентир для тех, кто строит серьёзные ML-конвейеры.

Илья Воронов, Суровый бэкендер и DevOps-инженер · обновлено 12 июня 2026 г.

Расходы на ИИ в корпоративном секторе: анализ затрат на инфраструктуру и MLOps

Где именно растут бюджеты

Исследование, на которое ссылается ICT-Online.ru, даёт более приземлённую картину по российскому рынку. 65% компаний увеличили IT-бюджеты в 2026 году: 48% — в пределах 15%, ещё 17% — более чем на 15%. Только 12% планируют сокращение, 24% держат уровень 2025 года. Среди направлений инвестиций лидируют:

```

$ priorities = [

'AI' => 35,

'cybersecurity' => 34,

'cloud' => 23,

];

```

Драйверы роста — развитие бизнеса (39%), рост объёмов данных (33%), модернизация инфраструктуры (32%) и требования ИБ (30%). Характерная деталь: «ИИ» как статья расходов обгоняет «безопасность» всего на процент, при том что ИБ исторически воспринимается как must-have, а не как зона эксперимента. Это индикатор того, что ИИ перешёл из категории «попробовать» в категорию «платить регулярно».

Облако или on-premise: что выбирают

Распределение способов развёртывания ИИ в исследовании выглядит так: 46% компаний используют облако (уже, тестируют или планируют в течение года), 11% держат локальную инфраструктуру на собственных мощностях, 7% работают по модели SaaS. На практике DevOps это разница в подходах к IaC: managed Kubernetes с GPU-нодами против собственного bare-metal-кластера с собственным контуром данных. Манифест, который придётся писать в обоих случаях, отличается незначительно:

```yaml

apiVersion: v1

kind: Pod

spec:

containers:

  • name: inference

resources:

limits:

nvidia.com/gpu: 1

memory: "32Gi"

requests:

cpu: "4"

memory: "16Gi"

```

Александр Тугов, директор AI-вертикали Selectel, в комментарии для ICT-Online.ru формулирует позицию рынка прямо: GPU-оборудование морально устаревает за два-три года, и облако позволяет «проверить гипотезу, масштабировать успешные кейсы и гибко управлять ресурсами без крупных капитальных затрат и риска ошибиться с выбором оборудования». Локальный контур при этом остаётся востребованным в отраслях с жёсткими требованиями к безопасности и регуляторике — под такие сценарии Selectel предлагает выделенные серверы с GPU, включая размещение на площадке заказчика.

Среди причин выбора облака для ИИ-задач респонденты называют: доступ к готовым моделям и сервисам (36%), ускорение запуска экспериментов (32%), безопасность (27%), масштабирование (23%) и снижение стоимости разработки (20%).

Что отслеживать на практике

Цифра $7 500 на сотрудника в месяц — не повод завидовать и не ориентир для собственного бюджета. Это повод посчитать unit-экономику своего пайплайна. Три метрики, которые стоит держать в дашборде по умолчанию:

  • GPU-утилизация. Метрика `DCGM_FI_DEV_GPU_UTIL` через node-exporter и Prometheus. Низкая утилизация — индикатор того, что бюджет уходит в холостую.
  • Стоимость inference в пересчёте на один запрос, а не «за всё разом». Без этого числа разговоры об окупаемости ИИ остаются декларативными.
  • TCO в сравнении capex (собственные GPU) и opex (облако) с учётом двух-трёхлетнего цикла устаревания оборудования.

На фоне роста бюджетов и заголовка про $7 500 на работника разумная инженерная позиция — не «у нас будет столько же», а «сколько у нас стоит один работающий inference-сервис и как эта цифра меняется при росте нагрузки». Бюджеты растут — но растут они у тех, кто умеет их измерять.