Расходы на ИИ в корпоративном секторе: анализ затрат на инфраструктуру и MLOps
Бюджеты на ИИ растут, но цифры требуют контекста. По данным NV Техно, компании-рекордсмены тратят на ИИ-инфраструктуру порядка 7 500 долларов на сотрудника ежемесячно — это не средний показатель по рынку, а ориентир для тех, кто строит серьёзные ML-конвейеры.

Где именно растут бюджеты
Исследование, на которое ссылается ICT-Online.ru, даёт более приземлённую картину по российскому рынку. 65% компаний увеличили IT-бюджеты в 2026 году: 48% — в пределах 15%, ещё 17% — более чем на 15%. Только 12% планируют сокращение, 24% держат уровень 2025 года. Среди направлений инвестиций лидируют:
```
$ priorities = [
'AI' => 35,
'cybersecurity' => 34,
'cloud' => 23,
];
```
Драйверы роста — развитие бизнеса (39%), рост объёмов данных (33%), модернизация инфраструктуры (32%) и требования ИБ (30%). Характерная деталь: «ИИ» как статья расходов обгоняет «безопасность» всего на процент, при том что ИБ исторически воспринимается как must-have, а не как зона эксперимента. Это индикатор того, что ИИ перешёл из категории «попробовать» в категорию «платить регулярно».
Облако или on-premise: что выбирают
Распределение способов развёртывания ИИ в исследовании выглядит так: 46% компаний используют облако (уже, тестируют или планируют в течение года), 11% держат локальную инфраструктуру на собственных мощностях, 7% работают по модели SaaS. На практике DevOps это разница в подходах к IaC: managed Kubernetes с GPU-нодами против собственного bare-metal-кластера с собственным контуром данных. Манифест, который придётся писать в обоих случаях, отличается незначительно:
```yaml
apiVersion: v1
kind: Pod
spec:
containers:
- name: inference
resources:
limits:
nvidia.com/gpu: 1
memory: "32Gi"
requests:
cpu: "4"
memory: "16Gi"
```
Александр Тугов, директор AI-вертикали Selectel, в комментарии для ICT-Online.ru формулирует позицию рынка прямо: GPU-оборудование морально устаревает за два-три года, и облако позволяет «проверить гипотезу, масштабировать успешные кейсы и гибко управлять ресурсами без крупных капитальных затрат и риска ошибиться с выбором оборудования». Локальный контур при этом остаётся востребованным в отраслях с жёсткими требованиями к безопасности и регуляторике — под такие сценарии Selectel предлагает выделенные серверы с GPU, включая размещение на площадке заказчика.
Среди причин выбора облака для ИИ-задач респонденты называют: доступ к готовым моделям и сервисам (36%), ускорение запуска экспериментов (32%), безопасность (27%), масштабирование (23%) и снижение стоимости разработки (20%).
Что отслеживать на практике
Цифра $7 500 на сотрудника в месяц — не повод завидовать и не ориентир для собственного бюджета. Это повод посчитать unit-экономику своего пайплайна. Три метрики, которые стоит держать в дашборде по умолчанию:
- GPU-утилизация. Метрика `DCGM_FI_DEV_GPU_UTIL` через node-exporter и Prometheus. Низкая утилизация — индикатор того, что бюджет уходит в холостую.
- Стоимость inference в пересчёте на один запрос, а не «за всё разом». Без этого числа разговоры об окупаемости ИИ остаются декларативными.
- TCO в сравнении capex (собственные GPU) и opex (облако) с учётом двух-трёхлетнего цикла устаревания оборудования.
На фоне роста бюджетов и заголовка про $7 500 на работника разумная инженерная позиция — не «у нас будет столько же», а «сколько у нас стоит один работающий inference-сервис и как эта цифра меняется при росте нагрузки». Бюджеты растут — но растут они у тех, кто умеет их измерять.