Битва за железо: как российский бизнес выстраивает ИИ-инфраструктуру в условиях …

Анастасия Андриянова 24 октября 2025 17:18 На чтение: 10 минут Нравится: Еще пару лет назад компании спорили, стоит ли вкладываться в ИИ. Сегодня вопрос звучит иначе: «Где взять железо, чтобы этот ИИ заработал?». Мировая гонка за графическими процессорами превратила видеокарты в новый нефтяной ресурс — редкий, дорогой и стратегически важный. Россия оказалась в непростой ситуации: спрос растет, но поставки ограничены, а собственное производство все еще делом далекого будущего. Почему рынок вычислительных мощностей «трещит по швам», как компании обходят ограничения и какие шаги помогут бизнесу не остаться без «топлива» для своих рабочих процессов — разберем в статье. Чипы есть, доступа нет Спрос на вычислительные ресурсы растет взрывными темпами: компании разворачивают ИИ-сервисы, обучают модели и автоматизируют процессы, но также сталкиваются с нехваткой базового ресурса — чипов. Речь идет о современных GPU уровня NVIDIA H100, B200 и B300 — «мозгах» для обучения крупных ИИ-моделей. По данным исследований, глобальный рынок GPU оценивается в десятки миллиардов долларов: в одном из отчетов за 2024 год рынок графических процессоров-ускорителей для дата-центров составил примерно 87,3 млрд. долларов. По прогнозам, он увеличится до 119,97 млрд. долларов к концу 2025 со среднегодовым ростом (CAGR) около 13,7% на период до 2030 года. В целом мировой рынок GPU, по оценкам аналитиков, был оценен на уровне 101,54 млрд. долларов в 2025 году, с прогнозом роста до более чем 1 млрд. долларов к 2034-му. Для России же импорт критически важного ИТ-оборудования серьезно ограничен . По данным отчетов, после 2022 года около 65% ранее импортируемого ИКТ-аппаратного и программного обеспечения оказались под санкциями. При сверхрастущем спросе на мощные вычислительные платформы российский рынок оказывается в относительно худших условиях по сравнению с глобальным. В таких условиях даже крупные игроки вынуждены искать обходные решения, чтобы не остановить развитие: «Общемировой дефицит во многом спровоцирован ажиотажным спросом на эти карты, в России же ситуация дополнительно осложняется ограничениями на поставки. Проблема частично решается за счет параллельного импорта, однако отсутствие прямого доступа к вендору — это не только сложности с поставками, но и недоступность официальных лицензий и инструментов, платформ и технологий». Алексей Зотов, руководитель направления ИТ-инфраструктуры К2Тех А ключевая технология объединения GPU — Mellanox InfiniBand, также принадлежащая NVIDIA, фактически закрыта для отечественного рынка. Дефицит чипов, как катализатор роста Дефицит чипов не парализовал российский ИТ-рынок — напротив, стал катализатором внутреннего роста. Компании, столкнувшись с невозможностью прямых поставок, начали искать другие пути: от параллельного импорта до разработки собственных решений и построения корпоративных дата-центров. На фоне глобального дефицита именно адаптивность и гибкость стали главным конкурентным преимуществом. Одним из ключевых направлений стало развитие отечественных аппаратных платформ: «Российские производители уже предлагают готовые решения для корпоративного ИИ. В их числе — аппаратные платформы, например, от производителей Yadro, Delta Computers, FPlus или R-Style. Многие из них в последние год-два представили свои линейки серверов, в которые можно установить от 8 графических карт». Алексей Зотов, руководитель направления ИТ-инфраструктуры К2Тех Параллельно набирают обороты программно-аппаратные комплексы под ключ, например, «К2 НейроТех» или «Скала-Р», которые объединяют безопасность, преднастроенные фреймворки и инструменты для MLOps. Такие системы позволяют компаниям развернуть полноценную ИИ-платформу за считанные дни, без необходимости погружаться в тонкости инфраструктуры. Все происходит автоматически: стоимость рассчитывается в реальном времени; масштабирование под новые задачи бизнеса становится почти мгновенным. Не остались в стороне и облачные провайдеры. В условиях дефицита «железа» они переходят на гибридные схемы и форматы GPU-as-a-Service, позволяющие компаниям арендовать вычислительные мощности по требованию. Компании могут больше не вкладываться в дорогое оборудование — они арендуют вычислительные мощности на время экспериментов и проектов, используют их только тогда, когда это действительно нужно. Такой подход превращает GPU из дефицитного ресурса в управляемый инструмент — гибкий и экономически эффективный. Важна работа с инфраструктурой Важно понимать, что «железо» — лишь часть экосистемы. Не менее критичен вопрос инфраструктуры, в которой это железо работает. Октябрьский инцидент с пожаром в корейском дата-центре NIRS показал , что уязвимыми могут оказаться даже технологически продвинутые площадки. После этого случая во всем мире усилилось внимание к вопросам пожарной безопасности и отказоустойчивости ЦОД. Пожарный обливает водой сгоревшие литий-ионные аккумуляторы, хранящиеся в резервуаре, после пожара в NIRS в Тэджоне, суббота 27 сентября // Источник: Yonhap «Пожар в NIRS напомнил простую вещь: важны N+1/N+2 по всем узлам, геореплика, регулярные учения DR. В России ориентируемся на Tier III/IV, 152-ФЗ и 187-ФЗ, но зрелость по рынку разная», — отмечает Максим Захаренко, СЕО «Облакотека». Кроме того, в России, по словам Дмитрия Бердникова, главного специалиста по пожарной безопасности STEP LOGIC, дата-центры изначально проектируются с учетом действующих строительных и противопожарных норм, хотя до недавнего времени эти требования были заимствованы из общепромышленных стандартов. «Законодательно кроме изменений в ФЗ “О связи”, это выразилось в утверждении новой редакции СП 541.1325800.2024 “Здания и сооружения центров обработки данных. Правила проектирования», а также появлении термина «центр обработки данных” в отдельных нормативных документах по пожарной безопасности». Дмитрий Бердников, главный специалист по пожарной безопасности STEP LOGIC Особое внимание сегодня уделяется системам пожаротушения, включая газовые решения и технологии тонкораспыленной воды, а вопросы безопасности литиевых аккумуляторов только начинают активно прорабатываться. Защита данных не ограничивается физической безопасностью — компании активно используют стратегию резервного копирования: «Существует золотое правило при формировании стратегии резервного копирования, которое называется “3-2-1” и означает, что нужно иметь как минимум три копии данных на двух разных типах носителей и одна копия должна храниться на территориально удаленной площадке. Вне зависимости от уровня надежности дата-центра, защита от подобных угроз должна быть реализована на уровне системы резервного копирования». Пресс-служба Selectel Облачные сервисы позволяют реализовать этот принцип, но определить приоритеты и частоту копирования должен сам заказчик. В целом российские дата-центры остаются достаточно защищенными: проекты проходят экспертизу, закладываются требования к резервированию и устойчивости, а компании вырабатывают собственные стандарты безопасности. Все это позволяет поддерживать стабильную работу инфраструктуры даже при высокой нагрузке и технологических ограничениях. Подписывайтесь на наш Telegram Подписаться Российский чип: между амбицией и реальностью Разговоры о создании российских GPU и серверных процессоров звучат все громче, но реальность остается куда жестче. ИЛИ Россия все активнее обсуждает возможность разработки собственных GPU и процессоров, однако пока это больше стратегическая цель, чем реальный проект. Разработка собственного «мозга» для ИИ — задача не только технологическая, но и стратегическая: она требует миллиардных инвестиций, десятилетий опыта и доступа к оборудованию, которого в стране попросту нет. Даже при растущем интересе государства и корпораций к импортонезависимости, разрыв с мировыми лидерами измеряется поколениями технологических циклов. «Создать полноценное производство GPU и серверных чипов в России в ближайшие 10 лет крайне сложно в текущем технологическом контексте. Технологический разрыв очень велик: современные GPU (NVIDIA, AMD) и серверные CPU (Intel, AMD и т. д.) выпускаются на 5–3 нм. Для этого в первую очередь нужен экстремальный UV-литограф (EUV). Помимо оборудования, также необходимы материалы и специализированное программное обеспечение, плюс полноценная экосистема». Андрей Ильичев, руководитель департамента продуктовых решений «Инферит Техника» (ГК Softline) Схожего мнения придерживается и Константин Хабаров, генеральный директор ООО «Байт». «Создание GPU или серверных SoC без доступа к современным технологическим процессам остается малореальным — максимум возможна разработка архитектур и прототипов под старые нормы. Опыта проектирования GPU в стране нет в принципе», — подчеркивает эксперт. EUV-литограф ASML // Источник: ixbt Однако полное отставание — не приговор. В мире уже формируется ниша специализированных решений: энергоэффективных ASIC, ARM-платформ и RISC-V-процессоров для более конкретных и отраслевых задач. Именно здесь у России есть шанс закрепиться, если объединить усилия разработчиков, университетов (для подготовки и выпуска кадров) и частного капитала. Сейчас важно не догнать лидеров, а создать основу — подготовить кадры, развить инженерную школу и укрепить собственные компетенции в проектировании. Только пройдя этот путь, можно будет перейти от разговоров о «своем чипе» к его реальному производству. Мировой расклад: как распределяются силы Мировая же индустрия чипов сегодня напоминает сложный механизм, в котором каждая страна выполняет строго отведенную роль. Ни один игрок не контролирует всю цепочку от разработки до массового производства. США задают интеллектуальное направление, создают архитектуры, софт и инструменты проектирования. Тайвань и Южная Корея владеют одними из самых передовых производственных мощностей в мире. Китай же стремительно сокращает отставание, инвестируя миллиарды в развитие собственных архитектур, исследовательской базы, и формирует замкнутый технологический контур, независимый от Запада. При этом пока речь идет в основном о 28-нм решениях, и до передового уровня, по мнению Ильи Глейкина, ведущего бизнес-консультанта по развитию «ТМ АРБАЙТ», страна не дотягивает, поэтому баланс сил в обозримом будущем вряд ли изменится. Технологическое отставание Китая не означает полной изоляции от глобального рынка. Несмотря на то, что передовые узлы пока недоступны, страна активно осваивает средние и массовые сегменты, формирует собственные производственные возможности и нарабатывает опыт в проектировании GPU. «Китайские производители быстро наращивают мощности, в том числе в сфере графических процессоров (GPU)… При этом китайские чипы становятся все более интересны и конкурентоспособны в среднем ценовом сегменте, в том числе для рынков, где доступ к западным технологиям ограничен». Святослав Сорокин, директор по развитию бизнеса вычислительных систем STEP LOGIC Для России это выбор между тем, чтобы остаться покупателем готовых решений, или тем, чтобы выстроить собственную нишу в этой глобальной архитектуре. Потенциальные локальные центры уже формируются по всей стране: «В России пока нет очевидного лидера, но формируются игроки. Например: «Микрон» (Зеленоград) — потенциал в аналоговой и legacy-логике, НИИ «Элвис», НПЦ «ЭЛВИС» — в RISC-V и embedded-решениях». Андрей Ильичев, руководитель департамента продуктовых решений «Инферит Техника» (кластер «СФ Тех» ГК Softline) Как действовать в условиях дефицита Дефицит вычислительных мощностей заставляет бизнес не искать «запасные варианты», а выстраивать стратегию технологической устойчивости. Речь идет уже не о временных решениях, а о переосмыслении подхода к ИИ-инфраструктуре. «Наша компания переживает дефицит следующим образом: это гибридные кластеры CPU+GPU, доля инференса на CPU/старших сетях, vGPU-шаринг, MPS/микрошардинг, квантование до INT8/FP8, аккуратный планировщик и preemption, FPGA — там, где дает выигрыш по ваттам». Максим Захаренко, СЕО «Облакотека» Компании комбинируют облака и локальные ресурсы, переходят на GPU-as-a-Service и оптимизируют собственные модели, чтобы снизить зависимость от дорогого «железа». Свою эффективность уже доказали: Гибридные облака — распределение задач между CPU и GPU, использование зарубежных площадок или мощностей, полученных через параллельный импорт. GPU-as-a-Service — подключение мощных ускорителей тогда, когда они действительно нужны, без затрат на покупку и обслуживание оборудования. Инвестиции в MLOps и оптимизацию моделей — чем эффективнее инфраструктура и код, тем меньше требуется вычислительных ресурсов. Локальная адаптация — создание собственных микросервисов и работа с более доступными GPU, которые способны решать прикладные задачи без потери качества. Чтобы не потерять темп в эпоху «железного дефицита», бизнесу важно действовать системно. Прежде всего, трезво оценить свои реальные потребности, так как не каждая ИИ-задача требует топовых GPU вроде H100, и зачастую разумнее использовать облачные мощности или оптимизированные модели. Параллельно стоит планировать технологическую независимость, следить за развитием отечественных решений и закладывать переход на них в долгосрочную стратегию. Инвестиции в компетенции сегодня приносят не меньше пользы, чем вложения в оборудование: эффективная архитектура, отлаженный код и грамотная работа с MLOps позволяют экономить ресурсы без потери качества. И, наконец, важно выбирать партнеров, способных обеспечить устойчивость, тех, кто выстроил надежные каналы поставок и умеет работать с гибридными архитектурами, совмещая локальные и облачные ресурсы. Source: https://www.computerra.ru/326623/bitva-za-zhelezo-kak-rossijskij-biznes-vystraivaet-ii-infrastrukturu-v-usloviyah-nehvatki-chipov/