Почему компании КНР открывают веса своих ИИ-моделей, а США строят заборы — iXBT.com

Для работы проектов iXBT.com нужны файлы cookie и сервисы аналитики. Продолжая посещать сайты проектов вы соглашаетесь с нашей Политикой в отношении файлов cookie Вынужденный альтруизм китайских нейросетей: Почему компании КНР открывают веса своих ИИ-моделей, а США строят заборы Пост опубликован в блогах iXBT.com, его автор не имеет отношения к редакции iXBT.com 5 часов назад | Мнение | ИИ, сервисы и приложения Мир искусственного интеллекта перевернулся с ног на голову, и мы наблюдаем картину, которая еще пару лет назад показалась бы абсурдной. Американские технологические гиганты, годами учившие планету принципам «демократии технологий» и свободного рынка, внезапно забаррикадировались в своих цифровых крепостях, спрятав самые мощные нейросети за API и дорогими платными подписками. В то же время Китай, который в западном общественном сознании прочно ассоциируется с закрытостью, цензурой и тотальным контролем, неожиданно превратился в главного мирового поставщика открытых весов (для неспециалиста: веса — по сути, «мозги» нейросети, её обученная структура, которую можно скачать и запустить у себя, дообучить или адаптировать; оптимизировать под свои нужды и запустить без спроса у создателя). Пока Кремниевая долина строит высокие заборы, китайские разработчики буквально наводняют GitHub и Hugging Face своими разработками, и эти модели качают, тестируют и запускают на частных инференсах энтузиасты по всему земному шару. Самое поразительное, что эти «подарки» из Поднебесной работают ничуть не хуже распиаренных западных аналогов, а отдельные образцы и вовсе демонстрируют производительность на уровне лучших коммерческих продуктов. Взять хотя бы недавний феномен kimi-k2-thinking, который уверенно ворвался в ТОП-20 престижного рейтинга lmarena, потеснив многих маститых конкурентов, причем находится он там далеко не на последних строчках, предлагая при этом полную открытость весов своей флагманской версии. Со стороны происходящее выглядит, как аттракцион невиданной щедрости, этакий цифровой коммунизм в действии… Но, как мы прекрасно понимаем, в большом бизнесе, а тем более в большой геополитике, чистого альтруизма не бывает и быть не может. За каждым «бесплатным» релизом стоит холодный расчет и жесткая необходимость. Так в чём же здесь подвох и почему стратегия Пекина так радикально разошлась со стратегией Вашингтона? Роскошь «Зелёного гиганта» Чтобы понять китайскую щедрость, нужно сначала осознать американскую стратегию. Она базируется на простом, как удар молота, и надёжном, как швейцарский банк, превосходстве в ресурсах. Корпорации вроде OpenAI, Microsoft или Anthropic могут позволить себе то, о чём остальной мир лишь мечтает: они просто покупают десятки тысяч самых современных и мощных ускорителей от NVidia. Автор: Pronoia (СС0) Источник: commons.wikimedia.org Да, флагманские чипы стоят целое состояние. Да, за ними выстраивается очередь из государств и технологических гигантов. Но для компаний из Кремниевой долины — вопрос лишь размера бюджета, а не принципиальной возможности. У них есть деньги, и они получают лучшее железо в мире. Наличие этих чипов даёт им не просто вычислительную мощность. Оно даёт доступ к «золотому стандарту» индустрии — экосистеме NVidia CUDA. Программистам не нужно изобретать велосипед: всё работает практически из коробки. Есть лучшие в мире чипы, есть идеально оптимизированные под них программные библиотеки, есть стандартные фреймворки. Нажал одну кнопку — модель начала многомесячное обучение на тысячах ускорителей. Нажал другую — готовая модель развернулась в облаке и начала обслуживать миллионы запросов от пользователей по всему миру. Процесс отлажен, надёжен и предсказуем. В таких условиях открывать веса модели — чистое безумие с точки зрения бизнеса. Зачем отдавать конкурентам рецепт своего фирменного блюда, если только у тебя есть идеальная кухня для его приготовления? Конкурентное преимущество американских компаний — не только в гениальности их алгоритмов, но и в колоссальной, эксклюзивной инфраструктуре, на которой эти алгоритмы работают. Именно поэтому им нет никакого смысла открывать код или делиться весами своих моделей. Их бизнес-модель — это «черный ящик», который работает идеально быстро и качественно благодаря аппаратному превосходству. Зачем давать конкурентам возможность заглянуть под капот, если ваша главная фишка — это скорость и стабильность, обеспеченные миллиардными инвестициями в дата-центры? Открывая веса, они лишь плодили бы клонов, которые могли бы работать на их же технологиях. Вместо этого они строят вокруг своих продуктов глубокий «ров с крокодилами», защищая свою монополию. В этой парадигме закрытость становится логичным продолжением доминирования. Когда у тебя на руках все козыри — от патентов до производственных мощностей TSMC, работающих на твои заказы, — делиться секретами просто глупо. Американские ИИ-гиганты превращают свои модели в сервис, в подписку, в «трубу», по которой течет интеллект, и кран от этой трубы находится исключительно в их руках. Они могут себе это позволить, потому что их инфраструктура работает как швейцарские часы, и пользователю проще заплатить 20 долларов в месяц, чем пытаться воспроизвести подобную мощь самостоятельно. Поэтому они и строят тот самый «ров с крокодилами» вокруг своих технологий. Их модель — крепость, а доступ к ней через API — единственный подъёмный мост, за проход по которому нужно платить. Им нет никакого смысла делиться чертежами крепости, потому что у них есть монополия на кирпичи и цемент. Потолок контрабанды КНР Совсем иная картина открывается, если мы перенесемся через океан. Из-за жестких санкций США Китай оказался фактически отрезан от легальных поставок топовых ускорителей, необходимых для обучения и работы современных нейросетей. Вашингтон методично перекрывает кислород, запрещая экспорт самых производительных чипов NVidia, что ставит китайские технологические компании в крайне уязвимое положение. Конечно, изобретательность бизнеса не знает границ, и «серые» схемы поставок существуют и процветают: через цепочки подставных фирм в Дубае, Сингапуре или Вьетнаме в страну всё же просачиваются заветные чипы Blackwell. Однако контрабанда имеет свои пределы, и этот предел — масштаб. Наскрести пару-тройку тысяч флагманских карт, переплатив за них в три дорога и потратив месяцы на логистические ухищрения, вполне реально. Этого объема вполне достаточно, чтобы собрать один мощный кластер для этапа обучения (Training) модели. Обучение — это разовая, пусть и очень ресурсоемкая задача: вы загружаете данные, запускаете процесс, ждете несколько недель или месяцев, и на выходе получаете готовую модель. Здесь можно потерпеть, можно переплатить, можно пойти на риск. Но когда дело доходит до инференса — то есть ежедневной, ежесекундной работы модели для миллионов пользователей, — ситуация меняется кардинально. Инференс требует не разового усилия, а постоянного наличия огромных вычислительных мощностей, распределенных по дата-центрам всей страны. Чтобы обслуживать запросы пользователей с той же скоростью, что и ChatGPT/Gemini/Claude, вам нужны не тысячи, а десятки тысяч карт, работающих 24/7. Построить такую инфраструктуру на контрабанде невозможно физически: цепочки поставок слишком ненадежны, объемы слишком малы, а цена такого «серого» импорта делает бизнес-модель убыточной еще на старте. В итоге китайские техногиганты оказываются в ловушке: они могут обучить крутую модель, используя накопленные или тайно ввезенные мощности, но они не могут обеспечить её массовую эксплуатацию на том же «золотом стандарте» железа, что и их американские конкуренты. И тут уже не до NVidia — приходится работать с тем, что есть в наличии, с тем, что можно купить легально и в больших объемах внутри страны или у менее принципиальных поставщиков. И именно здесь начинается главная головная боль китайских инженеров. Зоопарк архитектур То, с чем приходится работать китайским инженерам в продакшене, можно охарактеризовать одним емким словом — «зоопарк». Если в США стандарт де-факто — это монолитные кластеры из одинаковых карт NVidia, то в китайском дата-центре может царить настоящая эклектика. Здесь соседствуют старые карты NVidia прошлых поколений, закупленные еще до санкций, и игровые видеокарты серии GeForce, которые лицензионное соглашение прямо запрещает использовать в серверах (но кого это волнует, когда на кону выживание индустрии?). Рядом с ними трудятся чипы от AMD, которые, несмотря на свою мощь, всегда славились определенной «болью» в плане программной совместимости в профессиональных задачах. Но и это не самое сложное. Главный вызов — это собственные китайские ускорители, призванные заменить западные технологии. Чипы Ascend от Huawei, решения от Moore Threads, Biren и других локальных вендоров. Каждый из них имеет свою архитектуру, свои особенности работы с памятью и свои уникальные «болячки». Проблема этого «зоопарка» не столько в производительности железа, сколько в софте. Писать программное обеспечение под такой разношерстный парк — это настоящий ад для разработчика. Библиотеки глючат, совместимости нет, а стандартные, вылизанные годами фреймворки вроде PyTorch или TensorFlow на китайских чипах часто выдают непредсказуемые ошибки, работают вполсилы или вовсе отказываются запускаться. Команда разработчиков может потратить месяцы, просто чтобы заставить свою нейросеть стабильно работать на имеющемся оборудовании. Опенсорс как бесплатная рабочая сила И вот здесь мы подходим к разгадке китайской щедрости, к главному секрету их «вынужденного альтруизма». Выкладывая веса своей новенькой, мощной модели в открытый доступ, китайская компания совершает гениальный ход. Она фактически нанимает всё мировое IT-сообщество в качестве гигантского, бесплатного и невероятно мотивированного отдела тестирования и оптимизации. Логика предельно проста и эффективна. Зачем тратить миллионы долларов и тысячи человеко-часов своего R&D-отдела на адаптацию модели под каждую экзотическую железку, если можно отдать её миру? Как только крутая и бесплатная модель появляется на Hugging Face (главный мировой хаб для ИИ-моделей), за неё тут же берутся тысячи энтузиастов, исследователей и инженеров по всему миру. Какой-нибудь независимый бизнесмен из Германии, у которого стоит мощный кластер на базе AMD и есть желание продавать доступ к вашей модели, первым делом захочет запустить новинку на своём «красном» железе. Он потратит неделю, напишет необходимые патчи, выложит их на GitHub — и вот, модель уже работает на AMD. Другой напишет специальную библиотеку для эффективного сжатия (квантизации) модели, чтобы её можно было запускать даже на слабом железе. Третий энтузиаст из Кремниевой долины адаптирует её под нейропроцессоры в чипах Apple M-серии. Автор: 极客湾Geekerwan (CC BY 3.0) Источник: commons.wikimedia.org А где-то в китайском университете группа студентов, получившая грант на работу с отечественными ускорителями Huawei Ascend, возьмёт эту же модель и заставит её летать на китайских чипах. И всё это — абсолютно бесплатно для компании-создателя модели. Её инженерам остаётся лишь следить за активностью в сети, собирать лучшие наработки сообщества, как грибы после дождя, и внедрять их у себя. Таким образом, китайская компания, по сути, перекладывает самую нудную, дорогую и неблагодарную часть работы — адаптацию софта под кривое и разнообразное железо — на плечи мирового опенсорс-сообщества. Негласный договор выглядит так: «Мы даём вам один из лучших в мире ИИ-инструментов совершенно бесплатно. А вы уж сами разберитесь, как запустить его на старых картах NVidia, на чипах AMD, на процессорах Apple или на наших собственных китайских разработках». Фактор Партии Нельзя сбрасывать со счетов и мощнейший политический контекст, в котором существуют китайские технологические гиганты. Коммунистическая партия Китая (КПК) прекрасно осознает реальное положение дел: отставание в передовом железе от США — это факт, который невозможно игнорировать. И Партия требует компенсировать это аппаратное отставание скоростью внедрения и качеством программного обеспечения. В Пекине понимают, что в условиях санкционной войны каждый юань, вложенный в разработку закрытого, проприетарного кода, который нельзя переиспользовать в масштабах страны, — это юань, потраченный неэффективно. Для государства стратегически выгоднее, чтобы компании делились наработками, создавая общую национальную базу знаний. Ситуация, когда Alibaba, Tencent и Baidu сидят каждый в своей песочнице, изобретая велосипед на несовместимом проприетарном коде, для Китая сейчас непозволительная роскошь. Это замедляет общий прогресс и мешает стране в глобальной ИИ-гонке с США. Поэтому политика открытости активно поощряется сверху. Компании, которые играют по этим правилам и выкладывают модели в опенсорс, получают негласное (а часто и вполне официальное) одобрение в глазах Партии. Это открывает двери к получению жирных государственных заказов, грантов на исследования или налоговых льгот. Быть «открытым» в Китае сейчас — значит демонстрировать лояльность курсу на технологический суверенитет и общую победу. Ты не просто зарабатываешь деньги, ты вносишь вклад в общее дело, помогая всей индустрии быстрее адаптироваться к жизни без американских чипов. Кроме того, публикация весов моделей работает на имидж Китая как новой научной сверхдержавы. Это мягкая сила: пока США закрываются и прячут технологии, Китай позиционирует себя как драйвер прогресса, доступного каждому. Но за этим фасадом стоит прагматичный расчет Партии: объединить усилия всех игроков рынка, заставить их кодовую базу работать сообща и тем самым нивелировать преимущество Америки в «железе». Открытость становится формой мобилизации ресурсов перед лицом внешней угрозы. В условиях, когда доступ к передовым технологиям производства чипов перекрыт, софт становится главным полем битвы. И КПК делает ставку на то, что «народная война» в сфере разработки алгоритмов, подкрепленная открытым обменом данными, окажется эффективнее, чем закрытая корпоративная модель Запада. Заключение. Выживание через открытость Подводя итог, мы видим уникальную историческую гримасу, которую нам состроил XXI век. Самые «свободные» капиталисты планеты, базирующиеся в США, закрывают свои технологии на семь замков ради сохранения сверхприбылей и монопольного положения. Они превращают ИИ в элитарный клуб, вход в который возможен только по платной подписке, защищая свои инвестиции в «железо» стенами проприетарного кода. В то же время страна с жестким государственным регулированием, которую на Западе привыкли клеймить за тоталитаризм, становится флагманом свободного программного обеспечения. Китайские компании, ведомые прагматизмом и давлением обстоятельств, дарят миру инструменты, которые еще вчера казались фантастикой. Но важно помнить: это происходит не из любви к абстрактной свободе информации или душевной широты. В условиях тотальной аппаратной блокады «Open Source» для Китая — это единственный способ заставить софт работать на том железе, которое реально можно купить, а не искать на черном рынке. Это стратегия выживания, где мировое сообщество выступает в роли огромного распределенного отдела разработки, помогая Поднебесной преодолеть технологический разрыв. И пока США строят заборы, Китай строит мосты — просто потому, что по этим мостам к ним приходят необходимые решения. Изображение в превью: Source: https://www.ixbt.com/live/sw/vynuzhdennyy-altruizm-kitayskih-neyrosetey-pochemu-kompanii-knr-otkryvayut-vesa-svoih-ii-modeley-a-ssha-stroyat-zabory.html