Хайп vs реальность: что tech-медиа пишут об ИИ и кто реально лучший в 2025? — Habr

Лучший выбор: Hunyuan Image 3.0 или Seedream 4 Проверенный вариант: Imagen 4.0 Ultra от Google Забудьте: DALL-E и Midjourney уже не в топе Для генерации видео Лучший выбор: Veo 3.1 от Google (с audio) Альтернатива: Sora 2 Pro от OpenAI Бюджетный: Hailuo 2.3 (из Китая) Для AI-поиска Лучший выбор: Grok 4 Fast Search Альтернатива: Perplexity Sonar Pro От гигантов: Gemini 2.5 Pro Grounding или o3 Search Почему такой разрыв между медиа и реальностью? Несколько факторов объясняют этот феномен PR и маркетинг OpenAI тратит огромные бюджеты на PR. Anthropic фокусируется на продукте. Результат: ChatGPT знают все, Claude — только профессионалы. Timing ChatGPT был первым массовым продуктом в эпоху LLM. Первопроходцы получают непропорционально много внимания, даже если их потом обгоняют. Бизнес-новости интереснее технических Журналистам проще написать про $100M раунд, чем разбираться в архитектуре transformer'ов. Отсюда фокус на инвестициях, а не на бенчмарках. Западоцентричность медиа TechCrunch, VentureBeat и MIT Technology Review — американские издания. Они пишут о своих компаниях. Китайские модели в топах, но о них просто не знают. Бенчмарки сложны Chatbot Arena — отличный инструмент, но он не попадает в новостную повестку. Статья "OpenAI привлёк $X млрд" соберёт больше просмотров, чем "Claude обогнал GPT на 12 пунктов ELO". Что из этого следует для разработчиков Несколько советов на основе этого анализа: Не верьте хайпу — тестируйте сами То, о чём больше всего кричат, не обязательно лучшее. Проверяйте модели на своих задачах. Следите за бенчмарками, а не за новостями Chatbot Arena, MMLU, HumanEval — эти метрики важнее громких пресс-релизов. Смотрите на китайские модели Qwen, DeepSeek, Hunyuan — они уже в мировом топе и часто бесплатны или дешевле западных аналогов. Claude недооценён Если вы всё ещё используете только ChatGPT, попробуйте Claude. Особенно для кода и сложных reasoning-задач. Gemini — тёмная лошадка Google незаметно сделал одну из лучших моделей. Особенно сильна в мультимодальности. Используйте специализированные модели Для поиска — Grok или Perplexity. Для видео — Veo. Для изображений — Hunyuan. Универсальные модели не всегда лучшие. Заключение Анализ 200 статей показал огромный разрыв между тем, о чём пишут tech-медиа, и реальными возможностями ИИ-моделей. OpenAI доминирует в новостях, но Claude и Gemini часто превосходят его в тестах. Китайские модели в топах, но о них никто не знает на Западе. Журналисты пишут про инвестиции, а настоящий прогресс происходит в reasoning и мультимодальности. Главный вывод: в мире ИИ нельзя полагаться только на новости. Если вы разработчик, исследователь или просто интересуетесь технологиями — изучайте бенчмарки, тестируйте модели сами и следите за малоизвестными игроками. Часто именно они делают самые интересные вещи. Я продолжаю отслеживать новости об ИИ и публикую самые важные и интересные в своём Telegram-канале Ai&I ( https://t.me/ai_and_i_news ). Там вы найдёте не только хайп, но и реальные технологические прорывы — на русском языке, кратко и по делу. А какие модели используете вы? Совпадает ли ваш опыт с результатами LMArena? Делитесь в комментариях! Все данные актуальны на начало ноября 2025 года. Теги: Source: https://habr.com/ru/articles/964594/