Видеокодек AV2 готов. Почему нам важны открытые стандарты — Habr

Патентование ![](https://habrastorage.org/webt/nt/lh/tp/ntlhtprs5ouzqihugqesey33mki.png) Новые видеокодеки моментально улучшают жизнь миллионов людей. Тем не нужно прикладывать практически никаких усилий, разве что обновить железо или софт. После этого видеофайлы магически уменьшаются в размере, качество картинки становится лучше, видео в интернете перестаёт тормозить и т. д. Например, новый видеокодек [AV2](https://gitlab.com/AOMediaCodec/avm) уменьшает трафик на 30%. Единственный недостаток — время кодирования увеличивается, потому что используются сложные интеллектуальные технологии (например, [психофизические модели]( https://youtu.be/_DTtdDCT_CI) зрения и мозга, новые способы предсказания будущего (межкадровых изменений) по предыдущим кадрам, последние открытия в математике (вроде [треллис-квантования](https://ieeexplore.ieee.org/document/781487/)). Появляется ощущение некоего волшебства. Вообще, эффективное сжатие напрямую связано с *пониманием* данных, то есть с уровнем интеллекта. Чем глубже понимание смысла, тем больше мы видим аналогий, паттернов, циклов и рекурсий, которые можно использовать для «упаковки» информации. Как говорится, достаточно продвинутая технология неотличима от магии. Так и видеокодеки нового поколения — это настоящая программная магия. # AV2 До конца 2025 года Alliance for Open Media (AOMedia) [обещает]( https://aomedia.org/press%20releases/AOMedia-Announces-Year-End-Launch-of-Next-Generation-Video-Codec-AV2-on-10th-Anniversary/) выпустить спецификации AV2. Работа над самим кодеком и его эталонной реализацией [AVM 11.0](https://gitlab.com/AOMediaCodec/avm) (AOM Video Model) завершена, остаётся лишь отточить формулировки — и опубликовать пресс-релиз. Очень важно, что свободные стандарты вроде AV1 и AV2 составляют альтернативу коммерческим видеокодекам, за которые требуется платить роялти с каждого проданного устройства (об этом ниже). Кроме улучшенного качества компрессии, AV2 поддерживает ряд новых функций: * оптимизация для стриминга, * просмотр нескольких программ на разделённом экране (несколько видео в одном видеопотоке), * улучшенная обработка экранного контента, * возможность работы в более широком диапазоне качеств, * расширенная поддержка AR/VR. Три месяца назад AOMedia провела [опрос](https://aomedia.org/press%20releases/AOMedia-Announces-Year-End-Launch-of-Next-Generation-Video-Codec-AV2-on-10th-Anniversary/) новых участников альянса, чтобы оценить распространённость AV1 и принятие будущего AV2. Опрос показал, что 88% участников оценили AV1 как «чрезвычайно важный» или «важный» для текущих или будущих продуктов. Что касается AV2, то 53% опрошенных планируют внедрить AV2 в течение 12 месяцев после выхода, а 88% — в течение двух лет. # Улучшение сжатия В октябре 2025 года на конференции QoMEX (Quality of Multimedia Experience) были представлены [результаты тестов AV2](https://www.youtube.com/watch?v=f0ivgL8vu9w), которые выглядят многообещающе. Последняя версия эталонного кодека AVM 11.0 вышла в сентябре 2025 года. Для его тестирования разработан специальный пакет тестирования и оценки AOM Common Test Conditions (AOM CTC 7.0), тесты проведены с его помощью. Для воспроизведения результатов можно взять [тестовые скрипты AOM CTC](https://media.xiph.org/video/aomctc/test_set/) и исходные видеофайлы всех размеров. ![Тестовый набор: 91 видео, 51 изображение; натуральные и синтетические, разрешение от 1080p до 8К](https://habrastorage.org/webt/rk/bj/n2/rkbjn275j3wme4uttkhtjhww9qa.webp) Тестирование проводилось в нескольких конфигурациях, с обычными настройками: два прохода, адаптивная модуляция, без фильтрации промежуточных кадров и т. д.: * AI (All Intra), кодирование промежуточных ключевых кадров (то есть отдельных изображений). * RA, случайный доступ: 130 кадров в постоянном режиме качества. * LD, низкая задержка: 130 кадров только с одним ключевым. * AS, адаптивный стриминг. Оценки визуального качества PSNR, SSIM и VMAF вычислялись с помощью инструмента [VMAF]( https://github.com/Netflix/vmaf) (Video Multi-Method Assessment Fusion) от Netflix. В целом, при сохранении качества AV2 снизил трафик в канале видеопередачи примерно на треть, по сравнению с AV1. Например, RA — это популярный режим кодирования для видеотрансляций в интернете (самый главный, с точки зрения разработчиков). В этом режиме AV2 показал уровень сжатия на 27–34% лучше, чем AV1. Группа тестирования проводила эти оценки с каждой новой версией AVM, поэтому на правой диаграмме можно отследить прогресс по версиям: ![](https://habrastorage.org/webt/ma/8b/nj/ma8bnjwzv5lp1eg6lb0f52lszby.webp) Видео высокого разрешения 4К и 8К больше выигрывает от новых интеллектуальных алгоритмов AV2, чем видео более низкого разрешения. То есть на HiRes-файлах разница заметнее (в процентах). В конфигурации LD улучшение сжатия составляет 22–26%, в зависимости от перцептивной оценки: ![](https://habrastorage.org/webt/dy/qp/sg/dyqpsgi_heynvlybfrrrbqxjbhq.webp) Вероятно, тут преимущество не такое большое из-за малого количества ключевых кадров, на которых основано сжатие (в конфигурации LD устанавливается только один промежуточный кадр на 130 кадров). При адаптивной видеотрансляции (AS) кодек может изменять битрейт и устанавливать ключевые промежуточные кадры на своё усмотрение. Очевидно, что в таком режиме он проявляет себя максимально эффективно: разница в сжатии достигает 35,71%. ![Сжатие при адаптивном стриминге](https://habrastorage.org/webt/wa/4g/_j/wa4g_jcrv4tpxngtn6btkatbebq.webp) От появления нового кодека выиграют абсолютно все веб-сайты, дизайнеры и фотографы, потому что уровень сжатия статических изображений вырос на 14–16%, при сохранении того же качества: ![](https://habrastorage.org/webt/p1/_f/tv/p1_ftvjkm3mgvpqg4mr2_arjome.webp) Отдельные тесты проводились для режима расширенного цвета AV2 Extended Color Format, ECF (4:4:4 и 4:2:2, то есть по два–четыре бита на пиксель в каналах Y:U:V): ![](https://habrastorage.org/webt/ed/oh/ky/edohky-9uia8osjoy5ml3xt4u5k.webp) Результаты там примерно такие же, как и в стандартном 4:2:0, в разных конфигурациях: ![](https://habrastorage.org/webt/sq/ev/oz/sqevozabbnjcbnn3g8vv_nm9w0g.webp) Дополнительно разработчики приводят результаты сторонних тестов, которые осуществляли не они, а коллеги из Google, в других тестовых наборах и конфигурациях на UHD-видео. Там вообще разница в уровне сжатия достигает 50,63%, что кажется какой-то фантастикой. Это значит, что прежний видеофайл AV1 размером 10 ГБ ужался до 4,94 ГБ в AV2 без потери качества: ![](https://habrastorage.org/webt/4c/xs/-7/4cxs-79xnf86hgmi_uj2ueriyjs.webp) В среднем, разница составила 38,01%. # Архитектура AV2 В другом докладе можно познакомиться с [архитектурой AV2](https://www.youtube.com/watch?v=Se8E_SUlU3w). Поскольку доклад представил Андрей Норкин из Netflix, то можно понять, что эта корпорация является главным разработчиком и выгодоприобретателем от нового видеокодека. Кроме неё, в разработке принимали участие программисты из Alibaba, Amazon, Apple, Broadcom, Google, Intel, Netflix, Nvidia, Oppo, Samsung, Tencent и Visionular. ![Фреймворк и инструменты для разработки и тестирования кодеков практически не изменились с 90-х](https://habrastorage.org/webt/wq/-s/5o/wq-s5oefxudvr79kkd1_ipaixhm.png) Видеокодек предыдущего поколения AV1 вышел в 2010 году, за его основу взяли комбинацию кодеков VP10, Daala и Thor. Теперь он повсеместно используется для видеотрансляций в интернете, в том числе на сервисах Netflix, YouTube и др. Разработка AV2 началась в 2020 году и заняла почти пять лет. Сложность представляло большое разнообразие железа, для которого требуется оптимизировать декодеры. Новая версия AVM выходила каждые четыре месяца. С точки зрения архитектуры, в AV2 реализованы более крупные суперблоки 256×256 пикселей. ![](https://habrastorage.org/webt/qy/cb/jb/qycbjb5lkqxef-t2jqnwpxufs4m.webp) Здесь устранили рекурсивность секционирования (partitioning). ![](https://habrastorage.org/webt/km/pt/qo/kmptqojavkbyqc2sxafzmnjf0fa.webp) И реализовали более эффективное разделение параметров яркости и цветности. ![](https://habrastorage.org/webt/3b/zl/ro/3bzlroj6pbxpiw2oryxi7suz_r8.webp) Здесь также унифицированный экспоненциальный квантизатор с более широким диапазоном яркости, более высокой точностью квантования для 8-, 10- и 12-битного видео, с лучшим управлением низкими битрейтами: ![Унифицированный экспоненциальный квантизатор AV2](https://habrastorage.org/webt/fk/8c/je/fk8cjehghfbhkogqb1kzi5qqqow.webp) Треллис-квантование (TCQ) двумя квантизаторами: ![](https://habrastorage.org/webt/jf/iv/cf/jfivcf86xenkr3f04afpzprm_f8.webp) Расширены возможности предсказания межкадровых изменений. Теперь они учитывают до семи предыдущих кадров, лучше обрабатывают движение на видео. ![](https://habrastorage.org/webt/fl/yy/8o/flyy8os9pphhgkn1kcq_8qrere8.webp) Реализована новая концепция генерации виртуальных кадров между двумя промежуточными путём интерполяции: ![Temporal Interpolated Prediction (TIP)](https://habrastorage.org/webt/p7/zs/r0/p7zsr0drayt8rkqg-sw6dn0ajw4.webp) Добавлены дополнительные фильтры для подавления шумов, уменьшения артефактов сжатия, сохранения детализации. ![Фильтры Винера](https://habrastorage.org/webt/tw/gu/jd/twgujdps-f4bsu9wlvcjgb5j43a.webp) В общем, изменений много: ![](https://habrastorage.org/webt/ap/ah/qb/apahqbuswrln0tb0-o8ux7z4eqa.webp) ## Какой кодек выбрать для своего приложения Среди разработчиков может быть актуален вопрос, какой кодек выбрать для своего приложения или видеотрансляций в интернете? Если выбирать [между AV1, H.264 и H.265](https://www.red5.net/blog/av1-vs-h264/), то AV1 намного эффективнее H.264 по уровню сжатия, хотя требует больше вычислительных ресурсов и времени для кодирования. Специалисты считают, что H.264 всё-таки остаётся более стандартным и надёжным вариантом для многих реальных приложений. Так что есть смысл постепенно вводить AV1, сохраняя при этом поддержку H.264. Ну и готовиться к переходу на AV2 в будущем. # Важность открытых стандартов Любопытно, что производители некоторых ноутбуков в последнее время [втихую убрали](https://arstechnica.com/gadgets/2025/11/hp-and-dell-disable-hevc-support-built-into-their-laptops-cpus/) аппаратную поддержку HEVC/H.265. Сначала на форумах пользователей Dell и HP [появились]( https://www.reddit.com/r/Dell/comments/1jxwqj6/hevc_hardware_decoding_unsupported_in_latitude/) [жалобы]( https://community.intel.com/t5/Graphics/Intel-Arc-140v-HEVC-Hardware-Decoding-Not-Working-In-Browser/td-p/1717931), что аппаратное декодирование HEVC/H.265 в браузере не работает. В стандартном отчёте Chrome по адресу `chrome://gpu/ ` он не отображается, также как в аналогичном отчёте Firefox. ![](https://habrastorage.org/webt/qr/hk/lf/qrhklfmiwcytosikf5grxef8ctk.png) На [тестовой странице]( https://lf-tk-sg.ibytedtos.com/obj/tcs-client-sg/resources/video_demo_hevc.html) параметры `canPlayType`, `IsTypeSupported` и `MediaCapabilities` активированы, но вместо видео демонстрируется белый экран. Программные видеоплееры типа VLC воспроизводят видеофайлы, но [только с помощью программных кодеков]( https://www.reddit.com/r/sysadmin/comments/1opxue7/hp_seems_to_be_disabling_hevc_hardware_decode/). Как выяснилось, производитель умышленно отключил HEVC в ноутбуках HP ProBook 460 G11 [[PDF]( https://cdn.arstechnica.net/wp-content/uploads/2025/11/ProBook-460-G11.pdf)], ProBook 465 G11 [[PDF]( https://cdn.arstechnica.net/wp-content/uploads/2025/11/ProBook-465-G11.pdf)], EliteBook 665 G11 [[PDF]( https://cdn.arstechnica.net/wp-content/uploads/2025/11/EliteBook-665-G11.pdf)], 200 Series G9 и др. **из-за проблем с лицензированием кодека**. Возможно, просто для экономии, потому что по [условиям лицензии]( https://cdn.arstechnica.net/wp-content/uploads/2025/11/HEVC-Advance-Program-Overview-July-2025.pdf) они обязаны платить роялти с каждого проданного устройства. Недавно консорциум правообладателей предупредил о [подорожании лицензий HEVC]( https://accessadvance.com/2025/07/21/access-advance-announces-hevc-advance-and-vvc-advance-pricing-through-2030/) с января 2026 года [с $0,20 до $0,24](https://via-la.com/licensing-programs/hevc-vvc/#license-fees) за каждое устройство, начиная с 100 001-го). ![ Стоимость лицензий на патентный пул HEVC Advance, который включает в себя HEVC/H.265 и VVC/H.266 ](https://habrastorage.org/webt/kv/rt/p5/kvrtp5jgqxynjdhdekmmrplgdje.png) На первый взгляд странно, что в ноутбуке за $1000 отключают кодек из-за подорожания на четыре цента. Но у этих производителей количество проданных ноутбуков измеряется [десятками миллионов]( https://www.gartner.com/en/newsroom/press-releases/2025-10-16-gartner-says-worldwide-pc-shipments-grew-8-percent-in-third-quarter-of-2025). Оплата роялти не первый раз заставляет производителей отказаться от поддержки коммерческих видеокодеков. Например, в прошлом году компания Synology [убрала поддержку AVC/H.264]( https://www.synology.com/en-global/products/status/eol-video-codec-support) в программах DiskStation Manager и BeeStation OS транскодирования видео на своих NAS в связи с «широким распространением видеокодеков на пользовательских устройствах, таких как смартфоны, планшеты, компьютеры и умные телевизоры». В данном случае компания хотя бы назвала причину, по которой решила ограничить функциональность, пусть это и не настоящая причина. Однако производители ноутбуков не сделали даже этого, удалив поддержку в скрытном режиме без объявлений, так что людям пришлось разбираться самостоятельно. Многие пользователи думают, что проблема лицензирования кодеков их никогда не коснётся. Мол, этим заморачиваются только сторонники свободного ПО, потому что у них много свободного времени. Но случай с ноутбуками — это наглядный пример, как коммерческий софт наносит вред обычным людям. Это любопытная ситуация, потому что проблема наблюдается только на *новых* ноутбуках. На старых аппаратная поддержка работает отлично, видео воспроизводится без ошибок, как и файлы в свободных форматах. Вот такая непроизвольная реклама опенсорса от Dell и HP. Это ещё раз напоминает о важности открытого ПО, в том числе свободных кодеков. Вот зачем нужны открытые стандарты, такие как AV2. © 2025 ООО «МТ ФИНАНС» Теги: Source: https://habr.com/ru/amp/publications/970584/