Видеокарта AMD Radeon RX 7900 GRE вышла в Китае в июле 2023 года, который по восточному календарю был годом Кролика, к чему и отсылает аббревиатура GRE — Golden Rabbit Edition. В феврале 2024 года AMD выпустила RX 7900 GRE на глобальный рынок, составив конкуренцию видеокартам NVIDIA RTX 4070 Super и 4070 Ti. Как отличается их производительность в играх, кто лучше справляется с трассировкой лучей и что лучше — FSR или DLSS? Ответы на эти вопросы в новом обзоре Onlíner Lab.
Для удобства сравнения ценового позиционирования среди конкурентов посмотрим на график минимальных цен видеокарт в Каталоге. В нем учитываются модели видеокарт с как минимум двухвентиляторным охлаждением.
Как видно на графике, главными конкурентами по цене для RX 7900 GRE будут видеокарты RTX 4070 и 4070 Super. За видеокарту 4070 Ti уже придется изрядно доплатить, но для наглядности мы ее тоже добавили в сравнение.
Кратко про RX 7900 GRE: это вариант карты RX 7900 XT с чуть упрощенными характеристиками. Для удобства сравнения информации приводим таблицу с характеристиками обозреваемой видеокарты, конкурентных моделей от NVIDIA и ближайших моделей от AMD.
RX 7900 GRE | RTX 4070 Super | RX 7900 XT | RX 7800 XT | RTX 4070 Ti | |
Год анонса | 2023 (мир — 2024) | 2024 | 2022 | 2023 | 2023 |
Микроархитектура | RDNA 3.0 | Ada Lovelace | RDNA 3.0 | RDNA 3.0 | Ada Lovelace |
Чип | Navi 31 | AD104 | Navi 31 | Navi 32 | AD104 |
Шейдерные ядра | 5120 | 7168 | 5376 | 3840 | 7680 |
RT ядра | 80 | 56 | 84 | 60 | 60 |
L2 кэш | 6 МБ | 48 МБ | 6 МБ | 4 МБ | 48 МБ |
L3 кэш | 64 МБ Infinity Cache 2gen | — | 80 МБ Infinity Cache 2gen | 64 МБ Infinity Cache 2gen | — |
Базовая частота | 1287 МГц | 1980 МГц | 1387 МГц | 1295 МГц | 2310 МГц |
Максимальная частота | 2245 МГц | 2480 МГц | 2394 МГц | 2430 МГц | 2610 МГц |
Частота памяти | 2250 МГц | 1313 МГц | 2500 МГц | 2438 МГц | 1313 МГц |
Тип памяти | GDDR6 | GDDR6X | GDDR6 | GDDR6 | GDDR6X |
Объем памяти | 16 ГБ | 12 ГБ | 20 ГБ | 16 ГБ | 12 ГБ |
Ширина шины памяти | 256 бит | 192 бит | 320 бит | 256 бит | 192 бит |
Пропускная способность | 576.0 ГБ/с | 504.2 ГБ/с | 800.0 ГБ/с | 624.1 ГБ/с | 504.2 ГБ/с |
TGP | 260 Вт | 220 Вт | 315 Вт | 263 Вт | 285 Вт |
Видеокарта RX 7900 GRE использует тот же чип Navi 31, что и старшая RX 7900 XT. При этом объем видеопамяти уменьшили с 20 ГБ до 16 ГБ, ширину шины памяти ужали с 320 бит до 256 бит.
AMD для архитектуры RDNA 3 использует тип памяти GDRR6, тогда как NVIDIA перешла на более производительную и дорогую память GDDR6X. При этом пропускная способность у «красных» выше, чем у «зеленых», за счет более широкой шины памяти, а также другой системы кэша и компоновки. Конкретно эти два фактора разберем чуть подробнее.
AMD и NVIDIA использует разные подходы к построению своих графических процессоров. AMD с выходом RDNA 3 перешла на чиплетную архитектуру.
Это означает, что их графический процессор состоит из нескольких мелких чипов (чиплетов), которые объединяются на одной подложке. Основные компоненты AMD — это Graphics Compute Die (GCD) для графических вычислений и Memory Cache Die (MCD) для управления памятью. Важным элементом этой архитектуры является фирменный интерфейс Infinity Fabric, который соединяет чиплеты GCD и MCD, обеспечивая высокую пропускную способность и низкие задержки при передаче данных. Такая модульная структура позволяет гибко распределять функции между чипами, что упрощает масштабирование и увеличивает производительность.
Отличия в устройстве кэша между AMD и NVIDIA также значительны. В архитектуре AMD каждый шейдерный блок в чиплете GCD содержит кэш уровня L0, обеспечивающий быстрый доступ к данным для текущих вычислительных задач, и кэш L1, хранящий часто используемые данные и инструкции. Кэш L2 расположен между шейдерными блоками и внешней памятью (VRAM), координируя доступ к данным и увеличивая пропускную способность. Чиплет MCD содержит массивный кэш Infinity Cache, соединенный с GCD через интерфейс Infinity Fabric, что минимизирует обращения к внешней памяти.
NVIDIA, напротив, использует один монолитный чип, где внутри располагаются несколько крупных блоков обработки графики, каждый из которых содержит стриминговые мультипроцессоры.
В каждом мультипроцессоре находятся CUDA-ядра, тензорные ядра, RT-ядра, а также кэш уровня L0 и L1 и Shared Memory. Все эти компоненты имеют доступ к большому кэшу L2, который обеспечивает высокую скорость обмена данными внутри чипа. В отличие от чиплетной структуры AMD, монолитная структура NVIDIA упрощает взаимодействие между различными компонентами за счет единого большого кэша L2, что может обеспечивать более стабильную и предсказуемую производительность.
По ссылкам — характеристики и цены в Каталоге Onlíner.
Протестированы следующие видеокарты:
Gigabyte Radeon RX 7900 GRE Gaming OC оснащена тремя вентиляторами, каждый по 95 мм. Толщина радиатора составляет 25 мм.
В 4070 Super, как и в большинстве моделей новой архитектуры Ada Lovelace от NVIDIA, используется коннектор питания 16-pin. В AMD используют привычные два 8-пиновых разъема. Поэтому не нужно думать о совместимости блока питания или поиске переходника.
В синтетическом тесте OCCT средняя температура в течение 30 минут теста составила 49,02° (Hot-Spot 69,08°).
При включении скорости вращения вентиляторов на 100% температура практически не изменилась — 48,64° (Hot-Spot 68,84°).
Средняя температура Gigabyte Radeon RX 7900 GRE Gaming OC в играх среди всех разрешений составила 49°.
Энергопотребление в играх среди всех разрешений у Gigabyte Radeon RX 7900 GRE Gaming OC составило в среднем 271 Вт — на 69 Вт больше, чем у RTX 4070 Super в тех же условиях.
Для тестирования видеокарт мы используем единую методологию собственной разработки. Видеокарты были нами протестированы в Full HD, 2K- и 4K-разрешениях в шести тестах:
Все игры и карты тестировались на одном стенде с использованием одной версии драйверов.
Версия драйвера:
Во всех играх установлено самое высокое качество графики из возможных. Для видеокарт NVIDIA вместо сглаживания DLAA, доступного только для карт NVIDIA, использовалось встроенное в игру сглаживание для релевантного сравнения с видеокартами AMD. Для большего соответствия реальному игровому опыту использовались игровые тестовые сцены, а не встроенные в игры бенчмарки.
Список игр, в которых проводились тесты в нативном разрешении:
Судя по тестам, RX 7900 GRE отлично подходит для игр при любом разрешении, обеспечивая лидерство среди конкурентов в той же ценовой категории.
В FullHD-разрешении среди протестированных игр RX 7900 GRE показала среднее значение 128 fps, обойдя не только ближайшего конкурента по цене 4070 Super на 11%, но и более старшую и дорогую модель 4070 Ti.
В 2K- и 4K-разрешениях RX 7900 GRE мощнее 4070 Super в среднем на 7—10% и имеет почти одинаковую производительность с RTX 4070 Ti.
Ниже — показатели производительности RX 7900 GRE по разрешениям в каждой конкретной игре, включая онлайн-игры, которые не использовались при подсчетах среднего значения fps.
Как мы уже выяснили, RX 7900 GRE отлично справляется с современными ААА-проектами, однако с включением трассировки лучей ситуация поворачивается в невыгодную для AMD сторону.
Для сравнения производительности видеокарт в трассировке лучей мы постарались подобрать игры, где включение этой технологии значительно улучшает картинку и тем самым сильно нагружает видеокарту:
Все настройки графики и трассировки были выставлены на максимально возможные.
Видеокарта RX 7900 GRE в трассировке лучей оказалась хуже RTX 4070, 4070 Super и 4070 Ti на ~30%, ~50% и ~65% соответственно во всех разрешениях.
Большей производительности с RX 7900 GRE можно добиться, снизив настройки трассировки лучей или графики, однако это уже компромиссы, на которые не нужно идти в случае с RTX 4070 Super. Тем не менее в 4K-разрешении все видеокарты показали неиграбельный фреймрейт.
AMD FSR (FidelityFX Super Resolution) и NVIDIA DLSS (Deep Learning Super Sampling) — это технологии масштабирования изображения из низкого разрешения на входе в более высокое на выходе. Однако у них есть некоторые различия в принципах работы.
FSR использует алгоритмы пространственного апскейлинга для повышения разрешения изображения. Рендеринг происходит в более низком разрешении, затем изображение масштабируется до целевого разрешения с использованием алгоритмов улучшения резкости и других методов повышения качества. Алгоритмы FSR выполняются на стандартных шейдерных процессорах GPU, что делает технологию универсальной и применимой к широкому спектру графических карт. То есть FSR совместима с различными графическими процессорами, включая как устройства AMD, так и конкурирующие решения от NVIDIA и Intel.
DLSS использует нейронные сети и алгоритмы глубокого обучения для апскейлинга изображения. Исходный кадр рендерится в более низком разрешении, затем нейросеть повышает его разрешение до целевого (например, с 1080p до 4K), восстанавливая детали и улучшая качество картинки. Когда игра запущена, обученная модель загружается в тензорные ядра (специальные ядра для операций с нейросетями), доступные только в видеокартах NVIDIA RTX-серии.
В играх пользователю дается выбор уровня масштабирования FSR или DLSS для баланса между производительностью и качеством изображения.
При сравнении видеокарт с включенными FSR и DLSS мы использовали пресет «качество» плюс все те же максимальные настройки графики.
Список игр, в которых проводились тесты с использованием FSR для видеокарт AMD или DLSS для видеокарт NVIDIA:
В FHD-разрешении с ультранастройками и FSR в пресете «качество» видеокарта RX 7900 GRE показала лучший средний результат в протестированных играх — 132 fps.
В 2K-разрешении, которое для GRE-карты является целевым, получился результат в 117 кадров, что больше на 10% конкурента по стоимости RTX 4070 Super.
В 4K-разрешении RX 7900 GRE показала схожие результаты с RX 7800 XT, RTX 4070 Super и RTX 4070 Ti, однако последняя дороже на 570 рублей (!) на момент написания статьи.
Включением FSR на видеокарте RX 7900 GRE, также можно увеличить фреймрейт при использовании трассировки лучей. Однако в 4K с пресетом «качество» частота кадров все равно достаточно низкая, но можно попробовать другие пресеты для получения большей производительности.
Технологии генерации кадров позволяют создавать дополнительные кадры, существенно повышая плавность игрового процесса. И тут также есть различия в принципах работы генерации FSR и DLSS.
Генерация кадров AMD FSR 3 применяет метод интерполяции кадров, который генерирует новые кадры на основе предыдущих и текущих кадров. Это позволяет увеличить частоту кадров без дополнительной нагрузки на GPU. Интерполяция включает использование движения объектов и камеры в сцене. Технология отслеживает вектор движения для определения направления и скорости объектов. На основе этих данных FSR 3 предсказывает, как объекты переместятся в следующем кадре, и создает промежуточные кадры, вставляя их между уже существующими.
Генерация кадров NVIDIA DLSS использует искусственный интеллект для создания промежуточных кадров. Технология Optical Flow Accelerator анализирует два игровых кадра, идущих друг за другом, чтобы на их основе с применением обученной модели ИИ построить дополнительные кадры.
В отличие от открытой технологии AMD, DLSS FG можно активировать только на видеокартах NVIDIA архитектуры Ada Lovelace, то есть серии RTX 4***.
Однако важное обновление сделала AMD в марте 2024 года. В версии FSR 3.1 технологию генерации кадров стало возможно использовать в отдельности от самой FSR. То есть имея видеокарту NVIDIA серий RTX 2*** и 3***, можно активировать DLSS и генерацию кадров FSR 3.1.
Стоит упомянуть, что технология генерации кадров сильно зависит от изначального фреймрейта, потому что алгоритмы FSR/DLSS используют информацию из предыдущих кадров для создания новых. И если их было мало, то генерация только ухудшит ситуацию.
Теперь можно перейти к игровым тестам и сравнить работу FSR FG 3.1 и DLSS FG. Сравнивать будем в Horizon Forbidden West и Spider Man Miles Morales. На видеокартах NVIDIA мы активировали DLSS с пресетом «качество» + генерация кадров. На видеокартах AMD активировали FSR с пресетом «качество» + генерация кадров.
В Spider Man Miles Morales лидирующие позиции заняли видеокарты AMD с включенной технологией FSR 3.1 и активированной генерацией кадров. Прирост fps относительно нативного разрешения без применения технологий — во всех разрешениях разница практически в 2 раза!
В Horizon Forbidden West с применением технологий FSR и генерацией кадров наибольший фреймрейт во всех разрешениях выдали RX 7900 GRE и RX 7800 XT, увеличив количество кадров как минимум в 2 раза.
Однако применение технологии не происходит бесследно. Активация генерации кадров за счет принципов своей работы может добавить некоторую задержку во вводе при реальном игровом процессе. Это может негативно сказаться в онлайн-шутерах и при этом будет практически незаметным, но полезным в одиночных играх, таких как Horizon. Если опираться на субъективные ощущения, то у AMD с включенной генерацией кадров инпут-лаг (задержка ввода) меньше, чем на картах NVIDIA.
RX 7900 GRE и RTX 4070 Super технически разные видеокарты. AMD в новом поколении использует технологию чиплетов, тогда как NVIDIA использует похожую на предыдущие поколения структуру, дополнительно нарастив объем кэша L2.
По результатам тестирования RX 7900 GRE показывает производительность, достаточную для игры при любом разрешении.
RX 7900 GRE по результатам тестов в FullHD-разрешении выдала в среднем 128 fps, что лучше 4070 Super на 11%. В 2K- и 4K-разрешении RX 7900 GRE в среднем выдала 95 fps и 51 fps соответственно, что на 7—10% лучше, чем RTX 4070 Super. И это при практически идентичной стоимости видеокарт.
RTX 4070 Ti стоит на 570 рублей дороже, чем RX 7900 GRE, а производительность в нативном разрешении у них почти одинаковая.
С включением трассировки лучей RX 7900 GRE показывает не лучший результат, однако если в дополнение использовать FSR, то фреймрейт можно поднять до приемлемого уровня. Тем не менее NVIDIA остается лидером в производительности при использовании трассировки лучей.
Обновленная технология генерации кадров FSR 3.1 FG по результатам тестов увеличивает фреймрейт как минимум в два раза. Однако релиз версии 3.1 состоялся совсем недавно, и игр с ее поддержкой на момент написания статьи еще мало. Тем не менее достаточно игр использует FSR 3.0, и их количество постоянно увеличивается.
Отдельно стоит отметить использование RX 7900 GRE при работе с нейросетевыми моделями. Архитектура NVIDIA использует тензорные ядра, которые значительно ускоряют вычисления, связанные с машинным обучением и нейронными сетями. В дополнение к этому многие языковые модели в первую очередь оптимизируют под использование с видеоускорителями NVIDIA. Однако это совсем не означает отказ от использования видеокарт AMD с нейросетевыми моделями, хоть и накладывает определенные ограничения.
Благодарим интернет-магазин HAFF и импортера «Надежная техника» за предоставленные для проекта видеокарты.