24 032
11 сентября 2024 в 16:18
Источник: Дмитрий Содель. Фото: Оля Новицкая

Достойный соперник. Обзор видеокарты AMD Radeon RX 7900 GRE

Источник: Дмитрий Содель. Фото: Оля Новицкая

Видеокарта AMD Radeon RX 7900 GRE вышла в Китае в июле 2023 года, который по восточному календарю был годом Кролика, к чему и отсылает аббревиатура GRE — Golden Rabbit Edition. В феврале 2024 года AMD выпустила RX 7900 GRE на глобальный рынок, составив конкуренцию видеокартам NVIDIA RTX 4070 Super и 4070 Ti. Как отличается их производительность в играх, кто лучше справляется с трассировкой лучей и что лучше — FSR или DLSS? Ответы на эти вопросы в новом обзоре Onlíner Lab.

Цены и конкуренты

Для удобства сравнения ценового позиционирования среди конкурентов посмотрим на график минимальных цен видеокарт в Каталоге. В нем учитываются модели видеокарт с как минимум двухвентиляторным охлаждением.

Цены на видеокарты в 2024 году

 

16 ГБ GDDR6, 1287 МГц / 2391 МГц, 5120sp, 80 RT-ядер, трассировка лучей, 256 бит, 3 слота, питание 8+8 pin, HDMI, DisplayPort
12 ГБ GDDR6X, 1980 МГц / 2505 МГц, 7168sp, 56 RT-ядер, трассировка лучей, 192 бит, 2.5 слота, питание 16 pin (PCIe Gen5), HDMI, DisplayPort

Как видно на графике, главными конкурентами по цене для RX 7900 GRE будут видеокарты RTX 4070 и 4070 Super. За видеокарту 4070 Ti уже придется изрядно доплатить, но для наглядности мы ее тоже добавили в сравнение.

Характеристики

Кратко про RX 7900 GRE: это вариант карты RX 7900 XT с чуть упрощенными характеристиками. Для удобства сравнения информации приводим таблицу с характеристиками обозреваемой видеокарты, конкурентных моделей от NVIDIA и ближайших моделей от AMD.

RX 7900 GRE RTX 4070 Super RX 7900 XT RX 7800 XT RTX 4070 Ti
Год анонса 2023 (мир — 2024) 2024 2022 2023 2023
Микроархитектура RDNA 3.0 Ada Lovelace RDNA 3.0 RDNA 3.0 Ada Lovelace
Чип Navi 31 AD104 Navi 31 Navi 32 AD104
Шейдерные ядра 5120 7168 5376 3840 7680
RT ядра 80 56 84 60 60
L2 кэш 6 МБ 48 МБ 6 МБ 4 МБ 48 МБ
L3 кэш 64 МБ Infinity Cache 2gen 80 МБ Infinity Cache 2gen 64 МБ Infinity Cache 2gen
Базовая частота 1287 МГц 1980 МГц 1387 МГц 1295 МГц 2310 МГц
Максимальная частота 2245 МГц 2480 МГц 2394 МГц 2430 МГц 2610 МГц
Частота памяти 2250 МГц 1313 МГц 2500 МГц 2438 МГц 1313 МГц
Тип памяти GDDR6 GDDR6X GDDR6 GDDR6 GDDR6X
Объем памяти 16 ГБ 12 ГБ 20 ГБ 16 ГБ 12 ГБ
Ширина шины памяти 256 бит 192 бит 320 бит 256 бит 192 бит
Пропускная способность 576.0 ГБ/с 504.2 ГБ/с 800.0 ГБ/с 624.1 ГБ/с 504.2 ГБ/с
TGP 260 Вт 220 Вт 315 Вт 263 Вт 285 Вт

Видеокарта RX 7900 GRE использует тот же чип Navi 31, что и старшая RX 7900 XT. При этом объем видеопамяти уменьшили с 20 ГБ до 16 ГБ, ширину шины памяти ужали с 320 бит до 256 бит.

AMD для архитектуры RDNA 3 использует тип памяти GDRR6, тогда как NVIDIA перешла на более производительную и дорогую память GDDR6X. При этом пропускная способность у «красных» выше, чем у «зеленых», за счет более широкой шины памяти, а также другой системы кэша и компоновки. Конкретно эти два фактора разберем чуть подробнее.

Сравнение архитектуры видеокарт AMD и NVIDIA

AMD и NVIDIA использует разные подходы к построению своих графических процессоров. AMD с выходом RDNA 3 перешла на чиплетную архитектуру.

Чиплетная архитектура RDNA

Это означает, что их графический процессор состоит из нескольких мелких чипов (чиплетов), которые объединяются на одной подложке. Основные компоненты AMD — это Graphics Compute Die (GCD) для графических вычислений и Memory Cache Die (MCD) для управления памятью. Важным элементом этой архитектуры является фирменный интерфейс Infinity Fabric, который соединяет чиплеты GCD и MCD, обеспечивая высокую пропускную способность и низкие задержки при передаче данных. Такая модульная структура позволяет гибко распределять функции между чипами, что упрощает масштабирование и увеличивает производительность.

Отличия в устройстве кэша между AMD и NVIDIA также значительны. В архитектуре AMD каждый шейдерный блок в чиплете GCD содержит кэш уровня L0, обеспечивающий быстрый доступ к данным для текущих вычислительных задач, и кэш L1, хранящий часто используемые данные и инструкции. Кэш L2 расположен между шейдерными блоками и внешней памятью (VRAM), координируя доступ к данным и увеличивая пропускную способность. Чиплет MCD содержит массивный кэш Infinity Cache, соединенный с GCD через интерфейс Infinity Fabric, что минимизирует обращения к внешней памяти.

Архитектура RDNA 3

NVIDIA, напротив, использует один монолитный чип, где внутри располагаются несколько крупных блоков обработки графики, каждый из которых содержит стриминговые мультипроцессоры.

Строение чипа NVIDIA GA100

В каждом мультипроцессоре находятся CUDA-ядра, тензорные ядра, RT-ядра, а также кэш уровня L0 и L1 и Shared Memory. Все эти компоненты имеют доступ к большому кэшу L2, который обеспечивает высокую скорость обмена данными внутри чипа. В отличие от чиплетной структуры AMD, монолитная структура NVIDIA упрощает взаимодействие между различными компонентами за счет единого большого кэша L2, что может обеспечивать более стабильную и предсказуемую производительность.

Тестовая конфигурация

По ссылкам — характеристики и цены в Каталоге Onlíner.

Протестированы следующие видеокарты:

Игровой ПК

Температуры и энергопотребление

Gigabyte Radeon RX 7900 GRE Gaming OC оснащена тремя вентиляторами, каждый по 95 мм. Толщина радиатора составляет 25 мм.

В 4070 Super, как и в большинстве моделей новой архитектуры Ada Lovelace от NVIDIA, используется коннектор питания 16-pin. В AMD используют привычные два 8-пиновых разъема. Поэтому не нужно думать о совместимости блока питания или поиске переходника.

В синтетическом тесте OCCT средняя температура в течение 30 минут теста составила 49,02° (Hot-Spot 69,08°).

Тесты видеокарт

При включении скорости вращения вентиляторов на 100% температура практически не изменилась — 48,64° (Hot-Spot 68,84°).

Тесты видеокарт

Средняя температура Gigabyte Radeon RX 7900 GRE Gaming OC в играх среди всех разрешений составила 49°.

Температура RX 7900 GRE

Энергопотребление в играх среди всех разрешений у Gigabyte Radeon RX 7900 GRE Gaming OC составило в среднем 271 Вт — на 69 Вт больше, чем у RTX 4070 Super в тех же условиях.

TGP RX 7900 GRE

Методика тестирования

Для тестирования видеокарт мы используем единую методологию собственной разработки. Видеокарты были нами протестированы в Full HD, 2K- и 4K-разрешениях в шести тестах:

  1. в нативном разрешении без FSR/DLSS, генерации кадров и трассировки лучей;
  2. с включением FSR/DLSS в режиме «качество»;
  3. с включением FSR/DLSS в режиме «качество» и генерацией кадров одновременно;
  4. с трассировкой лучей;
  5. с трассировкой лучей и FSR/DLSS в режиме «качество».
  6. с трассировкой лучей, FSR/DLSS в режиме «качество» и генерацией кадров одновременно;

Все игры и карты тестировались на одном стенде с использованием одной версии драйверов.

Версия драйвера:

  • RTX 4070, 4070 Super, 4070 Ti - 555.99
  • RX 7700 XT, 7800 XT, 7900 GRE - 24.5.1

Во всех играх установлено самое высокое качество графики из возможных. Для видеокарт NVIDIA вместо сглаживания DLAA, доступного только для карт NVIDIA, использовалось встроенное в игру сглаживание для релевантного сравнения с видеокартами AMD. Для большего соответствия реальному игровому опыту использовались игровые тестовые сцены, а не встроенные в игры бенчмарки.

Тесты в играх в нативном разрешении

Список игр, в которых проводились тесты в нативном разрешении:

  • The Witcher 3;
  • Cyberpunk 2077;
  • Resident Evil 4 Remake;
  • Alan Wake 2;
  • Hogwarts Legacy;
  • Horizon Forbidden West;
  • Spider Man Miles Morales.

Судя по тестам, RX 7900 GRE отлично подходит для игр при любом разрешении, обеспечивая лидерство среди конкурентов в той же ценовой категории.
В FullHD-разрешении среди протестированных игр RX 7900 GRE показала среднее значение 128 fps, обойдя не только ближайшего конкурента по цене 4070 Super на 11%, но и более старшую и дорогую модель 4070 Ti.

В 2K- и 4K-разрешениях RX 7900 GRE мощнее 4070 Super в среднем на 7—10% и имеет почти одинаковую производительность с RTX 4070 Ti.

Сравнение RX 7900 GRE
Сравнение RX 7900 GRE
Сравнение RX 7900 GRE

Ниже — показатели производительности RX 7900 GRE по разрешениям в каждой конкретной игре, включая онлайн-игры, которые не использовались при подсчетах среднего значения fps.

Тесты RX 7900 GRE в играх
Тесты RX 7900 GRE в играх
Тесты RX 7900 GRE в играх

Тесты в играх с трассировкой лучей

Как мы уже выяснили, RX 7900 GRE отлично справляется с современными ААА-проектами, однако с включением трассировки лучей ситуация поворачивается в невыгодную для AMD сторону.
Для сравнения производительности видеокарт в трассировке лучей мы постарались подобрать игры, где включение этой технологии значительно улучшает картинку и тем самым сильно нагружает видеокарту:

  • Alan Wake 2;
  • Cyberpunk 2077;
  • Hogwarts Legacy;
  • SpiderMan Miles Morales;
  • The Witcher 3.

Все настройки графики и трассировки были выставлены на максимально возможные.

Видеокарта RX 7900 GRE в трассировке лучей оказалась хуже RTX 4070, 4070 Super и 4070 Ti на ~30%, ~50% и ~65% соответственно во всех разрешениях.

Большей производительности с RX 7900 GRE можно добиться, снизив настройки трассировки лучей или графики, однако это уже компромиссы, на которые не нужно идти в случае с RTX 4070 Super. Тем не менее в 4K-разрешении все видеокарты показали неиграбельный фреймрейт.

Сравнение RX 7900 GRE в FHD с трассировкой лучей
Сравнение RX 7900 GRE в 2K с трассировкой лучей
Сравнение RX 7900 GRE в 4K с трассировкой лучей

Сравнение технологий FSR и DLSS

AMD FSR (FidelityFX Super Resolution) и NVIDIA DLSS (Deep Learning Super Sampling) — это технологии масштабирования изображения из низкого разрешения на входе в более высокое на выходе. Однако у них есть некоторые различия в принципах работы.

FSR использует алгоритмы пространственного апскейлинга для повышения разрешения изображения. Рендеринг происходит в более низком разрешении, затем изображение масштабируется до целевого разрешения с использованием алгоритмов улучшения резкости и других методов повышения качества. Алгоритмы FSR выполняются на стандартных шейдерных процессорах GPU, что делает технологию универсальной и применимой к широкому спектру графических карт. То есть FSR совместима с различными графическими процессорами, включая как устройства AMD, так и конкурирующие решения от NVIDIA и Intel.

DLSS использует нейронные сети и алгоритмы глубокого обучения для апскейлинга изображения. Исходный кадр рендерится в более низком разрешении, затем нейросеть повышает его разрешение до целевого (например, с 1080p до 4K), восстанавливая детали и улучшая качество картинки. Когда игра запущена, обученная модель загружается в тензорные ядра (специальные ядра для операций с нейросетями), доступные только в видеокартах NVIDIA RTX-серии.

В играх пользователю дается выбор уровня масштабирования FSR или DLSS для баланса между производительностью и качеством изображения.

При сравнении видеокарт с включенными FSR и DLSS мы использовали пресет «качество» плюс все те же максимальные настройки графики.

Список игр, в которых проводились тесты с использованием FSR для видеокарт AMD или DLSS для видеокарт NVIDIA:

  • The Witcher 3;
  • Cyberpunk 2077;
  • Alan Wake 2;
  • Hogwarts Legacy;
  • Horizon Forbidden West;
  • Spider Man Miles Morales.

В FHD-разрешении с ультранастройками и FSR в пресете «качество» видеокарта RX 7900 GRE показала лучший средний результат в протестированных играх — 132 fps.

В 2K-разрешении, которое для GRE-карты является целевым, получился результат в 117 кадров, что больше на 10% конкурента по стоимости RTX 4070 Super.

В 4K-разрешении RX 7900 GRE показала схожие результаты с RX 7800 XT, RTX 4070 Super и RTX 4070 Ti, однако последняя дороже на 570 рублей (!) на момент написания статьи.

Сравнение RX 7900 GRE с FSR и DLSS в FHD
Сравнение RX 7900 GRE с FSR и DLSS в 2K
Сравнение RX 7900 GRE с FSR и DLSS в 4K
Тесты RX 7900 GRE в играх с FSR в Full HD
Тесты RX 7900 GRE в играх с FSR в Full HD
Тесты RX 7900 GRE в играх с FSR в Full HD

Включением FSR на видеокарте RX 7900 GRE, также можно увеличить фреймрейт при использовании трассировки лучей. Однако в 4K с пресетом «качество» частота кадров все равно достаточно низкая, но можно попробовать другие пресеты для получения большей производительности.

Сравнение RX 7900 GRE с FSR и трассировкой лучей в FHD
Сравнение RX 7900 GRE с FSR и трассировкой лучей в 2K
Сравнение RX 7900 GRE с FSR и трассировкой лучей в 4K
Тесты RX 7900 GRE в играх с трассировкой лучей и FSR
Тесты RX 7900 GRE в играх с трассировкой лучей и FSR
Тесты RX 7900 GRE в играх с трассировкой лучей и FSR

Чем отличается генерация кадров FSR от DLSS?

Технологии генерации кадров позволяют создавать дополнительные кадры, существенно повышая плавность игрового процесса. И тут также есть различия в принципах работы генерации FSR и DLSS.

Генерация кадров AMD FSR 3 применяет метод интерполяции кадров, который генерирует новые кадры на основе предыдущих и текущих кадров. Это позволяет увеличить частоту кадров без дополнительной нагрузки на GPU. Интерполяция включает использование движения объектов и камеры в сцене. Технология отслеживает вектор движения для определения направления и скорости объектов. На основе этих данных FSR 3 предсказывает, как объекты переместятся в следующем кадре, и создает промежуточные кадры, вставляя их между уже существующими.

Генерация кадров NVIDIA DLSS использует искусственный интеллект для создания промежуточных кадров. Технология Optical Flow Accelerator анализирует два игровых кадра, идущих друг за другом, чтобы на их основе с применением обученной модели ИИ построить дополнительные кадры.

Как работает DLSS 3

В отличие от открытой технологии AMD, DLSS FG можно активировать только на видеокартах NVIDIA архитектуры Ada Lovelace, то есть серии RTX 4***.

Однако важное обновление сделала AMD в марте 2024 года. В версии FSR 3.1 технологию генерации кадров стало возможно использовать в отдельности от самой FSR. То есть имея видеокарту NVIDIA серий RTX 2*** и 3***, можно активировать DLSS и генерацию кадров FSR 3.1.

Стоит упомянуть, что технология генерации кадров сильно зависит от изначального фреймрейта, потому что алгоритмы FSR/DLSS используют информацию из предыдущих кадров для создания новых. И если их было мало, то генерация только ухудшит ситуацию.

Теперь можно перейти к игровым тестам и сравнить работу FSR FG 3.1 и DLSS FG. Сравнивать будем в Horizon Forbidden West и Spider Man Miles Morales. На видеокартах NVIDIA мы активировали DLSS с пресетом «качество» + генерация кадров. На видеокартах AMD активировали FSR с пресетом «качество» + генерация кадров.

В Spider Man Miles Morales лидирующие позиции заняли видеокарты AMD с включенной технологией FSR 3.1 и активированной генерацией кадров. Прирост fps относительно нативного разрешения без применения технологий — во всех разрешениях разница практически в 2 раза!

В Horizon Forbidden West с применением технологий FSR и генерацией кадров наибольший фреймрейт во всех разрешениях выдали RX 7900 GRE и RX 7800 XT, увеличив количество кадров как минимум в 2 раза.

Однако применение технологии не происходит бесследно. Активация генерации кадров за счет принципов своей работы может добавить некоторую задержку во вводе при реальном игровом процессе. Это может негативно сказаться в онлайн-шутерах и при этом будет практически незаметным, но полезным в одиночных играх, таких как Horizon. Если опираться на субъективные ощущения, то у AMD с включенной генерацией кадров инпут-лаг (задержка ввода) меньше, чем на картах NVIDIA.

Плюсы и минусы RX 7900 GRE

RX 7900 GRE и RTX 4070 Super технически разные видеокарты. AMD в новом поколении использует технологию чиплетов, тогда как NVIDIA использует похожую на предыдущие поколения структуру, дополнительно нарастив объем кэша L2.

По результатам тестирования RX 7900 GRE показывает производительность, достаточную для игры при любом разрешении.

RX 7900 GRE по результатам тестов в FullHD-разрешении выдала в среднем 128 fps, что лучше 4070 Super на 11%. В 2K- и 4K-разрешении RX 7900 GRE в среднем выдала 95 fps и 51 fps соответственно, что на 7—10% лучше, чем RTX 4070 Super. И это при практически идентичной стоимости видеокарт.

RTX 4070 Ti стоит на 570 рублей дороже, чем RX 7900 GRE, а производительность в нативном разрешении у них почти одинаковая.

С включением трассировки лучей RX 7900 GRE показывает не лучший результат, однако если в дополнение использовать FSR, то фреймрейт можно поднять до приемлемого уровня. Тем не менее NVIDIA остается лидером в производительности при использовании трассировки лучей.

Обновленная технология генерации кадров FSR 3.1 FG по результатам тестов увеличивает фреймрейт как минимум в два раза. Однако релиз версии 3.1 состоялся совсем недавно, и игр с ее поддержкой на момент написания статьи еще мало. Тем не менее достаточно игр использует FSR 3.0, и их количество постоянно увеличивается.

Отдельно стоит отметить использование RX 7900 GRE при работе с нейросетевыми моделями. Архитектура NVIDIA использует тензорные ядра, которые значительно ускоряют вычисления, связанные с машинным обучением и нейронными сетями. В дополнение к этому многие языковые модели в первую очередь оптимизируют под использование с видеоускорителями NVIDIA. Однако это совсем не означает отказ от использования видеокарт AMD с нейросетевыми моделями, хоть и накладывает определенные ограничения.

Благодарим интернет-магазин HAFF и импортера «Надежная техника» за предоставленные для проекта видеокарты.

Onlíner Lab — новый проект Onlíner по тестированию видеокарт на основе единой методологии собственной разработки. Все игры и видеокарты тестируются с одинаковыми настройками и в одинаковых условиях. Результаты оформляются в виде обзоров и параметров в Каталоге Onlíner. Главная цель проекта — помочь читателям Onlíner в выборе новой видеокарты с учетом реалий белорусского рынка.

> Все обзоры на комплектующие и сборки ПК