Основное внимание в новой линейке видеокарт NVIDIA уделено развитию нейросетевых инструментов, которые улучшают графику и повышают производительность. При этом аппаратные изменения оказались менее значительными по сравнению с прошлым поколением. Как это отразилось на производительности? Узнаете из наших тестов в играх RTX 5070 Ti и сравнения с RTX 4070 Ti Super.
Onlíner Lab — проект Onlíner по тестированию видеокарт на основе единой методологии собственной разработки. Все игры и видеокарты тестируются с одинаковыми настройками и в одинаковых условиях. Результаты оформляются в виде обзоров и параметров в Каталоге Onlíner. Главная цель проекта — помочь читателям Onlíner в выборе новой видеокарты с учетом реалий белорусского рынка.
Обзоры Onlíner Lab:
> Обзор видеокарты RTX 4070 Ti Super
> Обзор видеокарты RTX 4070 Super
> Обзор видеокарты RTX 4060
> Обзор видеокарты AMD Radeon RX 7900 GRE
> Обзор видеокарты AMD Radeon RX 7600
> Обзор видеокарты Intel Arc B570
> Какой компьютер собрать в 2025 году?
> Сравнение топовых NVMe SSD PCIe 4.0
Для наглядного сравнения ценового позиционирования RTX 5070 Ti с конкурентами стоит взглянуть на график минимальных цен в Каталоге. На нем указаны минимальные цены видеокарт без учета их количества остатков у продавцов.
На момент написания статьи минимальная цена RTX 5070 Ti составляла 4350 руб. Теоретически прямым конкурентом по производительности для новинки является RTX 4070 Ti Super, которую можно купить на 850 рублей дешевле.
Однако сама по себе разница в цене не дает полной картины. Гораздо важнее, насколько производительность RTX 5070 Ti оправдывает эту разницу и стоит ли переплачивать по сравнению с RTX 4070 Ti Super — именно на эти вопросы отвечают результаты наших тестов.
NVIDIA в своих официальных документах по архитектуре Blackwell сравнивает новинку RTX 5070 Ti с RTX 4070 Ti. Это некорректно, ведь между ними еще есть Super-карты, а именно RTX 4070 Ti Super. Поэтому сравнивать архитектуру новинки будем именно с этой картой.
RTX 5070 Ti |
RTX 4070 Ti Super |
RTX 3070 Ti |
|
Наименование чипа |
GB203 |
AD104 |
GA104 |
Архитектура |
NVIDIA Blackwell |
NVIDIA Ada Lovelace |
NVIDIA Ampere |
Техпроцесс |
5 нм |
5 нм |
8 нм |
Интерфейс |
PCIe 5.0 |
PCIe 4.0 |
PCIe 4.0 |
Графические процессорные кластеры (GPC) |
6 |
5 |
6 |
Кластеры обработки текстур (TPC) |
35 |
30 |
24 |
Потоковые мультипроцессоры (SM) |
70 |
66 |
48 |
Объем видеопамяти |
16 ГБ |
16 ГБ |
8 ГБ |
Тип видеопамяти |
GDDR7 |
GDDR6 |
GDDR6 |
Ширина шины |
256 бит |
256 бит |
256 бит |
Пропускная способность памяти |
896 ГБ/с |
672,3 ГБ/с |
608,3 ГБ/с |
Ядра CUDA |
8960 |
8448 |
6144 |
Тензорные ядра |
280 (5-го поколения) |
264 (4-го поколения) |
192 (3-го поколения) |
RT-ядра |
70 (4-го поколения) |
66 (3-го поколения) |
48 (2-го поколения) |
Boost-частота |
2452 МГц |
2610 МГц |
1770 МГц |
Кеш L1 |
128 КБ (на каждый SM) |
128 КБ (на каждый SM) |
128 КБ (на каждый SM) |
Кеш L2 |
64 МБ |
48 МБ |
4 МБ |
В комплекте с видеокартой поставляется переходник питания 3x 8-pin на 1x 16-pin и регулируемая подставка для поддержки видеокарты. Переходник выполнен в формате обновленного разъема 12V-2x6, который оснащен укороченными контактами для предотвращения неполного подключения коннектора, что снижает риск оплавления разъема. Дополнительно коннектор выполнен в желтом цвете, что позволяет визуально заметить, если разъем вставлен не до конца, обеспечивая безопасность при подключении.
Видеокарта MSI GeForce RTX 5070 Ti Gaming Trio OC Plus имеет 2.5-слотовый дизайн охлаждения и оснащена тремя вентиляторами диаметром 95 мм.
Она получает питание через 16-pin-разъем. На задней стороне видеокарты присутствует тумблер переключения режимов BIOS видеокарты: Silent и Gaming. Оба BIOS управляют профилем скорости вращения вентиляторов видеокарты, позволяя добиться тишины, или же при нагрузках интенсивно охлаждать видеокарту. Забегая вперед, даже в профиле Gaming видеокарта остается достаточно тихой - ее не слышно на фоне офисного шума.
На вентиляторах и со стороны бэкплейта присутствуют фирменные символы MSI, которые переливаются на свету.
На лицевой панели видеокарты присутствует подсветка, выполненная тремя полосами, накрытыми матовым полупрозрачным пластиком. На противоположной стороне от разъемов присутствует фирменный логотип MSI, который также подсвечивается.
По ссылкам — характеристики и цены в Каталоге Onlíner.
Протестированы следующие видеокарты:
Для тестирования видеокарт мы используем единую методологию собственной разработки. Видеокарты были нами протестированы в Full HD, 2K- и 4K-разрешениях в шести тестах:
Версия драйвера для всех видеокарт: 572.47
Во всех играх установлено самое высокое качество графики из возможных. Вместо сглаживания DLAA/XeSS/FSR использовалось встроенное в игру сглаживание для релевантного сравнения видеокарт друг с другом. В Alan Wake 2 при тесте в нативном разрешении без трассировки лучей применено DLAA-сглаживание из-за невозможности его отключения. Для большего соответствия реальному игровому опыту использовались игровые тестовые сцены, а не встроенные в игры бенчмарки.
Согласно официальным данным, TBP (общее энергопотребление всей карты) составляет 300 Вт. В синтетическом тесте OCCT при максимальной нагрузке потребление карты составило 299,93 Вт. Что касается температуры, в стресс-тесте карта прогревалась до 66,7°C, а при максимальной скорости вентиляторов охлаждалась до 58,98°C.
NVIDIA в новом поколении видеокарт убрала датчик HotSpot, измеряющий соответственно температуру самой горячей точки на ГПУ. Из доступных для контроля датчиков остались только температура ГПУ и температура на чипах памяти.
При тестировании в играх видеокарта MSI GeForce RTX 5070 Ti Gaming Trio OC Plus нагревалась в среднем до 62°C.
Среднее энергопотребление всей видеокарты MSI RTX 5070 Ti Gaming Trio OC Plus в играх среди трех разрешений составило 262 Вт.
Список игр, в которых проводили тесты в классической растеризации. Во всех играх настройки качества графики выставлены на максимально возможные.
В FHD-разрешении RTX 5070 Ti выдает в среднем 132 fps, что ставит ее на уровне RTX 4070 Ti Super с небольшим преимуществом. При этом она остается на 15% медленнее RTX 4090, это ожидаемо, учитывая класс данных видеокарт. По сравнению с RTX 4070 Super разрыв составляет 27%, что показывает ощутимое преимущество.
В 2К-разрешении RTX 5070 Ti выдает 99 FPS, что на 11% быстрее RTX 4070 Ti Super и на 26% быстрее RTX 4070 Super.
Против RTX 4080 Super отставание составляет всего 6%, что демонстрирует высокую эффективность новой архитектуры.
В 4K-разрешении RTX 5070 Ti выдает среднее значение в 57 fps, что заметно опережает RTX 4070 Ti Super (+19%) и RTX 4070 Super (+46%). При этом разница с RTX 4080 Super всего 3%.
Высокая производительность RTX 5070 Ti в разрешении 4K объясняется несколькими ключевыми улучшениями в архитектуре Blackwell по сравнению с предыдущей серией Ada Lovelace. RTX 5070 Ti оснащена значительно бóльшим объемом кеша второго уровня по сравнению с RTX 4070 Ti Super и RTX 4080 Super. Увеличение кеша второго уровня позволяет хранить больше данных ближе к ядрам ГПУ, существенно сокращая обращения к видеопамяти, что особенно ощутимо в высоких разрешениях. RTX 5070 Ti использует GDDR7 с повышенной пропускной способностью. Это особенно важно в 4K, где нагрузка на память возрастает в разы.
Список игр, в которых проводили тесты. Во всех играх настройки качества графики и трассировки лучей выставлены на максимально возможные. В Cyberpunk 2077 использовался Path Tracing. При наличии в настройках игры опция Ray Reconstruction была активирована.
В FHD-разрешении с включенной трассировкой лучей RTX 5070 Ti показывает 67 fps, что на 8% быстрее RTX 4070 Ti Super и на 26% быстрее RTX 4070 Super. По сравнению с RTX 4080 Super отставание всего 7%.
В 2K-разрешении с трассировкой лучей RTX 5070 Ti демонстрирует в среднем 55 fps, что делает ее фактически равной RTX 4070 Ti Super.
Преимущество перед RTX 4070 Super составляет 25%, что заметно в этом более требовательном разрешении. RTX 4080 Super обгоняет RTX 5070 Ti всего на 6%, что впечатляет, учитывая ее более высокий ценовой класс.
В 4K видеокарта RTX 5070 Ti показывает 34 FPS, это на 13% быстрее RTX 4070 Ti Super и на 35% быстрее RTX 4070 Super. При этом разница с RTX 4080 Super всего 1 fps (2%), а это свидетельствует о высокой эффективности RTX 5070 Ti при максимальных нагрузках.
Со включением DLSS можно значительно повысить производительность при активной трассировке лучей с минимальной потерей качества. В играх, поддерживающих обновленный DLSS 4, визуальные отличия от нативного разрешения в динамике становятся практически незаметными. При активации DLSS также была включена опция реконструкции лучей (Ray Reconstruction), которая дополнительно улучшает качество освещения, теней и отражений без потери производительности.
С выходом DLSS 4 сравнение производительности игр с включенным апскейлингом становится менее корректным. Поддержка DLSS 4 постепенно добавляется разработчиками, и на данный момент не все тестируемые игры адаптированы под новую технологию. Поэтому сравнение результатов с разными версиями DLSS может быть нерелевантным.
Вместо стандартных тестов мы сосредоточились на сравнении работы DLSS 4 и технологии мультигенерации кадров в играх, которые уже получили поддержку новейших технологий, — Alan Wake 2 и Cyberpunk 2077. Тестирование проводилось как в режимах без трассировки лучей, так и с активной трассировкой, чтобы наглядно оценить влияние новых технологий на производительность. Для тестирования все графические параметры были выставлены на максимальные значения, включая трассировку лучей. DLSS 4 использовался в режиме «качество», а технология Ray Reconstruction была активирована.
С выходом DLSS 4 в Alan Wake 2 появилась новая настройка «ультра» для трассировки лучей, заменившая ранее максимальный пресет «высокие».
В Cyberpunk 2077 также были выбраны максимальные настройки графики. В качестве трассировки применялся режим «трассировка пути», который требует больших вычислительных ресурсов, чем стандартная трассировка лучей.
Интересно, что при тестировании RTX 5070 Ti с активированной генерацией кадров практически не ощущалось задержек ввода, которые ранее были заметны при использовании DLSS 3 на видеокартах серии RTX 4xxx.
Видеокарты архитектуры Blackwell производятся по тому же 5-нм-техпроцессу TSMC, что и модели на архитектуре Ada Lovelace. В новом поколении NVIDIA перешла на интерфейс PCIe 5.0, поддержку которого материнские платы и процессоры получили еще раньше, однако полноценное его использование в видеокартах реализовано только сейчас. Примечательно, что аналогичное решение применено и в новых видеокартах AMD RX 9070 и RX 9070 XT. Далее мы рассмотрим структуру кристалла Blackwell и разберем ключевые нововведения архитектуры.
NVIDIA не публикует блок-схемы кристаллов RTX 5070 Ti и RTX 4070 Ti Super, однако их можно визуально реконструировать, используя схему GB202 (RTX 5090) и AD102 (RTX 4090) с удалением лишних элементов. Кристалл RTX 5070 Ti включает 5 графических процессорных кластеров (GPC), 35 кластеров обработки текстур (TPC), 70 потоковых мультипроцессоров (SM) и 256-битную шину памяти.
Графический процессорный кластер (GPC) является основным высокоуровневым аппаратным блоком во всех ГПУ семейства Blackwell, содержащим основные графические вычислительные модули. Каждый GPC в RTX 5070 Ti содержит те же 6 кластеров обработки текстур (TPC), которые в свою очередь включают по 2 потоковых мультипроцессора (SM).
Потоковый мультипроцессор — это ключевой элемент архитектуры NVIDIA, объединяющий различные типы ядер (CUDA, Tensor, RT), работающих параллельно.
Поскольку техпроцесс не изменился, NVIDIA увеличила производительность за счет наращивания числа SM. В топовых чипах прирост значительный: RTX 5090 имеет 170 мультипроцессоров против 128 у RTX 4090. Однако в среднем сегменте изменения менее выражены: RTX 5070 Ti получил 70 SM, тогда как у RTX 4070 Ti Super — 66 SM.
За счет пусть и небольшого прироста количества SM увеличилось и число CUDA-ядер — 8960 у RTX 5070 Ti против 8448 у RTX 4070 Ti Super. При этом структура SM осталась неизменной: каждый мультипроцессор по-прежнему содержит 128 CUDA-ядер.
Изменения затронули блоки потокового мультипроцессора, отвечающие за вычисления целых чисел (INT32) и чисел с плавающей запятой (FP32). В играх FP32 используются для графических вычислений (освещение, физика, трассировка лучей), а INT32 задействуются для управления памятью, обработки индексов, логики рендеринга и оптимизации ИИ.
В архитектуре Ada Lovelace (RTX 4xxx) было разделение ядер.
В Blackwell NVIDIA унифицировала архитектуру, сделав все ядра универсальными — теперь каждое из них может работать как с FP32, так и с INT32. Однако, несмотря на универсальность, в рамках одного тактового цикла ядро может выполнять только один тип вычислений — либо FP32, либо INT32.
Новое поколение RT-ядер в архитектуре Blackwell получило значительные улучшения, которые, по заявлению NVIDIA, обеспечивают двукратный прирост производительности по сравнению с Ada Lovelace.
Коротко ключевые нововведения RT-ядер 4-го поколения:
Все эти элементы направлены на улучшение производительности с трассировкой лучей, однако мы подробнее рассмотрим только наиболее интересный на наш взгляд Mega Geometry.
Mega Geometry – это новая RTX-технология, значительно повышающая детализацию геометрии в играх с трассировкой лучей. Она позволяет игровым движкам использовать полноценные высокополигональные модели, а не упрощенные версии, которые ранее применялись для оптимизации ресурсов. Это делает LOD-переходы (изменение уровня детализации на расстоянии) более плавными, исключая резкие скачки качества.
Главное преимущество Mega Geometry — ускоренная трассировка сложных объектов, включая высокополигональные модели и сцены с большим количеством мелких деталей. Это стало возможным благодаря новой системе CLAS (Cluster-Level Acceleration Structures), которая группирует треугольники в компактные кластеры, ускоряя построение BVH (Bounding Volume Hierarchy). Такой подход снижает нагрузку на GPU и позволяет быстрее обрабатывать геометрию в реальном времени. Про то, что такое BVH простым языком, мы упоминали в обзоре Intel Arc B570.
Для геймеров это означает более реалистичные тени, отражения и освещение, так как трассировка лучей теперь работает с детализированными объектами без упрощения их геометрии. В результате визуальное качество в играх улучшается, а влияние рейтрейсинга на fps становится менее критичным.
Эта технология поддерживается на всех видеокартах RTX начиная с архитектуры Turing (RTX 20XX). Однако ее использование требует реализации со стороны разработчиков игр. Первой игрой, получившей поддержку Mega Geometry, стала Alan Wake 2.
С выходом архитектуры Blackwell NVIDIA добавляет поддержку операций FP4 и FP6 в тензорных ядрах, а также второе поколение FP8 Transformer Engine, аналогичное тому, что используется в серверных ГПУ Blackwell. Все это — форматы чисел, используемые для ускорения вычислений искусственного интеллекта, применяемые также в DLSS 4 и генерации кадров.
С выходом архитектуры Blackwell NVIDIA добавила поддержку FP4 и FP6 в тензорных ядрах, а также внедрила второе поколение FP8 Transformer Engine, аналогичное тому, что используется в серверных GPU Blackwell. Эти числовые форматы предназначены для ускорения вычислений искусственного интеллекта, что напрямую влияет на производительность DLSS 4 и генерации кадров, улучшая эффективность обработки нейросетевых алгоритмов.
Совместно с организацией JEDEC NVIDIA разработала новый тип памяти GDDR7 специально для поколения Blackwell. Это позволило увеличить пропускную способность с 672,3 ГБ/с (RTX 4070 Ti Super) до 896 ГБ/с (RTX 5070 Ti), сохраняя ту же 256-битную шину памяти. При этом объем видеопамяти остался неизменным — 16 ГБ.
В чипах архитектуры Blackwell появляется новый элемент — AI Management Processor, или сокращенно AMP. Это отдельный процессор внутри видеокарты, который помогает ей управлять задачами, не нагружая центральный процессор.
Контролем работы ГПУ обычно занимается ЦП, распределяя задачи между разными процессами (играми, программами и т. д.). Это создает задержки и может снижать fps в играх. Основная задача AMP — заменить ЦП при управлении задачами ГПУ, снижая зависимость от процессора, который часто является узким местом в производительности игр. Позволяя ГПУ управлять своими очередями задач, AMP уменьшает задержки, так как сокращает количество взаимодействий между процессором и видеокартой. Это приводит к более плавным fps в играх и лучшему многозадачному режиму в Windows, так как CPU не перегружается дополнительными задачами.
Во время написания обзора в сеть стали просачиваться новости про нестабильную производительность старых игр на видеокартах RTX 5xxx. На топовых видеокартах архитектуры Blackwell производительность в старых играх падала ниже 60 fps. Участники форумов быстро нашли виновника проблемы — при отключении PhysX, например, в Borderlands 2 производительность игры возвращалась в норму. При этом официальных заявлений компании NVIDIA по этому поводу не было.
Позже компания все-таки подтвердила — в видеокартах архитектуры Blackwell RTX 5xxx действительно прекращена поддержка 32-битной версии PhysX.
NVIDIA PhysX — это физический движок, который отвечает за реалистичное поведение объектов в играх. С момента его создания PhysX прошел несколько эволюционных этапов и получил разные версии с различной точностью и возможностями.
PhysX с 32-битными вычислениями активно использовался в играх на движках Unreal Engine 3 и Unity 4, таких как Mirror’s Edge, трилогия Mass Effect, Assassin's Creed Black Flag, Borderlands 2 и т. д. С полным списком игр с 32-битным PhysX можно ознакомиться тут.
Современные игры используют 64-битный PhysX, позволяющий более точно рассчитывать физику предметов и поверхностей в играх. В архитектуре Blackwell поддержка 64-битного PhysX не прекращалась.
Вполне вероятно, что в ближайшее время мы увидим пользовательские варианты решения этой проблемы. Однако, если вы любитель старых тайтлов и не сможете пережить отсутствие возможности их запускать без танцев с бубном на новейших видеокартах NVIDIA, всегда есть вариант остановиться на предыдущем поколении видеокарт RTX 4xxx.
С выходом архитектуры Blackwell NVIDIA представила обновленную технологию апскейлинга — DLSS 4. Главное нововведение — многокадровая генерация (Multi Frame Generation, MFG), обеспечивающая еще более высокую производительность при меньшем потреблении памяти.
До версии DLSS 3.8 для обработки изображения ИИ использовались сверточные нейросети (CNN, Convolutional Neural Networks). В DLSS 4 компания перешла на трансформерную модель, аналогичную тем, что применяются в современных нейросетях. Что это все значит и чем отличается новая модель? Разберем простым языком с примерами.
CNN (сверточная) модель — анализирует изображение «послойно», как сетку, объединяя соседние пиксели и выстраивая картину иерархически. Такой метод эффективен для обработки локальных деталей, но хуже справляется с большими областями изображения, особенно в динамике.
«Трансформер» DLSS 4 анализирует весь кадр сразу, используя механизм self-attention (самовнимание). Это позволяет определять важные зоны сцены и прорабатывать их детальнее. Например, если объект движется, модель сфокусируется на нем, а не на фоне, улучшая четкость в динамических сценах.
Хорошая новость заключается в том, что DLSS 4 поддерживается на всех видеокартах NVIDIA серии RTX, начиная с RTX2xxx. Хоть сама трансформерная модель не дает существенного прироста FPS, она позволяет использовать режимы «Баланс» и «Производительность» без ощутимой потери качества изображения.
Технология генерации кадров (Frame Generation) впервые появилась в архитектуре Ada в 2022 году, позволяя создавать дополнительный кадр между двумя традиционно рендеренными, используя оптический поток, векторы движения и нейросетевую модель.
Архитектура Blackwell, ориентированная на нейронный рендеринг, использует тензорные ядра 5-го поколения и DLSS Multi Frame Generation, что позволяет генерировать до трех дополнительных кадров на каждый отрендеренный. Новые кадры равномерно распределяются, обеспечивая более плавный игровой процесс.
Ранее в DLSS 3 управление кадрами выполнялось через ЦП, что могло вызывать нестабильное распределение и снижение плавности. В Blackwell эту проблему решает Flip Metering — новая система, которая переносит управление кадрами в дисплейный движок ГПУ, синхронизируя их отображение точнее и стабильнее.
Дополнительно NVIDIA заявляет двукратное увеличение скорости обработки пикселей, что обеспечивает поддержку высоких разрешений и частот обновления в DLSS 4.
С выходом DLSS 4 и переходом на трансформерную модель была обновлена и технология DLSS Ray Reconstruction (RR).
Ray Reconstruction — это технология от NVIDIA, разработанная для улучшения качества изображения в играх с трассировкой лучей с помощью искусственного интеллекта. При стандартной трассировке видеокарта рассчитывает, как свет взаимодействует с объектами — отражается, преломляется и создает тени. Этот процесс требует высоких вычислительных ресурсов, поэтому для ускорения традиционно применялись шумоподавители (денойзеры), сглаживающие артефакты, но требующие ручной настройки.
В обновленной версии Ray Reconstruction вместо стандартных шумоподавителей используется нейросеть NVIDIA, обученная на суперкомпьютере. Она самостоятельно дорисовывает пиксели между уже обработанными лучами, формируя более чистое и реалистичное изображение.
Помимо улучшения визуального качества, DLSS RR также повышает производительность трассировки лучей. GPU тратит меньше ресурсов на прямой расчет лучей, что дает прирост fps, особенно в сценах со сложным освещением, полупрозрачными поверхностями и динамическими источниками света.
В результате технологии Ray Reconstruction удается достичь одновременно высокой детализации и увеличения производительности, делая картинку в играх с трассировкой лучей более реалистичной и стабильной.
RTX 5070 Ti показывает заметный прирост производительности даже в нативном режиме, без активации DLSS и генерации кадров. Это стало возможным благодаря новой архитектуре Blackwell, которая включает улучшенные блоки TPC и SM, увеличенную пропускную способность памяти и расширенный кеш второго уровня. Эти улучшения позволяют видеокарте опережать предшественников в классической растеризации, особенно в высоких разрешениях, таких как 2K и 4K. В этих условиях оптимизированная работа с памятью и более эффективное распределение ресурсов обеспечивают стабильный fps даже в сложных игровых сценах.
В целевом 2К-разрешении RTX 5070 Ti выдает 99 fps, что на 11% быстрее RTX 4070 Ti Super и на 26% быстрее RTX 4070 Super.
При включении трассировки лучей без применения DLSS показатели RTX 5070 Ti выше, чем у RTX 4070 Ti Super, в среднем на 7% среди трех протестированных разрешений. С включением DLSS и технологии реконструкции лучей можно поднять производительность на 20—40%, в зависимости от разрешения.
Стоит отметить текущую ценовую ситуацию на рынке. Спустя короткое время после старта продаж новых видеокарт серии RTX 5xxx, модели предыдущего поколения в среднем и высоком ценовом сегменте начали стремительно дорожать. Это связано с завершением их производства и ограниченными складскими остатками. В результате старые видеокарты быстро исчезают с рынка, а новые модели заметно дороже. Такая ситуация будто бы не оставляет геймерам выбора и делает RTX 5070 Ti более привлекательными по сравнению с RTX 4070 Ti Super, особенно с учетом того, что всего несколько месяцев назад последнюю можно было приобрести значительно дешевле.
Благодарим партнеров HAFF и «Надежная техника» за предоставленные для проекта видеокарты.