Каталог
ZV
ездный б-р, 19
+7 (495) 974-3333 +7 (495) 974-3333 Выбрать город: Москва
Подождите...
Получить токен
Соединиться
X
Сюда
Туда
x
Не выбрано товаров для сравнения
x
Корзина пуста
Итого: 
Оформить заказ
Сохранить заказ
Открыть корзину
Калькуляция
Очистить корзину
x
X
Главная
Магазины
Каталог
Мои заказы
Корзина
Магазины Доставка по РФ
Город
Область
Ваш город - ?
От выбранного города зависят цены, наличие товара и
способы доставки

Вторник, 18 октября 2022 17:10

Производительность видеокарты NVIDIA GeForce RTX 4090 на различных конфигурациях PCI-Express

На прошлой неделе NVIDIA выпустила флагманскую видеокарту нового поколения GeForce RTX 4090 "Ada". Уже опубликовано несколько обзоров этой карты (точнее сказать – девять, включая Founders Edition). И по традиции, при выходе каждого нового поколения видеокарт один из обзоров мы посвящаем исследованию фактической производительности GPU в зависимости от пропускной способности предлагаемой конфигурации интерфейса PCI-Express – чтобы выяснить, как флагманские видеокарты используют доступный потенциал интерфейса и снижается ли заметно их производительность при использовании старших версий PCIe или шины PCIe с меньшим количеством линий. Сегодня этот вопрос особенно актуален для тех, кто собирает машину на платформе 13-го поколения Intel Core и при этом планирует использовать NVMe SSD с PCIe 5-го поколения.
1

Видеокарта NVIDIA GeForce RTX 4090 "Ada" имеет хост-интерфейс PCI-Express 4.0 x16, хотя сама графическая архитектура этой карты в принципе может поддерживать стандарт следующего поколения PCIe 5.0. Конфигурация Gen4 x16 обладает пропускной способностью 32 ГБ/с в каждом направлении. Эта карта также поддерживает технологию PCI Resizable BAR, которая позволяет центральному процессору обращаться ко всем 24 гигабайтам видеопамяти как к единому блоку, а не тянуть данные через окошко с апертурой 256 МБ. Решение NVIDIA сделать здесь хост-интерфейс PCIe 4-поколения выглядит немного странным, с учетом того, что новейшие платформы и Intel, и AMD перешли на 5-е поколение. Intel поддерживает PCIe 5.0 с 2021 года, начиная с 12-го поколения процессоров Core "Alder Lake"; AMD совсем недавно выпустила линейку процессоров Ryzen 7000 "Zen 4", которые тоже поддерживают PCIe 5.0. Ситуация становится еще интересней, если вспомнить, что в ноябре этого года выходят серии NVMe SSD также с PCIe 5.0.

Процессоры Ryzen 7000 "Zen 4" предлагают PCIe Gen5 и на 16 линиях PEG, и на четырех линиях подключенных к CPU слотов NVMe. Что касается Intel, то у них и в 12-м, и в грядущем 13-м поколении Core "Raptor Lake" поддержка 5-го поколения PCIe предусмотрена только в слоте x16 PEG, а подключенные к CPU слоты NVMe предлагают все-таки версию 4.0. Чтобы не терять преимущества перед AMD, Intel сегодня разрешает разработчикам материнских плат оснащать грядущие платы 700-й серии дополнительными слотами M.2 NVMe с поддержкой Gen5, но под это забирается часть линий PCIe, идущих от слота x16 PEG. Это значит, что если пользователь платформы 13-го поколения Core установит SSD в такой слот M.2, он переключит на этот слот восемь линий PCIe от графического слота x16. Таким образом, те, кто будет собирать ультрасовременные игровые ПК с процессором Core i9-13900K, видеокартой RTX 4090 и NVMe SSD Gen5, будут вынуждены оставить для графического контента с RTX 4090 канал с пропускной способностью PCI-Express x8. На платформе Ryzen 7000 эта проблема отсутствует: подключенные к CPU слоты NVMe уже предлагают Gen5, как на платах с чипсетами X670/B650 "E", так и не-E, что избавляет от необходимости перетягивать сюда линии с графической конфигурации PCI-Express.

Вот здесь и становится актуальным вопрос о том, будет ли GeForce RTX 4090 существенно терять в производительности при использовании конфигурации PCI-Express 4.0 x8. Хотя это и маловероятно, но некоторые пользователи RTX 4090 могут устанавливать ее на платформы с PCIe Gen3, например, в машины на процессорах 10-го поколения Core "Comet Lake" или серии Ryzen 2000. Версия PCIe Gen 4.0, как правило, поддерживается процессорами 11-го поколения Intel Core и серии Ryzen 3000 "Zen 2". Есть и несколько исключений, например, APU Ryzen 5000G, которые поддерживают только PCIe Gen3. Результаты конфигураций PCIe Gen2 x16 и Gen 1.1 x16 актуальны для тех, кто планирует использовать RTX 4090 с внешними док-станциями для GPU, так как опции подключения этих док-станций Thunderbolt/USB4 с пропускной способностью 40 или 80 Гбит/с, по существу, определяют доступную пропускную способность интерфейса установленных в них видеокарт.

В этом обзоре мы рассмотрим производительность RTX 4090 с хост-конфигурацией PCI-Express 4.0 x16 и сравним эти результаты с результатами, полученными на 16-линейной конфигурации PCI-Express версии 3.0 (которая по пропускной способности эквивалентна конфигурации PCI-Express 4.0 x8) и – из академических соображений – на более ранних версиях PCIe. Старшие версии PCIe мы устанавливали в настройках UEFI материнской платы.

Результаты тестирования

(полную версию обзора см. на www.techpowerup.com)

Relative Performance
1920x1080
Higher is Better
GTX 1630 4GB
RX 570 4GB
GTX 1060 6GB
RX 6500XT 4GB
GTX 1650 Super 4GB
RX 580 8GB
GTX 16660 Super 6GB
RTX 3050 8GB
RTX 2060 6GB
RX 5600XT 6GB
RX Vega 64 8GB
Arc A750 8GB
RX 6600 8GB
RTX 2070 6GB
RX 5700XT 8GB
RTX 3060 12GB
Arc A770 16GB
RX 6600XT 8GB
RTX 2080 8GB
RTX 3060 Ti 8GB
RX 6700XT 12GB
RTX 2080 Ti 11GB
RTX 3070 8GB
RTX 3070 Ti 8GB
RX 6800 16GB
RTX 3080 10GB
RX 6800XT 16GB
RTX 3080Ti 12GB
RTX 4090/PCIe x16 1.1
RTX 3090 24GB
RX 6900XT 16GB
RTX 3090Ti 24GB
RX 6950XT 16GB
RTX 4090/PCIe x16 2.0
RTX 4090/PCIe x16 3.0/x8 4.0
RTX 4090/PCIe x16 4.0
Relative Performance
2560x1440
Higher is Better
GTX 1630 4GB
RX 570 4GB
RX 6500XT 4GB
GTX 1060 6GB
GTX 1650 Super 4GB
RX 580 8GB
GTX 16660 Super 6GB
RTX 3050 8GB
RX 5600XT 6GB
RTX 2060 6GB
RX Vega 64 8GB
RX 6600 8GB
RTX 2070 8GB
RTX 3060 12GB
RX 5700XT 8GB
Arc A750 8GB
RX 6600XT 8GB
Arc A770 16GB
RTX 2080 8GB
RTX 3060 Ti 8GB
RX 6700XT 12GB
RTX 2080 Ti 11GB
RTX 3070 8GB
RTX 3070 Ti 8GB
RX 6800 16GB
RTX 3080 10GB
RX 6800XT 16GB
RTX 3080Ti 12GB
RX 6900XT 16GB
RTX 3090 24GB
RX 6950XT 16GB
RTX 3090Ti 24GB
RTX 4090/PCIe x16 1.1
RTX 4090/PCIe x16 2.0
RTX 4090/PCIe x16 3.0/x8 4.0
RTX 4090/PCIe x16 4.0
Relative Performance
3840x2160
Higher is Better
GTX 1630 4GB
RX 6500XT 4GB
RX 570 4GB
GTX 1650 Super 4GB
GTX 1060 6GB
RX 580 8GB
GTX 16660 Super 6GB
RTX 3050 8GB
RTX 2060 6GB
RX 5600XT 6GB
RX 6600 8GB
RX Vega 64 8GB
RX 6600XT 8GB
RTX 2070 8GB
RTX 3060 12GB
RX 5700XT 8GB
Arc A750 8GB
Arc A770 16GB
RTX 2080 8GB
RTX 3060 Ti 8GB
RX 6700XT 12GB
RTX 2080 Ti 11GB
RTX 3070 8GB
RTX 3070 Ti 8GB
RX 6800 16GB
RTX 3080 10GB
RX 6800XT 16GB
RX 6900XT 16GB
RTX 3080Ti 12GB
RTX 3090 24GB
RX 6950XT 16GB
RTX 3090Ti 24GB
RTX 4090/PCIe x16 1.1
RTX 4090/PCIe x16 2.0
RTX 4090/PCIe x16 3.0/x8 4.0
RTX 4090/PCIe x16 4.0

Заключение

GeForce RTX 4090 "Ada" – это мощнейшая видеокарта, обладающая значительно большей производительностью по сравнению с предыдущим аналогом (RTX 3090). Приступая к этому обзору, мы, прежде всего, хотели посмотреть, как поведет себя карта RTX 4090 при сокращении пропускной способности интерфейса PCIe вдвое относительно ее собственной конфигурации PCI-Express 4.0 x16. Для этого в настройках материнской платы мы ограничили пропускную способность PEG-интерфейса процессора – до версии Gen3 (т.е. PCI-Express 3.0 x16). Конфигурация Gen3 x16 по пропускной способности идентична Gen4 x8, которая нас и интересует. Этот режим PCIe актуален для тех, кто собирается использовать RTX 4090 вместе с процессором 13-го поколения Intel Core "Raptor Lake" и NVMe SSD с версией PCIe Gen5. Мы общаемся с различными производителями материнских плат, и они говорят, что большинство премиальных моделей на чипсете Intel Z790 оснащаются слотами M.2 NVMe Gen5, при использовании которых от основного PEG-интерфейса будет забираться восемь линий PCIe Gen5. Если вы не будете устанавливать в слот Gen5 никакие M.2 SSD, тогда видеокарта будет использовать полную конфигурацию PCIe 4.0 x16, но при установке в этот слот любого SSD-накопителя пропускная способность слота GPU сократится в два раза – до PCI-Express 4.0 x8 (что эквивалентно PCI-Express 3.0 x16).

Но, как показывают результаты, сборщики и пользователи "Raptor Lake" могут выдохнуть с облегчением – мы рады сообщить, что при переходе на PCI-Express 3.0 x16 (что то же самое, что и Gen 4 x8) карта GeForce RTX 4090 теряет в производительности ничтожно мало. На разрешении 4K Ultra HD эти потери в среднем составляют всего 2%, и даже на более низких, CPU-зависимых разрешениях не превышают 2-3%. Если говорить об отдельных тестах, то мы можем отметить только одну игру, в которой потери в скорости были существенными: это Metro: Exodus, где на разрешении 4K UHD частота кадров упала на 15%; на других разрешениях потери были примерно такими же.

Раньше правило "ниже разрешение – выше частота кадров – больше потери от сокращения пропускной способности PCIe" работало всегда, но сегодняшние результаты показывают, что в некоторых играх дело обстоит иначе. Например, в Elden Ring, Far Cry 6 и Guardians of the Galaxy явно прослеживается тенденция к более существенным потерям в скорости на более высоком разрешении. Все эти игры довольно новые и работают на современных движках с DX12, и, по-видимому, имеют какие-то отличия в алгоритмах. Мы предполагаем, что, в то время как другие игры передают для каждого кадра примерно одно и то же количество данных и поэтому более чувствительны к пропускной способности интерфейса на высокой частоте кадров, в этих новых играх передаваемое количество данных определяется главным образом оригинальным разрешением рендеринга. Поэтому, когда вы переходите с разрешения 1080p (8 МБ/ кадр) на 1440p (14 МБ/ кадр) и далее на 4K (32 МБ/ кадр), посекундное увеличение объема трафика за счет роста количества данных в каждом кадре оказывается больше, чем его уменьшение за счет снижения частоты (количества) кадров.

Мы также протестировали RTX 4090 с конфигурацией PCI-Express 2.0 x16. Эквивалентную пропускную способность вы получите, если установите эту карту на старую платформу с PCIe Gen3 x8 (например, в компьютер с APU AMD Ryzen 3000G) или случайно подключите ее к одному из электрических слотов PCIe Gen4 x4 вашей материнской платы (этим вы не перегрузите шину чипсета, которую на платах Intel Z690 и Z790 расширили до DMI 4.0 x8). И такую же пропускную способность будут обеспечивать док-станции для eGPU с портами Thunderbolt или USB4: скорость 80 Гбит/с соответствует конфигурации PCI-Express 4.0 x4. Здесь потери в производительности немного существеннее: на разрешении 4K UHD в среднем 8% и целых 18% в Metro: Exodus.

Больше из научного интереса, но мы протестировали еще и конфигурацию PCI-Express 1.1 x16: такую пропускную способность видеокарты использовали примерно 16 лет назад. Эту пропускную способность вы получите со старой графической док-станцией, когда подключите ее через Thunderbolt3 40 Гбит/с к слоту PCI-Express 3.0 x4. Некоторые игры на такой конфигурации пошли хорошо, но в целом потери в производительности здесь достаточно весомые: в среднем 19% на разрешении 4K UHD. В некоторых случаях они могут доходить до 30% – тогда вы теряете почти треть производительности и оказываетесь на уровне RTX 3090 Ti с Gen4 x16.

Итак, если вы счастливый обладатель процессора Ryzen 7000 "Zen 4" – можете смело собирать машину. Независимо от модели материнской платы и чипсета вы получите всю пропускную способность, обеспечиваемую интерфейсом Gen4 x16 вашей видеокарты, и при этом сможете воспользоваться преимуществами слота NVMe Gen5 x4 для новейших SSD, который не будет забирать линии PCIe от графического слота x16. Если же вас вдохновляет 13-е поколение Core "Raptor Lake" и при этом вы собираетесь пользоваться только NVMe SSD Gen4, подключайте эти накопители к слоту M.2, соединенному с чипсетом, или к слоту M.2, соединенному с процессором через интерфейс NVMe Gen4 x4, но избегайте использовать слот Gen5, потому что он заберет половину линий PEG-слота x16 и вы потеряете пару процентов в частоте кадров (ни за что ни про что). Но если через несколько месяцев у вас будет NVMe SSD Gen5, тогда стоит использовать слот Gen5 и на платформе 13-го поколения Intel Core: минус 2% в скорости графики – вполне приемлемая плата за дополнительные 10 ГБ/с к скорости накопителя, которые могут пригодиться в работе с медиаприложениями и т.д.

Если вы используете графические док-станции, обратите внимание на пропускную способность предлагаемых ими опций подключений. Порт Thunderbolt3 обеспечивает 40 Гбит/с, что соответствует конфигурации PCI-Express 1.1 x16, так что здесь готовьтесь потерять треть производительности видеокарты. Более новые модели док-станций предлагают интерфейсы Thunderbolt4 или USB4, которые поддерживают скорости до 80 Гбит/с – это уровень PCI-Express 2.0 x16 или 3.0 x8. Здесь потери в частоте кадров будут в пределах 15-20%, что более-менее приемлемо.