Среда, 31 июля 2024 17:34
Обзор NVMe SSD Solidigm D7-P5810: 800 ГБ, PCIe Gen4, большой ресурс записи
Прошло почти два года с того момента, как Intel объявила о снятии с производства серии Optane. В настоящее время большинство SSD большую часть своего рабочего времени заняты высокоскоростным чтением, но некоторым приложениям требуются просто диски с большим ресурсом, поскольку основным видом нагрузки в этих приложениях является непрерывная запись. Сегодня мы рассмотрим накопитель Solidigm D7-P5810 – 800-гигабайтный SSD с технологий NAND SLC, позволяющей довести ресурс записи до 50-65 объемов диска в день (drive writes per day, DWPD), что обеспечивает высокую надежность и стабильную скорость работы диска.

Внешний вид диска Solidigm D7-P5810 800GB
Мы будем рассматривать «упрощенную» версию Solidigm D7-P5810 емкостью 800 ГБ с PCIe Gen4 в форм-факторе NVMe SSD 2.5. Также Solidigm предлагает 1.6-терабайтную версию этого диска, и не у всех конкурентов есть аналогичные предложения.

Несмотря на новый бренд, модель Solidigm D7-P5810 имеет характерный шлифованный металлический корпус, какой мы видели у нескольких поколений SSD Intel.

Сам диск близок к стандартной модели 2.5. На его передней грани мы также находим порт для диагностики.

На рисунке ниже – коннектор U.2.

Для современного SSD 800 ГБ – не сверхбольшая емкость. Мы уже видели 60-терабайтные SSD (точнее 61.44 ТБ). И здесь есть интересный момент: если представить, что этот большой диск с в 72 раза большей емкостью имеет ресурс 1 DWPD, то по общему количеству записываемых петабайт (total petabytes written, PBW) такой диск будет эквивалентен 800-гигабайтному диску с ресурсом 72 DWPD.
Основной вопрос здесь не в емкости. Этот диск предназначен прежде всего для высоконагруженных сценариев записи, таких как логирование, некоторые функции баз данных и т.д., где требуется высокая скорость со стабильно низкой задержкой. Многие в отрасли перешли на более емкие SSD TLC и QLC, а производители SSD для дата-центров нацелились на категорию емкостей, традиционно предлагаемых жесткими дисками (HDD). Это оставляет открытой нишу высокопроизводительных накопителей сравнительно небольшой емкости, которую еще недавно занимали диски Optane.
Solidigm заявляет для этого диска две различные характеристики ресурса: 50 DWPD для случайной записи и 65 DWPD для последовательной записи. Случайная запись в большей мере нагружает механизм размещения данных в ячейках NAND, поэтому величина ресурса зависит от того, в каком порядке записываются данные. Что касается суммарного ресурса записи, то этот диск рассчитан на 73 PBW.
В каждой ячейке NAND типа SLC хранится только один бит, что при прочих равных условиях означает втрое или вчетверо меньшую емкость SSD по сравнению с TLC и QLC. Но, хотя технология SLC обеспечивает меньшую емкость, она значительно упрощает механизм записи данных в ячейки NAND, снижая вероятность ошибки и делая его более надежным. В результате мы получаем больший ресурс и более высокую скорость записи.

Сегодня у нас есть возможность протестировать образец такого диска. Давайте посмотрим, что получается.
Производительность диска Solidigm D7-P5810 800GB
В этом разделе мы сначала посмотрим, как диск Solidigm ведет себя в ряде стандартных тестов. Результаты приводятся в виде скриншотов из настольных бенчмарков, чтобы вы могли быстро сравнить их с результатами других дисков, которые, возможно, у вас есть.
CrystalDiskMark 8.0.4 x64
CrystalDiskMark – базовый бенчмарк для накопителей, с которого обычно начинают тестирование в обзорах и который конечные пользователи часто используют для проверки работоспособности диска. Сначала маленький 1-гигабайтный тест:

Увеличиваем размер тестового массива данных до 8 ГБ:

Хотя наш диск здесь был немного медленнее, чем DapuStor Xlenstor2 800GB, но в то же время в целом быстрее многих других дисков.
ATTO Disk Benchmark
ATTO Disk Benchmark уже многие годы служит основным инструментом оценки производительности накопителей в сценариях с последовательной передачей данных. Мы запускали ATTO с размером файла как 256 МБ, так и 8 ГБ.

Результат для 8 ГБ:

Возможно, самое стабильное явление, которое мы здесь наблюдаем, – это то, что скорость последовательного чтения неизменно превосходит скорость последовательной записи.
AS SSD Benchmark
AS SSD – еще один популярный бенчмарк для SSD-накопителей. Мы обычно включаем все три теста. По аналогии с другими утилитами, мы запускали AS SSD со стандартным и расширенным массивом данных – 1 ГБ и 10 ГБ.

Результат для 10 ГБ:

Здесь мы видим приличные скорости случайного чтения/ записи 4-килобайтных (4K) файлов и в целом производительность на уровне универсального накопителя, как и в других тестах.
Теперь давайте посмотрим на производительность SSD в среде Linux.
Производительность Solidigm D7-P5810 800GB в Linux
Наш первый тест показывает производительность диска Solidigm D7-P5810 в сценариях последовательного чтения/ записи данных и случайного чтения/ записи 4K-файлов. Мы просим прощения за меньшую, чем обычно, выборку результатов. В следующих разделах вы увидите, с чем это связано. Основная причина – в том, что у нас теперь мультиплатформенное тестовое оборудование. Фактически мы протестировали эти диски более чем в 20 системных конфигурациях с различными архитектурами процессоров, поддерживающими PCIe Gen4 и Gen5. Тем не менее, давайте посмотрим на производительность дисков.

Ниже – скорости случайного чтения/ записи 4K-файлов:

Здесь есть кое-что действительно интересное. В этой области доминируют такие диски, как Intel Optane P5800X, а DapuStor Xlenstor2 X2900P представляется солидным конкурентом. Другие диски, оптимизированные в направлении увеличения ресурса записи, такие как Kioxia FL6, здесь выглядят более предпочтительной альтернативой D7-P5810.
Производительность Solidigm D7-P5810 800GB в приложениях
Производительность в приложениях мы по-прежнему тестируем на платформе AMD EPYC. На процессорах x86 идут все эти сценарии, чего мы пока не можем сказать про платформы Arm и POWER9, так что это все-таки целевая нагрузка для x86.

Как вы сами можете видеть, влияние диска Solidigm на производительность системы в приложениях может быть различным. Рассмотрим каждый сценарий более подробно.
В сценарии запуска модели ИИ MobileNet V1 на платформе с видеокартой NVIDIA T4 накопитель очень незначительно влияет на системную производительность, хотя все-таки влияет. Это потому, что основным лимитирующим фактором здесь выступает производительность NVIDIA T4, и накопитель не является «узким местом». В будущем мы собираемся запускать более новую версию модели на видеокарте NVIDIA L4. Здесь же мы видим, что более современные диски дают небольшое преимущество в скорости, но оно не очень существенно. И это типичная история. В большинстве обзоров накопителей основное внимание уделяется производительности интерфейса, и последовательное удвоение пропускной способности PCIe при переходе к каждой следующей версии (например, от Gen3 к Gen4), действительно, впечатляет, но во многих реальных приложениях производительность зависит не только от скорости накопителя.
Тестовый сценарий Adobe Media Encoder включал в себя копирование видеофайла на диск, его последующее перекодирование и перенос с диска на другой носитель. Здесь мы видим большее влияние накопителя, поскольку в этой задаче возрастает удельный вес последовательного чтения/ записи, а результат определяется в основном скоростью кодирования. Практический вывод, который можно сделать из этого теста: если вы ограничены в вычислительных ресурсах, но часть нагрузки все-таки задействует преимущественно возможности накопителя, то более быстрый SSD может ускорить выполнение задачи.
Виртуализация с использованием KVM (Kernel-based Virtual Machine) в еще большей мере опирается на проиводительность накопителя. Первый KVM-сценарий (Workload 1) в большей степени процессорозависим, чем Workload 2 или VM Boot Storm, но здесь тоже заметно влияние производительности диска, хотя оно и не так ярко выражено, как в двух других сценариях. В тестах с KVM задача заключается в том, чтобы выяснить, сколько виртуальных машин могут параллельно работать онлайн в течение времени, требующегося для выполнения работ в соответствии с условиями SLA (соглашения об уровне сервиса). Каждая виртуальная машина работает независимо от остальных. Мы знаем, что Workload 2, в силу особенностей используемых баз данных, лучше реагирует на более быстрый накопитель, тогда как Workload 1 – на более быстрый CPU. В целом, диски с увеличенным ресурсом записи показывают не такие высокие результаты, как более экзотические (и ныне снятые с производства) диски Optane, но все же существенно более высокие, чем SSD общего назначения.
Переходя к сценариям для файлового сервера и сети дистрибуции контента (CDN) nginx, мы видим, что диск Solidigm очень хорошо справляется с приоритизацией трафика (QoS). На файловом сервере он был немного медленнее более дорогих дисков, но в целом показал солидный результат. В тесте Nginx CDN мы используем старый снапшот и шаблон доступа с сайта STH, с отключенным DRAM-кэшированием, чтобы проиллюстрировать скорость передачи данных с дисковых накопителей. Вот как выглядит скорость дистрибуции:

Здесь видна значительная разница между накопителями класса SCM (Storage Class Memory) и обычными «емкостными» SSD. Эта разница не очень заметна на 99% выполнения, но к моменту выхода на пять девяток после запятой она становится громадной. Задержка всегда в какой-то степени зависит от приложения, но в целом производительность отличная. Здесь можно выделить промежуточный класс производительности для дисков типа Solidigm D7-P5810 и Kioxia FL6, которые медленнее ультрабыстрых дисков SCM, но быстрее обычных SSD.
Теперь, для большей объективности: мы протестировали эти диски на всех архитектурах с поддержкой PCIe Gen4 и более современного стандарта PCIe Gen5, какие только смогли найти, а не просто на платформах x86 или первых попавшихся серверах.
Производительность Solidigm D7-P5810 800GB на разных процессорных архитектурах
Если вы читали наши недавние статьи о серверных процессорах AMD, Arm и Intel или обзоры таких серверов на базе Arm, как Supermicro ARS-210ME-FNR Ampere Altra Max и Huawei HiSilicon Kunpeng 920, то, возможно, обратили внимание на то, что наша экосистема тестовых платформ пополняется новыми архитектурами. В этот раз, помимо 80-ядерных процессоров из линейки Ampere Altra, представители которой используется в серверах Oracle Cloud, Microsoft Azure и Google Cloud, мы протестировали наши диски в конфигурациях с новейшими процессорами AMD EPYC Bergamo и Genoa-X.

Для большей наглядности ниже приводится правый край диаграммы в увеличенном масштабе, где лучше видна разница результатов.

В целом, диск хорошо работает с современными контроллерами PCIe Gen4 и Gen5 на процессорах x86. Аналогичные контроллеры Arm и IBM Power9 в целом медленнее по сравнению с x86, что мы здесь и наблюдаем. Никаких сюрпризов.
Так как мы неуклонно продвигаемся в эру SSD с PCIe Gen5 и, вероятно, в следующем году уже появятся процессоры с поддержкой PCIe Gen6, мы постепенно оптимизируем наше оборудование под процессоры поколения PCIe Gen5, чтобы иметь в своем распоряжении достаточно платформ для получения репрезентативных результатов.
У нас уже довольно много серверов с PCIe Gen5, а новые SSD выходят постоянно.
Резюме
Прежде всего, мы ожидали, что D7-P5810 сможет заменить снятый с производства SSD Optane DC P5800X. В некоторых аспектах – да, может, с учетом его внушительного ресурса и довольно впечатляющих характеристик задержки, обеспечиваемых технологией NAND SLC.
Протестировав этот диск, мы подумали, что ему можно найти еще лучшее применение. Он может использоваться в качестве кэширующего устройства перед такими массивными накопителями, как 61.44-терабайтный SSD Solidigm D5-P5336. Эти тяжелые диски QLC быстро справляются с чтением, но заметно медленнее выполняют случайную запись 4K-файлов. Более чем 70-кратная разница в емкости с дисками QLC, высокие скорости записи и большой ресурс делают этот диск SLC подходящим устройством для кэширования горячих данных на входе в основной массив на базе NAND QLC. Диск Solidigm D7-P5810 – скорей всего, не тот диск, который вы захотите использовать в качестве основного SSD для смешанных нагрузок. Этот диск заточен под высоконагруженные сценарии записи и будет хорош в роли кэширующего устройства.