Amd hammer сколько поддерживать оперативной памяти

Обновлено: 07.07.2024

2.21 ГГц, 1,00 ГБ ОЗУ - как его можно модернизировать под сервер?


Какие задачи у сервера будут, какой бюджет, какие у вас остальные комплектующие ?

Acer eMachines G730G:
17" 1600x900 TN

Core i3 350M @2,26GHz
DDR3 6Gb 1066MHz CL7
HD5470 512mb DDR3
120Gb SSD A-Data 510
16Gb SDHC A-Data 10class (кэш / темп / файлы подкачки)

Acer eMachines G730G:
17" 1600x900 TN

Core i3 350M @2,26GHz
DDR3 6Gb 1066MHz CL7
HD5470 512mb DDR3
120Gb SSD A-Data 510
16Gb SDHC A-Data 10class (кэш / темп / файлы подкачки)

2.21 ГГц, 1,00 ГБ ОЗУ - как его можно модернизировать под сервер?

Сервер - это не что-то иное железное, чем персональный компьютер.
Сервер - это понятие чисто условное.

Вот есть у тебя некий компьютер, может на одном Атлоне, а может на четырех шестиядерных Хеонах - не важно.
Если за этим компом работаешь ты сам - это персональный компьютер. Если это компьютер, к которому все подключаются и используют некие его ресурсы/программы - это сервер.

Превратить комп в сервер или сервер в комп - никаких модернизаций не требуется.

А вот для решения тех или иных задач может требоваться модернизация. Так что лучше вопрос уточнить.

Поле Значение
Свойства системной платы
ID системной платы 06/30/2006-MCP55-M2N-E-00
Системная плата Asus M2N-E

Свойства шины FSB
Тип шины AMD Hammer
Реальная частота 200 МГц
Эффективная частота 200 МГц
Частота HyperTransport 1000 МГц

Свойства шины памяти
Тип шины Dual DDR2 SDRAM
Ширина шины 128 бит
Соотношение DRAM:FSB CPU/9
Реальная частота 246 МГц (DDR)
Эффективная частота 491 МГц
Пропускная способность 7859 Мб/с

Физическая информация о системной плате
Число гнёзд для ЦП 1 Socket AM2
Разъёмы расширения 3 PCI, 2 PCI-E x1, 1 PCI-E x4, 1 PCI-E x16
Разъёмы ОЗУ 4 DDR2 DIMM
Встроенные устройства Audio, Gigabit LAN
Форм-фактор ATX
Размеры системной платы 240 mm x 300 mm
Чипсет системной платы nForce570Ultra
Дополнительные функции Asus Intelligence, JumperFree, Stepless Freq Selection

Производитель системной платы
Фирма ASUSTeK Computer Inc.

Поле Значение
Физическая память
Всего 1022 Мб
Занято 362 Мб
Свободно 660 Мб
Загрузка 35 %

Место под файл подкачки
Всего 2459 Мб
Занято 347 Мб
Свободно 2111 Мб
Загрузка 14 %

Виртуальная память
Всего 3481 Мб
Занято 709 Мб
Свободно 2772 Мб
Загрузка 20 %

Physical Address Extension (PAE)
Поддерживается ОС Да
Поддерживается ЦП Да
Активный Нет

Поле Значение
Свойства северного моста
Северный мост AMD Hammer DDR2 IMC
Поддерживаемые типы памяти DDR2-400 SDRAM, DDR2-533 SDRAM, DDR2-667 SDRAM, DDR2-800 SDRAM
Версия 00

Контроллер памяти
Тип Dual Channel (128 бит)
Активный режим Dual Channel (128 бит)

Тайминги памяти
CAS Latency (CL) 4T
RAS To CAS Delay (tRCD) 4T
RAS Precharge (tRP) 4T
RAS Active Time (tRAS) 12T
Row Cycle Time (tRC) 17T
Command Rate (CR) 2T
RAS To RAS Delay (tRRD) 2T
Write Recovery Time (tWR) 4T
Write To Read Delay (tWTR) 2T
Read To Precharge Delay (tRTP) 4T
Four Activate Window Delay (tFAW) 10T
Refresh Period (tREF) 3.9 us
DRAM Drive Strength 1.0x
DRAM Data Drive Strength 1.0x
Clock Drive Strength 1.0x
CKE Drive Strength 1.5x
Max Async Latency 5 ns
Idle Cycle Limit 16
Dynamic Idle Cycle Counter Разрешено
Read/Write Queue Bypass 8

Коррекция ошибок
ECC Поддерживается, Запрещено
ChipKill ECC Поддерживается, Запрещено
RAID Не поддерживается
DRAM Scrub Rate Запрещено
L1 Data Cache Scrub Rate Запрещено
L2 Cache Scrub Rate Запрещено

ЗЫ:
>>Какое программное обеспечение нужно и какие минимальные системные требования >>для сервера?

В нашей локальной сети нам вполне хватало Pentium 3 (900MHz), 1GB RAM PC2700 остальные требования системы не существенны. Однако играть на этой же машине невозможно. циклические обращения от клиента к серверу, которые по сути один комп, приводят к тому, что машинка типа AMD Athlon 5200+, 2GB DDR2 PC-466, едва ли справляется с "нормально" игрой с одним окном.

Lineage 2 Interlude - для меня это последняя часть, где ещё хоть как-то чувствуется Lineage 2. Давайте глянем на требования к этому серверу:
Процессор: Intel Pentium 4 3.0
Оперативная память: DDR *2048 Mb
Жёсткий диск: 7 Gb свободного места

Так что предлагаю процессор в разгон (до 2,5-2,6ГГц - соответственно понадобится нормальный кулер), оперативку заменить на 2 модуля по 2Гб (для надежности, ибо 2*1Гб может все же не хватить, если вы и сами с этого сервера играть будете). Если с сервера играть не будут, то хватит и 2 модуля по 1 Гб.
ну и 2 HDD (объем тут уже не особо важен. вполне и 2*160Гб или 2*250Гб) в Raid 0 объединить.

Итого:
2*2Гб Hynix PC2-6400 800MHz - 2 х 730 руб (или 2 х 430 руб, если 2 х 1ГБ)
2*160GB WD SATA-II 7200rpm - 2 х 1470руб
кулер - рубле500-900.
И будет вам счастье.

Acer eMachines G730G:
17" 1600x900 TN

Core i3 350M @2,26GHz
DDR3 6Gb 1066MHz CL7
HD5470 512mb DDR3
120Gb SSD A-Data 510
16Gb SDHC A-Data 10class (кэш / темп / файлы подкачки)

А сегодня попробуем поставить точку в спорах о влиянии оперативной памяти на процессоры AMD Ryzen в играх, и стоит ли оно того или нет? Тестироваться все будет в повседневных условиях 1080p, а не стерильных 720p и настройках Low, дабы показать, что частота памяти тащит.

реклама

Тестовая конфигурация.

  • AMD Ryzen 5 2600X@4200 МГц (Pinnacle Ridge, 6 ядер + SMT, 16 Мбайт L3).
MSI RTX 3070 сливают дешевле любой другой, это за копейки Дешевая 3070 Gigabyte Gaming - успей пока не началось
  • ASUS ROG Crosshair VI Hero (Socket AM4, AMD X370 BIOS 6401).

реклама

var firedYa28 = false; window.addEventListener('load', () => < if(navigator.userAgent.indexOf("Chrome-Lighthouse") < window.yaContextCb.push(()=>< Ya.Context.AdvManager.render(< renderTo: 'yandex_rtb_R-A-630193-28', blockId: 'R-A-630193-28' >) >) >, 3000); > > >);


Пресеты памяти.


Samsung B-Die и Hynix A-Die с частоте 3200 МГц с таймингами 14-17-17-30.

реклама



  • AMD Radeon RX Vega 64 от MSI с модифицированной системой охлаждения RAIJINTEK Morpheus II Core Black Heatpipe + 2 вертушки ID COOLING PL 12025, кулеры всегда установлены на частоту оборотов 1200. Характеристики видеокарты.

реклама

Монитор: LG 29UM65-P, 2560 x 1080.

Версия ОС 10.0.17763.316 (Win10 RS5 [1809] October 2018 Update) Microsoft Windows 10 Enterprise LTSB

Версия ПО Radeon Software 19.3.3.

Замеры производились программой Fraps и FrafsBenchViewer.

Игры.

Все настройки графики как у Phoenix, тестовый отрезок так же его, Мумбаи.

  • Версия 2.11.
  • DirectX 11.
    • Сглаживание - SSAA 1.00.
    • Уровень детализации - ультра высокий.
    • Качество текстур - высокое.
    • Фильтрация текстур - анизотропная х16.
    • Сложное затенение (SSAO) - включено.
    • Качество теней - ультра высокое.
    • Качество моделирования - наилучшее.


    • DirectX 11.
      • Качество графики - максимум.
      • Фильтрация текстур - максимум.
      • Тени - максимум.
      • Геометрия и растительность - максимум.
      • Окружение - максимум.
      • Вода - высоко.
      • Ландшафт - высоко.
      • Объемный туман – высоко.
      • Сглаживание - ТАА.
      • Размытие в движении - включено.
      • HD текстуры – выключены.
      • Второй прогон бенча.



      Выводы.

      И что же получается, максимальный прирост производительности наблюдается именно после разгона до частоты 3200MHz, дальнейшее наращивание частоты очень вяло увеличивает Fps либо вообще без изменений. Как такового смысла для игр в частоте оперативной памяти выше 3200-3466MHz просто нет, если вы конечно не любитель красивых циферок, и возможно виной именно слабая процессорная часть или же низкая частота ядер относительно продуктов конкурента. Факт- есть факт, и с ним не поспоришь: частота 3200MHz с заниженными таймингами является наиболее сбалансированной для процессоров Razen и доступна даже с oem модулями Hynix A-Die.

      Про Samsung B-Die ничего говорить не буду снова. А вот Hynix как и в случае с A-Die, так и с CJR C-Die меня очень порадовал, у меня были реальные опасения работы именно моего двухрангового комплекта на платформе AM4, но это все напрасно, времена, когда двухранг не мог взять даже 3000MHz, похоже, подошли к концу, и производители довели биос материнских плат до ума. В абсолютном автомате материнская плата запустила даже XMP профиль, что меня сильно удивило.

      Во всех играх с процессором Ryzen был замечен прирост в производительности, больше всех отреагировали на изменение частоты оперативной памяти Hitman 2 и FarCryNewDawn, но даже Watch Dogs 2 который упирается в производительность мой видеокарты дал положительный эффект.

      Очень жаль, что в статье у меня только видеокарта одного производителя. Если есть желание увидеть подобный тест с 1080Ti пишите в комментариях, в ближайшее время попробую обзавестись ею.

      В чем же заключается особенность этих новых процессоров, благодаря которой их называют процессорами нового, восьмого поколения? Что ж, нововведений действительно немало, причем речь идет не о банальных усовершенствованиях уже существующих процессоров, а о действительно революционных изменениях, позволяющих говорить о принципиально новой процессорной архитектуре.

      Принципиальных изменений в новом процессоре можно отметить три (рис. 1):

      • новое процессорное ядро Hammer с поддержкой архитектуры x86-64 ISA;
      • интегрированный контроллер памяти;
      • интегрированный интерфейс HyperTransport.

      Для того чтобы осознать все те преимущества, которые сулят перечисленные новшества, рассмотрим их более подробно.

      Процессорное ядро Hammer

      роцесс обработки данных процессором включает несколько характерных этапов. В простейшем случае можно выделить как минимум четыре этапа обработки команды:

      • выборка из кэша;
      • декодирование;
      • выполнение;
      • запись результатов.

      Стадии обработки команд принято называть конвейером обработки команд, а рассмотренный нами конвейер является четырехступенчатым. Заметьте, что каждую из этих ступеней команда проходит за один процессорный такт. Соответственно для примитивного четырехступенчатого конвейера на выполнение одной команды отводится четыре такта.

      Итак, разобрав схему гипотетического классического процессора, давайте перейдем к рассмотрению нового ядра Hammer (рис. 2).

      Изучая структурную схему нового ядра и сравнивая ее со схемой легендарного K7 (ядра, ставшего основой процессоров AMD Athlon), можно заметить, что общих черт у них больше, чем различий. Однако, несмотря на внешнее сходство, новое ядро процессора все же претерпело существенные изменения. Итак, расскажем обо всем по порядку.

      Схема работы ядра нового процессора в полной мере соответствует рассмотренной схеме классического процессора. Поток инструкций в формате x86-64 ISA (о том, что это такое, мы расскажем чуть позже) поступает в схему предпроцессора (Front End) из кэша L1. Кэш первого уровня (L1) остался точно таким же, как и в процессорах семейства Athlon XP, то есть имеет общий размер 128 Кбайт и разделен на кэш данных (D-cache) и кэш инструкций (I-cache), каждый размером по 64 Кбайт. Кэш L1 остался ассоциативным двухканальным с размером кэш-блока 64 байт. Кэш инструкций поддерживает два набора дескрипторов (тэгов): fetch port (порт выборки) и snoop (слежение).

      Кэш второго уровня (L2) может иметь максимальный размер до 1 Мбайт. Сам кэш является эксклюзивным по отношению к кэшу L1, 16-канальным, ассоциативным.

      Из новшеств можно отметить новую схему pseudo-LRU (псевдосхема), позволяющую наполовину уменьшить количество LRU-битов (служебных битов, используемых в протоколе работы кэша). Кроме того, кэш L2 содержит указатели предсказания ветвлений (branch prediction bits) и предварительно декодированные инструкции (IC precode). Еще одним нововведением является увеличенная вдвое (по сравнению с процессором Athlon XP) скорость передачи между кэшами L2 и L1.

      Рассмотрев структуру кэшей L1 и L2, вернемся к описанию логики работы процессора. Как и в большинстве современных х86-совместимых процессоров, имеющих внутреннюю RISC-архитектуру, в процессоре Hammer внешние CISC-команды декодируются во внутренние RISC-инструкции, для чего используется декодер команд.

      Каждый из двух декодеров может обрабатывать инструкцию длиной до 16 байт и выдавать по три :Ops-инструкции за такт, поэтому в общей сложности оба декодера производят шесть декодированных инструкций за каждый такт процессора.

      Попутно отметим, что декодер в ядре Hammer претерпел существенные изменения. Именно в него были добавлены две ступени конвейера по сравнению с ядром процессора Athlon XP. Кроме того, известно, что если в ядре Athlon XP команды SSE декодировались с использованием Microcode Engine, то есть считались сложными, то в ядре Hammer эти команды декодируются с использованием Fastpath, то есть являются простыми.

      Планировщик для работы с вещественными числами (FPU Scheduler) рассчитан на 36 инструкций (как и в процессоре Athlon XP), и его основная задача заключается в том, чтобы распределять команды по исполнительным блокам по мере их готовности. Просматривая все 36 поступающих инструкций, FPU-планировщик переупорядочивает следование команд, строя спекулятивные предположения о дальнейшем ходе программы, чтобы создать несколько полностью независимых друг от друга очередей инструкций, которые можно выполнять параллельно. В процессоре Hammer имеется три исполнительных блока для работы с вещественными числами (FADD, FMUL, FMISC), поэтому FPU-планировщик должен формировать по три инструкции за такт, направляя их на исполнительные блоки.

      Все целочисленные инструкции направляются в планировщик инструкций для работы с целыми числами (Int Scheduler), образованный тремя станциями резервирования (RES), каждая из которых рассчитана на восемь инструкций. Все три станции, таким образом, образуют планировщик на 24 инструкции (емкость аналогичного планировщика в процессоре Athlon XP составляла 18 инструкций). Этот планировщик выполняет те же функции, что и FPU-планировщик. Различие заключается в том, что в процессоре имеется семь функциональных исполнительных блоков для работы с целыми числами (три устройства ALU, три устройства AGU и одно устройство MULT).

      После того как все инструкции прошли диспетчеризацию в соответствующих планировщиках, они могут быть выполнены непосредственно в соответствующих исполнительных устройствах.

      Исполнительные устройства также претерпели некоторые изменения по сравнению с процессором Athlon XP. Как уже отмечалось, для работы с вещественными числами реализовано три функциональных устройства FPU, каждое из которых представляет собой 17-ступенчатый конвейер (как и в процессоре Athlon XP), то есть для работы с вещественными числами предусмотрено три разделенных конвейера. Подобная реализация блока FPU позволяет выполнять до трех вещественных операций за такт, причем такая производительность является рекордной для х86-совместимых процессоров.

      Блок операций с целыми числами также полностью конвейеризирован, но по сравнению с процессором Athlon XP длина конвейера увеличена с 10 до 12 ступеней. Блок состоит из трех распараллеленных частей, что в итоге позволяет выполнять три целочисленные операции за один такт (кроме умножения). Для умножения требуется три такта в случае 32-битных чисел и пять тактов в случае 64-битных.

      Процессоры Hammer имеют двухуровневый TLB (L1 TLB и L2 TLB), также разделяющийся на буфер данных и буфер инструкций. L1 TLB кэширует 40 адресов инструкций и 40 адресов данных. Этот кэш является полностью ассоциативным и поддерживает страницы емкостью как 4 К, так и 2/4 M.

      Кэш L2 TLB является четырехканальным ассоциативным кэшем с поддержкой страниц, емкостью 4 К. Этот кэш рассчитан на 512 записей, что в два раза больше, чем в процессоре Athlon XP.

      64-разрядная архитектура процессора

      Прежде всего попытаемся ответить на вопрос: зачем вообще нужны 64-разрядные процессоры и имеют ли они преимущество перед 32-разрядными? Давайте вспомним, что 32-разрядная адресация памяти позволяет адресовать только 4 Гбайт памяти. Конечно, для пользовательских приложений на данный момент такого объема вполне хватает, но… это сейчас. А завтра все может измениться. В серверных приложениях 4 Гбайт памяти уже сегодня может оказаться явно недостаточно. Правда, современные серверные процессоры и чипсеты с х86-32-архитектурой позволяют адресовать более чем 4 Гбайт памяти (типичным значением является 12 Гбайт), но достигается это не за счет плоской прямой адресации, а за счет эмуляции 36-битной адресации (которая позволяет адресовать до 64 Гбайт памяти). Впрочем, такая адресация имеет и свои минусы. Во-первых, это отражается на производительности, а во-вторых, при такой эмуляции максимальная память, которую может использовать один поток приложения, все равно не превышает 4 Гбайт.

      Для реализации 64-разрядности в процессор Hammer добавлено несколько новых регистров, а существующие регистры соответственно расширены с 32 до 64 бит. Так, к восьми регистрам общего назначения добавлено еще восемь 64-битных регистров, использование которых возможно только при соответствующей перекомпиляции программного кода. Кроме того, в блок SSE также добавлено восемь новых регистров, что обеспечивает поддержку процессорами Hammer потока инструкций SSE2.

      Расширение 32-битных регистров до 64-битных осуществляется в точности так же, как в свое время (с момента появления процессора i386) 16-битные регистры были расширены до 32-битных.

      Описав особенности ядра процессора, можно перейти к рассмотрению других элементов архитектуры процессора.

      Контроллер памяти

      Контроллер памяти процессора Hammer поддерживает DDR-память PC1600/2100/2700 (DDR200/ DDR266/ DDR333) и имеет ширину шины 64 или 128 бит. В последнем случае речь идет о двухканальной памяти, которая реализуется в серверных процессорах.

      Контроллер HyperTransport

      В ее основу положено две концепции: универсальность и масштабируемость. Универсальность шины HyperTransport заключается в том, что она позволяет связывать между собой не только процессоры, но и другие компоненты материнской платы, о чем мы еще расскажем. Масштабируемость шины состоит в том, что она дает возможность наращивать пропускную способность в зависимости от конкретных нужд пользователя. После общих замечаний, касающихся новой архитектуры ввода-вывода, давайте ознакомимся с ней более подробно.

      Масштабируемость шины HyperTransport обеспечивается посредством магистрали шириной 2, 4, 8, 16 и 32 бит в каждом направлении. Кроме того, предусматривается возможность работы на различных тактовых частотах (от 200 до 800 МГц). При этом передача данных происходит по обоим фронтам тактового импульса. Таким образом, пропускная способность шины HyperTransport меняется от 200 Мбит/с при использовании частоты 200 МГц и двух двухбитных каналов до 12,8 Гбит/с при использовании тактовой частоты 800 МГц и двух 32-битных каналов.

      ClawHammer и SledgeHammer

      Различия между процессорами SledgeHammer и ClawHammer отражены в таблице.

      Чипсет

      Компания AMD разработала требуемый набор из трех микросхем, называемых туннелями, под общим наименованием AMD-8000. Его уникальность заключается в том, что с помощью комбинаций этих трех микросхем можно создавать как чипсеты для low-end, так и для высокопроизводительных рабочих станций и даже для многопроцессорных систем (вот уж где действительно проявляется универсальность шины HyperTransport!). Набор микросхем AMD-8000 можно сравнить с набором кубиков, из которых можно создавать любые по сложности решения. Такой подход воплощает в себе как универсальность, так и масштабируемость.

      Ну а теперь подробнее ознакомимся с упомянутыми тремя туннелями набора AMD-8000.

      AMD-8151 Graphics Tunnel

      Как следует из названия, AMD-8151 Graphics Tunnel (рис. 3) представляет собой контроллер AGP 8х с пропускной способностью 2,1 Гбайт/с. Кроме того, данный туннель имеет два встроенных интерфейса HyperTransport: Link A (входной) и Link B (выходной). Первый интерфейс (Link A) является 16-битным с полосой пропускания 6,4 Гбайт/с (по 3,2 Гбайт/с в каждом направлении).

      AMD-8131 I/O Bus Tunnel

      Сам контроллер PCI-X поддерживает две независимые PCI-X-шины с возможностью установки до пяти устройств на одну шину.

      AMD-8111 I/O Hub

      Наличие лишь одного интерфейса HyperTransport объясняется в данном случае довольно просто: предполагается, что туннель всегда будет находиться в конце HyperTransport-цепочки.

      Системы с процессорами ClawHammer

      ак уже отмечалось, набор туннелей AMD-8000 позволяет создавать чипсеты любой заданной степени сложности. К примеру, чипсет, предназначенный для применения в типичном ПК на базе процессора AMD ClawHammer, будет состоять только из графического туннеля AMD-8151 Graphics Tunnel и туннеля AMD-8111 I/O Hub (рис. 6). Получаемая система выглядит вполне сбалансированно, так как пропускная способность шины HyperTransport, соединяющей процессор с туннелем AMD-8151 Graphics Tunnel, даже немного больше, чем суммарная пропускная способность шины AGP8х и шины HyperTransport, соединяющей туннели AMD-8151 Graphics Tunnel и AMD-8111 I/O Hub.

      Системы с процессорами SledgeHammer

      Таким образом, универсальный набор микросхем AMD8000 и процессор SledgeHammer действительно позволяют создавать любые по сложности решения и предоставляют прекрасные возможности по масштабированию системы.

      Продолжая наши рассуждения, нетрудно догадаться, как может выглядеть восьмипроцессорная конфигурация сервера. Впрочем, попытка объединить восемь процессоров приведет нас к двум альтернативным схемам, показанным на рис. 9. Остается лишь выяснить, какая из них предпочтительнее.

      Для того чтобы ответить на этот вопрос, давайте вспомним, что в традиционных многопроцессорных системах вся оперативная память разделяется между всеми процессорами. В процессорах Hammer контроллер памяти интегрирован в сам процессор, благодаря чему каждый процессор имеет свою собственную память. Однако и в данной схеме вся память образует единое адресное пространство с плоской адресацией и разделяется между всеми процессорами системы. Таким образом, если одному из процессоров требуется получить доступ к данным, которые находятся в памяти, присоединенной к другому процессору, то он посылает соответствующий запрос контроллеру памяти другого процессора (точнее, всем окружающим его процессорам) и получает необходимые данные. В такой схеме передачи данных неизбежно возникают задержки, причем величина этих задержек пропорциональна количеству процессоров, через которые передаются запросы и требуемые данные.

      Понятно, что чем больше хопов происходит при передаче запроса и данных, тем значительнее будет задержка, что не может не отражаться негативно на производительности системы. Поэтому желательно, чтобы количество хопов при передаче запросов было как можно меньше.

      Теперь давайте обратимся ко второй возможной схеме соединения восьми процессоров (рис. 11).

      Нетрудно заметить, что в данном случае при обращении первого процессора к контроллеру памяти восьмого процессора происходит всего три хопа, то есть на один меньше, чем в предыдущей схеме. Аналогично уменьшается и количество хопов при обращении первого процессора к контроллеру памяти шестого процессора (теперь оно равно двум хопам вместо трех). И поскольку в данной схеме количество хопов при обмене данными между процессорами уменьшается, она является более выгодной в плане возникающих задержек при обращении к памяти. Именно поэтому данная система соединения процессоров используется в восьмипроцессорных конфигурациях серверов.

      В заключение отметим, что, хотя сами процессоры Athlon 64 и Opteron пока не доступны, прототипы систем, в том числе и многопроцессорных (рис. 12), уже существуют и, по слухам, вполне оправдывают надежды, которые на них возлагались.

      Влияние частоты DDR4 2133-4000 МГц на производительность процессоров AMD Ryzen 5 5600X и AMD Ryzen 9 5950X

      Архитектура Zen 3 в процессорах AMD Ryzen 5000 сделала заметный рывок производительности благодаря увеличению показателя выполнения операций за такт на 19% и повышения рабочих тактовых частот.


      Основным нововведением архитектуры Zen 3 стала перекомпоновка внутренних «модулей» со значительными микроархитектурными изменениями. Инженеры объединили два CCX-комплекса внутри каждого восьмиядерного кристалла в единый блок. Это позволило всем восьми ядрам в одном CCX-комплексе иметь полный доступ к кеш-памяти, что ускорило работу всей подсистемы памяти и снижает задержки при обмене данными. Благодаря такому шагу в шести- и восьмиядерных процессорах Zen 3 основная шина Infinity Fabric стала полностью разгружена от межъядерного траффика и стала отвечать лишь за взаимодействие с контроллерами интерфейсов DRAM DDR4 и PCI Express 4.0. Однако она не потеряла полностью своего предназначения со старшими двенадцати- и шестнадцатиядерными процессорами, где связь между двумя CCD-чиплетами сохранена.


      Второй важной особенностью является принцип работы шины Infinity Fabric. Она имеет собственный тактовый домен, синхронизируемым с физической частотой памяти. Благодаря оптимизациям и некоторой разгрузке межъядерного обмена данными стабильной работы можно добиться в режиме DDR4-3600 в синхронном режиме и более в асинхронном режиме.

      Однако в общий алгоритм работы вмешивается еще один участник – непосредственно контроллер памяти DRAM DDR4. Поскольку он независим от процессорных ядер, то также имеет свою рабочую частоту. В совокупности мы получаем, что работа подсистемы памяти процессоров семейства Ryzen 5000 имеет три независимых параметра – частоту оперативной памяти, частоту шины Infinity Fabric и частоту контроллера памяти. Инженеры AMD постарались согласовать все три генератора в соотношении 1:1:1 в режиме до DDR4-3600 включительно, после чего работа каждого компонента изменяются согласно таблице.

      Частота памяти (MCLK) Частота Infinity Fabric (FCLK) Частота контроллера памяти (UCLK)
      До DDR4-3600 до 1800 МГц FCLK = MCLK UCLK = MCLK
      DDR4-3600 MCLK = 1800 МГц FCLK = MCLK UCLK = MCLK
      После DDR4-3600 выше 1800 МГц FCLK = 1800 МГц UCLK = ½ MCLK

      Поэтому в разгоне важно следить за частотой оперативной памяти выше 3600 МГц, вручную активируя частоту шину Infinity Fabric равную половине показателя DDR4 и не забывать выставлять режим UCLK=MemCLK.

      Для нашего тестирования мы будем использовать младший процессор AMD Ryzen 5 5600X с единственным CCD-чиплетом и самую старшую модель Ryzen 9 5950X, имеющую два полноценных CCD-чиплета, что позволит наглядно и в полной мере изучить влияние частоты оперативной памяти на показатели быстродействия процессоров с обменом данных, обработки информации и игровую производительность.


      В качестве основной платформы выступит материнская плата MSI MEG B550 Unify-X, установившая несколько рекордов разгона оперативной памяти.

      MSI MEG B550 Unify-X построена на шестислойном текстолите черного цвета с увеличенной толщиной медных слоев. В дизайне применим строгий внешний вид с минимальным количеством пластика и отличным охлаждением цепей питания. Последняя насчитывает 16 фаз (14+2) с мосфетами Infineon TDA21490 (по 90А), управляемые полноценным шестнадцатиканальным контроллером Infineon XDPE132G5C.


      Важнейшей особенностью материнской платы MSI MEG B550 Unify-X является переработанная оптимизированная разводка линий и только два слота DIMM DDR4 для достижения наилучшей производительности и уменьшения задержек.


      Производителем предусмотрены индикаторы POST-кодов, кнопки включения и перезагрузки, кнопки прошивки BIOS и сброса настроек на задней панели, а также простой доступ к важным перемычкам на плате. В наборе с MSI MEG B550 Unify-X имеется специальный пак DIY Stands Set с подставками для превращения платформы в открытый стенд с возможностью обдува снизу и легкой доступностью к компонентам.


      Завещающим основной «треугольник» комплектующих становится набор оперативной памяти Team T-Force Xtreem 8Pack 4500MHz 16Gb.



      В качестве графической составляющей выступает видеокарта MSI Radeon RX 6700 XT Gaming X.


      Тестовый стенд

      • Материнская плата: MSI MEG B550 Unify-X;
      • Процессоры:
        • AMD Ryzen 5 5600X;
        • AMD Ryzen 9 5950X;

        Методика тестирования

        BIOS материнской платы MSI MEG B550 Unify-X обновлен до последней стабильной версии A30 (7D13vA3).


        Для мониторинга показателей системы использовалась утилита HWINFO64.

        Процессоры AMD Ryzen 5000 работают на стоковых частотах.


        Оперативная память Team Xtreem 8Pack оснащена XMP-профилем с высокой тактовой частотой:

        Пределом стабильной работы для процессоров в синхронном режиме стала частота оперативной памяти 4000 МГц, контроллера памяти и шины Infinity Fabric – 2000 МГц. Тайминги понижены до «16-16-16 32-Т1», уменьшены вторичные тайминги. Остальные параметры выставлены в режиме «Auto», включая напряжения SoC, VDDP, VDDG.

        Частота оперативной памяти 4000 МГц и тайминги будет отправной точкой для нашего тестирования. Другие частоты будут достигаться уменьшением множителя с указанными параметрами, включая шину Infinity Fabric и контроллер памяти, кроме частоты 2133 МГц с автоматическими настройками по умолчании.

        Режим MCLK:FCLK:UCLK = 1:1:1


        Для максимальной стабильной частоты DDR4-4000 и демонстрации производительности добавлен асинхронный режим MCLK:FCLK:UCLK = 1:1:2.


        Результаты тестирования

        В первую очередь взглянем на AIDA64 бенчмарк кэша и памяти на системе с различной частотой памяти DDR4.




        Наблюдаем взрывной рост производительности до частоты DDR4-3600, заявленной компанией AMD как наиболее оптимальной для высокоэффективного быстродействия процессоров AMD Ryzen 5000 в независимости от компоновки CCX-комплексов и чипсетов. Дальнейшее повышение частоты ведет к менее значительному росту.

        Латентность оперативной памяти.


        Задержки памяти также заметно снижаются, но до порога DDR4-3200. Отметим, что асинхронный режим в значительной степени пока лишь продемонстрировал падение в данном тесте.

        Тест быстродействия обработки данных WinRAR.


        В обработке потока данных тест быстродействия WinRAR демонстрирует прирост производительности на 34% для младшего процессора AMD Ryzen 5 5600X с одним CCX при разгоне от 2133 МГц до 4000 МГц в синхронном режиме и на внушительные +52% для двух комплексного CCX старшего процессора Ryzen 9 5950X.

        Игровую производительность оценивали в «Ведьмак 3: Дикая Охота» с минимальными настройками графики в разрешении 720p для уменьшения влияния графической составляющей.



        Игра The Witcher 3: Wild Hunt блестяще реагирует на многоядерность системы, и мы снова наблюдаем как частота памяти и шины Infinity Fabric влияет на взаимосвязь в старшем процессоре Ryzen 9 5950X. При стоковой частоте DDR4-2133 она даже ниже младшей модели, но по мере оверклокинга наблюдается ошеломительный прирост до отметки DDR4-3600 МГц.


        Графические пакеты бенчмарки 3DMark Fire Strike и Time Spy, показатели Physics Score и CPU Score соответственно.


        Тест 3DMark Fire Strike практически не замечает разгона оперативной памяти.

        Однако пакет Time Spy значительно лучше демонстрирует связь частоты и влияния связи шины Infinity Fabric между CCX-комплектами: напомним, что Ryzen 5 5600X имеет один блок CCX с шестью ядрами, а Ryzen 9 5950X – два блока CCX, соединенные шиной IF. Прирост составляет 13,5% и потрясающие 42,4%% соответственно. Для моделей Ryzen 7 5800X и Ryzen 9 5900X ситуация будет аналогичная (один и два CCX).


        Результаты бенчмарков Cinebench R20 и Cinebench R23 от компании Maxon.


        Текущие тесты, наоборот, продемонстрировали небольшой спад производительности при многоядерном прогоне. Перегрев был исключен. Возможно, с ростом частот значительнее возрастает нагрузка на контроллер памяти, который сказывался на системе процессора по удержанию заданного лимита (CPU функционировали в стоке), поэтому, как и на решениях Intel чем сильнее разгон оперативной памяти, тем сильнее нагрузка на соответствующие блоки и тем выше нагрев и потребление.


        Заключение

        Влияние частоты оперативной памяти на процессоры AMD Ryzen 5000 неоспоримо и как мантра повторяется уже чуть ли не по телевидению. Однако нам хотелось подробнее изучить данный вопрос с обновлением прошивок BIOS, последней версией AGESA и драйверами, влияющие на оптимизации и быстродействия конечных продуктов, и конечно же на взаимосвязь младшего и старшего процессоров с различной компоновкой.

        AMD Ryzen 5 5600X остается бодрым шестиядерным процессором c одним CCD-чиплетом и IOD-чиплетом, где основная связь возлагается на шину Infinity Fabric. Как мы убедились последняя зависит от частоты оперативной памяти, как и контроллер памяти, поэтому отправной точкой для Ryzen 5 5600X и, следовательно, для Ryzen 7 5800X является частота в режиме DDR4-3200, а более благоприятная отметка достигается при DDR4-3600. Дальнейший рост наблюдается, однако, каждый шаг достигается все более высокими жертвами и меньшей выручкой. В общем итоге средний прирост составляет +28,5%! Если вы приобрели подобную систему и неуверенно разбираетесь в «железе», то нашей рекомендацией будет текущая проверка на какой частоте памяти DDR4 работает ваша система: нередко пользователи и сборщики забывают активировать хотя бы профиль XMP и работают на пониженной частоте 2133-2400 МГц, когда нашим минимумом является 3200 МГц!

        Для топового процессора AMD Ryzen 9 5950X справедливы все вышесказанные утверждения. Но не стоит забывать, что у него и версии Ryzen 5 5900X один блок CCX стоит особняком и там связь держится на той же шине IF, которая чувствительна к любому «чиху». Поэтому даже после частоты DDR4-3600 мы наблюдаем менее линейный, но прирост быстродействия: здесь стоит побороться хотя бы за частоту памяти 3800 МГц, а отметка ниже DDR4-3200 карается наказанием самого себя потерей драгоценных FPS в играх и лишних минутах при обработке больших потоков данных! Средний прирост производительности от 2133 МГц к 4000 МГц составляет аж +48%!

        Читайте также: