Масштабируемость процессора 1s only что это

Обновлено: 07.07.2024

Новые процессоры справятся с ресурсоемкими рабочими нагрузками с интенсивным использованием данных, включая Интернет вещей, искусственный интеллект и визуальные вычисления благодаря значительному повышению производительности, оптимизации конструкции ЦОД и расширению возможностей.

Услуги связи — поддержка 5G

Извлекайте прибыль из облачной экономики благодаря гибким оптимизированным серверам, соответствующим отраслевым стандартам, и виртуализованным оркестрированным сетевым сервисам.

Высокопроизводительные вычисления — ускорьте аналитику

Работайте с большими и сложными наборами данных, быстрее получайте аналитическую информацию, ускоряйте разработку инновационной продукции и проводите научные исследования, для которых раньше не было возможностей.

Искусственный интеллект — оптимизация для глубинного обучения

Быстрое и эффективное масштабирование для повышения производительности глубинного обучения в 2,1 раза по сравнению с процессорами предыдущих поколений, обеспечения максимальной гибкости рабочих нагрузок искусственного интеллекта и смешанных рабочих нагрузок, а также надежности серверного класса.

Информация о продукте и производительности

Заявление об ускорении рабочих нагрузок хранилища OLTP до 5 раз: 1 узел, 4 процессора Intel® Xeon® E7-4870 на платформе Emerald Ridge с совокупной емкостью памяти 512 ГБ, ОС Oracle Linux* 6.4 с использованием Oracle 12c* с 800 работающими хранилищами. Эталонный тест: HammerDB, показатель: 2.46322e+006 (чем выше, тем лучше) и 1 узел, 4 процессора Intel® Xeon® 8180 класса Platinum на платформе Lightning Ridge SKX с совокупной емкостью памяти 768 ГБ, ОС Red Hat Enterprise Linux* 7.3 с использованием Oracle* 12.2.0.1 (включая базу данных и грид-вычисления) с 800 хранилищами. Показатель: 1.2423e+007.

Процессор Intel® Xeon® 8180 класса Platinum по сравнению с процессором Intel® Xeon® E5-2699 v4. ПРИМЕЧАНИЕ. Увеличение в 113 раз за последние 2 года при использовании оптимизированных платформ и оптимизированных библиотек Intel® MKL по сравнению с процессором Intel® Xeon® E5-2699 v3 с платформой BVLC-Caffe: 2 процессора Intel® Xeon® 8180 класса Platinum с частотой 2,50 ГГц (28 ядер), технология HT отключена, режим Turbo отключен, для управления масштабированием установлен режим «производительность» с помощью драйвера intel_pstate, оперативная память: 384 ГБ DDR4-2666 ECC. ОС CentOS* Linux версия 7.3.1611 (основная), ядро Linux 3.10.0-514.10.2.el7.x86_64. Твердотельный накопитель: твердотельный накопитель Intel® DC серии S3700 (800 ГБ, 2,5 дюйма, SATA, 6 Гбит/с, 25 нм, MLC). Измерение производительности: переменные среды: KMP_AFFINITY='granularity=fine, compact‘, OMP_NUM_THREADS=56, CPU Freq set with cpupower frequency-set -d 2.5G -u 3.8G -g performance

Платформа: 2 процессора Intel® Xeon® E5-2697 v2 с частотой 2,70 ГГц (12 ядер), технология HT включена, режим Turbo включен, для управления масштабированием установлен режим «производительность» с помощью драйвера intel_pstate, оперативная память: 256 ГБ DDR3-1600 ECC. ОС CentOS* Linux версия 7.3.1611 (основная), ядро Linux 3.10.0-514.21.1.el7.x86_64. Твердотельный накопитель: твердотельный накопитель Intel® серии 520 (240 ГБ, 2,5 дюйма, SATA, 6 Гбит/с, 25 нм, MLC).

Измерение производительности: переменные среды: KMP_AFFINITY='granularity=fine, compact,1,0‘, OMP_NUM_THREADS=24, CPU Freq set with cpupower frequency-set -d 2.7G -u 3.5G -g performance

Пример оценки снижения совокупной стоимости владения до 65% за 4 года основан на оценке эквивалентных по производительности стоечных систем с использованием виртуализованной рабочей нагрузки консолидации VMware ESXi*. Сравнивались 20 установленных двухпроцессорных серверов с процессором Intel® Xeon® E5-2690 (прежнее название «Sandy Bridge-EP») с запущенным ПО VMware ESXi* 6.0 GA с использованием гостевой ОС RHEL* 6.4 с совокупной стоимостью 919 362 доллара и 5 новых процессоров Intel® Xeon® 8180 класса Platinum (Skylake) с запущенным ПО VMware ESXi* 6.0 U3 GA с использованием гостевой ОС RHEL* 6 (64-разрядная версия) с совокупной стоимостью 320 879 долларов, включая приобретение базового оборудования. Предположительная цена сервера основана на текущих опубликованных розничных ценах двухпроцессорных серверов OEM-производителей с процессорами Intel® Xeon® E5-2690 v4 и двух процессоров E7-8890 v4 в 4-процессорном сервере — цены могут изменяться на основании фактических цен предлагаемых систем.


Обновление модельного ряда процессоров Intel Xeon в этом году стало самым значительным событием на рынке серверных платформ Intel начиная с 2011 года – тогда были выпущены так привычные нам линейки Е3, Е5, Е7. И вот снова четырехзначные индексы, вдобавок серии Platinum, Gold, Silver и Bronze, а также обобщающий бренд Xeon Scalable. С первой попытки оказалось трудно понять логику происходящего, и в заинтересованных кругах подвис вопрос: зачем это вообще понадобилось? Об идеологической подоплеке создания семейства Xeon Scalable и самых интересных новшествах в нем мы расскажем в этом посте.

Быстрее, совместимее, гибче

Итак, для начала идеологический аспект. В последние годы жизнь в семействе Intel Xeon шла по накатанному. Постепенно щелкали счетчики поколений, происходило это несинхронно и беспорядочно. Каждая линейка Е3, Е5, Е7 жила своей жизнью, в своем сокете, несовместимая с соседями. Сервера проектировались под конкретную линейку и только под нее.

Шло время, Е7 менялись медленно, Е3 побыстрее, но все равно значительно, на несколько лет, опаздывали по техпроцессу от Intel Core. А нереализованный потенциал – это упущенная выгода. Проанализировав ситуацию, в Intel выделили ключевые проблемы, которые должен решить выход принципиально новых Xeon:

  • максимально оперативный выход новых Xeon вслед за обновлением ядра Core,
  • единовременное обновление линейки Xeon по всей ширине,
  • совместимость по сокету всех Xeon Scalable.

Какие области более всего нуждаются в комплексах с подобными характеристиками? Самые динамично развивающиеся, такие как облачные хранилища и сервисы, программно определяемые системы и так далее. Ну а что делать, если требуются сервера под традиционные нагрузки, скажем, для телекома (к слову сказать, показывающего в последнее время отрицательную динамику роста серверных мощностей)? Тогда Xeon Scalable можно считать следующим поколением Intel Xeon, партнеры Intel без проблем предоставят вам консультацию о соответствии старых и новых линеек.

Новые возможности

Теперь о функциональных новшествах Xeon Scalable – они также служат цели превращения платформы в идеально масштабируемую ноду.

  • Intel Volume Management Device (Intel VMD). Быстрые сервисы требуют быстрых хранилищ. Технология Intel VMD позволяет организовать набор различных NVMe устройств как единое логическое хранилище и презентовать его потребителям. Таким образом, для организации сетевого доступа к данным на PCIe накопителях более не требуются дополнительные устройства. Интеграция – необходимое условие масштабируемости.
  • Intel Virtual RAID on CPU (Intel VROC). Комбинированное аппаратно-программное решение, позволяющее создавать RAID различных уровней из PCIe накопителей.
  • Встроенный контроллер 4x10G Ethernet. По оценке Intel, сетевой интерфейс с суммарной производительностью 40 Гбит/с будет достаточным для подключения одной ноды. Опять-таки, согласно стратегии, он должен быть встроенным.
  • Remote Direct Memory Access (RDMA). Для эффективной кластеризации необходим прямой обмен содержимым памяти между приложениями на разных нодах. Новые сетевые контроллеры Intel Ethernet Connection X722 поддерживают RDMA с расширением iWARP (Internet Wide-Area RDMA Protocol), позволяющим передавать данные без дополнительного копирования и без задействования ядер операционных систем.

Scalable и не только

Означает ли нынешняя реформа то, что все Intel Xeon станут теперь Scalable? Отнюдь. В целом линейка будет выглядеть следующим образом:

    – преемники Xeon E3/E5/E7. Таблица соответствия для наглядности приведена выше. И да, мы по-прежнему не знаем, почему отсутствует 7000 серия – компактный SoC для систем хранения и телеком решений, линейка продолжает развиваться, новые модели будут представлены в конце этого года – процессоры для производительных рабочих станций, аналог старших Core, оснащенный серверным функционалом. Представлены в 3 квартале
  • Xeon E (Essential) – в какой-то степени продолжение нынешних Xeon E3, серверные процессоры начального уровня. Срок выхода пока не объявлен.

Сервера с Intel Scalable уже доступны для заказа. Вот, например, HP DL360 Gen10. Обратите внимание, если предыдущее поколение DL360 строилось только на процессорах Intel Xeon E5 (как и положено двухсокетному серверу), то теперь в вашем распоряжении весь набор линеек от 3000 до 8000 (от Bronze до Platinum). Вот такая скалабильность получается.

Более сложные математические расчеты в пакете Science Mark V1.0 показывают не столь однозначный результат. В этом пакете - три основных математических теста, два из которых (судя по моим многочисленным испытаниям) практически не зависят от подсистемы чипсет/память и определяются лишь тактовой частотой и мыслительными способностями CPU. Видимо, основной код этих тестов целиком залезает в кэш-память второго уровня современных процессоров. На диаграмме показан один из этих двух тестов - симулирование методами молекулярной динамики жидкого аргона при температуре 140 градусов Кельвина. По этому тесту наблюдается идеальная масштабируемость всех систем (прямая пропорциональность скорости тактовой частоте CPU) и равенство одночастотных систем с разной памятью (в пределах погрешности). Однако третий тест - численное решения уравнения Шредингера для атома прометия (Atomic RHF) - всегда был весьма чувствителен и к чипсету, и к памяти. Тут уже мы видим и проигрыш PC133, и преимущество PC800 над PC2100, и дивиденды от применения FSB 533 МГц (2% по крайней мере), хотя масштабируемость систем с PC800 и PC2100 достаточно хорошая по меньшей мере до частот процессора 2,8 ГГц. Пока на основе этих математических тестов беспокоиться вроде бы не о чем. Однако не все так безоблачно.

Для простоты анализа на графике под диаграммой архивирования представлена зависимость времени архивирования в WinRAR 2.90 (в обратно пропорциональном масштабе) от частоты CPU. Напомню, при идеальной масштабируемости мы должны были бы наблюдать на этом графике прямые (что мы и сможем увидеть, построив аналогичный график по результатам «зипования»). Однако для «российского» суперархиватора это не так. Во-первых, график для PC133 выходит в насыщение почти сразу и бесповоротно. Больше об этой памяти сказать нечего L . Во-вторых, масштабируемость стандартных систем с PC2100 и PC800 не слишком хорошая: экстраполяция графиков показывает, что проблемы с насыщением скорости из-за памяти могут начаться сразу за порогом 3 ГГц, хотя RDRAM выглядит все же заметно лучше DDR. Зато использование FSB 533 МГц тут способно решить множество проблем (вспомните об уменьшающейся латентности при переходе на более быструю системную шину): системы с PC800 (но FSB 533) начинают показывать идеальную масштабируемость, а системы с DDR резко прибавляют в скорости и догоняют стандартный i850. Можно сказать, что здесь FSB 533 МГц является почти панацеей от болезней прошлого, настоящего и недалекого будущего.

FlasK DivX 4.11 MPEG4 Encoding

Тесты работы с видео (видеокодирование).

Переходим к скорости кодирования видео. Здесь мы использовали результаты двух кодеров - Windows Media Encoder 7.1 и FlasK 0.6 MPEG4 c DivX 4.11. Оба достаточно популярны. Из диаграммы можно заметить, что с PC800 поведение масштабируемости для обоих кодеров почти одинаково, тогда как со SDRAM (и PC2100, и PC133) FlasK заметно подтормаживает. На двух графиках ниже показана масштабируемость каждого кодера по отдельности. По вертикали отложено время кодирования в обратно пропорциональном масштабе. Для WME практически во всех случаях наблюдается идеальное масштабирование (прямые), разницы между RDRAM и DDR практически нет для всех современных процессоров (хотя для частот выше 2,8 ГГц небольшое отклонение для DDR возможно). Таким образом, WME можно с легкостью отнести к «простой математике», почти залезающей в кэш L2. Зато для FlasK ситуация совсем иная. Конечно, до страстей WinRAR 2.90 он немного не дотягивает, но все же явно видна тенденция к насыщению скорости систем DDR266/FSB=400 выше 3 ГГц, слабый эффект от применения FSB 533 МГц и значительно более сильный - от перехода на DDR333. А еще более быстрая PC800 вообще демонстрирует практически идеальную масштабируемость процессоров даже с FSB 400 МГц. Может все-таки рано Intel полностью отказываться от RDRAM в своих будущих чипсетах, отдавая эту память на откуп SiS и другим?

Тесты работы с трехмерной графикой в DirectX.

Теперь подробнее о масштабируемости при работе с трехмерной графикой. В частности, в играх. И в DirectX 8 (3DMark 2001), и в более старом DirectX 7 (3DMark 2000 при разной глубине цветности) ситуация с этим примерно одинакова. На графике под двумя диаграммами показан итоговый индекс теста 3DMark 2001. И хотя не совсем понятно, что этот индекс означает и можно ли его предполагать линейно зависимым от частоты CPU в идеальном случае (часть этого индекса, безусловно, можно было бы, поскольку это fsp в игровых фрагментах), и вообще здесь возможно ограничительное влияние трехмерного видеоускорителя, некоторые выводы мы все же попробуем сделать. Во-первых, отставание PC133 катастрофично (для DirectX 7, кстати, оно менее фатально). Во-вторых, небольшая разница в скорости систем на PC800 и PC2100 есть, хотя обе они идут в насыщение по этому индексу для частоты процессора выше 3 ГГц. Другими словами, для систем с процессорами Pentium 4 от 3 ГГц могут потребоваться значительно более мощные видеоускорители (даже в существующих играх), чтобы иметь возможность использовать весь скоростной потенциал CPU (не терять его попусту). Еще одним приятным выводом из этого графика можно считать полезность перехода на FSB 533 МГц: при этом скорость систем со SDRAM существенно возрастет, а системы с RDRAM смогут даже побороться за идеальную масштабируемость (на графике - почти прямая!). Значит, возможно, что дело было вовсе не в слабом графическом адаптере.

Масштабируемость представляет собой возможность наращивания числа и мощности процессоров, объемов оперативной и внешней памяти и других ресурсов вычислительной системы. Масштабируемость должна обеспечиваться архитектурой и конструкцией компьютера, а также соответствующими средствами программного обеспечения.

Так, например, возможность масштабирования кластера ограничена значением отношения скорости процессора к скорости связи, которое не должно быть слишком большим (реально это отношение для больших систем не может быть более 3-4, в противном случае не удается даже реализовать режим единого образа операционной системы). С другой стороны, последние 10 лет истории развития процессоров и коммуникаторов показывают, что разрыв в скорости между ними все увеличивается. Добавление каждого нового процессора в действительно масштабируемой системе должно давать прогнозируемое увеличение производительности и пропускной способности при приемлемых затратах. Одной из основных задач при построении масштабируемых систем является минимизация стоимости расширения компьютера и упрощение планирования. В идеале добавление процессоров к системе должно приводить к линейному росту ее производительности. Однако это не всегда так. Потери производительности могут возникать, например, при недостаточной пропускной способности шин из-за возрастания трафика между процессорами и основной памятью, а также между памятью и устройствами ввода/вывода. В действительности реальное увеличение производительности трудно оценить заранее, поскольку оно в значительной степени зависит от динамики поведения прикладных задач.

Совместимость и мобильность программного обеспечения

Концепция программной совместимости впервые в широких масштабах была применена разработчиками системы IBM /360. Основная задача при проектировании всего ряда моделей этой системы заключалась в создании такой архитектуры, которая была бы одинаковой с точки зрения пользователя для всех моделей системы, независимо от цены и производительности каждой из них. Большие преимущества такого подхода, позволяющего сохранять существующий раздел программного обеспечения при переходе на новые (как правило, более производительные) модели, были быстро оценены как производителями компьютеров, так и пользователям, и начиная с этого времени практически все фирмы-поставщики компьютерного оборудования взяли на вооружение эти принципы, поставляя серии совместимых компьютеров. Следует заметить, однако, что со временем даже самая передовая архитектура неизбежно устаревает и возникает потребность внесения радикальных изменений и в архитектуру, и в способы организации вычислительных систем.

В настоящее время одним из наиболее важных факторов, определяющих современные тенденции в развитии информационных технологий, является ориентация компаний-поставщиков компьютерного оборудования на рынок прикладных программных средств. Это объясняется, прежде всего, тем, что для конечного пользователя, в конце концов, важно программное обеспечение , позволяющее решить его задачи, а не выбор той или иной аппаратной платформы. Переход от однородных сетей программно совместимых компьютеров к построению неоднородных сетей, включающих компьютеры разных производителей, в корне изменил и точку зрения на саму сеть : из сравнительно простого средства обмена информацией она превратилась в средство интеграции отдельных ресурсов - мощную распределенную вычислительную систему, каждый элемент которой ( сервер или рабочая станция ) лучше всего соответствует требованиям конкретной прикладной задачи.

Этот переход выдвинул ряд новых требований. Прежде всего, такая вычислительная среда должна позволять гибко менять количество и состав аппаратных средств и программного обеспечения в соответствии с меняющимися требованиями решаемых задач. Во-вторых, она должна обеспечивать возможность запуска одних и тех же программных систем на различных аппаратных платформах, т.е. обеспечивать мобильность программного обеспечения. В третьих, эта среда должна гарантировать возможность применения одних и тех же человеко-машинных интерфейсов на всех компьютерах, входящих в неоднородную сеть . В условиях жесткой конкуренции производителей аппаратных платформ и программного обеспечения сформировалась концепция открытых систем , представляющая собой совокупность стандартов на различные компоненты вычислительной среды, предназначенных для обеспечения мобильности программных средств в рамках неоднородной, распределенной вычислительной системы.


Процессоры Intel Xeon Scalable: масштабируемость и универсальность

Анонс новых процессоров Intel Xeon Scalable стал одним из самых существенных событий в серверном сегменте. Вместо уже привычных Xeon E3, E5 и E7 было выпущено новое семейство Xeon Scalable, которое разделено на четыре линейки:

Давайте разберемся в чем особенности новых процессоров, а также какие технические новшества в них реализованы.

2.jpg

Изменение концепции. Необходимость или прихоть?

За последние годы, серверные процессоры обновлялись постепенно – выпускались новые поколения, которые приносили небольшие улучшения в существующие модели. Однако, у существующей концепции наблюдалось несколько проблем:

  1. Низкая скорость обновления. Архитектура серверных процессоров обновлялась с существенной задержкой, по сравнению с пользовательскими Intel Core. Это не позволяло Intel своевременно внедрять технологические новшества при их появлении.
  2. Неравномерное обновление серверных линеек. Например, процессоры Xeon E7 обновлялись реже, чем младшая линейка E3. Это также замедляло внедрение нового техпроцесса и других новшеств.
  3. Использование различного сокета. Так, переход с одной линейки на другую был невозможен без замены материнской платы. Это осложняло процесс модернизации сервера, ведь требовало дополнительных финансовых расходов.

Успешно решив эти проблемы при разработке Xeon Scalable, Intel смогли создать подходящую основу для масштабируемого сервера.

Серверные процессоры: существующие линейки

Фактически, семейство Scalable является новым поколением серверных процессоров Intel Xeon. Однако на рынке будет представлено еще три линейки:

  1. Xeon D. Данные SoC отличаются небольшими габаритами и предназначены для использования в телеком решениях и системах хранения данных. Первые процессоры были выпущены еще в 2015 году и регулярно обновляются.
  2. Xeon W. Разработанные для использования в рабочих станциях. Фактически, являются улучшенной версией пользовательских процессоров Intel Core.
  3. Xeon E. Серверные процессоры начального уровня, в рамках которых будут представлены недорогие решения с небольшой производительностью.

Как видим, с выходом процессоров Xeon Scalable логика модельного ряда серверных процессоров Intel стала понятнее. Однако, помимо внедрения единого сокета и новой логики наименований, Xeon Scalable получили ряд технических новшеств.

Технические особенности

3.jpg

Для реализации масштабируемости, Intel следовало сделать несколько большее, чем использование единого сокета. Так, можно выделить несколько функциональных новшеств, которые интегрированы в платформу:

  1. Intel Volume Management Device (Intel VMD). Позволяет объединить несколько NVMe накопителей в единое логическое хранилище, при этом не используя сторонние решения.
  2. Intel Virtual RAID on CPU. Представляет из себя комбинированное решение, предназначенное для объединения PCIe накопителей в RAID-массив.
  3. Встроенный Ethernet-контроллер. Поддерживает работу с 4-мя подключениями до 10 Gb каждый. Суммарной пропускной способности достаточно для комфортного подключения одного сервера.
  4. Remote Direct Memory Access (RDMA). В современных сетях, кластеризация – часто используемое решение, существенно повышающее производительность системы. Для повышения эффективности следует организовать прямой обмен данным, без дополнительного копирования и использования ресурсов ОС. Новые сетевые контроллеры поддерживают технологию RDMA, что позволяет существенно повысить скорость передачи между разными узлами сети.

Практическое применение Xeon Scalable

Одно из основных преимуществ новых процессоров - они подходят для создания масштабируемых серверов. Давайте разберемся, в каких случаях это может быть полезным:

  • облачное хранилища;
  • терминальный сервер;
  • сервер приложений 1С.

Нагрузка на такие сервера зависит от количества пользователей, объемов информации и используемого ПО. Используя процессоры

Читайте также: