Самый большой процессор в мире

Обновлено: 04.07.2024

Наверняка вы подумали, что это какой-то очередной кликбейт. Что это за самый большой процессор в мире? Похоже сейчас нам будут рассказывать о процессоре, который на 5 процентов больше других, и то если рассматривать этот процессор только с определенной стороны. И да просмотры и прочтения мы хотим собрать, но…

Сегодня мы расскажем вам о процессоре компании Церебро, под названием Cerebras CS-1. И он действительно огромный!

Например GPU, который считался самым большим раньше - это процессор Nvidia V100, а вот новый процессор Церебро. Он почти в 57 раз больше! Площадь самого чипа - 462 квадратных сантиметра - это почти столько же сколько площадь всей Nvidia 3090, вместе с системой охлаждения и разъемами.

А что вы скажете на то, что этот монстр способен симулировать некоторые физические модели быстрее самих законов физики? Заинтриговали? Что ж тогда присаживайтесь, наливайте чаек. Сегодня будет разбор по-настоящему огромного однокристального процессора!

Итак, что же это за монстр такой и зачем он нужен? Давайте сразу ответим на второй вопрос - этот процессор создан для машинного обучения и искусственного интеллекта. Кроме того он сильно расширит возможности для различного сложного моделирования и сможет заглядывать в будущее. Вообще, искусственный интеллект - это невероятно интересная и актуальная тема, а ее главные ограничения - это слабые вычислительные мощности. А если хотите узнать о реальных проектах с использованием искусственного интеллекта - у Илона Маска есть такой в запасе - Open UI.

Если вы думали, что закон Мура со своим увеличением количества транзисторов в процессоре каждые 1,5 года - это быстро, то посмотрите на потребности в области ИИ, ведь спрос на эти вычисления удваивается каждые 3,5 месяца!

Классический подход - это напихать кучу процессоров в серверные стойки, к каждому подвести систему охлаждения и питания, при этом каждый отдельный процессор еще надо связать друг с другом, а это, кстати, неизбежно вызывает задержки.

Скажем так - если вы возьмете двигатель от Ferrari и запихнете ее в старые Жигули, то машина конечно поедет быстрее, но как Ferrari все равно не поедет. Поэтому тут нужен принципиально иной подход, ведь для того? чтобы получить настоящий гиперкар надо взять хорошие тормоза, подвеску, рассчитать аэродинамику; с компьютерами точно также.

Компания Церебро это и сделала - они решили разработать свою систему с нуля, то есть вообще все - от архитектуры самих процессоров, до системы охлаждения и питания.

Американская компания Cerebras Systems представила самый большой в мире процессор, получивший название Wafer Scale Engine. При размерах 21,5 х 21,5 см этот чип включает 1,2 триллиона транзисторов и колоссальные 400 000 ядер. По габаритам он сравним с 11-дюймовым iPad Pro.

По заверениям Cerebras Systems, новый чип в 56 раз больше самого крупного графического процессора. Его общая площадь составляет 46 225 квадратных миллиметров. На этом огромном полотне разместилось 1,2 триллиона транзисторов и 400 тысяч ядер, оптимизированных под задачи искусственного интеллекта. Выполнен чип по 16-нм техпроцессу TSMC.

Wafer Scale Engine включает 18 ГБ сверхбыстрой памяти SRAM. Её пропускная способность составляет 9 ПБ/с.

Wafer Scale Engine в сравнении с графическим чипом от NVIDIA

Wafer Scale Engine предназначен для использования в центрах обработки данных. Чип является частью устройства с собственной системой водяного охлаждения для нормальной работы тысяч ядер. По словам исполнительного директора Cerebras Systems Эндрю Фельдмана, их процессор способен выдавать в 150 раз большую вычислительную мощность в сравнении с сервером, оборудованном несколькими видеокартами NVIDIA. Более того, WSE потребляет от 2% до 3% пространства и электроэнергии, которые потребуются для сервера на базе чипов NVIDIA с той же вычислительной мощностью.

В традиционных серверах с несколькими отдельными графическими процессорами, ориентированных на выполнение задач искусственного интеллекта, обрабатываемые данные постоянно передаются между разными чипами по относительно медленным сетевым каналам, что существенно снижает эффективность таких решений. В случае с разработкой Cerebras Systems такой проблемы нет, так как все вычисления выполняются на одной плате.

До этого создание подобных процессоров было невозможным, так как если хотя бы некоторые из 1,2 триллиона транзисторов работали неправильно, это приводило бы в негодность весь чип. Cerebras Systems удалось обойти эту проблему, построив сеть в Wafer Scale Engine таким образом, чтобы данные «обходили» неисправные части.

Компания намерена начать поставки центра обработки данных на базе WSE в сентябре этого года. Некоторые организации уже получили ранние образцы.

В эру завершения закона Мура известная шутка про самые большие в мире советские микросхемы перестала быть шуткой. Новым чудом микроэлектроники стал процессор Cerebras WSE со сторонами кристалла 21,5 × 21,5 см. Первая практика применения серверов на базе Cerebras WSE показала, что в ряде задач он обеспечивает подавляющее превосходство, и ещё долго не будет иметь равных.

Процессор Cerebras WSE

Системы CS-1 на базе процессора Cerebras WSE (Wafer Scale Engine) — компактные блоки высотой 26 дюймов (66 см) — были представлены примерно год назад. Эти блоки занимают 1/3 стандартной серверной стойки, но их производительность колоссальна. Причём вся эта производительность — результат работы одного-единственного процессора. Проектировщики компании SeaMicro рискнули разработать процессор размером с целую кремниевую пластину и не прогадали. На выходе получился продукт, который в вычислительных задачах в 10 тыс. раз быстрее самых производительных графических процессоров.

На днях о практических испытаниях CS-1 сообщила Национальная лаборатория энергетических технологий Министерства энергетики США (NETL). Она стала одним из немногих обладателей системы CS-1 и получила возможность сравнить её с классическими суперкомпьютерами на базе x86-процессоров с GPU NVIDIA. В частности, CS-1 сравнивали с одним из последних полученных лабораторией суперкомпьютеров Joule.

Система CS-1. Источник изображения: LLNL

Система Joule занимает 82 место в списке 500 мощнейших систем на Земле. Она опирается на 84 тыс. вычислительных ядер, распределённых по десяткам стоек, оценивается в десятки млн долларов США и потребляет 450 кВт. Система Cerebras CS-1 занимает треть стойки, стоит несколько млн долларов и потребляет всего 20 кВт. При этом в задаче, которая нагружает 16 384 ядер Joule, система на Cerebras оказалась в 200 раз быстрее.

Следует сказать, что Cerebras подходит не для всех вычислительных нагрузок. Этот процессор разрабатывался с упором на ускорение вычислений нейронных сетей и идеально подходит для ИИ и машинного обучения. Но даже в таком случае ему требуется мощнейший внешний сервер для подготовки и последующей обработки полученных данных. «Сырые» данные ему не подходят, либо они не позволяют загрузить такого монстра оптимальным образом.

И всё же для моделирования, например, гидродинамических задач ему нет равных, что показало сравнение с системой Joule, которая как раз призвана решать подобные задачи. Более того, Cerebras CS-1 настолько быстр, что может решать сложнейшие задачи быстрее, чем моделируемые процессы протекают в реальном времени. К примеру, он заканчивает расчёт ядерной реакции задолго до её прекращения в реальном реакторе. А вместо месяцев обучения той или иной модели ML система CS-1 способна обучиться за считаные минуты.

Подробнее о процессоре Cerebras можно прочесть в нашем архиве новостей. Вкратце напомним, что он состоит из 1,2 трлн транзисторов, часть которых сконфигурирована в 400 тыс. вычислительных ядер.

Американская компания Cerebras Systems совместно с TSMC выпустила самый большой и производительный в мире процессор. Об этом сообщило издание Tom’s Hardware. Новинка, получившая название Wafer Scale Engine 2 (WSE-2), является преемником чипа WSE, выпущенного компанией в 2019 г.

Размеры чипа составляют 220x220 мм – на производство одной такой микросхемы уходит целая 300-миллиметровая кремниевая пластина. На площади чипа размером 46255 мм 2 (примерно в 56 раз больше площади самого крупного графического процессора Nvidia A100) умещается 2,6 трлн транзисторов.

При одинаковых габаритах WSE-2 отличается от предшественника пониженным энергопотреблением, более чем удвоенным числом транзисторов и ядер. Все это стало возможным благодаря переходу с 16-нанометрового на более совершенный, 7-нанометровый техпроцесс.

Cerebras утверждает, что у нее уже есть рабочие системы на базе WSE-2, а на рынке процессор появится в III квартале 2021 г.

Особенности чипа

Процессор содержит 850 тыс. программируемых ядер, оптимизированных для вычислений в векторном пространстве, а объем встроенной памяти SRAM достигает 40 ГБ. Ядра работают на частоте в диапазоне 2,5-3 ГГц – такой же, как и у чипа первого поколения. В WSE-2 пропускная способность памяти по сравнению с WSE увеличилась с 9 ПБ/сек до 20 ПБ/сек.

Благодаря усилению межкомпонентных соединений общая пропускная способность чипа выросла со 100 Пбит/сек до 220 Пбит/сек. В чипе предусмотрена возможность обхода дефектных областей. Это необходимо, поскольку при таком внушительном количестве ядер возникновение брака при штамповке на фабрике очень вероятно.

Созданием чипов для решения задач в области искусственного интеллекта занимается множество компаний по всему миру. В их числе как гиганты вроде Nvidia, Intel, Qualcomm и Google, так и небольшие стартапы, например, британская Graphcore или американская Sambanova Systems.

ИИ-системы опираются на параллельные вычисления, для которых требуются многопроцессорные системы. Их производительность во многом ограничивает низкая скорость межпроцессорных коммуникаций, в которых задействована оперативная память. Cerebras в своих чипах линейки WSE решает эту проблему с помощью размещения огромного объема памяти непосредственно на кристалле. В нее загружается сразу вся необходимая для проведения вычислений с использованием всех рабочих ядер информация. При этом нагрузка распределяется равномерно таким образом, чтобы обработка данных была завершена всеми ядрами одновременно.

WSE-2 в составе миниатюрного суперкомпьютера

Как и прежде, чип поставляется в составе специальной системы высотой 15U под названием CS-2. Миниатюрный суперкомпьютер включает все необходимые сетевые компоненты и систему водяного охлаждения, необходимые для его эксплуатации. Система в сборе потребляет около 17 кВт электроэнергии, что на 2 кВт меньше по сравнению с предыдущей моделью. По утверждению представителей Cerebras, вычислительная мощность CS-2 эквивалента «сотням серверов на базе GPU, потребляющих сотни киловатт».

Программное обеспечение, поставляемое Cerebras, дает возможность пользователям CS-2 создавать собственные модели машинного обучения с применением популярных фреймворков, например, PyTorch и TensorFlow.

Станет ли госсектор драйвером развития российского рынка BI

CS-2 предназначена для применения в дата-центрах по обработке параллельных вычислений в области машинного обучения и искусственного интеллекта. Среди потенциальных клиентов – исследовательские лаборатории. Издание Tom’s Hardware отмечает, что продукт может заинтересовать военных и разведывательные структуры.

Что касается гражданского сектора, первую модель мини-суперкомпьютера, в частности, использует Аргоннская национальная лаборатория (подконтрольна Министерству энергетики США) для изучения рака и проведения фундаментальных исследований, к примеру, изучения черных дыр.

Несколько фактов о Cerebras

Основанный в 2016 г. американский стартап Cerebras System, по данным ZDNet, за время своего существования привлек более 475$ млн. Сегодня в компании работают 330 сотрудников.

Побеждать в борьбе за клиентов Cerebras планирует в том числе и на маркетинговом фронте. Для этого компания наняла опытного Рупала Холленбека (Rupal Hollenbeck), бывшего директора по маркетингу в Oracle.

Читайте также: