Отличие старых процессоров от новых

Обновлено: 03.07.2024

Есть разные процессоры, все по-своему отличаются эффективностью по следующим факторам :

1) Архитектура
2) Ядра + Многопоточность/Виртуализация
3) Герцовка
4) Кэш памяти

Если с герцовкой и ядрами всё приблизительно понятно, то возникает желание провести сравнение старых процессоров, с тем же количеством ядер и герц, с новыми.

Допустим если взять десятилетний опыт. В чём принципиальное отличие и как эти изменения отвечают за производительность. Ядра и Герцы слишком простая пыль в глаза. Нигде к сожалению не смог найти ответ на этот вопрос, процессор новый, кэш больше, архитектура меньше. Герцы/Ядра по количеству и скорости идентичны.

Речь идет не о микроплаточке которую туда внедрили гении и не транзисторы, меня интересует конкретика.

Например взять старый процессор 10-ти летней давности 3.8 Ггц
Сравниваем с 2019 - 3.8 Ггц

Ядра/Виртуализация абсолютно идентичны.
Что помимо кэша, который непонятно как работает еще изменилось?
Что дал новый техпроцесс на уровне производительности?

КОЛИЧЕСТВО ТРАНЗИСТОРОВ
А ЭТО ЗАВИСИТ ОТ ТЕХПРОЦЕССА
ещё архитектура разная Может быть техпроцесс будет меньше, что скажется на более эффективном охлаждении, кол-во транзисторов и скорее всего в новых процах архитектура будет другая и более эффективная для современных задач. Все это в совокупности и влияет.

Несомненно, вопрос о сравнении и реальных значениях. Как показала практика некоторые новые процессоры могут уступать старому куску мусора с алиекспресса разогнанному до тех же параметров с идентичным ядрами/герцами.

Вот отсюда и вопрос.

tra-ta-ta Профи (904) Приведите пример такого процессора?

Если бы я мог привести пример, очевидно что я бы там и нашел ответ, Алиэкспресовские камни гонятся и выдают при тех же обстоятельствах ядра/герцы большую производительность.

Проблема упирается лишь в чипсет, но вряд ли это настолько сильно влияет.
К несчастью утратил.

Извиняюсь за голословность, примеров привести не могу. Лишь наслышан о подобных экспериментах где разница с современными версиями процессоров около 2-ух процентов в обе стороны. С теми же GPU но разной RAM.
Подобные проверки происходили на играх по типу Civilization 5.

Вам может быть любопытно, как новые поколения процессоров могут быть быстрее при тех же тактовых частотах, что и старые процессоры. Это просто изменения в физической архитектуре или что-то большее?

Почему, например, двухъядерный Core i5 с частотой 2,66 ГГц будет быстрее, чем Core 2 Duo с частотой 2,66 ГГц, который также является двухъядерным?

Это из-за новых инструкций, которые могут обрабатывать информацию за меньшее количество тактов? Какие ещё архитектурные изменения затронуты?


Почему процессоры нового поколения быстрее при той же тактовой частоте?

Обычно это не из-за новых инструкций. Это просто потому, что процессору требуется меньше циклов инструкций для выполнения тех же инструкций. Это может быть по большому количеству причин:

  1. Большие кеши означают меньше времени на ожидание памяти.
  2. Больше исполнительных единиц означает меньше времени на ожидание начала выполнения инструкции.
  3. Лучшее предсказание ветвления означает меньше времени, затрачиваемого на умозрительное выполнение инструкций, которые на самом деле никогда не нужно выполнять.
  4. Улучшения исполнительного модуля сокращают время ожидания выполнения инструкций.
  5. Более короткие конвейеры (pipeline) означают, что конвейеры заполняются быстрее.

Разработка процессора для обеспечения высокой производительности — это гораздо больше, чем просто увеличение тактовой частоты. Существует множество других способов повышения производительности, которые возможны благодаря закону Мура и играют важную роль в разработке современных процессоров.

Тактовая частота не может расти бесконечно

На первый взгляд может показаться, что процессор просто выполняет поток инструкций одну за другой, при этом производительность увеличивается за счёт более высоких тактовых частот. Однако одного лишь увеличения тактовой частоты недостаточно. Потребляемая мощность и тепловая мощность увеличиваются с увеличением тактовой частоты.

При очень высоких тактовых частотах необходимо значительное увеличение напряжения ядра процессора. Поскольку TDP увеличивается пропорционально квадрату Vcore, мы в конечном итоге достигаем точки, когда чрезмерное энергопотребление, тепловая мощность и требования к охлаждению предотвращают дальнейшее увеличение тактовой частоты. Этот предел был достигнут в 2004 году, во времена Pentium 4 Prescott. Хотя недавние улучшения в энергоэффективности помогли, значительное увеличение тактовой частоты уже невозможно.

График заводских тактовых частот современных ПК для энтузиастов за многие годы.


В соответствии с законом Мура, наблюдением, которое гласит, что количество транзисторов в интегральной схеме удваивается каждые 18–24 месяца, главным образом в результате уплотнения кристалла, были реализованы различные методы, повышающие производительность. Эти методы совершенствовались и совершенствовались на протяжении многих лет, что позволяет выполнять больше инструкций за определённый период времени. Эти методы обсуждаются ниже.

На первый взгляд последовательные потоки инструкций часто можно распараллелить

Хотя программа может просто состоять из серии инструкций, выполняемых одна за другой, эти инструкции или их части очень часто могут выполняться одновременно. Это называется параллелизмом на уровне инструкций (ILP). Использование ILP жизненно важно для достижения высокой производительности, и современные процессоры используют для этого множество методов.

Конвейерная обработка разбивает инструкции на более мелкие части, которые могут выполняться параллельно

Каждую инструкцию можно разбить на последовательность шагов, каждый из которых выполняется отдельной частью процессора. Конвейерная обработка инструкций позволяет нескольким инструкциям проходить эти шаги одна за другой, не дожидаясь полного завершения каждой инструкции. Конвейерная обработка обеспечивает более высокие тактовые частоты: при выполнении одного шага каждой инструкции в каждом тактовом цикле для каждого цикла потребуется меньше времени, чем если бы целые инструкции должны были выполняться по одной за раз.

Классический конвейер RISC состоит из пяти этапов: выборка инструкций, декодирование инструкций, выполнение инструкций, доступ к памяти и обратная запись. Современные процессоры разбивают выполнение на множество этапов, создавая более глубокий конвейер с большим количеством этапов (и увеличивая достижимую тактовую частоту, поскольку каждый этап меньше и требует меньше времени для завершения), но эта модель должна обеспечить базовое понимание того, как работает конвейерная обработка.


Используются кэши для ускорения доступа к памяти

Современные процессоры могут выполнять инструкции и обрабатывать данные намного быстрее, чем к ним можно получить доступ в основной памяти. Когда процессору требуется доступ к ОЗУ, выполнение может приостанавливаться на длительные периоды времени, пока данные не станут доступными. Чтобы смягчить этот эффект, в процессор включены небольшие области высокоскоростной памяти, называемые кешами.

Из-за ограниченного пространства, доступного на кристалле процессора, кэши имеют очень ограниченный размер. Чтобы максимально использовать эту ограниченную емкость, кеши хранят только самые последние или часто используемые данные (временная локальность). Поскольку доступы к памяти имеют тенденцию группироваться в определенных областях (пространственной локальности), блоки данных рядом с тем, к чему недавно осуществлялся доступ, также хранятся в кэше. См .: Местоположение ссылки

Кеши также организованы на нескольких уровнях разного размера для оптимизации производительности, поскольку кеши большего размера, как правило, медленнее, чем кеши меньшего размера. Например, процессор может иметь кэш уровня 1 (L1) размером всего 32 КБ, в то время как его кэш уровня 3 (L3) может иметь размер в несколько мегабайт. Размер кеша, а также ассоциативность кеша, которая влияет на то, как процессор управляет заменой данных в полном кэше, значительно влияют на прирост производительности, получаемый с помощью кеша.

Итак, как эти методы со временем улучшают производительность процессора?

С годами конвейеры стали длиннее, что сократило время, необходимое для завершения каждого этапа, и, следовательно, позволило повысить тактовую частоту. Однако, помимо прочего, более длинные конвейеры увеличивают штраф за неправильное предсказание ветвления, поэтому конвейер не может быть слишком длинным. Пытаясь достичь очень высоких тактовых частот, процессор Pentium 4 использовал очень длинные конвейеры, до 31 ступени в Prescott. Чтобы уменьшить дефицит производительности, процессор будет пытаться выполнять инструкции, даже если они могут дать сбой, и будет продолжать попытки, пока они не достигнут успеха. Это привело к очень высокому энергопотреблению и снижению производительности, получаемой от гиперпоточности. Новые процессоры больше не используют конвейеры такой длины, особенно после того, как масштабирование тактовой частоты достигло предела; Haswell использует конвейер, длина которого варьируется от 14 до 19 этапов, а архитектуры с низким энергопотреблением используют более короткие конвейеры (Intel Atom Silvermont имеет от 12 до 14 этапов).

Точность предсказания ветвлений улучшилась с более продвинутыми архитектурами, уменьшив частоту сбросов конвейера, вызванных неверным предсказанием, и позволив одновременно выполнять больше инструкций. Учитывая длину конвейеров в современных процессорах, это критически важно для поддержания высокой производительности.

С увеличением бюджета транзисторов в процессор могут быть встроены более крупные и более эффективные кэши, что сокращает задержки из-за доступа к памяти. Доступ к памяти может потребовать более 200 циклов для выполнения в современных системах, поэтому важно максимально снизить потребность в доступе к основной памяти.

Новые процессоры могут лучше использовать преимущества ILP за счёт более продвинутой суперскалярной логики выполнения и «более широких» конструкций, которые позволяют одновременно декодировать и выполнять больше инструкций. Архитектура Haswell может декодировать четыре инструкции и выполнять 8 микроопераций за такт. Увеличение бюджета транзисторов позволяет включать в ядро процессора больше функциональных блоков, таких как целочисленные ALU. Ключевые структуры данных, используемые при неупорядоченном и суперскалярном выполнении, такие как станция резервирования, буфер переупорядочения и регистровый файл, расширены в новых конструкциях, что позволяет процессору искать более широкое окно инструкций для использования их ILP. Это основная движущая сила повышения производительности современных процессоров.

Более сложные инструкции включены в новые процессоры, и всё большее число приложений используют эти инструкции для повышения производительности. Достижения в технологии компиляторов, включая улучшения в выборе инструкций и автоматической векторизации, позволяют более эффективно использовать эти инструкции.

В дополнение к вышесказанному, большая интеграция частей, ранее внешних по отношению к ЦП, таких как северный мост, контроллер памяти и линии PCIe, сокращает ввод-вывод и задержку памяти. Это увеличивает пропускную способность за счёт сокращения простоев, вызванных задержками доступа к данным с других устройств.

15432

Больше частота работы и больше ядер - верно. Но это как сравнивать современные фотокамеры по количеству мегапикселей. Современные процессоры устроены очень сложно и давно не являются "глупыми" исполнителями написанного программного кода. Для начала, ни одна ассемблерная команда (машинный опкод) не исполняется на процессоре "напрямую". Встроенный микрокод парсит опкоды x86 и превращает его в ещё более низкоуровневый код. Регистры ЦП, о которых вы наверняка наслышаны (eax, ebx. ) - не более чем виртуальная прослойка. Микрокод современного процессора можно представить как эмулятор архитектуры x86, реальные операции производятся на совсем иной архитектуре. Вот в этом и загвоздка. Например, операция деления целых чисел в x86 неделима. Но она преобразуется в несколько более низкоуровневых команд и в итоге [по времени] исполняется не один такт процессора, а несколько. Более современные процессоры могут иметь более быстрые варианты исполнения тех же операций. В итоге меньше гигагерц, но по факту работает быстрее.
Далее, целый мир оптимизаций исполнения кода. Предсказания переходов, спекулятивное исполнение операций (команда исполняется ещё до того как до этого места дойдёт исполнение, если вообще дойдёт), перестановка несвязанных команд местами и параллельное их исполнение на нескольких АЛУ, конвейеризация. В новых ЦПУ эти алгоритмы всё совершенствуются и совершенствуются, и сейчас ускорение работы процессора идёт по большей части за счёт этого.
Добавляются всё более новые SIMD "расширения" архитектуры, новые наборы команд, при помощи которых можно сильно ускорить исполнение того же кодирования видео (SSE, AVX и проч)
Наконец, в новых ЦПУ более быстрое железо в плане памяти (кеш) и соединений (шины данных), обмен с ОЗУ идёт гораздо быстрее, команды чтения/записи памяти сильно меньше тормозят. Связь между ядрами в Ryzen и вовсе устроена совсем иначе (Infiniry Fabric).

Если так, то ещё Pentium 4 выпускали с частотой 4 ГГц, предел где-то в этом районе. Дальнейшее поднятие частоты возможно разве что уходом с кремния на графен. Вот и мучаются с добавлением ядер и софтовыми оптимизациями.

Вот были раньше процессоры типа FX от АМД, там и ядер по 8 и ГГЦ до 4. Сейчас к таким показателям только приближаемся. Так почему же старые процессоры сейчас уже мало на что способны?

Бытовал такой миф: Чем больше частота, тем быстрее процессор.

Миф уходит корнями в 90-ые годы, когда многие пользователи, дабы не разбираться в непонятных Intel 386, 486 и Pentium просто смотрели на частоту — если у какого-то процессора она была выше, то он действительно оказывался быстрее.

Да еще и реклама немного позже "4 Гига/ 4Ядра" - подливала масла.

Современные процессоры устроены очень сложно. Для начала, ни одна ассемблерная команда не исполняется на процессоре напрямую.

Микрокод современного процессора можно представить как эмулятор архитектуры x86, реальные операции производятся на совсем иной архитектуре. Вот в этом и загвоздка. Например, операция деления целых чисел в x86 неделима . Но она преобразуется в несколько более низкоуровневых команд и в итоге исполняется не один такт процессора, а несколько. Более современные процессоры могут иметь более быстрые варианты исполнения тех же операций. В итоге меньше гигагерц, но по факту работает быстрее.

Далее, целый мир оптимизаций исполнения кода: предсказания переходов, спекулятивное исполнение операций (команда исполняется ещё до того как до этого места дойдёт исполнение, если вообще дойдёт), перестановка несвязанных команд местами и параллельное их исполнение на нескольких АЛУ, конвейеризация. Добавляются новые наборы команд, при помощи которых можно сильно ускорить исполнение того же кодирования видео (SSE, AVX и проч).

Наконец, в новых ЦПУ более быстрое железо в плане памяти (кеш) и соединений (шины данных), обмен с ОЗУ идёт гораздо быстрее, команды чтения/записи памяти сильно меньше тормозят. Связь между ядрами в Ryzen и вовсе устроена совсем иначе (Infiniry Fabric).

В 2002 году Pentium 4 достигли частот 3 ГГц, в 2003 — 3.2 ГГц, в 2004 — 3.4 ГГц, в 2005 — 3.8 ГГц. На этом диапазоне частот хотелось бы заострить внимание, во-первых, заметно резкое замедление прироста частот. Процессоры уперлись в технологический потолок, даже сейчас большинство выпускаемых моделей имеют частоты из диапазона 3.2-3.8 ГГц , а ведь достигнуты они были 15 лет назад .

Сейчас все больше устройств (планшеты/смартфоны) работает не на x86, а на архитектуре ARM

Некоторые говорят о том, что ARM лучше x86, и скоро все компьютеры перейдут на новую архитектуру . Apple со своими продуктами все ближе к этому. Они сами производят процессоры для планшетов и телефонов, так что такой переход и на компьютерах этой фирмы возможен. Но следует понимать, что нет такого понятия, как хорошая или плохая архитектура — есть понятие хороший или плохой процессор. Сравнение ARM и x86 выглядит странно и некорректно. Нужно сравнивать конкретные процессоры в конкретных задачах и программах. Иначе это просто "холивар".

Итак, миф про количество ядер - это тоже всего лишь миф

Так что выбирать процессор нужно не по количеству ядер, а по возможностям программ, в которых вы работаете. Более того — до сих пор хватает софта, который негативно реагирует на гиперпоточность: при отключении логических ядер производительность может не упасть, а вырасти.

После того как много лет назад с потребительского рынка ушла компания VIA, выбор процессоров для настольных ПК сократился до всего двух брендов – Intel и AMD. Впрочем, обширный модельный ряд каждой из этих двух компаний делает выбор оптимального процессора для конкретной задачи непростым делом. Самое главное, что нужно уяснить для себя – большое количество ядер и высокая частота не всегда означают мощный процессор, а основным показателем является современная архитектура.


Как устроены современные процессоры

Конструктивно процессоры для ПК делятся на три типа: центральные, с графическим ускорителем и однокристальные системы. Классические центральные процессоры помимо вычислительных ядер (от двух до десяти) имеют только встроенную кеш-память и контроллер оперативной памяти.

Большинство же современных процессоров обладают интегрированным графическим ускорителем, который является заменой недорогой дискретной видеокарты. Наконец, однокристальные системы являются полностью автономными решениями, не нуждающимися даже в чипсете материнской плате для взаимодействия с памятью, накопителями, сетевыми и звуковыми устройствами.

Основой основ процессоров Intel и AMD для ПК, является архитектура x86_64, подразумевающая совместимость с операционными системами Windows, macOS, Linux и BSD. Для сравнения, мобильные процессоры Qualcomm и MediaTek строятся на альтернативной архитектуре ARM, а серверные чипы IBM и Fujitsu – на архитектурах POWER и SPARC соответственно. Каждая новая реализация архитектуры x86_64 (у Intel это Skylake, у AMD – Excavator) чуть более производительная, чем предыдущая.

Серии процессоров Intel


Celeron J, Celeron N, Pentium J и Pentium N – самая младшая линейка процессоров компании Intel, которые даже не продаются отдельно, а поставляются в комплекте с бюджетными материнскими платами. Модели с индексом J построены на чуть более старой архитектуре Bay Trail, а c индексом N – на новейшей архитектуре Braswell. Производительность вычислительных ядер у Bay Trail и Braswell примерно одинаковая, тогда как интегрированная графика у новых чипов раза в три-четыре быстрее. Модели Celeron J/N являются двухъядерными, а Pentium J/N – четырехъядерными. Основная сфера применения – супердешевые офисные компьютеры для веб-серфинга и работы с электронными документами.

Celeron G и Pentium G (LGA1150 и LGA1151) – исключительно двухъядерные процессоры, но производительность каждого ядра на старшей архитектуре Haswell (под материнские платы LGA1150 и память DDR3) и Skylake (LGA1151, DDR4) в несколько раз превышает вышеупомянутые Bay Trail и Braswell. Отличаются Celeron G и Pentium G частотой и объемом кеш памяти – характеристики для процессора хоть и важные, но не критические. Учитывая невысокую стоимость, лучше всего Celeron G и Pentium G подходят для домашних мультимедийных компьютеров: интернет, фильмы, простые игры. А вот для новейших требовательных игр двух ядер уже категорически не достаточно.

Core i3 и Core i5 (LGA1150 и LGA1151) – это псевдочетырехъядерные и настоящие четырехъядерные процессоры Intel. Физических ядер у Core i3 только два, но благодаря технологии Hyper-Threading каждое ядро может обрабатывать данные в два потока. В результате операционная система и приложения воспринимают Core i3 как обычный четырехъядерник. Само собой, производительность четырех виртуальных ядер Core i3 раза в полтора меньше, чем четырех физических ядер у Core i5 с поддержкой автоматического разгона Turbo Boost. В итоге, для игр в пару к видеокарте вплоть до GeForce GTX 980 (см. статью «Сравнение видеокарт GeForce GTX 950, 960, 970, 980 и 980 Ti») вполне хватит Core i3. Тогда как в пару к видеокартам новой 1000-серии NVIDIA, а также для профессионального ПО, вроде видеореакторов, лучше подойдет Core i5.

Core i7 и Xeon (LGA1150 и LGA1151) – старшая потребительская и рабочая линейки процессоров Intel соответственно. Чипы Core i7 под материнские платы LGA1151 и LGA1150 имеют четыре физических, но восемь виртуальных ядер. А модели с индексом «К» еще и поддерживают ручной разгон, но лишь в случае использования материнки на чипсете Intel Z87, Z97 или Z170. Только процессоры Core i7 позволяют раскрыть потенциал флагманской видеокарты GeForce GTX 1080 либо связки из двух видеокарт попроще. Выгодной альтернативой Core i7 являются чипы Xeon, предназначенные для рабочих станций: у них частота ниже, но и цена меньше. Для игр это, пожалуй, не лучший вариант, а вот для видеомонтажа вполне имеет место быть. Но если процессоры Xeon LGA1150 работают на обычных потребительских материнках, то для Xeon LGA1151 требуется плата со специальным рабочим чипсетом Intel C232 или C236.

Core i7 Extreme Edition (LGA2011-v3) – флагманские процессоры компании Intel, да и вообще на рынке, предназначенные для заядлых геймеров и компьютерных энтузиастов. Семейство включает модели с 6-10 физическими ядрами и соответственно 12-20 виртуальными потоками. Стоимость старших моделей превышает отметку $1500 и это без учета материнской платы LGA2011-v3, которая потянет на дополнительные $250. Ну а что поделать, если только процессоры Core i7 Extreme Edition способны раскрыть потенциал связки из двух флагманских видеокарт GeForce GTX 1080 либо трех-четырех видеокарт попроще.

Серии процессоров AMD


Sempron и Athlon (AM1) – маломощные, зато очень дешевые двух- и четырехъядерные процессоры AMD. В отличие от вышеупомянутых Intel Bay Trail и Braswell, чипы AMD AM1 не впаяны в материнскую плату и продаются отдельно. В итоге, комплект из процессора и материнки AM1 обойдется во столько же или даже дешевле, чем Intel, но при этом позволит более точно подобрать оснащение портами и разъемами под вашу конкретную задачу. Главным же недостатком AM1 является шумный вентилятор боксового кулера, то есть для офисного ПК подойдет, а для домашнего кинотеатра – не лучшим образом.

A4, A6, A8, A10 и Athlon II X4 (FM2+) – среднеуровневая платформа AMD, основная ставка в которой сделана на баланс между производительностью вычислительных ядер и интегрированной графики. Особого внимания заслуживают A8 и Athlon II X4, которые являются самыми доступными четырехъядерными процессорами, пригодными для игр. Процессоры A8 обладают мощной интегрированной графикой, сопоставимой с дискретной видеокартой GeForce GT 730. Тогда как Athlon II X4 хоть и лишены интегрированной графики, зато стоят вдвое дешевле, чем Intel Core i3 (при этом, правда, и вдвое медленнее). То есть платформа FM2+ подойдет для сборки игрового ПК начального уровня (см. статью «Начальный игровой компьютер за 300 долларов (весна 2016)»).

FX-4000, 6000, 8000 и 9000 (AM3+) – уже не молодая старшая платформа AMD, которая за пять лет существования на рынке существенно подешевела, а потому не утратила актуальность. Главный минус процессоров FX – устаревший 32-нм техпроцесс, что выливается в высокие требования к электропитанию и охлаждению. Проще говоря, придется доплатить на материнскую плату понадежнее и процессорный кулер помассивнее (см. статью «Тишина и разгон: пятерка лучших процессорных кулеров»). Но все эти траты с лихвой перекрываются стоимостью самих процессоров AMD FX: шестиядерник можно купить за $110, а восьмиядерник – за $130. Для сравнения, цены на четырехъядерные Intel Core i5 начинаются с отметки $180. Конечно, производительность на ядро у чипов Intel выше, но в хорошо распараллеливаемых задачах, как то видеомонтаж, перевес будет на AMD FX с большим количеством ядер.

Менять ли старый процессор на новый?

Помимо сборки компьютера с нуля может возникнуть вопрос апгрейда уже имеющейся системы. Процессоры Intel Core i3, i5 и i7 серии 2000 (архитектура Sandy Bridge, разъем LGA1156) и новее, по большому счету, в апгрейде вообще не нуждаются. С каждой новой итерацией архитектуры Core компания Intel прибавляет в среднем по 5 процентов производительности, поэтому разница между процессорами пятилетней давности и текущими не превышает 25 процентов. А это явно не стоит того, чтобы помимо нового процессора тратиться на материнку с новым разъемом и оперативную память DDR4.

А вот заменить купленный много лет назад AMD FX-4000 на FX-8000 явно стоит – дополнительные четыре ядра продлят жизнь компьютеру на пару-тройку лет. Причем советуем поторопиться: выход новых процессоров AMD Zen AM4 не за горами, а значит в продаже решения AM3 будут оставаться не долго.

Читайте также: