Сколько процессоров в видеокарте

Обновлено: 19.05.2024

Ядро CUDA, потоковый процессор, блок шейдеров - все это синонимы вычислительного блока GPU, который выполняет расчет данных. NVIDIA по традиции называет их ядрами CUDA, где CUDA расшифровывается как Compute Unified Device Architecture. Ядра CUDA отличаются от ядер процессора, они намного менее сложные и имеют высокую степень специализации под обрабатываемые данные. GPU сегодня умеют намного больше, чем выполнять рендеринг графики через конвейер, поэтому унификация под названиями потоковый процессор или унифицированный блок шейдеров вполне обоснована.

Потоковый процессор обрабатывает непрерывный поток данных, которых насчитываются многие сотни, причем они выполняются параллельно на множестве потоковых процессоров. Современные GPU оснащаются несколькими тысячами потоковых процессоров, они отлично подходят для задач с высокой степенью параллельности. Это и рендеринг графики, и научные расчеты. Что, кстати, позволило GPU закрепиться в серверном сегменте в качестве вычислительных ускорителей.

Aufbau eines Shader Multiprozessors der Turing-Architektur

Впрочем, потоковые процессоры - довольно общий термин, на практике у современных GPU все сложнее. GPU могут выполнять как вычисления с плавающей запятой (FP), так и целочисленные (INT) с различной точностью. Для графики важнее всего вычисления FP32 и INT32 с 32-битной точностью. В случае научных расчетов все более важными являются расчеты с более высокой точностью, а именно FP64. Поэтому в GPU появились выделенные вычислительные блоки для типа данных FP64. Впрочем, далеко не для всех расчетов нужна точность с 32 и 64 битами. Были разработаны способы выполнения менее точных вычислений на блоках INT32, например, одновременное выполнение операций над двумя 16-битными целыми числами.

Еще одним шагом дальше можно назвать интеграцию ядер Tensor в архитектуру NVIDIA Volta и Turing, которые способны эффективно вычислять менее сложные числа INT8 и INT4, но об этом мы поговорим чуть позже.

TU102-GPU Blockdiagramm

Мы рассмотрим структуру вычислительных блоков на основе архитектуры Turing, которые организованы в определенные структуры. В составе GPU TU102 имеются шесть кластеров Graphics Processing Clusters (GPC), 36 кластеров Texture Processing Clusters (TPC) и 72 потоковых мультипроцессоров Streaming Multiprocessors (SM). Но на GPU видеокарты GeForce RTX 2080 Ti активны только 34 TPC. Каждый кластер GPC содержит шесть кластеров TPC, в каждом TPC содержатся два потоковых мультипроцессора SM. Последние предлагают 64 потоковых процессора, так что 34 TPC x 2 SM x 64 потоковых процессора как раз дают 4.352 потоковых процессора на видеокарте GeForce RTX 2080 Ti.

NVIDIA масштабирует архитектуру Turing с GeForce RTX 2060 до GeForce RTX 2080 Ti. Ниже представлен обзор видеокарт линейки GeForce RTX:

Также на рынок была представлена видеокарта Titan RTX, которая опирается на полную версию GPU TU102. NVIDIA позиционирует Titan RTX как "Ultimate PC GPU", видеокарта нацелена на исследователей, ученых и разработчиков в сфере глубокого обучения и искусственного интеллекта. TU102 GPU в полной версии оснащен шестью кластерами Graphics Processing Clusters (GPC), 36 кластерами TPC (Texture Processing Cluster) и 72 потоковыми мультипроцессорами Streaming Multiprocessors (SM). В случае Titan RTX мы получаем 4.608 потоковых процессоров, 576 ядер Tensor и 96 ядер RT. Полная конфигурация памяти составляет 384 бита, NVIDIA подключает 12 чипов памяти GDDR6. В случае Titan RTX, NVIDIA использует 2-Гбайт чипы памяти Samsung, которые дают емкость до 24 Гбайт.

NVIDIA Titan RTX

NVIDIA Titan RTX

NVIDIA Titan RTX

NVIDIA Titan RTX

NVIDIA Titan RTX

Одновременное выполнение операций с целыми числами и числами с плавающей запятой

Как мы уже упоминали, вычислительные блоки FP32 могут работать в режиме 2x FP16, то же самое касается INT16. Чтобы увеличить вычислительную производительность и сделать ее более гибкой, в архитектуре NVIDIA Turing появилась возможность одновременного расчета чисел с плавающей запятой и целых чисел. NVIDIA проанализировала данные вычисления в конвейере рендеринга в десятках игр, обнаружив, что на каждые 100 расчетов FP выполняется примерно треть вычислений INT. Впрочем, значение среднее, на практике оно меняется от 20% до 50%. Конечно, если вычисления FP и INT будут выполняться одновременно, то конвейеру придется иногда "подтормаживать" в случае взаимных связей.

Hybrid-Rendering

В случае всех предыдущих архитектур NVIDIA одновременное выполнение целочисленных вычислений и расчетов с плавающей запятой не поддерживалось. В случае Turing все изменилось. Параллельная обработка FP и INT ускоряет рендеринг, поэтому NVIDIA как раз и добавила ее с архитектурой Turing. У Turing SM имеются 64 блока FP32 и 64 блока INT32 - не совсем типичное соотношение для конвейера рендеринга. Но одновременная работа блоков позволила существенно увеличить вычислительную производительность.

Потоковые процессоры уже давно превратились в универсальные вычислительные блоки в составе GPU. От их количества зависит итоговая вычислительная производительность, но здесь следует учитывать точность вычислений.

Текстурные блоки

Потоковые процессоры выполняют так называемые шейдеры - небольшие программы. Вершинные шейдеры используются для геометрических вычислений и динамического изменения объектов. Геометрические шейдеры позволяют рассчитать финальную геометрию и структуру объекта из точек, линий и треугольников. Шейдеры тесселяции обеспечивают дальнейшее разделение примитивов (тех же треугольников).

Текстурные блоки Texture Mapping Units (TMU) отвечают за то, чтобы все поверхности были покрыты соответствующими текстурами. TMU - выделенные арифметические блоки GPU. В случае архитектуры Turing, один текстурный блок дополняет 16 потоковых процессоров. Данные для текстурных блоков хранятся в видеопамяти, их можно считывать оттуда и записывать. Поскольку TMU уже не являются внешними арифметическими блоками в полном понимании, а встроены в конвейер рендеринга, каждый текстурный блок может обрабатывать объекты по нескольку раз. Действительно, для рендеринга объекта простых текстур уже недостаточно, использование нескольких слоев позволяет получить 3D-вид вместо плоской текстуры. Раньше объекты приходилось рассчитывать несколько раз, и каждый раз текстурный блок накладывал текстуру, сегодня достаточно обычного процесса рендеринга, текстурный блок может получать данные для многократной обработки из буфера.

Контроллер памяти

Высокая пропускная способность памяти не менее важна, чем вычислительная производительность GPU. Только если данные можно будет быстро считывать из видеопамяти на GPU и записывать их обратно, вычисления будут проводиться достаточно быстро. С одной стороны здесь располагается GPU, выполняющий вычисления, а с другой стороны - система кэшей и памяти. Архитектуры GPU разрабатываются таким образом, чтобы получить преимущество от высокой пропускной способности памяти. Производители пытаются выжать максимум из подсистемы памяти, поэтому контроллер памяти имеет решающее значение.

Еще с архитектуры Pascal NVIDIA придерживается почти идентичной структуры GPU по работе с памятью GDDR. Интерфейс памяти разбит на 32-битные блоки. В полном варианте NVIDIA предусматривает 384-битную ширину шины, но из-за одного отключенного 32-битного блока мы получаем 352 бита у GeForce RTX 2080 Ti. Через каждый 32-битный интерфейс подключен чип памяти. 352 бит/ 32 бит дает 11 каналов и 11 чипов памяти GDDR6. В случае GeForce RTX 2080 и GeForce RTX 2070 ширина шины ограничена 256 битами, то есть восемью каналами и восемью чипами памяти GDDR6.

Ядра Tensor и RT

Ядра Tensor

С архитектурой Turing NVIDIA представила два новых вычислительных блока, ранее на GPU не использовавшихся. Конечно, ядра Tensor знакомы нам по архитектуре Volta, но там они использовались для научных расчетов. В случае GPU Turing и видеокарт GeForce RTX данные блоки играют особую роль.

Ядра Tensor предназначены для выполнения матричного умножения. Матричное умножение (BLAS GEMM) - наиболее важный компонент для тренировки и инференса сетей глубокого обучения. Матричные операции подразумевают выборку значений матриц A и B (выполнение сложения и умножения), после чего результат будет записываться в матрицу C. Для матриц 4x4 данные операции выполняются для всех 16 полей. В архитектуре Pascal для выполнения упомянутых операций использовались блоки FP32, поэтому скорость оставляла желать лучшего.

Funktionsweise von Ray Tracing

Ядра Tensor в архитектуре Turing могут выполнять INT16, INT8 и INT4. Вычислительная производительность INT8 в два раза выше, чем для INT16, поскольку можно выполнить две операции INT8 вместо INT16. То же самое касается сравнения между INT4 и INT8. В максимальном варианте GPU TU102 NVIDIA указывает 576 ядер Tensor. Но у GeForce RTX 2080 мы получаем только 544 ядра Tensor, для которых NVIDIA указывает вычислительную производительность 110 TFLOPS FP16 для игр и обработки изображений. В случае вычислений INT8 мы получаем 220 TOPS, а INT4, которые пока не используются, уже 440 TOPS.

Основная сфера применения ядер Tensor - Neural Graphics Framework (NGX) от NVIDIA. NGX обеспечивает интерфейсы для вычисления Deep Learning Super Sampling (DLSS) и различных эффектов пост-обработки через ANSEL. Но мы остановимся на этом чуть позже.

Ядра RT

Ядра RT - второй тип особых аппаратных блоков архитектуры Turing, которые используются в ней впервые. На полную трассировку лучей уходит слишком много ресурсов и времени даже с учетом нескольких тысяч потоковых процессоров на GPU. Именно по этой причине NVIDIA добавила ядра RT в архитектуру Turing, которые выполняют расчеты, необходимые для трассировки лучей. И с некоторыми типами вычислений ядра RT справляются очень эффективно. Все технологии трассировки лучей сегодня пытаются снизить вычислительную нагрузку, для этого используются разные алгоритмы.

Все они опираются на тот принцип, что удаленные от луча примитивы не могут с ним пересекаться. Поэтому и смысла их просчитывать нет. Экспоненциальное увеличение числа лучей приводит к тому, что на каждый луч следует обрабатывать как можно меньшее число примитивов, чтобы не увеличивать вычислительную нагрузку.

Aufbau eines Shader Multiprozessors der Turing-Architektur

Один из способов выборки примитивов - Bounding Volume Hierarchy (BVH). В случае BVH сцена разбивается на все меньшие по размеру блоки, в которых присутствуют примитивы. Луч следует обрабатывать только с теми блоками, которые он проходит на пути к примитиву. Подход несколько напоминает воксели, которые NVIDIA использует для Voxel Global Illumination (VXGI). BVH представляет собой дерево, в котором можно видеть, какой именно блок и, в конечном итоге, примитив следует учитывать для расчета трассировки лучей.

BVH на классических архитектурах GPU или на CPU может выполняться только программно. Таким образом, потоковым процессорам приходится на каждый луч выполнять несколько тысяч инструкций, в том числе многочисленные циклы для поиска блоков и, в конечном итоге, примитива. Только после нахождения примитива можно выполнять шейдинг луча. Именно здесь на помощь приходят ядра RT. Они содержат специальные функциональные блоки SFU (Special Function Units), оптимизированные под поиск нужных блоков и примитива, с которым пересекается луч. Потоковый процессор принимает задачу, после чего передает ее ядру RT, которое возвращает результат потоковому процессору - и последний может выполнять рендеринг дальше по конвейеру.

Грамотный выбор видеокарты

Теоретически современный компьютер может существовать без видеокарты — не зря материнские платы наделены одним или даже двумя разъемами, использующимися для подключения монитора. Совсем никаких проблем с этим нет у владельцев процессоров с интегрированным графическим ядром. Но даже они приобретают видеокарту в том случае, если хотят играть в современные игры. Только видеоадаптер способен обеспечить достойный уровень графики. А ещё сильнее она помогает в случае видеомонтажа или работы над визуальными спецэффектами. Но как выбрать подходящую модель?

Зависимость видеоадаптера от других компонентов

Предупреждаем сразу, ориентироваться в первую очередь следует на уже имеющиеся компьютерные комплектующие! Представьте, что вы приобрели мощнейший NVIDIA TITAN в то время, как в вашем системном блоке ютится скромный двухъядерный процессор. Он попросту не сможет обработать всю ту информацию, что поступает к нему от видеокарты. В связи с этим ваш TITAN будет использовать лишь половину или даже четверть своих возможностей.

Одним словом, подбирайте себе комплектующие примерно одного класса. Если вы покупаете мощную игровую видеокарту, то и процессор с материнской платой не должны быть дешевыми. Нет проблем только с бюджетными видеоадаптерами, предназначенными для обработки офисной графики. Как правило, выжать максимум из такого устройства могут любые «материнки» и процессоры, если только речь не идет об одноядерном чипсете десятилетней давности.

Основные критерии выбора

Интерфейс подключения

Как известно, видеоадаптеры вставляются в слот PCI-Express. Он имеется в практически каждой материнской плате, за исключением наиболее миниатюрных моделей. Но версия данного интерфейса может отличаться! Если вы собираете компьютер прямо сейчас, то точно приобретёте материнскую плату со слотом PCI-Express 3.0. Но если вы подбираете видеокарту для имеющейся «матери», то не лишним будет ознакомиться с тем, какая версия интерфейса ею используется. Вполне возможно, что это устаревший PCI-Express 2.0.

Ничего страшного в установке видеокарты на интерфейс прошлого поколения нет. Просто вы не сможете использовать все её возможности, так как она будет работать в режиме совместимости. Различие интерфейсов кроется лишь в пропускной способности — о высоком уровне графики в современных играх вы можете забыть. Справедливо это и в обратную сторону. Видеоадаптеры, предназначенные для PCI-Express 2.0, будут работать и в новом слоте. Но лучше поискать видеокарту поновее, дабы раскрыть потенциал материнской платы.

Энергопотребление

Давно уже прошли времена, когда видеоускоритель не требовал дополнительного питания. Сейчас отличается только количество разъемов, используемых для подключения блока питания. Самые мощные модели требуют обеспечения питания посредством двух разъемов 8PIN — если ваш блок питания не имеет таких кабелей, то придется озаботиться приобретением переходников, задействующих MOLEX. Чуть менее мощные видеокарты могут использовать один разъем 8PIN или даже 6PIN.

Само собой, отличается у видеоадаптеров и уровень энергопотребления. В технических характеристиках обычно указывается, сколько электричества видеокарта требует в режиме простоя и под нагрузкой. Обычно этот параметр варьируется от 50 до 350 Вт. Если вы не собираетесь менять блок питания, то подбирайте видеокарту под него. Например, GeForce 770 с системой охлаждения от GIGABYTE потребляет в играх до 220 Вт. Прибавьте к этому энергопотребление имеющихся у вас жестких дисков, CD-привода, звуковой карты и материнской платы. В результате вы получите, что такой видеокарте требуется блок питания не менее, чем на 600 Вт. Если ваш блок питания не способен выдать такой объем электричества, то следует рассмотреть более простой видеоадаптер. Или NVIDIA GeForce 970, созданный по утонченному техпроцессу и потребляющий меньшее количество электроэнергии.

Объем и шина видеопамяти

Многим кажется, что чем больше видеопамяти у видеокарты, тем лучше. Однако на самом деле это не всегда так. Дело в том, что видеопамять расходуется через специальную шину. И если у неё пропускная способность слишком низкая, то в редкой игре вы сможете израсходовать весь запас имеющейся видеопамяти. В частности, для объема 1 Гб достаточно шины 128 бит. А для объема 2-4 Гб нужна шина 256 бит. Для ещё большего объема потребуется ещё более широкая шина. Для разных нужд могут потребоваться видеоадаптеры со следующими параметрами:

  • Работа в офисе — в таком случае вас может устроить простейшая видеокарта, на борту которой имеется 512 Мб видеопамяти с не очень широкой шиной;
  • Просмотр видео и игры прошлых поколений — для решения таких задач потребуется видеокарта с 1 Гб видеопамяти (желателен стандарт GDDR5) и шиной от 128 бит.
  • Современные игры со средними настройками графики — здесь всё зависит от разрешения экрана. Вывод картинки в Full HD потребует 2 Гб видеопамяти и 256-битную шину.
  • Современные игры с максимальными настройками графики требуют как минимум 4 Гб видеопамяти и шину от 256 бит (чем шире, тем быстрее будет загружаться графика).
  • Задел на будущее и профессиональный монтаж видеоматериалов — потребуется модель, оснащенная 6 Гб видеопамяти (а лучше — ещё большим количеством) и максимально широкой шиной. Если высокое энергопотребление не пугает, то можно рассмотреть двухпроцессорную видеокарту или связку из двух видеоадаптеров.

Частота видеопамяти и процессора

Любая видеокарта состоит из процессора и видеопамяти. Оба этих компонента характеризуются частотой — в этом плане они не отличаются от процессора и оперативной памяти, подключаемых к материнской плате — только цифры совсем другие. В частности, частота видеопамяти обычно повышена до нескольких тысяч мГц — это сделано для того, чтобы обмен данными происходил как можно быстрее. Ну а что касается процессора, то его тактовая частота варьируется от 600 до 1300 мГц. Чем все эти параметры выше, тем более высокий уровень графики видеоадаптер способен обеспечить.

Обращаем ваше внимание, современные видеокарты, стоимость которых начинается от 15 тысяч рублей, поддаются разгону! В BIOS можно попытаться повысить частоту процессора, добившись чуть более интересного результата.

Число универсальных процессоров

Тоже весьма интересный параметр. Для геймеров он не так важен, так как универсальные процессоры в играх задействуются далеко не всегда. В первую очередь они предназначены для обработки потока видеоданных, а не трехмерной графики. В частности, с их помощью осуществляется рендеринг видео и конвертирование одного формата в другой. Чем процессоров больше, тем быстрее закончится этот процесс. У топовых видеокарт число универсальных процессоров может достигать пары тысяч. В бюджетных моделях их может быть встроено всего 300-500. К слову говоря, у NVIDIA эта технология получила наименование CUDA — должно быть, вы о ней уже слышали.

NVIDIA Experience

Раз уж речь зашла о видеокартах NVIDIA, то стоит рассказать о главном их преимуществе. При установке такого устройства вы получаете в своё распоряжение программу NVIDIA Experience. Изначально она была предназначена лишь для автоматического обновления драйверов и оптимизации имеющихся игр. Но сейчас в этом приложении имеется более интересный пункт — NVIDIA ShadowPlay. Если его задействовать, то видеокарта будет в фоновом режиме записывать ваш игровой процесс (от пяти до двадцати последних минут). Нажатие на определенную комбинацию клавиш позволяет сохранить видео на жесткий диск.

Нужно отметить, что данная функция доступна только обладателям видеокарт NVIDIA GeForce 600-й и более высокой серии. Её главное отличие от Fraps, Bandicam и прочих подобных программ — отсутствие какой-либо дополнительной нагрузки на систему, в связи с чем FPS (частота кадров) в играх не проседает.

Разъемы

Для вывода изображения на монитор или проектор могут быть использованы разные разъемы. Обычно видеокарта наделена как минимум четырьмя интерфейсами, а в дорогих моделях можно найти четыре или даже пять разъемов.

  • HDMI — современный цифровой интерфейс, который встречается в подавляющем большинстве телевизоров и многих мониторах, стоимость которых превышает 6 тысяч рублей. Обратите внимание, существуют уменьшенные версии разъема, которые требуют соответствующего кабеля! В зависимости от версии интерфейса, видеокарта может вывести на монитор картинку с разным разрешением (вплоть до 4K) и даже в 3D-виде. Доступен вывод изображения в паре со звуком.
  • DisplayPort — ещё один современный разъем. Этот интерфейс позволяет вывести картинку в любом разрешении, какое только поддерживает видеоадаптер. Вместе с изображением можно вывести и звук. Также доступна функция подключения нескольких мониторов.
  • DVI — наиболее надежный разъем. «Вилка» к нему не только подключается, но и вкручивается двумя болтиками. Недостатком можно считать только разрешение — картинку можно вывести в Full HD, но не более того.
  • VGA — устаревший разъем, через который невозможно вывести изображение в высоком разрешении, звук же им не поддерживается совсем. Однако таким интерфейсом подключения до сих пор обладают многие мониторы.

Популярные производители видеокарт

Здесь следует отметить, что производитель видеокарты и самой печатной платы — это далеко не одно и то же. Фактически видеоадаптеры создаются лишь двумя компаниями — NVIDIA и AMD. Но найти в продаже такие заводские варианты крайне непросто. Гораздо легче приобрести продукт от сторонних производителей, которые изменяют заводские настройки (разгоняют видеокарту) и ставят собственную систему охлаждения. Среди таких компаний наибольшее уважение имеют GIGABYTE, MSI, ASUS, Palit, Zotac, Inno3D, EVGA GmbH, Sapphire и некоторые другие.

На что же ориентироваться?

  • В случае потребности вывода изображения на несколько мониторов необходимо рассматривать мощную видеокарту, наделенную современными разъемами (о VGA точно следует забыть).
  • Офисных работников устроит практически любой видеоадаптер, продающийся сейчас в магазинах. При покупке бывшего в употреблении устройства следует ориентироваться на объем видеопамяти — при 512 Мб будут стабильно работать любые приложения, связанные с графикой или видео.
  • Любители игр обязаны искать видеокарту с приличной разрядностью шины видеопамяти. 256 бит — оптимальный параметр, позволяющий играм спокойно задействовать любой объем видеопамяти — вплоть до 4 Гб.
  • Если вы обожаете записывать свой игровой процесс или вести стримы, то ориентируйтесь на продукцию NVIDIA — в этом деле вам поможет ShadowPlay. Но не забудьте перед этим запастись вместительным жестким диском, выбору которого посвящена отдельная статья!

Как бы то ни было, а при выборе видеокарты обязательно нужно читать обзоры и отзывы. Только так можно понять, не пищат ли у устройства дроссели, как громко работает система охлаждения и каковы показатели видеоадаптера в ваших любимых играх.

Видеокарты различаются сериями видеочипов, в каждой серии есть по три-пять графических процессоров. На базе этих процессоров выпускают десятки версий видеокарт — с разным охлаждением, количеством видеопамяти и разгоном. Поможем разобраться в этом хаосе.

AMD или Nvidia?

Принципиальной разницы между производителями нет. До конца 2020 года видеокарты Nvidia выдавали более реалистичную графику благодаря технологии трассировки лучей, но сейчас она есть и у AMD.

В продаже не найти заводские версии видеокарт от AMD и Nvidia. Вы покупаете версии от Gigabyte, MSI, Asus, Palit и других. На одном и том же видеочипе от AMD или Nvidia компании выпускают несколько модификаций, которые отличаются тактовой частотой, количеством памяти и системой охлаждения. И всё это влияет на цену.

Вот как прочитать название видеокарты.


С чего начать?

Очевидно — с бюджета. Решите, сколько денег вы готовы потратить на видеокарту. Но не спешите брать самую дорогую.

Например, Radeon RX 6800 при сравнимой производительности в середине 2021 года стоит на 30% дороже GeForce RTX 3070, ее конкурента от Nvidia. Чтобы не ошибиться с выбором, оцените производительность подходящих по цене видеокарт, мы расскажем об этом далее.

Выбираем видеочип

Мощность видеокарты зависит не только от видеочипа, но и от огромного количества других технических характеристик: частоты графического процессора, объема видеопамяти, разрядности шины, числа универсальных вычислительных процессоров и так далее. Но это то, с чего стоит начать.

Например, вашего бюджета хватит на GTX 1660 Super или RTX 2060. При беглом сравнении видно, что частота графического процессора у первой — 1530 МГц, а у второй — 1365 МГц. Получается, новая RTX менее производительная, чем GTX? Конечно нет! В ней более совершенная архитектура: больше графических CUDA-ядер, быстрее память.

Для сравнения чипов лучше использовать сервис UserBenchmark

. Введите в поиске название серии и номер видеочипа, например GTX 1660, и посмотрите на графы User rating (пользовательский рейтинг) и Avg. bench (средний результат).

В первой отражается пользовательский рейтинг, во второй — среднее значение в тестах на производительность. Чем значения выше, тем более мощная видеокарта.


Справа находится блок со средним значением FPS в разных играх

Чтобы понять, каких результатов ожидать в играх, нажмите на название видеокарты и посмотрите замеры средней частоты кадров (количество FPS). Идеальной считается частота от 60 кадров в секунду и выше.

Производительность в играх зависит не только от видеокарты, но и от процессора, поэтому сравнивать видеокарты лучше в паре с ним. На том же UserBenchmark при клике на значок игры можно увидеть процессор, на котором она тестировалась.

Те же действия проделайте с RTX 2060. Как только решите, какой чип вам больше подходит, переходите к выбору модификации.

Стоит ли переплачивать за частоту видеопроцессора?

Чтобы ответить на этот вопрос, возьмем для примера две модификации Nvidia GeForce RTX 3060: Palit GeForce RTX 3060

Версия от Palit стоит на 15 000 рублей дешевле, но и частота графического процессора у нее — 1320 МГц, а у Asus — 1882 МГц. Выбрав более разогнанную модель, в играх вы получите на 5–10% больше кадров в секунду.

Объем видеопамяти

Количество видеопамяти в разных модификациях тоже может отличаться. Например, RX 570 встречаются как с 4 ГБ, так и 8 ГБ видеопамяти. У GTX 1060 бывает 3 ГБ или 6 ГБ видеопамяти. Если разница в цене составляет 500–1000 рублей, лучше доплатить.

Если разница в цене больше, выбирайте объем, отталкиваясь от своих потребностей в игре. Вот на какие параметры стоит ориентироваться (для ААА-проектов):

  • Full HD — 4 ГБ,
  • 2К на высоких настройках — 4–8 ГБ,
  • 4К — не менее 6 ГБ,
  • 4К на высоких настройках — 12 ГБ.

Трассировка и сглаживание: нужны или нет?

Технология трассировки лучей. Создана для того, чтобы объекты в игре выглядели максимально реалистично. Чтобы лучи света, блики и тени выглядели, как в жизни. Nvidia впервые представила эту технологию вместе с линейкой видеокарт GeForce RTX, а позже выпустила драйвер и для более ранних карт.

AMD поддержку трассировки реализовали только в Radeon RX 6000-й серии, которая начала появляться в продаже в конце 2020 года. Таких видеокарт у компании меньше, чем у Nvidia.

Учтите, что трассировка лучей снижает производительность видеокарты в играх. Вы получите более реалистичную графику, но с меньшей частотой кадров (FPS). Для топовых видеокарт это не проблема, частота кадров остается приемлемой. Но с бюджетными решениями, чтобы сохранить 60 FPS, придется снижать настройки графики.

Технологии сглаживания. Позволяют улучшить качество картинки. Контуры объектов и персонажей выглядят ровными, пропадает эффект лесенки, во время движения нет ряби.

Раньше для достижения такого эффекта в видеокартах использовались технологии TXAA, FXAA и MSAA. Но они снижали производительность: частота кадров падала до 30–40 FPS.

Современные разработки — DLSS у Nvidia и FidelityFX Super Resolution у AMD — наоборот, дают прирост производительности от 5% до 20%. То есть вместо 50 FPS можно получить стабильные 60 FPS, а вместо 90 FPS — 100 FPS. Это позволяет не снижать настройки графики при повышении разрешения и играть на мониторе с частотой обновления 80, 90 или даже 120 Гц и выше.

: какой игровой монитор купить: Acer Nitro или Asus Rog Swift?

Чтобы всё сработало, разработчики игры должны предоставить Nvidia данные для анализа или встроить в свою игру часть кода от AMD. Перед покупкой проверьте, какие игры поддерживают технологии сглаживания. Посмотрите списки для видеокарт Nvidia

Как убедиться, что видеокарта подходит ПК?

Еще один важный шаг — проверка на совместимость. Если не учесть размер и другие особенности, видеокарта может не поместиться в корпус или вовсе не заработает.

Длина и ширина

Убедитесь, что видеокарта поместится в корпус вашего ПК. В первую очередь посмотрите, какую максимальную длину видеокарты он поддерживает. Это указано в характеристиках корпуса.

Но учтите, что видеокарте могут мешать другие элементы: радиатор системы водяного охлаждения и вентиляторы. Это происходит там, где установка вентиляторов и СВО происходит во внутреннюю часть корпуса.

допускается установка видеокарт длиной до 450 мм, а при установке спереди вентиляторов — до 425 мм. Эту информацию можно найти на сайте

производителя. А если вы решите установить еще и радиатор СВО, то от 425 мм нужно будет отнять толщину радиатора.

Еще один важный параметр — ширина. Видеокарты с массивной системой охлаждения могут занимать несколько слотов расширения корпуса. Например, Palit GeForce RTX 3070 GamingPro

занимает целых три слота, через которые на заднюю стенку компьютера выводятся разъемы для подключения мониторов. Широкие видеокарты часто блокируют установку Wi-Fi-плат, звуковых карт в соседние слоты PCI-Express, которые находятся выше или ниже слота видеокарты. Как проверить?

Посмотрите, как расположены слоты на плате, и измерьте расстояние между ними. Например, в Asus ROG STRIX B450-F Gaming II

слоты PCI-Express далеко один от другого, так что видеокарта Palit, которую мы недавно упоминали, их не перекроет.

Обратите внимание на расположение слотов PCIe. В этой материнской плате Asus между ними большое расстояние — поместится любая современная видеокарта и не перекроет нижний слот PCIe

Не забудьте про питание

В технических характеристиках видеокарты указывается минимальная мощность блока питания (БП), с которым она будет стабильно работать.

В названии блока пишут суммарную мощность для всех линий питания, куда входят жесткие диски и другое оборудование. Выделяемая процессору и видеокарте мощность может быть значительно меньше. Значение можно узнать из таблицы на корпусе БП, в графе 12 В.

Мощность, выделяемая на видеокарту и процессор, указана в графе +12 В. У этого блока — все 600 Вт

Какой у вас экспресс?

Когда говорят о разъеме подключения на материнской плате, обычно упоминают версию PCI-Express (2.0, 3.0 и с недавнего времени — 4.0). Точное количество портов и их тип указаны в графе «Слоты расширения» в характеристиках материнской платы. Как правило, порт с самой последней версией предназначен для видеокарты. У видеокарт версия PCI-е указана в характеристиках в пункте «Интерфейс».

Если у вас установлена старая материнская плата, поддерживающая формат 2.0, а видеокарта поддерживает 3.0, ничего страшного. Видеокарта будет работать с пропускной способностью младшей версии PCI-Express, хотя и медленнее. В идеале стоит выбрать видеокарту с разъемом той же версии, которую поддерживает материнская плата. Или с более высокой, если собираетесь менять плату.

А что с монитором?

Видеокарты поддерживают разные разрешения экрана и разное количество мониторов. А еще от видеокарты зависит максимальная частота кадров, которую отобразит монитор за одну секунду (частота обновления, измеряется в герцах (Гц)).

. Максимальное разрешение, которое поддерживает видеокарта, — 7 680 x 4 320, то есть она будет работать с широкоформатным монитором или телевизором 8К.

Характеристики видеокарты Gigabyte GeForce RTX 2060

Также у видеокарты есть один порт HDMI версии 2.0b и три порта DisplayPort версии 1.4. То есть порт HDMI поддерживает Full HD с частотой до 240 Гц, 2K до 144 Гц, 4K до 60 Гц, а порты DisplayPort — Full HD/2K с частотой до 240 Гц и 4K с частотой до 120 Гц.


Чтобы понять, какие разъемы вам нужны, посмотрите на характеристики монитора. Если монитор Full HD с частотой обновления до 240 Гц, хватит HDMI 2.0b или DisplayPort 1.2a. Для монитора с 2К-разрешением и частотой 240 Гц понадобится HDMI 2.1 или DisplayPort 1.3.

При подключении посмотрите в инструкции к монитору, какая частота и какое разрешение поддерживаются на каждом из его портов. Бывает так, что максимальное качество доступно только на DisplayPort или одном из нескольких HDMI. Именно к ним и нужно подключить видеокарту.

Одна из проблем, создаваемых маркетингом производителей видеокарт, заключается в том, что речь идет о количестве ядер, которые GPU / ГРАФИЧЕСКИЙ ПРОЦЕССОР имеет, мы предполагаем, что они лгут, чтобы преувеличить цифры. Но что мы понимаем под ядром в графическом процессоре, можем ли мы сравнить их с ядрами графического процессора? CPU / ЦЕНТРАЛЬНЫЙ ПРОЦЕССОР а какие есть отличия?

Когда вы идете покупать видеокарту последней модели, первое, что вы видите, это то, что вам говорят об огромном количестве ядер или процессоров, но что произойдет, если мы скажем вам, что это неправильная номенклатура?

Ядро графического процессора: как это работает

Ловушка, которую делают производители, заключается в том, чтобы вызывать простые ALU или исполнительные блоки под именем ядер, например NVIDIA называет свои ALU ядрами CUDA, которые работают с 32-битными числами с плавающей запятой, но если мы будем строги, мы больше не сможем называть их ядрами или процессорами. Они не соответствуют основным требованиям, чтобы их можно было рассматривать таким образом.

Итак, что такое ядро ​​или процессор в графическом процессоре?

Ciclo Instrucción Unidad Control

Ядро или процессор - это любая интегральная схема или ее часть, которые вместе могут выполнять полный цикл команд, это захват команд из памяти, их декодирование и их выполнение.

ALU - это всего лишь исполнительный блок, поэтому он должен быть полноценным ядром. А что считать полноценным ядром? Ну то, что NVIDIA называет SM, Intel вызывает Sub-Slice и AMD Вычислительный блок.

Причина этого в том, что именно в этих модулях происходит весь цикл команд, а не в ALU или исполнительных модулях, которые отвечают только за часть цикла команд.

Графические процессоры не «запускают» программы

Графический процессор NVIDIA

Имейте в виду, что графические процессоры не выполняют программы в том виде, в каком мы их знаем, а представляют собой последовательность инструкций. Исключение составляют шейдерные программы, которые работают на ядрах графического процессора.

Программы шейдеров манипулируют наборами данных или графическими примитивами на разных этапах. Но на уровне аппаратной функциональности они представлены в виде ядер.

Ядра, не путать с ядрами операционных систем, представляют собой автономные наборы данных и инструкций, которые также называются потоками в контексте графического процессора.

Чем ядро ​​графического процессора отличается от ядра процессора?

CPU GPU

Основное различие заключается в том, что ЦП в первую очередь предназначены для параллелизма на уровне команд. , В то время Графические процессоры специализируются на параллелизме на уровне потоков.

Параллелизм на уровне команд предназначен для сокращения времени выполнения команд программы за счет одновременного выполнения нескольких одинаковых команд. Ядра, основанные на параллелизме на уровне потоков, принимают несколько программ одновременно и выполняют их параллельно. ,

Современные процессоры сочетают в своих архитектурах ILP и TLP, в то время как графические процессоры остаются чисто TLP. без какой-либо ILP, чтобы упростить блок управления и иметь возможность разместить как можно больше ядер.

Работа на графическом процессоре по сравнению с работой на процессоре

Чип пор дентро

В большинстве случаев, когда поток достигает ALU ядра графического процессора, он содержит инструкцию и данные напрямую, но бывают случаи, когда данные необходимо искать в кэшах и в памяти, чтобы избежать задержек в выполнении планировщика ядра графического процессора. то, что он делает, называется циклическим перебором и передает этот поток для последующего выполнения.

В ЦП это невозможно сделать, причина в том, что потоки представляют собой очень сложные наборы инструкций и с высокой степенью зависимости между ними, в то время как в графическом процессоре для этого нет проблем, поскольку потоки выполнения чрезвычайно малы, поскольку они самодостаточны в «ядрах» много раз на протяжении одной инструкции.

На самом деле графические процессоры собирают набор ядер в так называемой волне, назначая каждую волну ALU графического процессора, они выполняются каскадно и по порядку. Каждое ядро ​​имеет ограничение по потокам или ядрам, которые будут держать его занятым некоторое время, пока ему не понадобится новый список, таким образом избегая того, что огромное количество ядер постоянно делает запросы к памяти.

Читайте также: