Что такое тьюринг видеокарта

Обновлено: 04.07.2024

Turing - это кодовое название микроархитектуры графического процессора (GPU), разработанной Nvidia . Он назван в честь выдающегося математика и программиста Алана Тьюринга . Архитектура была впервые представлена ​​в августе 2018 года на SIGGRAPH 2018 в видеокартах Quadro RTX , ориентированных на рабочие станции , [2] и через неделю на Gamescom в потребительских видеокартах серии GeForce RTX 20 . [3] Основываясь на предварительной работе своего предшественника, эксклюзивного для высокопроизводительных вычислений, архитектура Тьюринга представляет первые потребительские продукты, способные к трассировке лучей в реальном времени. , давняя цель индустрии компьютерной графики. Ключевые элементы включают специализированные процессоры искусственного интеллекта («тензорные ядра») и специализированные процессоры трассировки лучей. Тьюринг использует DXR , OptiX и Vulkan для доступа к трассировке лучей. В феврале 2019 года Nvidia выпустила графические процессоры серии GeForce 16 , в которых используется новый дизайн Тьюринга, но отсутствуют ядра трассировки лучей и искусственного интеллекта.

Turing производится с использованием процесса изготовления полупроводников TSMC FinFET с длиной волны 12 нм . Высокопроизводительный графический процессор TU102 включает 18,6 миллиарда транзисторов, изготовленных с использованием этого процесса. [4] Тьюринг также использует память GDDR6 от Samsung Electronics , а ранее Micron Technology .

Микроархитектура Тьюринга объединяет несколько типов специализированных процессорных ядер и позволяет реализовать ограниченную трассировку лучей в реальном времени. [5] Это ускоряется за счет использования новых ядер RT (трассировки лучей), которые предназначены для обработки квадродеревьев и сферических иерархий, а также ускорения тестов на столкновения с отдельными треугольниками.

Особенности в Тьюринге:

    Ядра CUDA (SM, потоковый мультипроцессор)
    • Вычислительные возможности 7.5
    • традиционные растровые шейдеры и вычисления
    • одновременное выполнение целочисленных операций и операций с плавающей запятой (унаследовано от Volta)
      ускорение иерархии ограничивающих объемов[6]
    • тени, ambient occlusion , освещение, отражения
    • искусственный интеллект
    • большие матричные операции Суперсэмплинг глубокого обучения (DLSS)

    Память GDDR6 производится Samsung Electronics для серии Quadro RTX. [7] Серия RTX 20 первоначально была запущена с микросхемами памяти Micron , а затем к ноябрю 2018 года была переключена на микросхемы Samsung. [8]

    Растеризация

    Nvidia сообщила о приросте производительности растеризации (CUDA) для существующих заголовков примерно на 30–50% по сравнению с предыдущим поколением. [9] [10]

    Трассировка лучей

    Трассировка лучей, выполняемая RT-ядрами, может использоваться для создания отражений, преломлений и теней, заменяя традиционные растровые методы, такие как кубические карты и карты глубины . Однако вместо полной замены растеризации информацию, собранную с помощью трассировки лучей, можно использовать для дополнения затенения информацией, которая является гораздо более фотореалистичной , особенно в отношении действий вне камеры. Nvidia заявила, что производительность трассировки лучей увеличилась примерно в 8 раз по сравнению с предыдущей потребительской архитектурой Pascal.

    Тензорные ядра

    Генерация окончательного изображения дополнительно ускоряется ядрами Tensor, которые используются для заполнения пробелов в частично визуализированном изображении, метод, известный как устранение шума. Ядра Tensor выполняют результат глубокого обучения, чтобы систематизировать, например, как увеличить разрешение изображений, генерируемых конкретным приложением или игрой. При основном использовании тензорных ядер проблема, которую необходимо решить, анализируется на суперкомпьютере, который на примере обучается желаемым результатам, и суперкомпьютер определяет метод, который следует использовать для достижения этих результатов, что затем выполняется с помощью тензорного модуля потребителя. ядра. Эти методы доставляются потребителям через обновления драйверов . [9] Суперкомпьютер сам использует большое количество тензорных ядер.

    Чипсы

    Платформа разработки Тьюринга называется RTX . RTX трассировки лучей функция может быть доступна с помощью Microsoft «s DXR , OptiX , а также с помощью Vulkan расширений (последний из которых также доступны на драйверах Linux). [11] Он включает доступ к функциям с ускорением AI через NGX. Функции Mesh Shader и Shading Rate Image доступны с использованием расширений DX12 , Vulkan и OpenGL на платформах Windows и Linux. [12]

    Обновление Windows 10 за октябрь 2018 г. включает общедоступную версию DirectX Raytracing. [13] [14]

    Lorem ipsum dolor

    Архитектура Turing в видеокартах NVIDIA. Что новенького появилось?

    1. Это RT-ядра, отвечающие за расчет трассировки лучей в онлайн режиме.
    2. Это тензорные ядра, предназначение которых — это решение задач, объединенных с работой искусственного интеллекта.
    1. L1;
    2. И блок с общей памятью.
    1. Mesh Shading. При помощи этой технологии при разработк е игр можно будет переложить задачу расчета уровня детализации технологии на GPU. Это позволит увеличить количество объектов в кадре во многих современных играх. Без использования этой технологии их количество на экране ограничено. С использованием Mesh Shading сам расчет детализации объекта на экране будет производить видеокарта, а она , как известно, более приспособлена к таким задачам. К примеру, на презентации технологии Turing на экране удалось отразить около 300 тысяч объектов. А это в десятки раз больше, чем при применении других технологий.
    2. Variable Rate Shading. Эта технология позволяет разработчикам игр улучшить применение шейдеров, то есть снизить точность расчетов маловажного «кусочка» кадра. К примеру, если представить сцену автогонки, то точное отображение уносящегося дорожного покрытия внизу кадра необязательно. Потому что игрок просто «не успевает» оценить всю «красоту» дороги из-за происходящего экшена.

    Что дает использование видеокарты NVIDIA Turing ?

    1. Правильное глобальное освещение в сценах. Данная возможность позволяет использовать все имеющиеся источники света, даже те, которые находятся за кадром сцены. К примеру , свет, поступающий через окно, будет освещать не только прямоугольник окна в комнате, а все остальное оставляя в «темноте», но и отразится о имеющиеся предметы, которые «подсветят» всю комнату. И комната преврати тся из «непроглядной» тьмы в реалистичный полумрак.
    2. Натуральность теней. Раньше тени были резкие и с четко очерченными краями. Сейчас же о ни становятся «мягче», с корректными краями, в правильных оттенках и отсветах. То есть , опять же, добавлена реалистичность показа теней.
    3. Зеркальное отражение происходящего на зеркальных поверхностях. Раньше получить отражение происходящего на зеркальных поверхностях было практически невозможным. Или решения настолько были «громоздкими», что ими пренебрегали. С новой архитектурой Turing в видеокартах NVIDIA отражение в зеркальных поверхностях (лужи воды, масла, стекла, зеркала, гладкие поверхности, глаза и т.д . ) стало не просто возможным, но и основной «фишкой» этих видеокарт.

    Мы будем очень благодарны

    если под понравившемся материалом Вы нажмёте одну из кнопок социальных сетей и поделитесь с друзьями.

    Во время презентации NVIDIA на мероприятии SIGGRAPH 2018 исполнительный директор компании Дженсен Хуанг (Jensen Huang) официально представил долгожданную архитектуру GPU Turing, о которой ходило так много слухов. Следующее поколение графических процессоров будет включать в себя ряд новых функций и появится уже в этом году. Хотя в центре внимания пока были решения Quadro RTX для рынка профессиональной визуализации (ProViz), новые GPU будут применяться в других грядущих продуктах NVIDIA. Итак, что же приносит на рынок Turing?


    Гибридный рендеринг и нейронные сети: ядра RT и Tensor

    Знаковой функцией, по крайней мере, для рынка ProViz, является так называемый гибридный рендеринг, сочетающий в себе методы трассировки лучей и традиционное растрирование. Результатом должна стать возможность добиваться в реальном времени качества графики, близкого к полноценной трассировке лучей.


    Новый анонс, по сути, является продолжением мартовского заявления на Game Developers Conference, когда Microsoft рассказала о стандарте DirectX Raytracing (DXR), а NVIDIA о собственной реализации этой технологии — GameWorks RTX. Тогда партнёры NVIDIA показали впечатляющие демонстрации с применением RTX: это и проект PICA PICA от команды EA SEED, и юмористическая зарисовка по мотивам VIII эпизода «Звёздных войн» на движке Unreal Engine, и демонстрация студии Remedy на базе движка Northlight, и запись реальной игровой сцены из грядущей Metro Exodus. Также на канале NVIDIA появился специальный ролик, в котором директор по развитию продуктов Фрэнк Делиз (Frank DeLise) рассказал о принципе работы RTX. Все они демонстрировались на ускорителях Titan V (архитектура Volta).

    Большим изменением в Turing является ещё большая по сравнению с Volta аппаратная ориентированность на трассировку лучей. Архитектура впервые получила новые RT-ядра для трассировки лучей. Эти процессорные блоки ускоряют проверку пересечения лучей и треугольников и манипуляции с иерархиями ограничивающих объёмов (Bounding Volume Hierarchies, BHV) — последние является очень популярной структурой данных для хранения объектов при трассировке лучей. RT-ядра ускоряют расчёты движения света и звука в 3D-среде до 10 миллиардов лучей в секунду (Quadro RXT 8000 и 6000), что в 25 раз превосходит показатели старого «неускоренного» поколения Pascal.


    Архитектура Turing также включает тензорные ядра, представленные впервые в архитектуре Volta, и развивают их. Эти блоки с производительностью до 500 трлн тензорных операций в секунду являются важным аспектом нескольких инициатив NVIDIA. Наряду с ускорением трассировки лучей, они также позволяют уменьшать количество лучей, требуемых в сцене, с помощью шумоподавления на основе ИИ, и очищать изображение. Конечно, это не единственное предназначение тензорных ядер — NVIDIA предлагает использовать эти блоки в набирающих популярность вычислениях в области ИИ, машинного обучения и нейронных сетей.

    Новшеством Turing является поддержка более широкого диапазона точности, что позволяет кратно ускорить некоторые рабочие нагрузки, не предъявляющие высоких требований к точности. Так, помимо режима половинной точности вычислений с плавающей запятой FP16, компания реализовала поддержку целочисленных инструкций INT8 и даже INT4. Это соответственно в 2 и 4 раза быстрее, чем FP16. И, хотя точность нейронной сети уменьшается, при использовании INT4 можно многократно ускорить вычисления, что в некоторых случаях крайне полезно, особенно в процессах логических умозаключений ИИ.

    Возвращаясь к гибридному рендерингу в целом, интересно отметить, что, несмотря на ускорение отдельных задач в 20 и более раз, обещания NVIDIA по приросту конечной производительности не столь радикальны. Компания заявляет, что новые карты могут моделировать физический мир в 6 раз быстрее, чем с помощью GPU предыдущего поколения Pascal (впрочем, какие именно чипы сравниваются — не ясно). Время покажет, насколько реалистична эта оценка, но очевидно даже с ядрами RT трассировка лучей в целом по-прежнему остаётся довольно ресурсоёмкой задачей, с трудом подходящей для игр.


    Между тем, чтобы лучше использовать тензорные ядра не только в задачах трассировки лучей и специального ПО для глубинного обучения, компания представит новые инструменты для разработчиков — NVIDIA NGX, которые позволят интегрировать нейронные сети в задачи обработки изображений и видео (шумоподавление, масштабирование и ретайминг). В том числе появится новый метод полноэкранного сглаживания на основе машинного обучения Deep Learning Anti-Aliasing (DLAA).

    Новый потоковый мультипроцессор

    Наряду с блоками RT и тензорными ядрами, архитектура Turing приносит новый потоковый мультипроцессор (SM), который по аналогии с Volta добавляет целочисленный исполнительный блок параллельно к каналу данных с плавающей точкой, и новую унифицированную архитектуру кеша с удвоенной по сравнению с предыдущим поколением полосой пропускания. Преимуществом является ускорение создания адресов и производительность в задачах совмещённого умножения-сложения с однократным округлением (Fused Multiply Add, FMA), хотя наверняка новый инструмент будет использоваться во многих задачах.

    В сочетании с новыми графическими технологиями, такими, как Variable Rate Shading, потоковый мультипроцессор Turing достигает высочайшей производительности на ядро. Подобные методы ускорения вычислений весьма важны в условиях, когда так называемый Закон Мура теряет силу и новые технологические процессы осваиваются всё тяжелее.


    Поддержка GDDR6

    Поскольку память, используемая видеокартами, разрабатывается сторонними компаниями, здесь нет больших секретов. JEDEC и три его крупных участника в лице Samsung, SK Hynix и Micron позиционируют стандарт GDDR6 в качестве преемника GDDR5 и GDDR5X, и NVIDIA подтвердила, что чипы Turing будут его поддерживать. В зависимости от производителя, GDDR6 первого поколения, как правило, позволяет развивать до 16 Гбит/с на единицу полосы пропускания, что вдвое больше, чем у GDDR5 и на 40 %, чем у GDDR5X в картах NVIDIA (ускорители Quadro будут использовать модули Samsung на 14 Гбит/с).


    По сравнению с GDDR5X новый стандарт не является слишком большим шагом вперёд, но всё же должен стать основным типом памяти для индустрии GPU за исключением решений самого высокого класса, использующих HBM2. Принципиальные изменения GDDR6 включают более низкие рабочие напряжения (1,35 В), и внутренне память теперь разделена на два канала в каждом чипе. Для стандартного 32-битного чипа это означает пару 16-битных каналов памяти — на 256-битной карте таких каналов в общей сложности будет 16. Хотя это увеличивает количество каналов, такое новшество не помешает графическим ускорителям, которые являются высокопараллельными устройствами.


    NVLink, VirtualLink и поддержка 8K HEVC

    NVIDIA также вкратце подтвердила некоторые функции ввода-вывода, которые будут поддерживаться в архитектуре Turing. NVLink будет присутствовать, по крайней мере, в некоторых продуктах, — в частности, NVIDIA использует её для всех трёх своих новых карт Quadro RTX. Эти продукты предлагают двойные соединения с общей пропускной способностью до 100 Гбайт/с. Присутствие NVLink не означает, что интерфейс будет использоваться в потребительских ускорителях для SLI-конфигураций.

    Между тем, для игроков и пользователей ProViz реализованы и новшества на фронте виртуальной реальности — а именно поддержка VirtualLink. Альтернативный режим USB Type-C был анонсирован в прошлом месяце: он поддерживает передачу энергии на уровне 15+ Вт, данных 10 Гбит/с по стандарту USB 3.1 и 4 полосы видеоизображения DisplayPort HBR3 по одному кабелю. Другими словами, это DisplayPort 1.4 с дополнительной передачей данных и питания, что позволяет видеокарте напрямую управлять VR-гарнитурой. Стандарт поддерживается NVIDIA, AMD, Oculus, Valve и Microsoft, а продукты Quadro станут первыми с поддержкой VirtualLink.

    Наконец, хотя NVIDIA только кратко коснулась темы, она всё же сообщила, что в Turing был обновлён блок обработки NVENC. Последняя версия NVENC, в частности, приносит поддержку кодирования HEKC 8K на лету. При этом NVIDIA также улучшила качество своего блока кодирования, что позволило достичь того же уровня, что раньше, со снижением битрейта на 25 %.


    В общем, осталось дождаться анонса потребительских продуктов GeForce. Согласно последним слухам, флагманские решения этого семейства будут использовать марку RTX вместо привычной GTX, что указывает на поддержку трассировки лучей. Также ускорители могут получить довольно нестандартные объёмы видеопамяти. Так ли это — уже вскоре должно стать ясно, ведь анонс ожидается в текущем месяце.

     Схема с указанием размера схемы ampere и turing gpu

    Turing и Ampere - это две передовые технологии графических процессоров от Nvidia, используемые в их видеокартах серии RTX. Обе эти архитектуры предлагают значительное улучшение по сравнению с более старых версий Nvidia, которые включают в себя Volta и Pascal. Эти два новейших графических процессоров (Turing и Ampere) имеют некоторое сходство друг с другом.

    Ampere является более новой из двух и используется в видеокартах Nvidia последнего поколения, включая RTX 30 Series, а Turing обслуживает видеокарты RTX 20 Series. Архитектура Ampere поставляется с некоторыми новыми функциями и улучшениями по сравнению с архитектурой Turing GPU. Итак, чтобы помочь вам узнать о существенных различиях между этими видами графических процессоров, здесь я провожу общее сравнение двух типов процессоров по важным параметрам.

    Архитектура графического процессора Turing

    Тьюринг - непосредственный преемник графического процессора Volta. Архитектура построена по 12-нм техпроцессу и поддерживает GDDR5, HBM2 и память GDDR6. Tensor GPU поставляется с ядрами CUDA, RT Core и тензорными ядрами в одном чипе GPU (за исключением карт серии GTX 16). Это первая архитектура, поддерживающая трассировку лучей в реальном времени, которая используется для создания реалистичных изображений, теней, отражений и других сложных световых эффектов.

    Более того, архитектура Тьюринга также поддерживает DLSS (Deep Learning Super Sampling), которая представляет собой технологию на основе искусственного интеллекта, использующую тензорные ядра для увеличения частоты кадров в играх без ущерба для качества изображения или графики. Однако следует отметить, что для использования преимуществ этих двух технологий игра также должна поддерживать их (трассировку лучей и DLSS). Архитектура Turing GPU обеспечивает увеличение производительности до 6 раз по сравнению со старой архитектурой Pascal GPU, что является большим шагом вперед.

    Turing GPU архитектура

    Графические карты на базе архитектуры Turing GPU включают GeForce RTX 20 Series и GTX 16 Series. Однако видеокарты Turing серии GeForce GTX 16 не поставляются с ядрами RT и тензорными ядрами. Видеокарты серии GeForce RTX 20 также поддерживают VirtualLink через разъем USB Type-C для подключения гарнитуры VR следующего поколения через порт USB Type-C для получения потрясающих впечатлений от виртуальной реальности. Архитектура Turing GPU также используется в видеокартах для рабочих станций, включая Quadro RTX 4000, Quadro RTX 5000, Quadro RTX 6000 и Quadro RTX 8000.

    Архитектура графического процессора Ampere

    Эти новые ядра RT и Tensor обеспечивают примерно в 2 раза пропускную способность или производительность по сравнению с ядрами RT и Tensor предыдущего поколения, используемыми в архитектуре Turing. Это означает, что вы получаете значительный прирост производительности в играх и других приложениях, если игра или приложение поддерживает технологии Ray Tracing и AI.

    Ампер GPU архитектура
    Ампер архитектура

    Архитектура Ampere теперь поддерживает стандарт PCIe Gen 4, что вдвое увеличивает пропускную способность интерфейса PCIe Gen3. Архитектура поддерживает CUDA версии 8.0 и включает 2 потоковых мультипроцессора FP32, что означает двойную производительность FP32 по сравнению с Turing. Архитектура графического процессора Ampere поддерживает NVLink 3.0 для увеличения вычислительной мощности системы, использующей более одного графического процессора. Архитектура Ampere обеспечивает повышение производительности на ватт до 1,9 раза по сравнению с архитектурой Turing.

    Ampere perf на watt улучшение

    Еще одним отличным дополнением к Ampere является поддержка HDMI 2.1, который поддерживает сверхвысокое разрешение и частоту обновления, которая составляет 8K при 60 Гц и 4K при 120 Гц. Он также поддерживает Dynamic HDR, а общая пропускная способность, поддерживаемая HDMI 2.1, составляет 48 Гбит/с.

    RTX IO - это еще одна новая функция, представленная в архитектуре Ampere, которая может снизить накладные расходы на ввод-вывод ЦП и значительно сократить время загрузки игры за счет распаковки игровых текстур/данных внутри памяти графического процессора с помощью графического процессора. Эта функция работает вместе с Microsoft Windows DirectStorage API. Графические карты, использующие архитектуру графического процессора Ampere, - это видеокарты серии RTX 30, в том числе GeForce RTX 3090, RTX 3080, RTX 3070.

    Сравнение архитектур Nvidia Ampere и GPU Turing

    Быстрое и краткое сравнение архитектур графических процессоров Ampere и Turing от Nvidia.

    Архитектура GPU Ampere Turing
    Производитель Nvidia Nvidia
    Процесс изготовления 8 нм (Samsung) 12 нм (TSMC)
    Версия CUDA 8 7,5
    RT ядра 2-е поколение 1-е поколение
    Тензорные ядра 3-е поколение 2-е поколение
    Потоковые мультипроцессоры 2x FP32 1x FP32
    DLSS DLSS 2.0 DLSS 1.0
    Поддержка памяти HBM2, GDDR6X GDDR6, GDDR5, HBM2
    Поддержка PCIe PCIe Gen 4 PCIe Gen 3
    Кодировщик NVIDIA (NVENC) Gen 7 Gen 7
    Декодер NVIDIA (NVDEC) Gen 5 Gen 4
    DirectX 12 Ultimate да да
    VR технология да да
    Поддержка нескольких GPU NVLink 3.0 NVLink 2.0
    Энергоэффективность Лучше, чем Turing Лучше, чем Volta
    Видео порты HDMI 2.1, DisplayPort 1.4a HDMI 2.0b, DisplayPort 1.4a
    Графические карты RTX 30 серии Серия RTX 20, серия GTX 16
    Приложения Игры, домашний пк, искусственный интеллект (AI) Игры, домашний пк, искусственный интеллект (AI)

    Заключение

    Что ж, архитектура графического процессора Ampere предлагает значительные улучшения, когда дело доходит до трассировки лучей и DLSS, но даже когда эти функции не используются, прирост производительности в Ampere больше, чем у Turing. Другим значительным дополнением к Ampere является поддержка PCIe Gen 4, которая предлагает гораздо более высокую пропускную способность и может оказаться весьма полезной в будущем.

    Читайте также: