EpicTech
Видеокарты Обзоры

Обзор ASUS TUF Gaming GeForce RTX 3080 OC

Компания AMD вот уже несколько лет подряд буквально наступает на пятки Intel на рынке центральных процессоров и при этом внимательно смотрит в сторону NVIDIA, ведь у AMD есть свой бизнес по производству видеокарт. Вполне вероятно, что это стало одной из причин, почему новые видеокарты серии RTX 3000 стали столь быстрыми. Ведь даже RTX 3080, согласно спецификациям, будет в два раза быстрее своего предшественника, RTX 2080. И это огромный рост производительности среди современных видеокарт, поэтому в данной статье мы тщательно разберёмся в этой ситуации на примере топовой игровой видеокарты ASUS TUF RTX 3080 OC.

Архитектура NVIDIA Ampere – что нового?

Видеокарта ASUS TUF Gaming GeForce RTX 3080 OC построена на новом чипе NVIDIA GA102, который по плотности транзисторов в два раза превосходит своего предшественника, NVIDIA TU104, который используется в RTX 2080 и 2080 Super. Чип GA102 получил 28,3 миллиарда транзисторов, размещённых на кристалле площадью 628 мм^2. А у TU104 было 13,6 млрд транзисторов и площадь кристалла составляла 545 мм^2. Разумеется, прямое сравнение старого и нового кристаллов без учёта техпроцесса проводить не совсем правильно, поэтому укажем, что новый NVIDIA GA102 выполняется по новому особому 8-нм техпроцессу разработанному компанией Samsung для NVIDIA. В то время как TU104 изготавливался по уже обкатанному 12-нм техпроцессу на мощностях TSMC.

Почему NVIDIA решила сменить производителя чипов – остаётся загадкой, но судя по тому, что релиз видеокарты RTX 3070 перенесли с 15 на 29 октября, что-то пошло не так и выход годных чипов мог оказаться меньше запланированного. Впрочем, вернёмся к обзору новой архитектуры. Итак, количество транзисторов в новом чипе выросло почти в два раза, это не новость для IT рынка и такое уже бывало. Вот только ранее производительность графики не росла так сильно. Продолжим наше расследование и взглянем пристальнее на новый чип.

На первый взгляд, дизайн и компоновка GA102 мало чем отличается от предшественников. На фото выше можно разглядеть усиленные кластеры GPC (Graphics Processing Cluster), которые включают в себя несколько кластеров обработки текстур TPC (Texture Processing Cluster), в которых содержатся потоковые мультипроцессоры SM (Streaming Multiprocessor), блоки растеризации ROP (Raster Operator) и контроллеры памяти. Итого один чип GA102 содержит 84 потоковых мультипроцессора, часть из которых будет отключена в зависимости от модели видеокарты. Поэтому у RTX 3080 для обработки графики будут задействованы только 68 потоковых мультипроцессоров, и как следствие – меньше блоков растеризации и CUDA-ядер. Ну а у флагманской RTX 3090 доступно 72 мультипроцессора вместо 68 как у RTX 3080. При этом не стоит недооценивать RTX 3090 и считать её переименованной «RTX 3080 Ti». Это видеокарточка совсем другого класса, и о ней мы поговорим в других обзорах. Чтобы не увеличивать объём текста в этой статье, мы не будем подробно расписывать количество GPC, TPC, SM, ROP и других блоков в RTX 2080 Super, а просто приведём наглядную иллюстрацию, на которой видео почти трёхкратный рост CUDA-ядер в новой RTX 3080 относительно 2080.

Увеличение количества CUDA-ядер это замечательно, но увеличенное быстродействие RTX 3080 определяется не только за их счёт. Новая архитектура Ampere принесла с собой много оптимизаций для уже существующих блоков, а заодно – новые технологии.

Удвоение скорости вычислений FP32

Вычисления с плавающей запятой и 32-битной точностью (FP32) используются для обработки графики в играх. Хоть это и не главный показатель производительности видеокарты, но если опустить другие научные термины и типы вычислений, то чем быстрее карточка сможет проводить вычисления FP32, то тем больше FPS мы получим. Зависимость будет, хоть она и нелинейна.

Если вы сейчас подумали, что весь фокус в увеличении темпа расчёта FP32 заключается только в дополнительных CUDA-ядрах, то увы, это не так. Разумеется, архитектура Ampere позволила увеличить их количество почти в три раза, но всему есть свой предел. В качестве примера можно вспомнить Intel, архитектуру Skylake и её кольцевую шину, которая не может «удержать» бесконечное количество вычислительных ядер процессора. Просто по тому, что и у неё есть своё предел. Поэтому в NVIDIA не только нарастили производительность за счёт увеличения CUDA ядер, но и внесли оптимизации, в работу потоковых мультипроцессоров.

Ненадолго вернёмся к строению потоковых мультипроцессоров. Каждый мультипроцессор можно разделить на четыре равных подраздела. А в каждом подразделе, ещё со времён Turing, присутствует по два набора функциональных блоков ALU, которые занимаются обработкой данных. Первый занимается обработкой вычислений FP32 и существует уже давно, а вот второй, появившейся во времена Turing, создан для выполнения целочисленных вычислений INT32, которые иногда тоже нужны как в играх, так и в других сложных задачах.

И вот теперь мы наконец переходим к ответу на вопрос «почему Ampere в 2 раза быстрее Turing». Ответ оказался простым, NVIDIA научила блоки INT32 проводить вычисления FP32, тем самым удвоив производительность потоковых мультипроцессоров. Проще говоря, если игра полагается на вычисления FP32, то в случае с Turing часть вычислительных блоков, отвечающих за вычисления INT32, будет простаивать. А теперь, в архитектуре Ampere, они будут задействованы на свою полную мощность.

Разумеется, это не значит, что FPS в играх увеличится ровно в два раза. Всё будет зависеть от каждой конкретной игры и от её разработчиков. Но тем не менее, огромный рост производительности заметен. Это далеко не маркетинговый ход.

RT-ядра второго поколения и тензорные ядра третьего поколения

Вместо того, чтобы добавить дополнительные RT-ядра, NVIDIA решила наращивать их эффективность при помощи внутренних оптимизаций. В результате удалось добиться удвоения темпа поиска точек пересечения треугольников и лучей, и поднять производительность почти вдвое, с 34 RT-терафлопсов у архитектуры Turing, до 58 RT-терафлопсов у Ampere.

По каким-то своим причинам в чипе NVIDIA GA102 NVIDIA в два раза сократила количество тензорных ядер в каждом потоковом мультипроцессоре. Теперь в нём находится по одному ядру вместо двух. Однако, благодаря оптимизациям, а именно, увеличению размера перемножаемых матриц с 4х4 до 4х8, удалось повысить эффективность таких ядер в два раза. Ну а благодаря тому, что в Ampere можно одновременно использовать блоки трассировки лучей вместе с тензорными ядрами, удалось поднять и общую производительность DLSS.

NVIDIA DLSS 2.1

Технология Deep Learning Super Sampling (DLSS) доросла до версии 2.1 и научилась строить качественную картинку при меньшем количестве входных данных. Поэтому одной RTX 3090 хватило для того, чтобы запустить Wolfenstein: Youngblood с RTX-эффектами при разрешении 8К и комфортным значением FPS. Пожалуй, это можно назвать большим шагом как для DLSS, так и для игровой индустрии в целом. Но пока, к сожалению, список игр, поддерживающих DLSS не слишком большой, да и сама поддержка DLSS зависит от разработчиков.

NVIDIA Reflex

Среди производителей видеокарт стал намечаться новый тренд: сокращение аппаратных задержек при действиях игрока. Для примера возьмём любой шутер. С момента нажатия на кнопку мыши и до выстрела проходит определённое время, это и называется задержкой ввода, знакомое всем геймерам под названием Input Lag. Инженеры NVIDIA проанализировали эту проблему и нашли решение, создав технологию NVIDIA Reflex. Благодаря ей в нужный момент уменьшается влияние видеокарты на процессор, нужные кадры двигаются вперёд в очереди на рендер, а частоты видеокарты временно повышаются.

С одной стороны, идея отличная, а вот с другой – пока она ориентирована только на игры с высоким количеством FPS, измеряемым сотнями кадров, а также требует интеграции в игру Reflex SDK, что под силу только разработчикам. Да и процесс включения NVIDIA Reflex простым не назвать. Для этого приходится идти в настройки драйвера и находить нужную технологию именно там. К сожалению, в GeForce Experience включить поддержку Reflex пока нельзя. И кстати, у AMD есть похожая технологи, Radeon Anti-Lag.

NVIDIA RTX IO

C каждым разом разом игры становятся всё больше и требуют больше видеопамяти. Однако, мало нарастить её объём, надо ещё каким-то образом передать все эти файлы с накопителя в память видеокарты. Здесь геймерам приходят на помощь быстрые NVMe-накопителя и высокая скорость работы памяти видеокарты. Однако, порой и этого становится недостаточно.

Благодаря NVIDIA RTX IO можно заметно сократить путь файлов с текстурами из накопителя в память видеоадаптера. И если раньше сперва эти файлы перемещались в оперативную память силами процессора, то теперь они могут копироваться непосредственно в память GPU.

NVIDIA Broadcast

С каждым годом стримы игр набирают всё больше популярности. Отчасти этому процессу помогла NVIDIA, добавив блок аппаратного декодирования видео к своим видеокартам, что позволило снять с CPU нагрузку на обработку стрима. Теперь инженеры компании решили пойти дальше и представили технологию NVIDIA Broadcast.

При помощи Broadcast можно убирать фоновый шум при помощи интеллектуального шумоподавления RTX Voice. Также можно удалять и накладывать любой фон на видео, а также автоматически кадрировать изображение и фокусировать камеру при отклонении головы.

NVIDIA Omniverse Machinima

И последняя технология, о которой нам хотелось бы рассказать, создана для тех, кто любит создавать собственные видеоролики на базе игр и их движков. С помощью NVIDIA Omniverse Machinima различные эффекты, объекты и добавлять свои ассеты в игру. Например, можно добавить эффекты огня, дыма и так далее. И всё это может работать при помощи PhysX. А если к этом добавить ещё и захват движений, синхронизацию губ через NVIDIA Audio2Face, RTX-рендеринг, то на базе игр можно снимать неплохие ролики.

Видеопамять GRRD6X

Видеопамять GDDR6X можно назвать уникальной и даже эксклюзивом NVIDIA. А всё по тому, что она разрабатывалась в тесном сотрудничестве NVIDAI и Micron Technology, без привлечения других крупных компаний. По-видимому, NVIDIA уже не устраивала производительность существующей памяти и поэтому она обратилась к Micron, которая работала над GDDR6X с 2017 года для своих проектов. В результате NVIDIA пришлось создавать свой собственный контроллер для памяти, но это того стоило. Новая память GDDR6X казалась заметно быстрее GDDR6. Например у видеокарты ASUS TUF Gaming GeForce RTX 3080 OC память GDDR6X работает с частотой 19 ГГц, при этом её пропускная способность достигает почти одного гигабайта в секунду. Это почти в полтора раза выше пикового значения скорости передачи данные у памяти RTX 2080 Ti.

Разумеется, разработка новой памяти была не таким простым занятием, как может показаться. Для того, чтобы получить такую высокую пропускную способность памяти применяется новая, четырёхуровневая амплитудно-импульсная модуляция сигнала PAM4. Благодаря ей GDDR6X может передавать два бита информации за раз вместо одного, за счёт этого удалось добиться удваивания пропускной способности памяти, по сравнение с существующей двухуровневой схемой PAM2/NRZ. Однако, при увеличении частоты передачи сигнала память память стала более чувствительной к внешним помехам. Проще говоря, появилась проблема отношения сигнал/шум. Поэтому для её решение применяется новая схема кодирования Maximum Transition Avoidance (MTA), что привело у изменению конструкции микросхемы памяти и даже к переработке дизайна печатной платы. Всё для борьбы с помехами и ради увеличения быстродействия.

В результате получилась оригинальная, быстрая и сложная в производстве память GDDR6X. Пока она используется только в новых видеокарта NVIDIA, и непонятно, сможет ли она стать следующим стандартом, учитывая её высокую стоимость и сложность изготовления.

Есть у GDDR6X ещё одна важная особенность, которая стала известна после того, как NVIDIA раскрыла документацию GA102. У GDDR6X появился механизм коррекции ошибок Error Detection and Replay, сходный с ECC (Error-correcting cod), который используется в оперативной памяти. Суть в том, что при разгоне памяти на экране могут появляться артефакты – поломанные куски изображения – или, если внутри памяти находится много «битых» файлов, то игра может вылетать, зависать или вовсе Windows покажет синий экран. Благодаря системе коррекций ошибок повреждённые данные будут передаваться повторно, таким образом контроллер памяти будет пытаться исправить найденные ошибки.

Из минусов новой технологии можно отметить только то, что при коррекции ошибок частота работы памяти не будет увеличиваться. Да и сама NVIDIA говорит о том, что Error Detection and Replay не сможет полностью убрать все проблемы, связанные с ошибками в памяти.

Дизайн ASUS TUF Gaming GeForce RTX 3080 OC

С кратким изложением теории покончено и теперь мы переходим ко второй части обзора, всестороннему изучению видеокарты ASUS TUF Gaming GeForce RTX 3080 OC. Начнём по традиции с коробки. Её дизайн обновился, он стал минималистичнее и строже. Однако, некоторые традиции сохранились. Это перечисление основных характеристик на лицевой стороне коробки, и полный список ТТХ на обратной стороне.

Дизайн видеокарты тоже претерпел изменения. Она получил совершенно новый кожух системы охлаждения, который выполнен из алюминия, а не из пластика. Что же до габаритов TUF RTX 3080 OC, то они буквально на несколько миллиметров больше, чем у RTX 2080 Super из серии ROG Strix. Поэтому тестируемая видеокарта поместится в современных корпусах. Её толщина составляет 5,17 сантиметра, что эквивалентно 2,7 слотам, а длина – 29,9 сантиметра.

Для питания видеокарте потребуются два 8-контактных разъёма, которые есть у всех мощных блоков питания. Никакой экзотики вроде 12-контактного разъёма и сложностей с поиском нужного переходника не предвидится. Впрочем, если бы у видеокарты был бы новый разъём питания, то переходник поставлялся бы вместе с ней. Кстати, точно также сделано у версии NVIDIA GeForce RTX 3080 Founders Edition – переходник лежит в коробке с видеокартой.

Обратная сторона видеокарты закрыта металлической пластиной, но если раньше у видеокарт ASUS пластины были сплошными – за исключением зоны монтажа графического чипа – то сейчас у неё появился вырез, для дополнительного вывода горячего воздуха. Также сзади находится переключатель микросхем BIOS видеокарты. Можно выбрать как тихий режим работы вентиляторов, так и производительный – с небольшим увеличением уровня шума и более высокими частотами. Кстати, если вы сейчас подумали, какие конденсаторы распаяны около видеоядра, то хотим вас обрадовать – правильные, керамические.

Монтажная планка видеокарты выполнена из нержавеющей стали, что мы тоже видим впервые у видеокарт. Для подключения мониторов доступны три порта DisplayPort 1.4a и двое HDMI версии 2.1.

Система охлаждения ASUS TUF Gaming GeForce RTX 3080 OC тоже была переработана. Для того, чтобы уменьшить турбулентность воздушных потоков, центральный вентилятор вращается в обратном направлении, по отношению к обычным вертушкам. Да и его лопасти расположены иначе. Вентиляторы — уже известные нам вертушки Axial-tech, которые часто встречаются у видеокарт ASUS и ROG Strix. У этих вентиляторов улучшена форма крыльчатки, уменьшена центральная часть, чтобы пропускать больше воздуха и используются двойные шарикоподшипники, которые служат дольше обычных подшипников.

Радиатор ASUS TUF Gaming GeForce RTX 3080 OC получил шесть тепловых трубок и контактную пластину, выполненную по технологии MaxContact. При помощи последней удалось получить максимально гладкую и ровную поверхность, чтобы обеспечить идеальный контакт пластины с видеоядром. Видеопамять получила отдельный радиатор, который также захватывает её фазы питания и также часть фаз питания чипа памяти.

Подсистема питания видеопроцессора насчитывает 16 фаз. Элементов оказалось так много, что их пришлось разделить на две части. Первые 12 фаз находятся справа от видеоядра, а остальные 4 фазы, совмещённые с другими четырьмя фазами питания видеопамяти, находятся слева от чипа GA102.

Фотографии ASUS TUF Gaming GeForce RTX 3080 OC

Технические характеристики ASUS TUF Gaming GeForce RTX 3080 OC

  • GPU
  • Архитектура
  • Техпроцесс
  • Размер кристалла
  • Количество транзисторов
  • Ядра CUDA
  • Текстурные блоки (TMU)
  • Блоки растеризации ROP
  • Тензорные ядра
  • Ядра Ray Tracing
  • Частоты GPU
  • Тип видеопамяти
  • Объём видеопамяти
  • Частота видеопамяти
  • Шина видеопамяти
  • Интерфейс
  • Разъём питания
  • Видеовыходы
  • Поддержка DirectX 12
  • Поддержка G-Sync
  • Габариты
  • Рекомендуемая мощность блока питания
  • ASUS TUF Gaming GeForce RTX 3080 OC

  • GA102
  • Ampere
  • 8 нм
  • 628,4 мм^2
  • 28,3 млрд
  • 8704
  • 272
  • 96
  • 272
  • 68
  • Gaming Mode 1 440 МГц / 1 710 МГц
    OC Mode: 1785 МГц (Boost)
  • GDDR6X
  • 10 Гбайт
  • 19 000 МГц
  • 320 Бит
  • PCIe 3.0 X16
  • 2x 8-Pin
  • 2x HDMI 2.1 3x DisplayPort 1.4a
  • 30,5 x 13,06 x4,89 см
  • 850 Вт

Тестирование ASUS TUF Gaming GeForce RTX 3080 OC

Видеокарта ASUS TUF Gaming GeForce RTX 3080 OC тестировалась с двумя процессорами, это были Intel Intel Core i5-10600K и Intel Core i9-10920X. Все игры тестировались при разрешении 2560х1440 пикселей при максимальных настройках графики.

Тестовый стенд:

  • Процессор: Intel Core i5-10600K и Intel Core i9-10920X@4700Мгц;
  • Система охлаждения: ASUS ROG RYUJIN 360;
  • Материнская плата: ASUS ROG Maximus XII Formula и Prime X299 Edition 30;
  • Оперативная память: 2x 8 Гбайт DDR4-3333 Kingston HyperX Predator (HX433C16PB3K2/16);
  • Накопитель: 1 Тбайт WD Blue SN550 NVMe;
  • Блок питания: ASUS ROG Thor 850W;
  • Монитор: ASUS ROG Swift PG279Q;
  • Операционная система: Windows 10 Pro, 64 bit;

 

Пожалуй, комментарии здесь излишни. Нет ни одной игры, в которой ASUS TUF Gaming GeForce RTX 3080 OC не справилась бы с задачей, за исключением лишь Crisis, в котором FPS упал ниже 60 кадров в секунду. Также стоит отметить расхождение в результатах между Call of Duty: Modern Warfare 2 Remastered и Call of Duty: Modern Warfare. Всё дело в Super Sampling х4, который был активирован в MW2 Remastered. У Modern Warfare его нет, поэтому производительность этой игры закономерно выше. Во время всех тестов видеокарта вела себя тиха и практически не шумела — спасибо качественной системе охлаждения.

Видео обзор ASUS TUF RTX 3080 OC

Leave a review

  • Производительность в классе
  • Технологичность
  • Эффективность СО
  • Качество исполнения

Рекомендуемые обзоры

Обзор ASUS ROG Strix GeForce GTX 1660 Super

EpicTeam

Обзор ASUS VivoMini VC66-C

EpicTeam

Обзор Easy UPS BV1000I-GR

EpicTeam