Китай с нуля создал полноценные видеокарты на замену amd и nvidia. россияне спасены

Бенчмарки: Zotac — сверхпроизводительная модель

Обозначение «AMP Extreme» от компании Zotac, говорит о том, что модель разогнана с завода практически до упора: устройство с тремя вентиляторами охлаждения достигает отметки в 1875 МГц. Из-за 4-процентного прироста шейдеров мы ожидали увидеть прибавку мощности примерно в 10 процентов по сравнению с RTX 2080. Наши ожидания оправдались: по сравнению с немодифицированной Asus RTX 2080 Turbo, модель RTX 2080 Super оказывается приблизительно на 9 процентов быстрее. Особенно сильно прирост производительности заметен в 4К-разрешении: в «Metro: Exodus» разница — 5 fps (кадров в секунду), а в «Rise of the Tomb Raider» — 8 fps. В данной весовой категории это солидный результат.

В синтетическом бенчмарке «Port Royal», который измеряет производительность с учетом трассировки лучей, «Super» имеет большое преимущество. Намного меньше разница заметна в разрешении Full-HD, что вполне вероятно связано с нашей старой тестовой системой, которую мы в настоящее время обновляем.

В сравнении с предшественницей, разница в производительности практически не ощущается: Zotac Gaming Geforce RTX 2080 AMP Extreme в настоящее время является одной из лучших моделей на рынке. Если в 4К-тестах «Super»-вариант имеет преимущество в несколько fps, то в Full HD-разрешении картина переворачивается с ног на голову. Этому есть несколько объяснений:

При низких разрешениях разница менее ощутима в процентном соотношении.
Бета-драйвера 2080 Super не так хорошо оптимизированы. Во время проведения тестовых испытаний 2080 AMP Extreme с драйверами был полный порядок.
Zotac проделала фантастическую работу со своими старыми картами и смогла выжать больше мощности из GPU.

Но в оценке производительности, роль данных факторов можно не учитывать, так как результаты в разрешении Full-HD намного важнее, чем в 4К, поскольку именно Full-HD является наиболее популярным разрешением, используемым геймерами.

Таким образом, общую оценку производительности нужно рассматривать в рамках контекста: в 4К-разрешении «Super» все-таки лучше, а в Full HD разницы практически нет.

3DMark Fire Strike: 20.492 очков3DMark Spy Time: 10.030 очковVRMark: Blue Room: 3.871 очковVRMark: Бирюзовый Room: 11.987 очков3DMark Cloud Gate (общая): 34.376 очков3DMark Fire Strike (ультра): 6.827 очковVRMark: Orange Room: 9.780 очков

FlacCL (Flacuda)

FlacCL — это кодировщик звуковых файлов в формат FLAC, задействующий в своей работе возможности OpenCL. Он входит в состав пакета CUETools для Windows, но благодаря mono может быть использован и в Linux. Для получения архива с кодировщиком выполняем следующую команду:

Далее устанавливаем unrar, mono и распаковываем архив:

Чтобы программа смогла найти библиотеку OpenCL, делаем символическую ссылку:

Теперь запускаем кодировщик:

Если на экран будет выведено сообщение об ошибке «Error: Requested compile size is bigger than the required workgroup size of 32», значит, у нас в системе слишком слабенькая видеокарта, и количество задействованных ядер следует сократить до указанного числа с помощью флага ‘—group-size XX’, где XX — нужное количество ядер.

Сразу скажу, из-за долгого времени инициализации OpenCL заметный выигрыш можно получить только на достаточно длинных дорожках. Короткие звуковые файлы FlacCL обрабатывает почти с той же скоростью, что и его традиционная версия.

Критерии выбора

Критерии выбора графического ускорителя складываются из производительности, размера, энергопотребления, бесшумности, системы охлаждения и PCI. Чтобы свободно ориентироваться в характеристиках этого типа товаров, необходимо знать минимум о каждом из перечисленных пунктов.

Производительность

На производительность влияет:

Тактовая частота – показатель мощности напрямую зависит от количества сделанных кадров в секунду, от есть от тактовой частоты графического ядра. Чем она выше, тем выше производительность и мощность графического процессора. Измеряется в мегагерцах (МГц).
Техпроцесс – на работу процессора влияет техпроцесс, представляющий собой размер транзисторов – чем он меньше, тем больше транзисторов разместится на кристалле. Величина измерения техпроцесса – нанометры (Нм);
Разрядность шины памяти – от ширины шины памяти зависит количество информации, которое устройство обработает за минуту, поэтому это главный параметр при выборе графической платы.

Размер

Преимущество низкопрофильных карт – это маленькие габариты, однако даже в случае с такими маленькими электронными устройствами нужно чётко знать о количестве слотов для расширения. Если в материнской плате будет всего один слот, а карта рассчитана на два, то придётся снова идти в отдел электроники и возвращать недавно сделанную покупку.

Энергопотребление

Энергопотребление – это количество электричества, которое требуется карте для нормального функционирования. Когда энергии не хватает, подключаются блоки питания.

Нагревание

TDP – количество тепловой энергии, которую необходимо рассеять, чтобы избежать перегревания графической платы. Чем меньше показатель, тем лучше, так как вероятность того, что компьютер будет «гореть» под руками – напрямую зависит от этого пункта.

Уровень шума

Бесшумность – главнейший критерий при выборе видеоадаптера. Идеальный вариант, если последний не издает звуков во время работы или охлаждения.

Система охлаждения

Бывает два типа охлаждения – активный и пассивный. Активный тип представляет собой отвод тепла с помощью обдува вентиляторами, а пассивный – естественной конвекцией, то есть за счёт естественного охлаждения окружающей среды.

Ремонтоспособность

Каждое устройство должно иметь такую характеристику, так как благодаря ей можно отдать его в ремонт, а не идти за новым. Существенно экономит бюджет тем, кто в электронике не разбирается, и даёт возможность профессионалам в этой сфере отремонтировать часть компьютера или телефона.

PCI-E

PCI-E или PCI Express – это шина компьютера, основой которой является программа шины PCI, и высокопроизводительный физический протокол, ориентированный на последовательную передачу данных. Имеет несколько форматов – x1, x2, x4, x8, x12, x16 и x32.

Разгон

Две младших модели видеокарт Zotac у нас имеют приставку AMP! Edition, что означает наличие заводского разгона графического чипа и памяти. GeForce GTX 570 разогнан со стандартных 732 МГц по чипу и 3800 МГц по памяти до 780 и 4000 МГц соответственно. Мы также попытались разогнать эту видеокарту дополнительно. Без повышения напряжения на графическом процессоре (950 мВ) мы достигли 820 МГц по чипу и 4400 МГц на памяти. При повышении напряжения до 1.05 В мы смогли «сделать» уже 870 МГц для чипа и 4480 МГц на памяти.

GeForce GTX 580 был разогнан со стандартных для него 772 и 4008 МГц (чип/память) до 815 и 4100 МГц на заводе. Мы попробовали разогнать карту без повышения напряжения, однако ничего не получилось — карта отказывалась стабильно работать при изменении частот. Подняв напряжение до 1.113 В, мы смогли прибавить ядру 45 МГц к заводскому разгону и 400 МГц к частоте памяти, получив 860 и 4500 МГц соответственно.

GeForce GTX 590 — изначально «горячая» карта, поэтому её графические чипы работают на сниженных частотах — 607 МГц для каждого чипа и 3414 МГц для модулей памяти. Заводского разгона тут не предусмотрено, да и увеличивать напряжение по понятным причинам не разрешено. Поэтому мы смогли лишь немного разогнать карту, подняв частоту обоих чипов до 680 МГц и чипов памяти до 3800 МГц, что можно считать неплохим результатом для столь мощной видеокарты.

Разгон
Тестирование
Выводы

ImageMagick и OpenCL

Поддержка OpenCL появилась в ImageMagick уже достаточно давно, однако по умолчанию она не активирована ни в одном дистрибутиве. Поэтому нам придется собрать IM самостоятельно из исходников. Ничего сложного в этом нет, все необходимое уже есть в SDK, поэтому сборка не потребует установки каких-то дополнительных библиотек от nVidia или AMD. Итак, скачиваем/распаковываем архив с исходниками:

Далее устанавливаем инструменты сборки:

Запускаем конфигуратор и грепаем его вывод на предмет поддержки OpenCL:

Правильный результат работы команды должен выглядеть примерно так:

Словом «yes» должны быть отмечены либо первые три строки, либо вторые (или оба варианта сразу). Если это не так, значит, скорее всего, была неправильно инициализирована переменная C_INCLUDE_PATH. Если же словом «no» отмечена последняя строка, значит, дело в переменной LD_LIBRARY_PATH. Если все окей, запускаем процесс сборки/установки:

Проверяем, что ImageMagick действительно был скомпилирован с поддержкой OpenCL:

Теперь измерим полученный выигрыш в скорости. Разработчики ImageMagick рекомендуют использовать для этого фильтр convolve:

Некоторые другие операции, такие как ресайз, теперь тоже должны работать значительно быстрее, однако надеяться на то, что ImageMagick начнет обрабатывать графику с бешеной скоростью, не стоит. Пока еще очень малая часть пакета оптимизирована с помощью OpenCL.

Тестируем

Тестовый стенд мы собрали на основе MSI X58 Platinum, установили на нее Core i7 920 с крейсерской скоростью в 2,66 МГц, 6 Гб Kingston HyperX DDR3-1600 и подали питание от киловаттного блока Floston. Тесты проводились под управлением 64-битной Windows Vista Ultimate.

Мы использовали стандартный пакет тестов – 3DMark06, Crysis и Resident Evil 5, – но работали в щадящем режиме: сначала отказались от сглаживания, фильтрации и высоких разрешений, а затем еще и выставили средние настройки графики. В итоге мы добились от GeForce GT 220 приличных результатов. Так, Resident Evil 5 разогналась до 60 кадров в секунду, а Crysis продемонстрировал приличные 32 fps.

Как закалялся Turing: экскурсия на предприятие по выпуску видеокарт ZOTAC

Помимо обширного иллюстративного материала, участники экскурсии поделились и видеороликом, основные комментарии в котором сделаны на японском языке в виде субтитров, а звуковое сопровождение представляет лишь непринуждённую музыку. Коллегам с сайта AKIBA PC Hotline выпала возможность посетить предприятие PC Partner в китайской провинции Гуандун, где производятся видеокарты ZOTAC семейства GeForce RTX.

Эта часть работы уже сопряжена с поднятием тяжестей, поэтому к ней привлекаются сотрудники мужского пола. Большие коробки затем штабелируются на паллетах для транспортировки и хранения.

В этом смысле все подобные производства организованы аналогичным образом. Выборочные видеокарты также подвергаются длительному тестированию на выносливость.

Ещё новости

27.08.2022 Как очистить электрический чайник от накипи

27.08.2022 Первоначально сиквел A Plague Tale Innocence не планировался

В такую ситуацию, например, попала A Plague Tale Requiem — сиквел A Plague Tale Innocence про приключения преследуемых инквизицией брата и сестры Гуго и Амиции. Игровая индустрия не всегда предстаёт перед…

27.08.2022 Xiaomi отказалась работать с DxOMark. Лабораторию обвиняют в продаже оценок, глава компании ответил на критику

Впоследствии в DxOMark заявили о покупке Xiaomi 12S Ultra для тестирования. Не так давно Лэй Цзюнь сообщил, что Xiaomi 12S Ultra не будет отправлен на тестирование в лабораторию DxOMark, что вызвало бурные…

27.08.2022 В России стартовал предзаказ игры God of War: Ragnarok для PlayStation 4 и PlayStation 5

Физические копии игры будут доступны для российских пользователей PlayStation 4 и 5. Магазин »1С Интерес» объявил предзаказов на игру God of War: Ragnarok, релиз которой состоится 9 ноября 2022 года. …

26.08.2022 Криптобиржа Binance заблокировала счёт с цифровыми активами на сумму $ 1 млн

Список проектов не ограничен экосистемой Tezos и достаточно большой, его можно посмотреть на официальном сайте. Baking Bad — команда блокчейн разработчиков и крипто энтузиастов, известная в криптосообществе…

Все новости

* * *

К новой видеокарте можно относиться по-разному. Любителям высоких разрешений и максимальных настроек она не понравится. Но для ограниченного бюджета – отличное решение, ведь ZOTAC GeForce GT 220 стоит всего 3000 руб., а справляется со всеми современными играми. Также новинка – хороший выбор для HTPC. С такими габаритами она поместится даже в самый маленький корпус, а встроенные HDMI– и HD-декодеры позволят сэкономить на процессоре и звуковой карте.

Таблица 1

Синтетические тесты
3DMark06
SM2.0	2615
SM3.0	2534
CPU	4755
Overall	6913

Таблица 2

Игровые тексты
Crysis 1.2.1
	1280×1024	1680×1050
Medium	32,81	24,74
High	9,37	6,85
Resident Evil 5
	1280×1024	1680×1050
Medium	61,4	46,2
High	36,4	28,7

MSI

Компания MSI анонсировала две линейки видеокарт RTX Ampere, это GAMING и VENTUS.

Серия GAMING также получила обновленный дизайн, но, пожалуй, главным нововведением стали вентилятора TORX Fan 4.0, которые, как сообщает производитель, стали тише предыдущей версии, и при этом обеспечивают лучший поток воздуха. С более подробными характеристиками вы можете ознакомиться на изображении ниже.

Что касается серии VENTUS, то видеокарты из данной линейки обзавелись куда более массивным радиатором, по сравнению с текущим поколением RTX 20. Плюс был добавлен еще один вентилятор, теперь их три, опять таки в отличии от текущего поколения. С более подробными характеристиками вы можете ознакомиться на изображении ниже.

Рождение GPGPU

Мы все привыкли думать, что единственным компонентом компа, способным выполнять любой код, который ему прикажут, является центральный процессор. Долгое время почти все массовые ПК оснащались единственным процессором, который занимался всеми мыслимыми расчетами, включая код операционной системы, всего нашего софта и вирусов.

Позже появились многоядерные процессоры и многопроцессорные системы, в которых таких компонентов было несколько. Это позволило машинам выполнять несколько задач одновременно, а общая (теоретическая) производительность системы поднялась ровно во столько раз, сколько ядер было установлено в машине. Однако оказалось, что производить и конструировать многоядерные процессоры слишком сложно и дорого. В каждом ядре приходилось размещать полноценный процессор сложной и запутанной x86-архитектуры, со своим (довольно объемным) кэшем, конвейером инструкций, блоками SSE, множеством блоков, выполняющих оптимизации и т.д. и т.п. Поэтому процесс наращивания количества ядер существенно затормозился, и белые университетские халаты, которым два или четыре ядра было явно мало, нашли способ задействовать для своих научных расчетов другие вычислительные мощности, которых было в достатке на видеокарте (в результате даже появился инструмент BrookGPU, эмулирующий дополнительный процессор с помощью вызовов функций DirectX и OpenGL).

Графические процессоры, лишенные многих недостатков центрального процессора, оказались отличной и очень быстрой счетной машинкой, и совсем скоро к наработкам ученых умов начали присматриваться сами производители GPU (а nVidia так и вообще наняла большинство исследователей на работу). В результате появилась технология nVidia CUDA, определяющая интерфейс, с помощью которого стало возможным перенести вычисление сложных алгоритмов на плечи GPU без каких-либо костылей. Позже за ней последовала ATi (AMD) с собственным вариантом технологии под названием Close to Metal (ныне Stream), а совсем скоро появилась ставшая стандартом версия от Apple, получившая имя OpenCL.

GPU — наше все?

Несмотря на все преимущества, техника GPGPU имеет несколько проблем. Первая из них заключается в очень узкой сфере применения. GPU шагнули далеко вперед центрального процессора в плане наращивания вычислительной мощности и общего количества ядер (видеокарты несут на себе вычислительный блок, состоящий из более чем сотни ядер), однако такая высокая плотность достигается за счет максимального упрощения дизайна самого чипа.

В сущности основная задача GPU сводится к математическим расчетам с помощью простых алгоритмов, получающих на вход не очень большие объемы предсказуемых данных. По этой причине ядра GPU имеют очень простой дизайн, мизерные объемы кэша и скромный набор инструкций, что в конечном счете и выливается в дешевизну их производства и возможность очень плотного размещения на чипе. GPU похожи на китайскую фабрику с тысячами рабочих. Какие-то простые вещи они делают достаточно хорошо (а главное — быстро и дешево), но если доверить им сборку самолета, то в результате получится максимум дельтаплан. Поэтому первое ограничение GPU — это ориентированность на быстрые математические расчеты, что ограничивает сферу применения графических процессоров помощью в работе мультимедийных приложений, а также любых программ, занимающихся сложной обработкой данных (например, архиваторов или систем шифрования, а также софтин, занимающихся флуоресцентной микроскопией, молекулярной динамикой, электростатикой и другими, малоинтересными для линуксоидов вещами).

Вторая проблема GPGPU в том, что адаптировать для выполнения на GPU можно далеко не каждый алгоритм. Отдельно взятые ядра графического процессора довольно медлительны, и их мощь проявляется только при работе сообща. А это значит, что алгоритм будет настолько эффективным, насколько эффективно его сможет распараллелить программист. В большинстве случаев с такой работой может справиться только хороший математик, которых среди разработчиков софта совсем немного.

И третье: графические процессоры работают с памятью, установленной на самой видеокарте, так что при каждом задействовании GPU будет происходить две дополнительных операции копирования: входные данные из оперативной памяти самого приложения и выходные данные из GRAM обратно в память приложения. Нетрудно догадаться, что это может свести на нет весь выигрыш во времени работы приложения (как и происходит в случае с инструментом FlacCL, который мы рассмотрим позже).

Но и это еще не все. Несмотря на существование общепризнанного стандарта в лице OpenCL, многие программисты до сих пор предпочитают использовать привязанные к производителю реализации техники GPGPU. Особенно популярной оказалась CUDA, которая хоть и дает более гибкий интерфейс программирования (кстати, OpenCL в драйверах nVidia реализован поверх CUDA), но намертво привязывает приложение к видеокартам одного производителя.

ASUS

Компания ASUS представила три линейки видеокарт: ROG STRIX, TUF Gaming и Dual. Все они претерпели значительное изменение в дизайне, по сравнению с решениями на архитектуре Turing.

За охлаждение видеокарт ROG STRIX отвечает массивный алюминиевый радиатор, через который проходят 6 медных тепловых трубок. Как и в предыдущем поколении здесь располагаются 3 вентилятора, насчитывающие 13 лопастей. Также в наличии фирменная RGB подсветка. Карты в данном дизайне занимают 2,9 слота расширения.

Порты подключения: 3x DisplayPort 1.4a и 2x HDMI 2.1. Кроме того, видеокарты ASUS ROG STRIX RTX 3090 и 3080 будут получать питание от трех разъемов 8-pin, а RTX 3070 от двух.

Карты из серии TUF Gaming получили так же достаточно массивный радиатор, но более простые вентиляторы с 9-ю лопастями. Здесь предусмотрена RGB подсветка, но представлена она не так обширно.

Порты подключения здесь аналогичные. Все модели TUF Gaming, включая RTX 3090 и RTX 3080, будут питаться от двух разъемов по 8-pin.

Наконец, ASUS GeForce RTX 3070 Dual, дизайн которой предусматривает два осевых вентилятора. Питаться видеокарта будет через два разъема по 8-pin.

Видеокарты из серий ROG Strix, TUF Gaming и Dual будут доступны по всему миру в сентябре – начале октября 2020 года.

Ставим CUDA Toolkit

Идем по вышеприведенной ссылке и скачиваем CUDA Toolkit для Linux (выбрать можно из нескольких версий, для дистрибутивов Fedora, RHEL, Ubuntu и SUSE, есть версии как для архитектуры x86, так и для x86_64). Кроме того, там же надо скачать комплекты драйверов для разработчиков (Developer Drivers for Linux, они идут первыми в списке).

Запускаем инсталлятор SDK:

Когда установка будет завершена, приступаем к установке драйверов. Для этого завершаем работу X-сервера:

Открываем консоль <Ctrl+Alt+F5> и запускаем инсталлятор драйверов:

После окончания установки стартуем иксы:

Чтобы приложения смогли работать с CUDA/OpenCL, прописываем путь до каталога с CUDA-библиотеками в переменную LD_LIBRARY_PATH:

Или, если ты установил 32-битную версию:

Также необходимо прописать путь до заголовочных файлов CUDA, чтобы компилятор их нашел на этапе сборки приложения:

Все, теперь можно приступить к сборке CUDA/OpenCL-софта.

Техногиганты поддержат

Во время презентации видеокарт представители Moore Threads похвастались большим количеством крупных инвесторов, представляющих мировой ИТ-сегмент. Весь перечень компаний, вложивших в Moore Threads свои средства, они раскрывать не стали, равно как не назвали и объемы их инвестиций.

Карты Moore Threads для серверов не нуждается в активном охлаждении

Известно лишь, что в перечень входит китайская компания Lenovo. Это крупнейший производитель ПК в мире, представленный, в том числе, и на российском рынке. Компанию ему составляет китайский ИТ-холдинг Tencent.

Разработчики заявили, что их карты будут работать в компьютерах и серверах на базе процессоров х86 и ARM, управляемых китайскими операционными системами. Пока неясно, собираются ли они выпускать для них драйверы под Windows.

Возможности впечатляют

По заверениям Moore Threads, первые видеокарты компании демонстрируют довольно высокую производительность. Настольная S60 выдает 6 TFLOPS, а серверная S2000 – 12 TFLOPS. Разумеется, это не уровень флагманских видеокарт Nvidia и AMD, но популярным в России и мире ускорителям они все же смогут составить конкуренцию. Для примера, карта Nvidia GeForce GTX 1070 на пике выдает 6,5 TFLOPS.

Обе карты построены на собственной архитектуре MUSA (Moore Threads Unified System Architecture) первого поколения с кодовым названием Sudi. В ней реализована поддержка технологий OpenCL, OpenGL, Vulkan и Nvidia CUDA, использующихся в GPU именитых брендов. Поддержка DirectX тоже есть.

Основные возможности архитектуры MUSA и карт на ее основе

Настольная карточка поставляется с 8 ГБ памяти LPGDDR4X, у серверной же объем памяти равен 32 ГБ. В младшей карте используется 2048 ядер MUSA, в старшей их ровно вдвое больше.

Международный салон изобретателей: станет ли Новосибирск новым центром притяжения инноваторов?
Инновации для промышленности

Следует обратить внимание, что карта MTT S60, в отличие от монструозных конкурентов на чипах AMD и Nvidia, занимает сравнительно мало места в системном блоке. Это однослотовое решение, что позволяет использовать ее даже в очень компактных корпусах

Охлаждение у карты активное, турбинного типа. MTT S2000 тоже однослотовая, но с пассивным охлаждением.

GIGABYTE

Компания Gigabyte представила следующие решения на архитектуре Ampere: GeForce RTX 3090 GAMING OC 24G, GeForce RTX 3090 EAGLE OC 24G, GeForce RTX 3080 GAMING OC 10G, GeForce RTX 3080 EAGLE OC 10G, а также AORUS GeForce RTX 3090 Master 24G, AORUS GeForce RTX 3080 Master 10G, AORUS GeForce RTX 3090 XTREME 24G и AORUS GeForce RTX 3080 XTREME 10G.

Линейка EAGLE пришла на смену WINDFORCE и является самой бюджетной из представленной троицы. По этой причине радиатор данной модели получился наиболее компактным.

В тоже время решения из серии GAMING и AORUS оборудованы более массивным радиатором охлаждения, с медной пластиной на месте контакта с графическим чипом и памятью.

В линейке AORUS также установлен небольшой LCD дисплей, который показывает текущую температуру видеокарты.