Отраслевой портал электроники «Техниклайф»

20 Сентября 2018

Тесты указывают на отличные перспективы ARM-чипов на рынке HPC

Тесты указывают на отличные перспективы ARM-чипов на рынке HPC

06.07.2018

Британский альянс Great Western 4 (GW4), в который входят четыре университета на юго-западе Англии и Уэльса (города Бат, Бристоль, Кардифф, Эксетер), скоро установит Isambard — суперкомпьютер с 10 тысячами ядер CPU, который считается первым в мире выпущенным суперкомпьютером на базе ARM. Когда Isambard заработает, то станет самой мощной подобной системой в Великобритании и уступит только Astra, который планируется развернуть в Sandia National Laboratories позже этим летом.

GW4 тестирует предварительные версии чипов Cavium ThunderX2 минимум год, но теперь, с поступлением кристаллов в массовое производство, можно сделать более практическое сравнение с процессорами Intel Xeon. В данном случае 32-ядерная версия ThunderX2 сравнивалась с 22-ядерным Broadwell и 28-ядерным Skylake. Саймон Макинтош-Смит (Simon Mcintosh-Smith) из Университета Бристоля обобщил результаты в блоге, в котором основное внимание уделил производительности вычислений с плавающей запятой, а также пропускной способности памяти и кеша. Показанные в таблице баллы были получены в наиболее распространённых нагрузках HPC, которые запускаются на ARCHER, национальном суперкомпьютере Великобритании.

Для всех, кто следит за прогрессом ARM на серверном рынке в целом и за ThunderX2 в частности, результаты в значительной степени окажется ожидаемыми. Процессоры Xeon значительно лучше, чем ThunderX2 справляются с вычислениями с плавающей запятой с точки зрения показателя FLOPS. Это в особенности справедливо для Skylake Xeon, который включает в себя 512-битные продвинутые векторные расширения (AVX). Ширина векторных инструкций ThunderX2, в свою очередь, составляет 128 бит.

С другой стороны, благодаря 8-канальной архитектуре памяти Cavium ThunderX2 предлагает на 23 % бо́льшую пропускную способность, чем Skylake, и на 95 % бо́льшую, чем Broadwell. Результаты производительности кеша оказались не столь очевидными, хотя Skylake Xeon вышел в лидеры на всех трёх уровнях кеш-памяти.

Очевидный вывод состоит в том, что чипы Xeon предпочтительнее для исполнения кода, интенсивно использующего вычисления с плавающей запятой, а ThunderX2 — наилучший выбор для задач, упирающихся в пропускную способность памяти и меньше зависящих от показателей FLOPS. Для инструкций, которые могут выполнять большую часть своей работы с помощью кеша, Xeon также станет наилучшим выбором.

Но есть ещё одно важное преимущество процессоров Cavium — более низкая цена. Господин Макинтош-Смит говорит, что процессоры на базе архитектуры ARM значительно дешевле, чем те, которые поставляются от существующих поставщиков. Разница порой оказывается в 2–3 раза, в зависимости от того, какие модели сравнивать. Как следствие, с учётом стоимости, ThunderX2 могут выглядеть намного привлекательнее.

Исследователь также подчёркивает, что наличие в распоряжении учёных разных наборов архитектур CPU на выбор — хорошая практика, позволяющая не зависеть от тех или иных слабых сторон или преимуществ конкретных чипов. «С точки зрения конечных пользователей суперкомпьютеров это означает, что у нас появился новый набор поставщиков процессоров, что даёт нам гораздо более широкие возможности выбора, чем в любой момент за последний десяток лет», — отметил он.

Конечно, несмотря на все дискуссии, в наши дни главный спрос на вычисления в области суперкомпьютеров формирует аналитика, ИИ и другие приложения с интенсивным использованием данных, так что главным показателем по-прежнему остаётся производительность вычислений с плавающей запятой. Поэтому разработчикам северных чипов ARM необходимо выстроить связи с поставщиками ускорителей вроде NVIDIA, AMD и Xilinx или найти способы распространения своей технологии вроде ARMv8-A SVE (масштабируемые векторные расширения). SVE проходит обкатку в Японии, где Fujitsu разрабатывает свои чипы для суперкомпьютера RIKEN Post-K, который дебютирует в 2021 году.

Саймон Макинтош-Смит также отмечает, что большим преимуществом ARM является возможность создания недорогих специализированных процессоров благодаря простому лицензированию архитектуры. Другими словами, предприимчивые компании могут создавать специализированные процессоры ARM для рынка HPC, оптимизированные под векторную обработку, ИИ-вычисления или другие типы расчётов.

«Такие процессоры будут сильно отличаться от массовых чипов для ЦОД и смогут стать большим шагом вперёд в области производительности для учёных во всём мире, которые в последние годы недовольны относительно медленным наращиванием производительности, особенно в переложении на 1 доллар, — написал Макинтош-Смит. — Таким образом, выход ARM на рынок HPC и внедрение новых идей, новаций и, соответственно, появление конкуренции, могут привести к перевороту в научных вычислениях такого масштаба, который мы в последний раз видели разве что в области потребительских CPU в конце 1990-х годов. Нас ждут увлекательные времена».

Впрочем, пока прекрасное будущее постоянно откладывается. Например, в 2014 году Calxeda свернула разработки серверных чипов ARM, а не так давно стало известно, что и Qualcomm призадумалась об уходе из этого зарождающегося бизнеса.

Источник:



Источник: оригинал статьи