Отраслевой портал электроники «Техниклайф»

25 Мая 2018

Обзор процессора AMD Ryzen 7 1800X: неужели дождались?!

Обзор процессора AMD Ryzen 7 1800X: неужели дождались?!

03.01.2018

Сегодня именно тот случай, когда во вводной части статьи можно было бы написать тысячи слов. Ещё бы, ведь выходит Ryzen – самый многообещающий за последние пять лет x86-процессор, который к тому же имеет огромное значение для того, по какому пути индустрия персональных компьютеров пойдёт в ближайшей перспективе. Однако вы наверняка ждёте от нас не пространных рассуждений на тему того, насколько ожидаем новый продукт и как было бы хорошо, если бы на рынок процессоров вернулась полноценная конкуренция. Поэтому мы не будем откладывать самое интересное на потом, а сразу перейдём к техническим деталям, а потом и к тестам.

Ryzen для AMD фактически означает полную перезагрузку на процессорном рынке. После того как стало понятно, что Bulldozer и его производные не отвечают современным реалиям, компания решила сделать принципиально новый процессорный дизайн, в котором бы использовались современные полупроводниковые технологии (читай: FinFET), кардинальным образом была бы увеличена производительность (речь идёт о более чем полуторакратном приросте), а также на новый уровень была бы выведена энергоэффективность. Всё это вместе и сведено в микроархитектуре Zen, которая должна стать основой всего семейства процессорных продуктов AMD в ближайшее время: для ноутбуков, десктопов и серверов.

В последние шесть лет AMD на процессорном рынке терпела сплошные неудачи. С ядрами семейства Bulldozer компания застряла в мире 32- и 28-нм чипов на планарных транзисторах, в то время как Intel раз за разом проводила архитектурные улучшения, переходила на трёхмерные транзисторы, а также внедряла производственные процессы с 22- и 14-нм нормами. Тем не менее багаж, с которым AMD подошла к текущему моменту, всё-таки устарел далеко не полностью. У компании остались вполне конкурентоспособные технологии энергопотребления, хорошее и современное интегрированное графическое ядро и отвечающие потребностям пользователей мультимедийные блоки. Не хватало только производительного и энергоэффективного x86-ядра, которое позволило бы вместе со всеми своими смежными наработками вылезти из ультрабюджетного болота.

Zen – это именно такое ядро. Оно принципиально отличается от всего того, что у AMD было до этого. Для помощи в его создании AMD приглашала ведущего процессорного архитектора Джима Келлера, перед которым была поставлена задача разработать ядро с классической «широкой» микроархитектурой, которое по параметрам потребления и производительности смогло бы стать основой процессоров для всего спектра компьютеров, начиная с безвентиляторных ноутбуков и заканчивая высокопроизводительными рабочими станциями и серверами. В итоге сегодня AMD представляет на суд публики яркое исключение в «эре 5-процентных улучшений» – новые процессоры компании должны обеспечить кардинально более высокий прирост производительности.

И тому есть вполне объективные предпосылки. Ядра Zen больше не разделяют друг с другом никаких ресурсов, как это было в Bulldozer, они полностью самостоятельны и к тому же поддерживают технологию SMT, позволяющую исполнять два потока на одном ядре одновременно (аналог Hyper-Threading). Кроме того, каждое ядро получило существенно снижающий накладные расходы по декодированию инструкций собственный кеш микроопераций, полностью переделанный быстрый кеш первого уровня с обратной записью и низким энергопотреблением, собственный для каждого ядра блок FPU и выделенный L2-кеш, а также массу иных оптимизаций. Базовый целочисленный конвейер Zen получил длину в 19 стадий, что сопоставимо с конвейером современных процессоров Intel (у Skylake и Kaby Lake – 14-19 стадий). А кроме того, производство чипов, собранных из ядер Zen, теперь будет происходить по 14-нм техпроцессу с FinFET-транзисторами, что лишь одно способно примерно на 30 процентов понизить потребление.

До сегодняшнего момента процессоры AMD базировались на ядрах Piledriver, Steamroller и Excavator, но теперь флагманские продукты компании переходят на новую основу. С 2 марта AMD начинает продвигать платформу Socket AM4 и продавать восьмиядерные процессоры Ryzen с микроархитектурой Zen, которые предназначаются для высокопроизводительных десктопных систем. Затем, в течение второго квартала, семейство Ryzen пополнится процессорами с шестью вычислительными ядрами, а во второй половине года в нём появятся и четырёхъядерные представители. Таким образом, к концу 2017 года у AMD в арсенале будет полный набор обновлённых процессоров для настольных ПК. Впрочем, при этом компания пока не планирует сворачивать продажи процессоров с более старыми архитектурами, которые должны будут поддержать линейку Ryzen в ультрабюджетном сегменте.

Представители AMD, рассказывающие о преимуществах Zen, не скупятся на эпитеты. Например, Лиза Су, исполнительный директор компании, говорит, что Ryzen – это наиболее конкурентоспособный CPU за последние десять лет. По словам же технического директора AMD Марка Пэйпермастера, ядра Zen делают ни много ни мало квантовый скачок в скорости исполнения инструкций, и в особенности в части однопоточной производительности. Звучит впечатляюще? Давайте посмотрим подробнее, какими же выдающимися усовершенствованиями может похвастать микроархитектура Zen.

⇡#Микроархитектура Zen

Одно из главных концептуальных изменений в Zen – это поддержка многопоточности и расчленение ядер. Прошлая микроархитектура, Bulldozer, предполагала разделение частей конвейера, FPU и SIMD-блоков, а также L2-кеша между сблокированными в модули парами ядер. Теперь же все эти ресурсы стали для каждого ядра полностью индивидуальны.

Однако одним лишь этим дело далеко не ограничивается. Если посмотреть на блок-диаграмму Zen, то первым, что бросится в глаза, окажется кеш микроопераций, появившийся в процессорах AMD впервые. Intel ввела подобный функциональный блок ещё в Sandy Bridge, и тогда он смог доказать свою высокую востребованность тем, что нагрузка на входные стадии исполнительного конвейера заметно снизилась. Положительный опыт надо перенимать, поэтому теперь кеш микроопераций есть и в Zen: в него помещаются результаты декодирования x86-инструкций, что позволяет снять нагрузку с декодера, а значит повысить производительность и снизить потребление при выполнении повторяющихся участков кода.

Кеш микроопераций работает в Zen в связке с механизмом предсказания переходов. Дело в том, что в новой архитектуре AMD отвязала предсказание переходов от выборки инструкций, и это значит, что реализованные в нём алгоритмы могут заполнять очередь на исполнение исключительно основываясь на собственных алгоритмах. Для того чтобы такая схема была жизнеспособна, при предсказании переходов стали использоваться буфера существенно большего размера. Кроме того, для условных переходов в Zen используется самообучающаяся система на основе перцептронов и двухуровневого буфера целей ветвлений.

Эта схема позаимствована из процессоров Jaguar, но в Zen она несколько усовершенствована и более тщательно перенастроена. Для динамических непрямых переходов используется отдельный массив адресов. Все буфера при предсказании переходов делятся между потоками, при этом обращения к ним получают разный приоритет в зависимости от состояния каждого потока. Ещё одно важное изменение касается перемещения буферов трансляции адресов (ITLB) в блок предсказания переходов. Это увеличивает агрессивность предварительной выборки и положительно сказывается как на скорости предсказания, так и на задержках для восстановления конвейера после неправильно взятых ветвлений кода.

Буфер трансляции адресов (ITLB) разделён в Zen не на два, а на три уровня. Добавлен дополнительный нулевой уровень, который может хранить до 8 записей для страниц любого размера. L1 TLB при этом рассчитан на 64 записи для страниц любого размера, а L2 TLB хранит 512 записей для 4- и 256-килобайтных страниц. Адреса гигабайтных страниц в L2 TLB не обслуживаются.

Блок декодирования инструкций в Zen, который преобразует поступающий поток x86-команд в микрооперации, способен обрабатывать напрямую до четырёх инструкций одновременно. Однако с учётом того, что некоторые инструкции могут быть взяты из кеша микроопераций, общий объём которого составляет 2048 микрокоманд, на выходе у декодера может оказываться до шести целочисленных микроопераций и до четырёх операций с плавающей точкой каждый такт.

В дальнейшем конвейеры, относящиеся к целочисленной и вещественночисленной частям ядра, полностью разделены. У каждой части ядра не только свои собственные исполнительные блоки, но и свои собственные планировщики. В теории это и делает Zen «широким» ядром, способным обрабатывать сразу большое число параллельных инструкций. Сама AMD характеризует возросшие по сравнению с Bulldozer исполнительные ресурсы двумя коэффициентами: объём окна планировщика увеличился на 75 процентов, а в целом планировщики могут отправлять на исполнение в полтора раза больше инструкций, чем это было в ядрах Excavator. И это значит, что в теоретическом плане Zen может обеспечивать примерно такой же темп исполнения инструкций, как и последние интеловские процессоры. Правда, Intel тоже не стоит на месте, и декодер в Skylake и Kaby Lake стал способен декодировать не четыре, а пять x86-инструкций за такт.

Что касается целочисленной части исполнительного конвейера Zen, то она в общей сложности способна обработать все шесть поставленных микроопераций за такт. Для этого в микроархитектуре заложено четыре арифметико-логических устройства (ALU) и два устройства генерации адресов (AGU). Каждое из этих исполнительных устройств имеет собственный планировщик с 14-позиционной очередью, плюс все они вместе работают с единым физическим регистровым файлом на 168 записей. Целочисленные устройства не совсем равноправны, и их назначение несколько различается в деталях. Ветвления могут исполняться только на одной паре ALU, а операции умножения и деления – на другой паре, причём каждая из этих операций подходит только для определённого устройства. В целочисленной части сделаны и некоторые специфичные оптимизации, направленные на ускорение обработки инструкций и снижение энергопотребления. Например, операции переноса данных в регистрах происходят путем переименования ссылок, а не через исполнение микроопераций. Кроме того, при прохождении ветвлений применяется техника сохранения контрольных точек, что позволяет быстро восстанавливать конвейер при ошибках в предсказании переходов.

Загрузки и сохранения выполняются в AGU, которые симметричны и работают параллельно. По сравнению с Excavator очереди внеочередного чтения и записи сильно выросли и достигли 72 и 44 операций в глубину, что сравнимо с последними интеловскими микроархитектурами. Устройства генерации адресов могут обслужить до двух 128-битных чтений и одну 128-битную запись за такт. Буфер трансляции адресов данных (DTLB) реализован по двухуровневой схеме. L1 TLB содержит 64 записи для страниц любого размера, L2 TLB рассчитан на полторы тысячи записей, но без поддержки страниц размером 1 Гбайт.

Все исполнительные устройства Zen имеют прямой доступ к общей очереди отставки, которая рассчитана на 192 записи и может завершать исполнение до восьми команд за такт. Надо сказать, что в микроархитектурах, производных от Bulldozer, в этом месте нередко возникали заторы, поэтому в Zen разработчики перестраховались и сделали финальную часть механизма исполнения команд вдвое быстрее декодера.

Вещественночисленная часть Zen (FPU) при этом выглядит не столь впечатляюще, как целочисленная. Несмотря на то, что в новых процессорах заявлена поддержка AVX2-инструкций, весь блок FPU оптимизирован для работы с 128-битными операндами. Обработка же 256-битных чисел в рамках AVX2 распадается на пары 128-битных команд и требует, соответственно, вдвое больше времени и ресурсов.

Регистровый файл для вещественночисленных операций в Zen рассчитан на 160 128-битных вхождений, очередь планирования же состоит из двух частей, суммарно вмещающих до 96 микроопераций. Регистровые файлы целочисленной и вещественночисленной частей вычислительного ядра имеют возможность прямого обмена данными друг с другом.

Набор исполнительных ресурсов FPU представлен четырьмя устройствами, что на самом деле делает Zen существеннее производительнее Bulldozer, так как в прошлой микроархитектуре предусматривалось лишь три исполнительных устройства для чисел с плавающей точкой на каждые два ядра. Два устройства предназначено для сложений, два – для умножений, а в сумме это означает, что FPU спроектирован с прицелом на работу с 128-битными командами набора FMA, но не AVX. Кроме того, на двух из четырёх устройств FPU могут выполняться инструкции набора AES, и делать это очень быстро.

Изменилась в Zen и система кеширования, что связано с необходимостью увеличить скорость подачи данных и инструкций к ядру с более высокой степенью внутреннего параллелизма. Кеш первого уровня удвоил свой размер и ассоциативность. AMD дала Zen 64-килобайтный L1-кеш с четырёхкратной ассоциативностью – для инструкций и 32-килобайтный L1-кеш с восьмикратной ассоциативностью – для данных. Увеличение размеров в данном случае должно благотворно сказаться на проценте попаданий, а ассоциативность дополнительно улучшает эту характеристику, правда, ценой некоторого увеличения энергопотребления. Каждый такт процессора кеш инструкций может выдавать по 32 байта в блок выборки, а кеш данных способен обслужить по две 16-байтные загрузки и одну 16-байтную команду сохранения данных. Обмен данными между L1- и L2-кешем во всех случаях строится по 32-байтной полнодуплексной шине.

Кеш второго уровня, индивидуальный для каждого ядра Zen, имеет размер 512 Кбайт и восьмикратную ассоциативность. Это вдвое больший объём и ассоциативность по сравнению с кеш-памятью второго уровня процессоров Skylake и Kaby Lake, что в итоге должно давать примерно 40-процентное преимущество в частоте попадания в него данных. Оба кеша, L1 и L2, – с обратной записью, что является важным усовершенствованием по сравнению со всеми Bulldozer, где L1-кеш работал по схеме со сквозной записью. Однако несмотря на то, что скорость работы кеша в Zen по сравнению с процессорами AMD предыдущего поколения заметно выросла, процессоры Intel, начиная с Haswell, имеют вдвое более быструю кеш-память за счёт ширины шины.

Кеш третьего уровня в архитектуре Zen является общим на каждые четыре ядра. Размер такого L3-кеша установлен в 8 Мбайт с 16-кратной ассоциативностью. Иными словами, у восьмиядерных Zen общий объём кеш-памяти третьего уровня – 16 Мбайт, но логически он состоит из двух полностью независимых 8-мегабайтных частей, каждая из которых живёт своей собственной жизнью. Причём алгоритм работы этого кеша – виктимный. На него не распространяется предварительная выборка, данные просто вытесняются в него из L1/L2. Таким образом, в отличие от инклюзивных кешей первого и второго уровня, L3-кеш оказывается преимущественно эксклюзивным.

То, что L3-кеш – свой для каждой четвёрки ядер, связано с особенностями компоновки полупроводникового кристалла. Он составляется из четырёхъядерных строительных блоков CPU Complex (CCX), которые на полупроводниковом кристалле размещаются бок о бок. Именно из таких блоков будут собираться многоядерные серверные процессоры, восьмиядерный же Ryzen представляет собой объединение двух CCX. Это значит, что при обращении к разным частям полного L3-кеша в многоядерных процессорах латентность будет получаться различной в зависимости от того, лежат ли данные в кеш-памяти третьего уровня, относящегося к собственному CCX или к CCX соседа. Однако AMD отдельно подумала над тем, чтобы дополнительные задержки были минимальными. Для связи различных CCX применена специальная высокоскоростная шина Infinity Fabric, основанная на технологии HyperTransport и поддерживающая приоритизацию трафика.

В заключение рассказа о микроархитектуре Zen несколько слов нужно сказать о том, как ресурсы ядра разделяются на два потока в рамках технологии SMT (Simultaneous Multi Threading). Смысл технологии состоит в том, чтобы все имеющиеся в ядре ресурсы были задействованы более полно, но конкурентное исполнение двух потоков при этом не только не должно приводить к блокировке одного потока другим. В идеале более приоритетный поток должен получать в своё распоряжение большие ресурсы. Для основных процессорных блоков, находящихся во входной части конвейера, в Zen используется разделение на основе квантования времени, когда на выполнение разных потоков поочерёдно выделяются свои временные промежутки. При этом AMD говорит о том, что на этапах предсказания ветвлений и переименования регистров выполняется анализ приоритетов, в результате которого некоторые потоки могут получить в своё распоряжение большее количество ресурсов. Основная же часть конвейера, включая декодер, планировщики, исполнительные устройства и кеш-память, разделяются между потоками по мере необходимости. Исключение сделано лишь для очереди микроопераций и для очереди отставки, которые для каждого потока продублированы.

⇡#Первые прикидки: Zеn против Broadwell-E и Kaby Lake

В том, что микроархитектура Zen представляет собой гигантский шаг вперёд по сравнению с Bulldozer, никаких сомнений не остаётся. И дело не только в том, что для новых процессоров используется современный техпроцесс и традиционный x86-дизайн с полноценными широкими ядрами без разделяемых блоков и с поддержкой многопоточности (SMT). Сделана и масса других улучшений, благодаря чему число исполняемых одним ядром инструкций за такт выросло более чем в полтора раза. В пользу этого играет улучшенное предсказание переходов, появление кеша микроопераций, возможность отсылки на исполнение до шести микроопераций за такт (против четырёх), 60-процентное увеличение буферов планировщиков, двукратное увеличение темпа завершения и отставки микроопераций, полуторакратное увеличение глубины очередей загрузки и выгрузки данных, возможность выполнения до четырёх операций с плавающей точкой за такт (против трёх), кратное увеличение пропускной способности всех кешей и рост размеров L1-кеша, улучшения на уровне предварительной выборки данных и масса всего прочего.

Однако гораздо более интересный вопрос заключается в том, как выглядит микроархитектура Zen на фоне тех процессоров, которые есть в распоряжении Intel. И вот тут-то всё оказывается не столь очевидно. Дело в том, что Zen, хотя и спроектирован по классическим канонам, сильно отличается по строению от Broadwell и Skylake/Kaby Lake, причём наибольшие отличия касаются механизма исполнения инструкций. Как и в Bulldozer, в Zen AMD разделила целочисленные и вещественночисленные конвейеры, в то время как в процессорах Intel применены универсальные исполнительные порты, суммарное число которых, например, в Skylake/Kaby Lake доведено до восьми. Поэтому прямое сравнение архитектур проводить тяжело.

Тем не менее совершенно точно можно сказать, что по производительности работы с 256-битными AVX2-инструкциями Zen серьёзно слабее своих конкурентов. Дело в том, что в процессорах Intel, начиная с Haswell, устройства, работающие с плавающей точкой, перенастроены на 256-битные операнды. Это позволяет им обеспечивать вещественночисленную производительность из расчёта 16 FLOPs за такт, в то время как Zen со своими 128-битными устройствами может выдавать лишь вдвое меньшую скорость. Уступает Zen и в пропускной способности системы кеширования. Кеш-память процессоров Intel, начиная с Haswell, использует 64-битные пересылки данных, в то время как в Zen соответствующие шины имеют в два раза меньшую ширину. Впрочем, высокий темп работы с кешем важен лишь при работе с векторными инструкциями, а AVX2-инструкции в Zen и так исполняются медленно.

Что же касается быстродействия процессоров с микроархитектурой Zen на целочисленных данных, то тут, похоже, они могут выдавать вполне конкурентный уровень. Несмотря на то, что декодер в Skylake/Kaby Lake рассчитан на обработку пяти операций за такт против четырёх у Zen, а устройства генерации адресов могут вычислять в Haswell, Skylake и Kaby Lake по три адреса за такт, а не по два, как в новой архитектуре AMD, Zen может противопоставить всему этому мощную систему предсказания переходов и более вместительные кеши, а том числе и кеш микроопераций.

При знакомстве с новыми микроархитектурами мы всегда проверяем их эффективность простыми синтетическими тестами, которые чутко реагируют на особенности тех или иных процессорных блоков. Такое сравнение уместно и сейчас. На этот раз мы воспользовались бенчмарками, входящими в комплект тестовой утилиты AIDA64 5.80. На следующих графиках приводятся показатели производительности старших четырёхъядерных процессоров поколений Ryzen (Zen), Vishera (Piledriver), Broadwell-E и Kaby Lake, работающих на одной и той же постоянной частоте 4,0 ГГц. Для начала тесты CPU в обычном восьмиядерном режиме.

Различия в микроархитектурах приводят к тому, что производительность при различных операциях может отличаться очень сильно. Zen показывает серьёзные преимущества в шифровании, достойно проявляет себя в тесте Queen на эффективность предсказания переходов и в классическом целочисленном тесте ZLib, однако уступает интеловским процессорам в тесте на обработку изображений PhotoWorxx, где активно задействуется система кеширования данных и целочисленные AVX-инструкции.

При работе с числами с плавающей точкой ситуация становится ещё более неоднозначной.

В целом в вещественночисленных алгоритмах микроархитектура Zen уже сильна не так, как при работе с целыми числами. Относительно неплохие результаты наблюдаются только в тестах VP8 и SinJulia, которые используют наиболее простые x87-инструкции или наборы семейства SSE. Если же дело начинает касаться AVX, FMA или, что ещё хуже, AVX2-операций, Zen актуальной архитектуре Intel проигрывает, причём очень заметно.

Для сравнения те же тесты были проведены в однопоточном режиме.

Любопытно, что в однопоточном режиме относительные скоростные показатели микроархитектуры Zen хуже, чем в многопоточном случае. Это – прямое указание на то, что технология SMT у инженеров AMD получилась очень удачной. Её эффективность явно выше, чем у интеловской Hyper-Threading.

Правда, в тестах, делающих упор на операции с числами с плавающей точкой, такой закономерности уже не наблюдается. Здесь вновь приходится констатировать, что FPU-часть в новых процессорах AMD справляется со своей работой не столь хорошо, как обрабатывают числа с плавающей точкой Broadwell или Kaby Lake.

Можно ли на основании этих данных делать вывод о том, что новая микроархитектура Zen не сможет вывести производительность Ryzen в реальных задачах на должный уровень? Нет! Дело в том, что идеология разработки Zen базировалась на принципах, сильно отличающихся от подхода Intel. В то время как микропроцессорного гиганта заботят проблемы глобального масштаба, и он старается в меру своих сил управлять рынком программного обеспечения и упреждающе предоставлять в распоряжение программистов всевозможные расширения архитектуры, AMD смотреть в столь отдалённую перспективу не нужно. Инженеры этой компании проанализировали не будущие тенденции, а то, какое программное обеспечение существует сейчас, и, опираясь на собранные сведения, сделали упор на увеличение мощности наиболее востребованных в данный момент процессорных блоков. Пусть из-за этого Ryzen и демонстрирует отставание во многих синтетических тестах, зато в реальных задачах он работает с максимальной отдачей. Всё это позволило AMD не разбазаривать транзисторный бюджет ради редко используемых возможностей вроде AVX2 и получить более компактный полупроводниковый кристалл с более низкой себестоимостью.

Следующий проведённый нами низкоуровневый тест касается латентности подсистемы кеш-памяти. В этом случае для измерений мы воспользовались утилитой SiSoftware Sandra 2016.03.22.20. Полученные результаты сведены в таблицу, латентность приводится в процессорных тактах.

Объём (на ядро)

32 Кбайт

32 Кбайт

32 Кбайт

16 Кбайт

Латентность

4

4

5

4

Объём

64 Кбайт

32 Кбайт

32 Кбайт

32 Кбайт, разделяемый на 2 ядра

Латентность

5

2-3

5

2

Объём (на ядро)

512 Кбайт

256 Кбайт

256 Кбайт

1024 Кбайт, разделяемый на 2 ядра

Латентность

17

12

13

18

Объём (на ядро)

2 Мбайт, разделяемый на 4 ядра

2 Мбайт, разделяемый для всех ядер

2,5 Мбайт, разделяемый для всех ядер

1 Мбайт, разделяемый для всех ядер

Латентность

36-37

22

27

76

Эффективность системы кеширования в микроархитектуре Zen по понятным причинам хуже, чем в интеловских процессорах. Так, практическая латентность L2- и L3-кешей у Ryzen выше, чем у актуальных процессоров Intel, примерно в полтора раза. Однако по сравнению с микроархитектурой Bulldozer прогресс виден очень хорошо. Наиболее сильно он проявляется в улучшении времени отклика L3-кеша.

И последняя группа тестов касается проверки контроллера памяти. В процессорах Ryzen появился новый контроллер, поддерживающий двухканальную DDR4 SDRAM, и в теории по этой характеристике они стали похожи на интеловские процессоры для платформы LGA1151. Но эффективность контроллера сильно зависит от его конкретной реализации, и поэтому мы оценили практическую пропускную способность и латентность памяти Ryzen по сравнению с альтернативами. В этих испытаниях использовался бенчмарк Stream и уже упоминавшаяся утилита SiSoftware Sandra 2016.03.22.20. Все измерения проведены с DDR4-2933, работавшей со схемой задержек 15-17-17-35.

Контроллер DDR4 SDRAM в процессорах Ryzen оказался далеко не таким удачным. Единственный случай, где он оказывается на одном уровне с контроллерами памяти процессоров Intel, — это при многопоточном последовательном доступе. В этом случае он способен выдать даже чуть лучшую пропускную способность, чем двухканальный контроллер памяти Kaby Lake. Но латентность при этом оказывается примерно в три раза хуже, чем в процессорах конкурента, что влечёт за собой и отставание Ryzen в пропускной способности памяти при однопоточной нагрузке. Иными словами, ждать от новинки компании AMD высоких результатов в приложениях, которые работают с большими массивами данных, не приходится.

⇡#Энергопотребление Zen и 14-нм техпроцесс

Процессоры, построенные на микроархитектуре Zen, производятся на заводах GlobalFoundries по 14-нм техпроцессу 14LPP c применением FinFET-транзисторов. Важны обе составляющие. Современные нормы техпроцесса позволяют снизить площадь ядра и добиться того, что 4,8 млрд транзисторов могут разместиться на кристалле площадью всего лишь порядка 200 мм2 (по нашим расчётам).

Полупроводниковый кристалл AMD Ryzen 7

Это значит, что по плотности упаковки транзисторов AMD смогла переиграть даже Intel. По оценкам компании, преимущество перед конкурентом в плотности дизайна составляет не менее 10 процентов.

FinFET-технология же означает, что затвор транзисторов расположен вертикально, помогая не только более точно управлять каналом, но и снизить токи утечки. Это также вносит немалый вклад в энергоэффективность и позволяет достичь достаточно высоких тактовых частот.

В пользу снижения потребления играет и специальная технология Pure Power, интерактивно управляющая питанием процессора. Стараясь добиться невысокого потребления ещё в линейке своих APU инженеры AMD смогли достичь немалых успехов и сделать сравнительно экономичные чипы, даже невзирая на неудачную архитектуру и устаревший техпроцесс. Теперь все такие наработки перенесены в Zen. Новый процессорный дизайн подробно контролирует состояние чипа по температурам и токам и отключает неиспользуемые блоки или снижает их частоты. Стоит отметить, что число управляемых цепей питания в ядре Ryzen превышает 1300 штук, а число встроенных датчиков температуры и токов достигает нескольких десятков.

Рост эффективности достигается не только благодаря новой микроархитектуре, применению FinFET-транзисторов и внедрению технологии PurePower, но и специально оптимизированному физическому дизайну ядра, который во многих частях делался не автоматическими методами, а вручную. В конечном итоге энергоэффективность Ryzen просто поражает. AMD удалось вписать в 95-ваттный тепловой пакет флагманские восьмиядерные процессоры, частоты которых подпирают отметку в 4,0 ГГц. Кроме того, в линейке Ryzen есть и совершенно уникальный 65-ваттный восьмиядерник, в то время как текущие десктопные восьмиядерные процессоры Intel для настольных систем Broadwell-E имеют расчётное тепловыделение на уровне 140 Вт. Похоже, что в гонке энергоэффективности микропроцессорный гигант рискует утратить свои передовые позиции.

⇡#Платформа Socket AM4 и новые чипсеты

Процессоры семейства Ryzen ориентированы на использование принципиально новой платформы и нового разъёма Socket AM4. Связано это в первую очередь с тем, что у AMD возникла необходимость во внедрении поддержки DDR4-памяти, которая к настоящему времени завоевала место индустриального стандарта. А заодно, пользуясь моментом, было решено перекроить всю платформу, сделав процессоры похожими на SoC. Иными словами, в интегрированный северный мост процессора был перенесён дополнительный набор контроллеров, что сделало чипсеты нового поколения крайне простыми устройствами.

Вследствие этого неудивительно, что новый процессорный разъём AM4 получил возросшее число контактов – их теперь 1331. Это значит, что Ryzen не имеют совместимости ни с какими старыми материнскими платами. К тому же AMD изменила требования к расположению на материнских платах крепёжных отверстий для систем охлаждения, и поэтому для Ryzen требуются новые кулеры или по крайней мере новые крепления для старых. Поэтому, несмотря на то, что Ryzen на первый взгляд похожи на предшественников, имеют аналогичные габариты и внешнее исполнение, вся экосистема для них должна быть полностью обновлена.

В Bulldozer в процессорном кристалле был реализован контроллер памяти. В APU последних поколений в основной чип переехал и контроллер для графической шины PCI Express. В Ryzen же в процессоре добавились дополнительные линии PCI Express, порты USB и SATA. Фактически сейчас AMD создала ситуацию, когда процессор может работать вообще без каких-либо дополнительных наборов логики, что делает возможным создание крайне простых и компактных материнских плат.

Однако начать стоит с того, что встроенный контроллер памяти в процессорах Ryzen – абсолютно новый. Он рассчитан на работу с двухканальной DDR4 SDRAM и поддерживает исключительно такую память. Обратной совместимости с DDR3 SDRAM не предусматривается. Официально контроллер памяти Ryzen поддерживает модули DDR4 с частотой до 2666 МГц, для которых на Socket AM4-материнских платах может быть предусмотрено два или четыре слота. Память с частотой выше DDR4-2666 с Ryzen тоже может применяться, но авторы процессора в этом случае не дают никаких гарантий.

Впрочем, с использованием в Socket AM4 скоростных модулей памяти могут возникать проблемы. Максимальная частота DDR4, которая может быть получена в Ryzen без изменения базовой частоты BCLK, составляет всего лишь 3200 МГц. Причём работа DDR4-2933- или DDR4-3200-памяти возможна только в случае использования пары модулей. Иными словами, по частотным возможностям контроллера памяти Ryzen сильно уступает текущим процессорам Intel для платформы LGA 1151, которые свободно покоряют режимы DDR4-4000 и выше. Но пока остаётся некоторая надежда на то, что ситуация может быть исправлена через новые версии BIOS для материнских плат.

Помимо встроенного контроллера памяти с поддержкой двухканальной DDR4 SDRAM, Ryzen предоставляет:

Таким образом, из одного только процессора Ryzen получается полноценная система-на-чипе.

Однако для типичных настольных систем имеющихся в процессоре средств расширения, скорее всего, окажется недостаточно. Поэтому к процессору по отведённым для этой цели линиям PCI Express может быть подсоединён один из наборов логики – X370, B350 или A320, которые добавят к указанному перечню какие-то дополнительные вещи. А если нужды в этом нет, то существует возможность укомплектовать Ryzen и специальными упрощёнными Mini-ITX-чипсетами X300 или A300, которые процессорные линии PCI Express 3.0 на себя не расходуют, но и к списку возможностей почти ничего не добавляют.

Основная масса свойств платформы Socket AM4 определяется именно процессором Ryzen. Чипсеты в новой платформе играют сугубо второстепенную роль, и на самом деле от них в плане функциональности платформы зависит немногое.

Даже старший набор логики X370, который, скорее всего, будет использоваться в большинстве материнских плат для энтузиастов, привносит не так уж и много: дополнительные два порта USB 3.1, по шесть портов USB 3.0 и USB 2.0, восемь портов SATA, четыре из которых могут быть конвертированы в два интерфейса SATA Express, и восемь дополнительных медленных линий PCI Express 2.0. Плюс в платформе Socket AM4 использование того или иного чипсета либо разрешает, либо запрещает разгон, деление графических линий PCI Express 3.0 x16 и режимы RAID для SATA-портов. Например, в том же X370 как в старшем чипсете допускается и разгон, и SLI- или CrossfireX-конфигурации, и RAID-массивы уровня 0, 1 и 10.

Наряду с X370 заинтересовать продвинутых пользователей может и более простой набор логики B350. В нём остался разрешён разгон процессора и RAID-массивы, а главное отличие от старшего варианта касается невозможности делить процессорную графическую шину на два слота. Кроме того, под нож попала часть портов USB 3.0 и SATA, которых в чипсете осталось два и шесть соответственно, плюс число линий PCI Express 2.0 сократилось до шести.

Ещё одна любопытная альтернатива – X300 – чипсет, который специально предназначается для простых компактных систем. Он к возможностям процессора ровным счётом ничего не добавляет, зато разрешает деление графической шины PCI Express 3.0 x16 на два слота и позволяет разгон процессора.

Детальные сведения о том, какие возможности предлагают в сочетании с Ryzen те или иные чипсеты, мы свели в следующей таблице.

Хотя наборы логики и несут на себе название AMD, в их разработке первоочередную роль играла компания ASMedia, известная по своим разнообразным контроллерам. Именно благодаря ей AMD смогла первой вывести на рынок наборы логики с поддержкой портов USB 3.1 с пропускной способностью 10 Гбит/с. Однако врождённой поддержки разъёмов Type-C при этом в чипсетах AMD нет. Для того чтобы на плате появился удобный симметричный разъём USB, производителям материнок придётся раскошелиться на дополнительный чип-драйвер.

Благодаря поддержке USB 3.1 наборы логики для платформы Socket AM4 выглядят современно, но особенно обольщаться по поводу их возможностей всё-таки не следует. В то время как интеловские наборы логики двухсотой серии могут обеспечивать работу до 30 высокоскоростных портов (PCIe 3.0, SATA и USB 3.0), даже у старшего AMD X370 таких портов вдвое меньше. Частично это компенсируется возможностями встроенного в процессор северного моста, но тем не менее платформа Intel позволяет создавать более гибкие конфигурации с более широкими возможностями подключения дополнительных устройств.

Есть в чипсетах AMD и ещё один изъян. Для удешевления они производятся по 55-нм техпроцессу, и потому, несмотря на свою относительную простоту, назвать их особенно экономичными нельзя. Они в любом случае требуют охлаждения (хотя бы пассивного) на материнской плате.

⇡#Линейка Ryzen 7

Сегодня, 2 марта 2017 года, компания AMD начинает продажи первой партии своих принципиально новых процессоров Ryzen. И это – воистину историческое событие: продуктов, на которые был бы возложен подобный груз ожиданий, на процессорном рынке не было уже очень давно. Шутка ли – AMD собирается составить конкуренцию старшим интеловским процессорам для высокопроизводительных десктопов, но при этом чуть ли не вдвое понизить ценовую планку.

В течение первой фазы вывода Ryzen на рынок AMD собирается сделать ставку на свои восьмиядерные процессоры, отнесённые к семейству Ryzen 7. Это – наиболее дорогие десктопные носители новой микроархитектуры Zen со стоимостью от $330 до $500. Но несмотря на относительно высокую цену, компания ожидает чуть ли не ажиотажного спроса на новинку и серьёзно подготовилась к нему. Товарные партии Ryzen 7 уже лежат на складах ведущих магазинов, а всего AMD предварительно произвела порядка миллиона процессоров.

Одними только восьмиядерниками Ryzen 7 дело, естественно, не ограничится, но более простые и дешёвые версии новых процессоров AMD Ryzen 5 и Ryzen 3, которые будут обладать шестью и четырьмя вычислительными ядрами соответственно, придут на рынок позднее. Семейство Ryzen 5 появится в течение второго квартала (скорее всего, в начале июня), а Ryzen 3 будут представлены во второй половине текущего года. Поэтому на данный момент для поклонников компании AMD доступны лишь три восьмиядерные альтернативы с разными частотами.

В конечном итоге фла

Источник: оригинал статьи