Обзор процессора Atom C2758 и материнской платы SuperMicro A1SRM-2758F: бьем рекорды энергоэффективности


⇡#Вступление

За последние годы на рынке серверов и суперкомпьютеров произошли серьезные изменения, и главное из них — появление гетерогенных вычислений и микросерверов.

Когда смотришь на рейтинг суперкомпьютеров TOP500, становится ясно, что с каждым годом не только растет количество гетерогенных суперкомпьютеров, но и «классические» суперкомпьютеры на базе ЦП опускаются всё ниже и ниже, сдавая позиции гетерогенным кластерам. То есть современному рынку суперкомпьютеров требуются не унифицированные мощные процессоры, а узкоспециализированные, которые позволяют поднять и производительность, и энергоэффективность вычислительного комплекса на новый уровень — например, не так давно система на базе процессоров Xeon Е5 и сопроцессоров Xeon Phi показала рекордный уровень энергоэффективности в TOP500.

Игнорировать данные тенденции нельзя, если хочешь остаться на рынке, — компания AMD, купив производителя графических карт ATI в далеком 2006 году, решила проблему с сопроцессорами, выпустив профессиональные устройства для GPGPU-вычислений. Компания Intel, не имея под своим крылом разработчика графических ускорителей, пошла своим путем — начала с нуля разработку амбициозного проекта Larrabee, который впоследствии трансформировался в Intel MIC и высокопроизводительные сопроцессоры Xeon Phi. Де-факто Intel сумела ответить на потребности рынка суперкомпьютеров и, очевидно, весьма успешно — согласно ноябрьскому рейтингу TOP500 2013 года, самый производительный суперкомпьютер основан на процессорах Xeon E5 и сопроцессорах Xeon Phi.

Рынок микросерверов также нуждался в специализированном устройстве, как и рынок суперкомпьютеров. Поскольку необходимы были процессоры с небольшим энергопотреблением и высокой энергоэффективностью, классические мощные и сложные х86-ядра как у Xeon E3/E5/E7 и Itanium явно не подходили. Компания AMD пошла по пути наименьшего сопротивления — купила лицензию на ARM-архитектуру, которая отличается своей «простотой» и высокой энергоэффективностью. Решение Intel было понятно сразу — если уж на рынке мобильных телефонов, планшетов, суперкомпьютеров она не отказалась от х86-архитектуры, то что уж говорить про микросерверы? Поскольку реагировать на запросы рынка надо оперативно, то не было и речи о разработке архитектуры с нуля — в качестве отправной точки был взят «вездесущий» Atom. Адаптировав под серверные нужды в 2012 году микроархитектуру Saltwell, Intel получила серию процессоров S1200 с кодовым именем Centerton. Это были двухъядерные процессоры, произведенные по 32-нм техпроцессу. Ввиду невысокой производительности, необходимости в дополнительной обвязке (контроллеры Ethernet, SATA, USB) и ограничения максимального объема ОЗУ отметкой в 8 Гбайт данная серия не получила особого распространения. Это решение было пробой пера на рынке микросерверов, так что ему был отмерен краткий срок.

В 2013 году, сделав работу над ошибками, Intel выпускает в свет новую линейку процессоров Atom С2000 — теперь в состав чипа входят не только восемь процессорных ядер с переработанной архитектурой и ИКП, но и контроллеры SATA, USB, Ethernet и PCI Express, то есть речь идет о полноценной SoC.

Материнская плата SuperMicro A1SRM-2758F, CPU-Z

Несмотря на то, что Intel значительно переработала ядро «Атома», от предшественника осталась несимметричная компоновка кешей первого уровня: кеш инструкций объемом 32 Кбайт, кеш данных — 24 Кбайт. Что весьма странно.

Само процессорное ядро Atom С2000 имеет архитектуру Silvermont, которую мы не так давно рассматривали. Поэтому нет смысла делать это еще раз, а вот строение SoC ввиду кардинальных изменений стоит детально разобрать.

В состав SoC Bay Trail входит до четырех процессорных ядер, графическое ядро Intel HD с четырьмя EU, контроллеры USB 3.0 и 2.0, SATA 2.0, PCI Express 2.0 с четырьмя линиями и двухканальный контроллер памяти с поддержкой DDR3-1333. В микросервере как таковой необходимости в графическом ядре нет, поэтому первое, что было исключено из SoC, — это графика Intel HD. Хотя здесь стоит сделать поправку — графическое ядро в целом серверу необходимо, но от него требуются другие функции, например, IPMI — для этого используются специализированные устройства вроде Aspeed AST2400. Теоретически можно было оставить Intel HD, «прикрутив» к нему все необходимые функции, в том числе и IPMI, — это позволило бы не только снизить количество дополнительного оборудования (а значит, и упростить разводку материнской платы), но и иметь поддержку OpenCL «на всякий случай» для гетерогенных вычислений «завтрашнего дня». Безусловно, это бы несколько увеличило площадь SoC, а следовательно, и транзисторный бюджет, который, как правило, ограничен на моменте проектирования процессора, но вариант все равно интересный — конкурент в лице AMD двигается именно в этом направлении. Однако это все теории. Итого в состав SoC Atom C2000 входит:

  • до восьми процессорных ядер;
  • двухканальный контроллер DDR3-1600 с поддержкой ECC;
  • контроллер PCI Express 2.0 с шестнадцатью линиями (четыре контроллера по четыре линии);
  • контроллер с квартетом портов SATA 2.0;
  • контроллер с двумя портами SATA 3.0;
  • четыре сетевых контроллера;
  • контроллер USB 2.0 с четырьмя портами;
  • криптографический сопроцессор Intel QuickAssist.

Следует остановиться на самой серии процессоров С2000, ведь в ней формально присутствуют два типа SoC — Rangeley и Avoton. По сути, это одни и те же чипы с одинаковой архитектурой, разница между которыми заключается в том, что процессоры Rangeley имеют поддержку технологии Intel QuickAssist, а Avoton — нет. Для различения процессоров в рамках серии компания Intel использует разный числовой индекс в конце названия: цифра 8 означает принадлежность SoC к Rangeley, а 0 — к Avoton.

У Rangeley и Avoton разные сегменты рынка: первые предназначены для облачных хранилищ и устройств коммутации, а вторые — для микросерверов. Стоит заметить, что Rangeley за счет Intel QuickAssist имеет рекомендованную стоимость на 37 долларов больше, чем Avoton (на примере С2758 и С2750). Безусловно, процессоры Rangeley можно также использовать в микросерверах, переплатив за криптографический сопроцессор.

⇡#Модельный ряд Atom C2000

Модельный ряд серии С2000 на данный момент времени содержит восемь процессоров Rangeley и пять процессоров Avoton. Количество ядер в линейке варьируется от двух до восьми, а TDP — от 6 до 20 ватт.

Модельный ряд Intel Rangeley

Модельный ряд Intel Avoton

⇡#Спецификации процессора Atom C2758

Тестирование производительности Rangeley будем выполнять на примере материнской платы SuperMicro A1SRM-2758F. Стоит заметить, что плата имеет «сестру-близняшку», на которой распаян SoC Avoton, — SuperMicro A1SAM.

Материнская плата SuperMicro A1SRM-2758F, CPU-Z

  Atom C2758 Atom C2750
Кодовое название Rangeley Avoton
Техпроцесс, нм 22
Количество ядер/потоков, шт 8/8
Тактовая частота, ГГц 2,4
Максимальная тактовая частота с Turbo Boost 2,6
Кеш-память L1i/L1d, Кбайт 8х 32/8х 24
Кеш L2, Мбайт 4х 1
Набор инструкций Intel 64, MMX, SSE, SSE2, SSE3, SSSE3, SSE 4.1, SSE4.2, VT-x, AES-NI, EPT
Поддержка Intel QuickAssist Есть Нет
Максимальный объем ОЗУ, Гбайт 64
Тип поддерживаемой памяти DDR3, DDR3L
Максимальная эффективная частота ОЗУ, МГц 1600
Количество каналов памяти 2
Поддержка ECC Есть
Количество линий PCI Express 16
Редакция PCI Express 2.0
Количество портов USB 2.0 4
Количество портов SATA 2.0/3.0 4/2
Интегрированный сетевой контроллер 4 х 1000 Мбит/с или
4 х 2,5 Гбит/с
TDP, Вт 20
Рекомендованная стоимость, $ 208 171

Из таблицы спецификаций видно, что Avoton (Atom C2750) имеет поддержку Turbo Boost и несколько меньшую стоимость, в свою очередь Rangeley (Atom C2758) поддерживает технологию Intel QuickAssist. В остальном же перед нами одинаковые чипы.

Материнская плата SuperMicro A1SRM-2758F, CPU-Z

Если говорить о поддерживаемых наборах инструкций, то Atom C2000 выглядит вполне современно: Intel 64, MMX, SSE, SSE2, SSE3, SSSE3, SSE 4.1, SSE4.2, VT-x, EPT, AES-NI. Для полного счастья не хватает только AVX, AVX2 и FMA3, но поддержка данного набора инструкций вылилась бы в кардинальное изменение и усложнение ядра и кешей в силу 256-битной разрядности. Возможно, в следующих поколениях Atom получит поддержку 256-битных расширений — ведь будущее поколение Xeon Phi, базирующееся на схожем с Avoton ядре, имеет поддержку 512-битных AVX-инструкций. Отдельно стоит сказать, что, как и в Haswell, в Rangeley предусмотрен аппаратный цифровой генератор случайных чисел DRNG, обеспечивающий высокую скорость генерации случайных чисел — например для криптографических задач (с помощью инструкции RDRAND). Также присутствует поддержка набора инструкций виртуализации Intel VT-x2, в состав которого входят: Intel VT FlexMigration, Intel VT FlexPriority, VPID, VT Real Mode, VMFUNC.

⇡#Спецификации материнской платы SuperMicro A1SRM-2758F

Процессор Atom C2758
Оперативная память Четыре 240-контаных слота для DDR3 SDRAM DIMM
Поддерживается память типа DDR3 1333/1600
Возможен двухканальный доступ к памяти
Максимальный объем 64 Гбайт
Поддержка коррекции ошибок ECC
Возможности расширения 2 x SATA 2.0
4 x SATA 3.0
3 x USB 2.0
1 x Fast UART 16550 Serial Port
1 x SATA DOM TPM 1.2 Header
Интерфейсная панель 1 x COM
4 x USB 2.0
1 x IPMI LAN
4 x LAN
1 x D-Sub
1 x UID Switch
BIOS 128 Мбайт SPI Flash EEPROM with AMI UEFI BIOS DMI2.3 ACPI5.0 USB Keyboard Support SMBIOS 2.7.1 UEFI
Разное 3 х 4-pin коннектора для подключения вентиляторов
Питание Основной 24-контактный разъем питания ATX
Мониторинг Мониторинг напряжений ядер процессора, +1,8V, +3,3V, +5V, +12V, +5V Standby, VBAT, ОЗУ
Мониторинг тахометров вентиляторов
Мониторинг температур ядер процессора
Форм-фактор и размер uATX, 24,4×19,05 см

Перед осмотром материнской платы ознакомимся со схемой коммутации интерфейсов на ней.

Схема коммутации интерфейсов материнской платы SuperMicro A1SAM/A1SRM

А также со схемой расположения слотов и разъемов.

Схема материнской платы SuperMicro A1SAM/A1SRM

⇡#Упаковка и внешний вид

Упаковка материнской платы SuperMicro A1SRM-2758F

Поставляется материнская плата в лаконичной и невзрачной упаковке — стоит заметить, что материнские платы для Xeon имеют аналогичный дизайн. Конечно, не стоит забывать, что это серверное решение, а не геймерское, тем не менее «фирменный» стиль, на наш взгляд, стоит переработать — хотя бы сделать лицевую сторону более информативной.

Комплектация материнской платы SuperMicro A1SRM-2758F

Комплектация материнской платы SuperMicro A1SRM-2758F

Комплектация материнской платы в целом обычна: шесть кабелей SATA, крепежно-усилительная пластина, краткий информационный листок и «чек-лист». Необходимы драйверы и мануал? Добро пожаловать в Сеть. Кстати, это даже к лучшему — пользователь всегда получает свежие драйверы с сайта производителя, а не «50-летней давности», записанные на диске.

Материнская плата SuperMicro A1SRM-2758F, общий вид

Материнская плата имеет форм-фактор MicroATX и, соответственно, размеры 24,4х19,05 см. Безусловно, такой форм-фактор позволяет получить плотную компоновку в стойке, но небольшие габариты выливаются в огрехи дизайна — например, защелки двух из четырех слотов для ОЗУ труднодоступны, так как им мешает интерфейсная панель. Плата питается от 24-контактного разъема ATX, но если не использовать слоты PCI Express, то подойдет и 20-контактный. Также на плате можно заметить нераспаянный слот PCI Express x4, который устанавливается опционально.

Материнская плата SuperMicro A1SRM-2758F, порты SATA

Примечательной особенностью SuperMicro A1SRM является распаянный прямо на плате порт USB 2.0, рядом с которым расположились порты SATA: два белых SATA 3.0 и четыре SATA 2.0 — три черных и желтый.

Материнская плата SuperMicro A1SRM-2758F, ASPEED AST2400

В качестве графического адаптера выступает ASPEED AST2400, поэтому о 3D стоит забыть, но в нем, в принципе, и необходимости нет, особенно в случае NAS.

Материнская плата SuperMicro A1SRM-2758F, Marvell Alaska 88E1543

Как мы помним, в SoC интегрирован контроллер Intel I347 с поддержкой четырех сетевых интерфейсов со скоростью 1000/2500 Мбит/с, а в качестве приемопередатчика выступает распаянная на плате микросхема Marvell Alaska 88E1543.

Материнская плата SuperMicro A1SRM-2758F, радиатор СО

Материнская плата SuperMicro A1SRM-2758F, радиатор СО

Система охлаждения пассивная — она представляет собой небольшой радиатор с винтовым креплением, чего, в принципе, должно хватать для процессора с TDP 20 ватт. Полировка основания далека от идеала. Зато на плате распаяно три 4-контактных разъема для подключения вентиляторов, что позволяет трансформировать СО в активную.

Материнская плата SuperMicro A1SRM-2758F, кристалл SoC Atom C2758

Материнская плата SuperMicro A1SRM-2758F, кристалл SoC Atom C2758

Сама SoC Atom C2758 распаяна на материнской плате, поэтому ни о какой смене процессора речи быть не может. Площадь чипа невелика для 8-ядерного процессора — всего 106 мм2. Для сравнения: у 4-ядерного Haswell — 177 мм2, при этом оба изготавливаются по 22-нм техпроцессу с технологией 3D Tri-Gate. Рядом с кристаллом располагаются массивы резисторов, которые, как и ядро, к сожалению, не защищены металлической рамкой от сколов.

Материнская плата SuperMicro A1SRM-2758F, оборотная сторона

На оборотной стороне платы нет ничего примечательного, разве что металлическая усилительная пластина, удерживающая радиатор охлаждения.

Материнская плата SuperMicro A1SRM-2758F, интерфейсная панель

Интерфейсная панель весьма скудная — COM-порт, по четыре порта USB 2.0 и RJ-45 для подключения к локальной сети и Интернету, D-Sub, а также отдельный разъем RJ-45 для IPMI. С другой стороны, для NAS больше и не надо — разве что пару портов USB 3.0.

Если Вы заметили ошибку — выделите ее мышью и нажмите CTRL+ENTER.