ЖУРНАЛ СТА 3/2019

микропрограммном уровне посредством специальных инструкций, добавляемых компилятором в программный код. Для обеспечения высокой произво- дительности, кроме увеличения такто- вой частоты, все современные процес- соры используют одновременное (па- раллельное) выполнение инструкций, так как параллельный код присутствует во всех без исключения классах про- грамм. Самым распространённым яв- ляется суперскалярный принцип распа- раллеливания операций. В архитектурах, использующих этот принцип, и, в частности, в процессорах х86, последовательный код, получен- ный после компиляции программ, рас- параллеливается на аппаратном уровне. Для этого используются специальные функциональные блоки процессора, которые прогнозируют, планируют и диспетчеризируют выполнение ин- струкций. В отличие от процессоров х86 в про- цессоре «Эльбрус» реализованы только те функции, которые необходимы для обеспечения выполнения кода, подго- товленного оптимизирующим компиля- тором. Это позволяет, с одной стороны, убрать с кристалла некоторые необходи- мые для суперскалярной архитектуры компоненты, что уменьшает тепловыде- ление, упрощает конструкцию процес- сора и технологию его изготовления, а также повысить производительность пу- тём наращивания вычислительных ком- понентов. С другой стороны, код, подго- товленный оптимизирующий компиля- тором, позволяет достичь высокой про- ОБ ЗОР / В С Т РАИВ А ЕМЫЕ СИС Т ЕМЫ СТА 3/2019 21 www.cta.ru Архитектура «Эльбрус» «Эльбрус» «Эльбрус-S» «Эльбрус -2C+» «Эльбрус-4C» «Эльбрус-1C+» «Эльбрус-8C» Год выпуска 2005 2010 2011 2014 2016 1 квартал 2015 (серийно с 2016) Техпроцесс, нм 130 90 90 65 40 28 Архитектура «Эльбрус» «Эльбрус» «Эльбрус», ElCore9 «Эльбрус» «Эльбрус», MGA2, Vivante GC2500 «Эльбрус» Количество ядер 1 1 2 (+4 DSP) 4 1 (+1 2D, +1 3D) 8 Тактовая частота, МГц 300 500 500 800 1000 1300 Производительность (32 бита), Гфлопс 4,8 8 28 50 24 250 Производительность (64 бита), Гфлопс 2,4 4 8 25 12 125 Потребляемая мощность, Вт 6 20 25 45 10 80 Команд на 1 такт 23 23 23 23 25 25 Кэш уровня 1, кбайт (данные + команды) – – – – 64 + 128 (64 + 128)/ядро Кэш уровня 2, Мбайт 0,25 2 2 8 2 4 0,512/ядро Кэш уровня 3, Мбайт – – – – – 16 Тип встроенного контроллера памяти – DDR2-500 DDR2-800 DDR3-1600 DDR3-1600 DDR3-1600 Количество каналов обмена с памятью – 1 1 3 2 4 Пропускная способность шины памяти, Гбайт/с 4,8 8 12,8 38,4 25,6 51,2 Площадь кристалла, мм 2 189 142 289 380 122 321 Число транзисторов, млн 75,8 218 368 986 375 2730 Число слоёв металла 8 9 9 9 – – Тип корпуса HFCBGA 900 HFCBGA 1156 HFCBGA 1296 HFCBGA 1600 HFCBGA 1156 FCBGA 2028 Максимальное число ядер в системе с общей памятью (прямое соединение) 2 4 8 16 – 32 Максимальное число ядер в системе с общей памятью (через чип-коммутатор) – 16 32 64 – – Каналы межпроцессорного обмена ccLVDS 0 3 3 3 – 3 Пропускная способность одного канала ccLVDS, Гбайт/с – 4 4 12 – 16 Пропускная способность канала ioLVDS, Гбайт/с – 2 2 4 – – Комплексирование машин через каналы RDMA До 2 До 4 До 4 До 4 – – Пропускная способность канала ввода-вывода/ RemoteDMA, Гбайт/с 2 2 2 4 – – Южный мост На базе FPGA КПИ* КПИ КПИ КПИ2 КПИ2 Таблица 1 Технические характеристики процессоров с архитектурой «Эльбрус» *КПИ – контроллер периферийных интерфейсов.

RkJQdWJsaXNoZXIy MTQ4NjUy