ЖУРНАЛ СТА 3/2019

архитекторы применяют AI для обра- ботки широкого спектра входных дан- ных, таких как видео, текст, голос, изоб- ражения и данные от датчиков. При этом они должны выбрать наилучший из методов принятия решений, реали- зуемых различными алгоритмами глубо- кого обучения (например, TensorFlow, Torch и Caffe) и нейросетевыми алго- ритмами (например, рекуррентными и свёрточными) с различным числом слоёв. Конкретные комбинации ней- ронных сетей и программных пакетов, работающих на специализированных вычислительных ядрах, подходят для ре- шения определённых задач, таких как обработка изображений, распознавание символов и классификация объектов. Многие рабочие алгоритмы AI тре- буют большого объёма памяти, парал- лельных вычислений и вычислений с низкой точностью [1]. Задача систем- ных архитекторов состоит в том, чтобы определить оптимизированную плат- форму для AI, которая бы сочетала эко- номическую эффективность с достаточ- ными вычислительными ресурсами, удовлетворяющими требованиям ско- рости и точности. При разработке плат- форм для решений «на грани» систем- ные архитекторы должны учитывать до- полнительные требования, такие как надёжность оборудования и строгие SWaP-ограничения. ADLINK ПРЕДЛАГАЕТ ПЛАТФОРМУ При проектировании платформы AI системным архитекторам следует рас- смотреть возможность использования гетерогенной вычислительной архитек- туры, содержащей несколько типов ядер, включая CPU, GPU, FPGA и ASIC. Цель такого подхода состоит в распределении рабочих нагрузок AI между наиболее подходящими для это- го ядрами, что приводит к более быст- рым вычислениям и меньшему энерго- потреблению при реализации конкрет- ных функций по сравнению с однород- ной платформой. Разработка такой платформы на практике является более сложной зада- чей, но ADLINK упрощает процесс проектирования, предлагая гетеро- генные платформы, представляющие собой своеобразный конструктор из базовых платформ (рис. 1). Системные архитекторы могут настраивать плат- формы ADLINK в соответствии с вы- числительными потребностями задач AI, что сокращает их усилия по разра- ботке и обеспечивает масштабируемое решение. С РАВНЕНИЕ ОСНОВНЫХ ТИПОВ ЯДЕР Далее приводится краткий обзор не- которых сильных сторон и ограничений для разных типов ядер, используемых при обработке задач AI. Дополнитель- ная информация представлена в табл. 1. ОБ ЗОР / Т Е Х НОЛОГ ИИ СТА 3/2019 Аппаратные ускорители Интерфейс памяти Ядро RISC Ядро RISC Массив векторных процессоров Интерфейсы VPU GPU Шина DMI PCIe PCIe USB Ethernet Интерфейс процессора FPGA Последовательные и параллельные рабочие задачи Параллельная обработка данных CPU Контроллер DDR3 L2-кэш L2-кэш Ядро процессора UNB Канал GMCH Ядро процессора 15 www.cta.ru Условные обозначения: UNB – унифицированный северный мост; GMCH – центр управления графикой и памятью; CPU – центральный процессор; GPU – графический процессор; FPGA – программируемая вентильная матрица; VPU – процессор обработки зрительных образов. Рис. 1. Гетерогенная платформа ADLINK для систем искусственного интеллекта Тип ядра Специализи- рованные ASIC Типовое энерго- потребление Описание Сильные стороны Ограничения CPU Высокое Гибкие универсальные процессоры • Сложные инструкции и задания • Управление системой • Возможные узкие места доступа к памяти • Немного ядер (4–16) GPU Высокое Параллельные ядра для высококачественного рендеринга графики • Высокопроизводительная обработка задач AI • Высокопараллельное ядро со 100 или 1000 ядрами • Высокое энергопотребление • Большие габариты FPGA Среднее Конфигурируемые логические элементы • Гибкость • Перепрограммируемость в полевых условиях • Высокое энергопотребление • Сложность программирования ASIC Низкое Индивидуальная логика на основе специализированных библиотек • Быстрая работа и низкое энергопотребление • Малые габариты • Ограниченная функциональность • Дорогой индивидуальный дизайн VPU Сверхнизкое Процессор обработки изображений и искусственного зрения • Низкая потребляемая мощность и небольшие габариты • Процессор предназначен для ускорения обработки изображений • Ограниченный набор данных и их комбинаций • Ограниченная поддержка сети TPU От среднего до низкого Специализированная интегральная схема ASIC, разработанная Google • Специализированная поддержка инструмента • Процессор оптимизирован для TensorFlow • Уникальный дизайн • Очень ограниченная поддержка фреймворка Таблица 1 Сравнение типов ядер, применяемых для решения задач AI