СТА №3/2017

В гетерогенной системе при обработ- ке каждого типа потока данных можно выбрать наиболее эффективную архи- тектуру. Например, для реализации ря- да специальных прикладных алгорит- мов или предварительной обработки не- стандартных данных целесообразно ис- пользовать вычислитель на базе ПЛИС, для стандартной обработки видеопото- ков – вычислители на базе графических процессоров, для решения задач конт- роля и принятия решений – вычисли- тель с центральным процессором. Платформу ГРИФОН выгодно отли- чает от аналогов возможность построе- ния на её базе параллельно-конвейер- ной системы за счёт поддержки между вычислителями соединений типа «точ- ка–точка» через PCI Express-коммута- тор. Богатый аппаратный состав плат- формы и гетерогенность её вычисли- тельной среды позволяют достаточно эффективно и быстро организовать па- раллельно-конвейерную обработку. Идея использования гетерогенных вы- числительных конвейеров заключается в выстраивании процесса обработки данных в цепочку. На каждом этапе та- кой цепочки (участке конвейера) с дан- ными работает вычислитель с опти- мальной для данного этапа аппаратной архитектурой. Своевременная загрузка конвейера новыми данными без на- кладных расходов на их пересылку поз- воляет организовать одновременную и слаженную работу всех вычислитель- ных модулей. Механизмы параллельно-конвейер- ной обработки являются признанным классическим методом повышения бы- стродействия систем обработки дан- ных, и если структура данных и алго- ритм позволяют распараллеливать зада- чу, это почти всегда повышает эффек- тивность такой обработки. Р ЕШЕНИЕ ЗАДАЧИ КОМПЬЮТЕРНОГО ЗРЕНИЯ Постановка задачи Рассмотрим возможность организа- ции параллельно-конвейерной обра- ботки данных на платформе ГРИФОН на примере системы обработки видео высокого разрешения. Постановку за- дачи можно сформулировать следую- щим образом – требуется: ● в режиме реального времени прини- мать данные от двух камер разреше- нием 1920 × 1080; ● провести предварительную обработ- ку кадров при приёме; ● применить к видеопотокам алгорит- мы фильтрации и компьютерного зрения (поиск лиц, детектор движе- ния, фильтр Собеля); ● отобразить полученный результат на мониторах; ● сжать видео кодеком MPEG-4; ● записать в режиме реального времени сжатое видео на жёсткий диск. Состав вычислителя Для решения поставленной задачи в состав гетерогенного вычислителя на- ми были включены: ● модуль центрального процессора CPC510, работающий под управлени- ем Linux Ubuntu 14.04; ● модуль ПЛИС FPU500 с мезонинным модулем ввода TB-FMCH-3GSDI2A; ● модуль графического процессора VIM556; ● модуль-носитель HDD-накопителя KIC550 (табл. 1). Организация взаимодействия между модулями вычислителя Последовательность операций, кото- рые требуется провести над видеопото- ками, можно организовать в виде неза- висимо работающего конвейера. Ви- деопотоки удобно обрабатывать в неза- висимо работающих параллельных кон- вейерах (рис. 1). Основная нагрузка по обработке дан- ных при этом ложится на модули FPU500 на базе ПЛИС и VIM556 на ба- зе графического процессора. Модуль центрального процессора CPC510 вы- даёт только управляющие команды и не задействован непосредственно в обра- ботке данных, что существенно снижа- ет его загрузку, высвобождая ресурсы для выполнения других функций. Каждый построенный для решения настоящей задачи конвейер включает в себя: ● блок управления входными данными, реализованный на модуле ПЛИС FPU500; ● графическую видеокарту VIM556; ● набор управляющих программных потоков, выполняющихся на процес- сорном модуле CPC510. Блок управления входными данными на ПЛИС написан на языке VHDL, в нём можно выделить следующие основ- ные части: блок приёма данных по про- токолу 3G-SDI и их преобразования из формата YUV422 в формат YUV420, блок контроля и управления кольцевым РАЗ РА БОТ КИ / КОН Т РОЛ Ь НО - ИЗМЕ Р И Т Е Л Ь НЫЕ СИС Т ЕМЫ 83 СТА 3/2017 www.cta.ru Таблица 1 Аппаратный состав гетерогенного вычислителя для обработки видео высокого разрешения Наименование Описание Производитель Внешний вид CPC510 Модуль центрального процессора (Intel i7-3555LE 2,5 ГГц, 8 Гбайт ОЗУ DDR3L) ЗАО НПФ «Доломант» FPU500 Модуль реконфигурируемого процессора на базе ПЛИС Xilinx Virtex-6 с ОЗУ ёмкостью 4 Гбайт ЗАО НПФ «Доломант» VIM556-01 Модуль графического процессора (графическая карта NVIDIA Quadro K2100M, 2 Гбайт ОЗУ) ЗАО НПФ «Доломант» KIC550 Модуль-носитель HDD-накопителя ЗАО НПФ «Доломант» TB-FMCH-3GSDI2A Мезонинный модуль ввода Texas Instruments Компактная трансляционная камера Full-HD Marshall CV360-CGB (Full HD 1920 × 1080p) Marshall

RkJQdWJsaXNoZXIy MTQ4NjUy