ЖУРНАЛ «СТА» 4/2018

системных архитектур. Например, NVIDIA предоставляет два набора спе- цификаций для своего графического процессора Tesla V100, в зависимости от того, использует ли хост-система под- ключение шины NVLink или PCI Express. С PCIe процессор V100 макси- мально потребляет мощность в 250 Вт, но эта мощность обеспечивает 7 Тфлопс производительности в тестах с двойной точностью или 112 Тфлопс при Deep Learning (глубоком обучении). Напро- тив, с шиной NVLink максимальная по- требляемая мощность V100 равна 300 Вт, но NVLink обеспечивает более высокую пропускную способность и меньшую задержку и, следовательно, имеет бо- лее высокую эффективность. Сегодня серверные архитектуры Intel, распро- странённые в приложениях обработки сигналов, допускают между процессо- ром и графическим процессором толь- ко интерфейс PCI Express, поэтому дан- ная модель и доминирует над более со- временными решениями. Тем не менее, независимо от специфики соотноше- ние мощности/производительности ос- таётся ключевым фактором при выборе платформы GPGPU (General-Purpose Computing for Graphics Processing Units – графические процессоры общего на- значения). З АЧЕМ БОЛЬШИЕ МОЩНОСТИ ДЛЯ ОБРАБОТКИ ? Потребляемая мощность также предъявляет требования к размерам платформ. В полевых условиях, напри- мер при проведении боевых операций (рис. 1), всё чаще ключевым фактором становятся возможности средств управ- ления, контроля, связи, сбора и ком- пьютерной обработки, разведки и на- блюдения (C4ISR – Command, Control, Communications, Computers, Intelli- gence, Surveillance and Reconnaissance), которые устанавливаются в транспорт- ные средства, начиная от самолётов и кончая беспилотниками. Требования к гибкости и мобильности становятся определяющими при полевых опера- циях, а крупногабаритные стационар- ные системы с электрогенераторами быстро уступают место малым форм- факторам (SFF – Small Form Factor), решениям с автономным питанием от батарей, которые можно разместить под сиденьем. Встроенные платформы ста- новятся нормой, но они должны быть в состоянии обеспечить выполнение тре- бований к производительности при анализе сигналов. Вместе с тем корпуса с меньшим размером сталкиваются с большими проблемами при рассеива- нии тепла компонентов из-за более вы- соких вычислительных нагрузок. Из-за отсутствия места под вентиляторы ос- новными конструкциями, которые мо- гут противостоять пыли, ударам и виб- рациям в полевых условиях, становятся системы пассивного охлаждения. Обычно при обработке сигналов на поле боя делается выбор: либо проведе- ние анализа на месте с учётом ограниче- ний полевых систем, либо отправка дан- ных в более мощные централизованные системы, расположенные далеко от зо- ны действий, что создаёт задержки в об- работке. Оба подхода активно разви- ваются по мере появления более совре- менных сенсорных систем. Рассмотрим электрооптические и инфракрасные (EO/IR – Electro-Optic/Infrared) реше- ния, такие как датчик изображения WXCAMMX-25D для систем целеуказа- ния. MX-25D включает до девяти датчи- ков, обеспечивающих тепловое наведе- ние, оптическое увеличение, HD-съём- ку в условиях низкой освещённости и лазерную систему слежения. Объём дан- ных, получаемых с этого устройства, яв- ляется существенным, но не стоит забы- вать, что используются камеры с разре- шением 720p и 1080p. Представьте себе загрузку данных с датчиков следующего поколения, поддерживающих 4K-визуа- лизацию или 360-градусные системы па- норамной съёмки для виртуальной ре- альности, которые могут включать в се- бя более десятка камер. В зависимости от приложения и ситуации несколько та- ких сенсорных кластеров могут быть объединены в общий пул данных для анализа, что многократно увеличивает нагрузку на вычислительную систему. П ОЧЕМУ GPGPU – ЛУЧШЕЕ РЕШЕНИЕ ? Выбираемые процессоры должны справляться с большим потоком дан- ных, но тип и количество применяемых процессоров могут различаться по про- изводительности и влиять на жизнеспо- собность решения. В целом процессоры для таких задач делятся на три группы. ● Центральные процессоры (ЦП) , также известные как процессоры общего назначения (GPP – General Purpose Processor). В серверных системах дол- гое время доминировало семейство процессоров Intel ® Xeon ® . Эти про- цессоры преуспевают в решении ши- рокого круга проблемно-ориентиро- ванных или произвольных задач. ● Графические процессоры общего назна- чения (GPGPU – General-Purpose Computing for Graphics Processing Units), появившиеся в 1970-х годах для поддержки компьютерных игр. В начале 2000-х NVIDIA, а затем ATI разработали методы для запуска не- больших программ на GPU для вы- числений отдельных пикселей. Это быстро превратилось в параллельную обработку потока на множестве логи- ческих ядер в графическом процессо- ре. В 2007 году компания NVIDIA представила свою архитектуру про- граммирования CUDA, чтобы дать разработчикам простой и эффектив- ный доступ к вычислениям общего назначения на базе GPU (GPGPU), которые обеспечили бы в несколько раз более высокую производитель- ность для многих распараллеливае- мых функций по сравнению с тем, что могли предоставить процессоры общего назначения. ● Программируемая логическая интег- ральная схема (FPGA), предназначен- ная для конфигурирования клиента- ми или интеграторами (то есть про- граммируется пользователем интег- ральной схемы). Многие логические блоки в FPGA могут выполнять слож- ные комбинированные функции, позволяя им эффективно решать практически любую задачу. FPGA мо- гут быть чрезвычайно эффективными для конкретных вычислительных за- дач, включая параллельные опера- ции, но они по-прежнему относи- тельно сложны в программировании, а разработка приложений на их базе имеет более долгие сроки, чем на ба- зе процессоров общего назначения или GPGPU. Все три типа процессоров широ- ко используются в ответственных при- ложениях, но для обработки и анали- за сигналов в реальном времени ре- шения на GPGPU предлагают наилуч- шее соотношение цены и возмож- ностей. К преимуществам относятся: ● высокая пропускная способность ви- деопамяти, что делает скорость обра- ботки сложных задач близкой к ско- рости работы основного процессора; ● сравнительно высокая производи- тельность вычислений с плавающей запятой; ● многоядерная архитектура, в кото- рой большинство чипов является вычислительными устройствами, а не кэш-памятью, что дополнительно ОБ ЗОР / АППА РАТ НЫЕ С Р Е ДС Т В А СТА 4/2018 39 www.cta.ru

RkJQdWJsaXNoZXIy MTQ4NjUy