ЖУРНАЛ СТА 3/2020

По оценке Bloomberg, мировой ры- нок распознавания лиц вырастет с $4,05 млрд в 2017 году до $7,76 млрд к 2022 году. На рис. 1 приведены сведения (с прогнозом развития) о годовом дохо- де от технологий распознавания лиц на мировом рынке по регионам, основан- ные на данных исследовательской ком- пании Omdia/Tractica. К АК РАБОТАЕТ СИСТЕМА РАСПОЗНАВАНИЯ ЛИЦ ? В принципе, система распознавания лиц может быть описана как процесс сопоставления лиц, попавших в объ- ектив камеры, с базой данных ранее со- хранённых и идентифицированных изображений лиц-эталонов. Можно выделить три распространён- ные схемы структурной реализации си- стемы распознавания лиц. 1. Наиболее распространённая схема реализации: IP-камера передаёт ви- деопоток на сервер, где специализиро- ванное программное обеспечение вы- полняет анализ видеопотока (рис. 2) и сравнение полученных из видеопото- ка изображений лиц с базой лиц-эта- лонов. Недостатки: высокие нагрузки на сеть и стоимость сервера. Даже к самому мощному серверу можно подключить ограниченное количество IP-камер, то есть чем масштабнее система, тем больше требуется серверов. Преимущество: возможность исполь- зовать уже существующую систему видеонаблюдения. 2. На рис. 3 показан случай, когда ана- лиз изображения производится в са- мой камере, а на сервер передаются обработанные метаданные. Недостатки: нужны специальные ка- меры, выбор которых в данный мо- мент не столь широк, как обычных IP-камер, и их стоимость существен- но выше. В системах различных про- изводителей будет по-разному ре- шаться вопрос хранения и размера базы данных распознанных лиц-эта- лонов, а также вопрос взаимодей- ствия ПО камеры и сервера. Преимущество: подключение практи- чески неограниченного количества камер к одному серверу. 3. В отличие от первых двух схем, где используются IP-камеры, в данном случае камера встроена в устройство контроля доступа (рис. 4), которое кроме распознавания лица выпол- няет функции управления доступом через турникет или электромеханиче- ский замок, установленный на двери. База данных лиц-эталонов хранится на устройстве и, как правило, уже не в виде фотоизображений. Само же рас- познавание происходит непосред- ственно на устройстве. Недостатки: как правило, все такие устройства выпускаются для исполь- зования в помещениях. Преимущество: низкая стоимость си- стемы по сравнению с системами ви- деонаблюдения, используемыми для распознавания лиц. В любом случае успех реализации проектов по распознаванию лиц зави- сит от трёх важных факторов: ● качества и быстродействия алгоритма распознавания лиц; ● качества и полноты базы данных рас- познанных лиц (эталонов); ● быстродействия устройства. Т ЕХНОЛОГИЯ РАСПОЗНАВАНИЯ ЛИЦ Как правило, система состоит из ка- меры видеонаблюдения и программно- го обеспечения, которое выполняет анализ изображений. Программное обеспечение распоз- навания лиц основано на обработке изображений и вычислениях сложных математических алгоритмов, для кото- рых требуется более мощный сервер, чем для обычных систем видеонаблю- дения. 2D-распознавание лиц В основе технологии 2D – двухмер- ного распознавания лиц – лежат плос- кие двухмерные изображения. Алгорит- мы распознавания лиц используют антропометрические параметры лица, графы – модели лиц или эластичные 2D-модели лиц, а также изображения с лицами, представленные некоторым набором физических или математиче- ских признаков. Распознавание 2D-изображений – одна из наиболее востребованных тех- нологий на данный момент, так как ос- новные базы данных идентифициро- ванных лиц, накопленные в мире, со- держат именно двухмерные изображе- ния. И основное оборудование, уже установленное по всему миру, тоже ори- ентировано на технологию 2D. Именно поэтому основной спрос приходится на 2D-системы распознавания лиц. Преимущества: наличие готовых баз данных лиц-эталонов и готовой инфра- структуры является огромным преиму- ществом 2D-распознавания лиц. Мак- симальный спрос придётся именно на этот сегмент, и он будет стимулировать разработчиков совершенствовать тех- нологии. Недостатки: более высокие коэффи- циенты ошибок FAR и FRR по сравне- нию с 3D-распознаванием лиц. FAR (False Acceptance Rate) и FRR (False Rejection Rate) характеризуют соответ- ОБ ЗОР / Т Е Х НОЛОГ ИИ СТА 3/2020 Рис. 2. Вариант анализа видеопотока на сервере Рис. 3. Вариант анализа видеопотока в IP-камере Рис. 4. Вариант анализа видеопотока на устройстве контроля доступа 13 www.cta.ru Видеопоток Сервер IP-камера Метаданные Сервер IP-камера Метаданные Сервер Устройство контроля доступа

RkJQdWJsaXNoZXIy MTQ4NjUy