Статистика алгоритма обнаружения лиц на основе HOG

Проведено исследование алгоритма обнаружения лиц на основе гистограмм направленных градиентов (HOG) библиотеки dlib на 10000 размеченных изображений базы Megaface для определения количества ошибок второго рода (ложных отрицательных срабатываний) и причин их возникновения.

Количество ошибок второго рода составило 3251 (~32,5%). Большая часть ошибок допущена на снимках в естественных условиях (Wild Faces) и изображениях малого размера.

Ведется первая доработка алгоритма, нацеленная на преодоление ограничения по размеру лица путем увеличения изображения.

 

Основные причины ошибок:



1. Малый размер лица. Согласно описанию разработчиков детектор dlib нечувствителен к лицам, размер которых составляет менее 40х40 точек (face_detection_ex.cpp). Количество ошибок ~15% от общего количества протестированных изображений.

Не распознанное лицоНе распознанное лицо 1Не распознанное лицо 1Не распознанное лицо 1Не распознанное лицоНе распознанное лицо 1Не распознанное лицо 1Не распознанное лицо 1

2. Изображение лица в профиль. Детектор настроен на фронтальное положение лица в кадре и для снимка в профиль не находит требуемых признаков. Количество ошибок ~10% от общего количества протестированных изображений.

Не распознанное лицо 1Не распознанное лицо 1Не распознанное лицо 1Не распознанное лицо 1Не распознанное лицо 2Не распознанное лицо 1Не распознанное лицо 1Не распознанное лицо женщины

3. Голова наклонена вниз. На снимке не видны глаза и изменены пропорции лица. Количество ошибок ~0.1% от общего количества протестированных изображений.

Не распознанное лицо - голова внизНе распознанное лицо - голова внизНе распознанное лицо - голова внизНе распознанное лицо - голова внизНе распознанное лицо - голова вниз

4. Размытие изображения от движения объекта (motion blur) и расфокусировка при съемке. Размытое изображение лица не дает четких откликов. Количество ошибок ~0.5% от общего количества протестированных изображений.

Не распознанное лицо на размытом снимкеНе распознанное лицо на размытом снимкеНе распознанное лицо на размытом снимкеНе распознанное лицо на размытом снимке

Не распознанное лицо на размытом снимкеНе распознанное лицо на размытом снимкеНе распознанное лицо на размытом снимке

5. Лицо расположено близко к краю кадра или частично перекрыто другими объектами. Отсутствие полного изображения лица не позволяет сформировать однозначный отклик. Количество ошибок ~4% от общего количества протестированных изображений.

Не распознанное лицо на краю изображенияНе распознанное лицо на краю изображенияНе распознанное лицо на краю изображенияНе распознанное лицо на краю изображенияНе распознанное лицо на краю изображенияНе распознанное лицо на краю изображенияНе распознанное лицо на краю изображенияНе распознанное лицо на краю изображения

6. Изображения детей. Расположение ключевых точек (landmarks) лица детей отличаются от таковых у взрослых, следовательно, детектор HOG, настроенный на изображения взрослых, не реагирует на них. Количество ошибок ~1,5% от общего количества протестированных изображений.

Не распознанное лицо ребенкаНе распознанное лицо ребёнкаНе распознанное лицо ребёнкаНе распознанное лицо ребёнка

7. Очки, головной убор, грим на лице, прическа, частично закрывающая лицо. Количество ошибок ~0,1% от общего количества протестированных изображений.

Не распознанное лицо с очкамиНе распознанное лицо с очкамиНе распознанное лицо с очкамиНе распознанное лицо с очкамиНе распознанное лицо с очкамиНе распознанное лицо с очкамиНе распознанное лицо с аквагримомНе распознанное лицо чёрно-белое, частично закрытое

8. Зашумленное изображение из-за низкого разрешения датчика, съемки при слабой освещенности, сканирования изображения с бумажного носителя. Количество ошибок ~0,5% от общего количества протестированных изображений.

Не распознанное лицо назашумленном изображенииНе распознанное лицо назашумленном изображенииНе распознанное лицо назашумленном изображенииНе распознанное лицо назашумленном изображенииНе распознанное лицо назашумленном изображенииНе распознанное лицо назашумленном изображенииНе распознанное лицо назашумленном изображенииНе распознанное лицо назашумленном изображении

9. Особенности освещения лица, сочетание света и тени. Количество ошибок <0,01% от общего количества протестированных изображений.

Не распознанное лицо пересвеченный высококонтрастный снимокНе распознанное лицо пересвеченный высококонтрастный снимокНе распознанное лицо пересвеченный высококонтрастный снимок

Большая часть нераспознанных изображений сочетает в себе совокупность перечисленных причин. 

 

КодЛикс разрабатывает программное обеспечение обработки изображений, систем технического зрения, искусственный интеллект и нейросети. Мы создаём программное обеспечение любой сложности под ключ и с гарантией.