Исследование алгоритмов обнаружения лиц
- Информация о материале
- Опубликовано: 31.08.2018, 19:09
Специалистами ООО «КодЛикс» начато исследование алгоритмов обнаружения лиц на изображениях с обязательным функционированием на «Wild Faces» – снимках в «естественных» условиях:
– различные позы
– размеры лица на снимке
– повороты в пространстве и в плоскости кадра
– количество лиц в кадре
– снимки похожих на лица объектов (как визуально, так и специфичные для определенных методов обнаружения)
– расфокусировка, размытие при движении или низкое качество изображения.
Целью исследования является определение доступного state-of-the-art алгоритма обнаружения, который позволит находить более 95% лиц на тестовых изображениях, а также определение его недостатков и направлений дальнейшего совершенствования.
Для тестирования будут использованы следующие базы изображений (доступны на http://megaface.cs.washington.edu):
– Megaface (~1 млн. снимков, wild faces, снимки объектов, похожих на лица)
– MF2 (~4,7 млн. снимков 672 тыс. человек, wild faces)
– FGNet (2 979 снимков, 82 человека в разном возрасте)
– FaceScrub (100 тыс. снимков, 530 человек портретная съемка знаменитостей).
Первым объектом исследования является классический алгоритм обнаружения лиц на основе гистограмм направленных градиентов (Histograms of Oriented Gradients, HOG).
Алгоритм реализован в библиотеке dlib (Boost Software License) в виде класса frontal_face_detector (face_detection_ex.cpp).
Для оценки качества функционирования будут использованы следующие критерии точности:
– количество ошибок первого рода (ложных положительных срабатываний) для изображений, не содержащих лиц;
– количество ошибок второго рода (ложных отрицательных срабатываний).
В настоящее время ведется эксперимент на базе Megaface, результаты обнаружения представлены ниже. Красной рамкой показаны обнаруженные с помощью детектора лица, синей – эталонная разметка.
Успешное обнаружение
Ошибки первого рода (ложные положительные срабатывания)
Ошибки второго рода (ложные отрицательные срабатывания)
В настоящее время ведется расчет статистики на выборке в 10 тыс., подсчет количества ошибок второго рода (ложных отрицательных срабатываний) и определение причин их возникновения.
Ссылки
Детектор лиц на основе HOG:
Albiol, Alberto, et al. "Face recognition using HOG–EBGM" Pattern Recognition Letters 29.10 (2008): 1537-1543.
Тестовые базы снимков:
1. "The MegaFace Benchmark: 1 Million Faces for Recognition at Scale", Ira Kemelmacher-Shlizerman, Steve Seitz, Daniel Miller, Evan Brossard, IEEE Conference on Computer Vision and Pattern Recognition (CVPR), 2016
2. Aaron Nech and Ira Kemelmacher-Shlizerman,"Level Playing Field for Million Scale Face Recognition", IEEE Conference on Computer Vision and Pattern Recognition (CVPR) 2017
КодЛикс разрабатывает программное обеспечение обработки изображений, систем технического зрения, искусственный интеллект и нейросети. Мы создаём программное обеспечение любой сложности под ключ и с гарантией.