Построение дескриптора и верификация лица

Заключительным и наиболее важным компонентом системы распознавания лиц (III и IV элементы) является алгоритм создания дескриптора, который для переданного на вход изображения лица конструирует вектор в 128-мерном пространстве, являющийся одновременно ключом для выборки лиц в базе изображений и основой для расчета меры схожести двух лиц.

Проведены исследования предобученного нейросетевого алгоритма, реализованного в библиотеке dlib. Алгоритм построен на основе сети ResNet34, обученной на 3 млн. снимков. Лицо на входном изображении должно быть нормализовано: центрировано и повернуто так, чтобы линия глаз совпадала с осью абсцисс, а линия носа – с осью ординат, само же изображение должно иметь размер 150х150 точек, что достигается с помощью исследованного ранее алгоритма выделения ключевых точек.

Нормирование изображения лица перед передачей в нейросеть

В результате нормализации для каждого человека формируется набор изображений, аналогичный приведенному ниже.

Примеры нормализованных изображений лиц

Алгоритм построения дескриптора лица протестирован с помощью базы портретных снимков знаменитостей FaceScrub, которая может служить моделью системы биометрического доступа (530 человек, 60-300 снимков на человека, всего 105661 изображениe). Эксперимент организован следующим образом: для каждого из 530 человек случайным образом выбрано от 1 до 7 эталонных снимков (обучающая выборка), которые использованы для верификации оставшихся изображений. Алгоритм использован в сочетании с kNN классификатором для определения принадлежности описываемого дескриптором лица определенному человеку. Ниже приведена диаграмма зависимости корректно верифицированных изображений лиц, а также ошибок первого и второго рода.

Диаграмма зависимости корректно верифицированных изображений лиц, а также ошибок первого и второго рода

В результате для 7 эталонных изображений, что составляет 2,5-12% обучающей выборки, ошибка составила менее 6%, что является хорошим результатом.

Описанный эксперимент не завершен. Всего планируется использовать от 1 до 25 эталонных изображений, а также реализовать другие алгоритмы классификации, после чего выполнить эксперимент на «Faces in the wild» и возрастно-переменных базах снимков.

Список источников

He, K., Zhang, X., Ren, S., & Sun, J. (2016). Deep residual learning for image recognition. In Proceedings of the IEEE conference on computer vision and pattern recognition (pp. 770-778).

 

КодЛикс разрабатывает программное обеспечение обработки изображений, систем технического зрения, искусственный интеллект и нейросети. Мы создаём программное обеспечение любой сложности под ключ и с гарантией.