Исследование нейросетевого алгоритма обнаружения лиц

Проведено исследование алгоритма обнаружения лиц на основе сверточной нейронной сети, реализованного в библиотеке dlib, на базе изображений Megaface (1 027 060 снимков). Алгоритм доработан для автоматического масштабирования распознаваемых изображений в следующих случаях:
– при малых размерах снимка, он увеличивается до размера в 300 или более точек по ширине или высоте для преодоления ограничения нейросетевого алгоритма на минимальный размер лица в 40х40 точек;
– при размерах снимка, превосходящих 1500 точек, он уменьшается для размещения всех необходимых для функционирования алгоритма данных в памяти графического ускорителя (для эксперимента использован GeForce 1050 2Gb).

Данный алгоритм продемонстрировал значение ошибки второго рода в 0,82% (лица не найдены лишь на 8466 снимков) и на настоящий момент является искомым state-of-the-art решением задачи обнаружения лиц.

Ведется анализ обработанных снимков для выявления причин ошибок второго рода. Часть изображений, не распознанных алгоритмом, будут использованы для его дообучения и повторного исследования на базе Megaface.

Некоторые примеры необнаруженных лиц приведены ниже:

Обнаруженное лицо мальчика в маске Обнаруженное лицо в профильОбнаруженное лицо за помехамиОбнаруженное лицо при размытииОбнаруженное лицо при пересветеОбнаруженное лицо на втором плане

Исследование алгоритма будет продолжено на базах MF2 и возрастно-инвариантной FGNET.

КодЛикс разрабатывает программное обеспечение обработки изображений, систем технического зрения, искусственный интеллект и нейросети. Мы создаём программное обеспечение любой сложности под ключ и с гарантией.