Исследование нейросетевого алгоритма обнаружения лиц
- Информация о материале
- Опубликовано: 17.09.2018, 13:00
Проведено исследование алгоритма обнаружения лиц на основе сверточной нейронной сети, реализованного в библиотеке dlib, на базе изображений Megaface (1 027 060 снимков). Алгоритм доработан для автоматического масштабирования распознаваемых изображений в следующих случаях:
– при малых размерах снимка, он увеличивается до размера в 300 или более точек по ширине или высоте для преодоления ограничения нейросетевого алгоритма на минимальный размер лица в 40х40 точек;
– при размерах снимка, превосходящих 1500 точек, он уменьшается для размещения всех необходимых для функционирования алгоритма данных в памяти графического ускорителя (для эксперимента использован GeForce 1050 2Gb).
Данный алгоритм продемонстрировал значение ошибки второго рода в 0,82% (лица не найдены лишь на 8466 снимков) и на настоящий момент является искомым state-of-the-art решением задачи обнаружения лиц.
Ведется анализ обработанных снимков для выявления причин ошибок второго рода. Часть изображений, не распознанных алгоритмом, будут использованы для его дообучения и повторного исследования на базе Megaface.
Некоторые примеры необнаруженных лиц приведены ниже:
Исследование алгоритма будет продолжено на базах MF2 и возрастно-инвариантной FGNET.
КодЛикс разрабатывает программное обеспечение обработки изображений, систем технического зрения, искусственный интеллект и нейросети. Мы создаём программное обеспечение любой сложности под ключ и с гарантией.