На чем основаны современные технологии распознавания лиц

Сейчас существует огромное множество систем распознавания лиц, начиная от технологий локализации лиц в смартфоне и заканчивая сложными системами, способными найти человека в толпе. В этой статье поговорим о том, на каких принципах основаны современные системы распознавания лиц.

Чтобы объяснить, как искусственный интеллект распознает лица, нужно сказать, каким образом сами люди отличают лица друг друга. То, каким образом взгляд человека перемещается, рассматривая лицо, выглядит следующим образом. 

По этому рисунку видно, что человек сначала видит весь образ в целом, затем идентифицирует отдельные части — глаза, нос, подбородок, лоб, уши, выделяет особенности лица и различия, и только после этого воспринимает целостный образ и узнает человека.

В разговоре человек то фокусирует внимание на одной части, при этом остальные детали воспринимаются хуже, то снова видит весь объект в целом. 

Рис. 1. Стабилизированные образы обычно угасают.

Остающиеся видимые части профиля – это всегда осмысленные элементы или группы элементов (лицо, верхняя половина лица и т. д.)

Тем не менее, человеческий мозг воспринимает изображение стабильным и постоянным, несмотря на движение глаз и тела смотрящего и движения рассматриваемых объектов. 

Исходя из этого, можно выделить следующие этапы распознавания человеческого лица компьютером: выделение признаков, предварительный анализ, выдвижение гипотезы, проверка гипотезы (сличение изображений с эталоном, взятым из памяти). 

Способы распознавания лиц в целом

Существует несколько способов распознавания лиц. Первый способ — геометрическое сравнение, основанное на распознавании элементов лица. В этом случае даже несмотря на незначительные различия между элементами лица, общее изображение будет верно распознано как лицо человека. 

Второй способ — эталонное сравнение. Изображение, представленное в виде массива байтов, сравнивается с эталоном (стандартным лицом).Несколько эталонов используются для распознавания объектов в разных ракурсах. 

Третий подход — когда лицо представлено в виде набора малых эталонов.

Более комплексным методом является использование одного эталона совместно с деформируемой базовой моделью лица, которая позволяет оценить трансформацию распознаваемого лица при изменении ракурса наблюдения.

То есть сначала компьютер путем эталонного сравнения идентифицирует элементы лица (глаза, нос, рот) на изображении, и уже потом нормализует изображение по масштабу и ориентации в пространстве. 

Еще один способ распознавания лиц основан на использовании нейронных сетей. Благодаря большому объему данных нейронные сети способны распознать лицо человека в разных ракурсах и положениях. Однако такой метод эффективен только для распознавания определенного (ограниченного) набора лиц