Новый патент Apple описывает технологию определения лиц на изображении


Во вторник, 7 марта, Apple получила патент, описывающий технологию определения на видеозаписи человеческих лиц при помощи информации о глубине изображения. Эта разработка может быть одним из шагов к новой биометрической системе аутентификации по лицу в iPhone 8, о которой ходит так много слухов.

Документ называется «Улучшенная система распознавания лиц на основе данных о глубине изображения». Он раскрывает детали технологии компьютерного зрения, решающей задачи обнаружения и определения объектов, в частности, человеческих лиц.

Это изобретение является частью патентов, приобретенных Apple вместе с израильской компанией PrimeSense, специализирующейся на технологии motion capture. Целый поток разработок PrimeSense прошел через Ведомство по патентам и товарным знакам США в прошедшие годы, включая 3D-маппинг, виртуальную 3D-клавиатуру и многое другое.

Как отмечено в патенте, алгоритмы распознавания строятся на программном обеспечении, которое умеет сканировать изображение и вычислять участок, или «окошко», содержащее лицо. В случае динамических сцен или видео в режиме реального времени задача значительно усложняется, так как лица могут появляться в произвольных местах и на разных планах.

Чтобы правильно следить за сценой, обычные системы одновременно производят выборку из массы возможных «окон» различных размеров. Такой процесс не только требует больших вычислительных мощностей, но и приводит к росту неверно обнаруженных объектов.

Для сокращения используемых ресурсов и уменьшения вероятности ошибки Apple предлагает добавить обработку информации о глубине сцены к существующим методам распознавания лиц. В некоторых реализациях данные о глубине можно применить для интеллектуального масштабирования «окошка» в зависимости от плана, на котором находится человек.

Говоря языком патента, специальная система излучает на видимое пространство инфракрасный свет. Полученные данные обрабатываются и конвертируются в соответствующую карту глубины сцены (depth map).

Описанная система основана на технологии инфракрасного отслеживания объекта, разработанной PrimeSense, похожие версии которой уже используются, например, в сенсоре Microsoft Xbox Kinect.

Область для захвата лица становится больше или меньше в зависимости от положения человека относительно камеры устройства. Например, если он находится на расстоянии полуметра, потребуется «окошко» большего размера, чем для расстояния в 1,5 метра.

Так как положение объекта в перспективе известно, получается меньше данных для обработки, что снижает вычислительную нагрузку.

Патент описывает довольно общее решение для распознавания лиц. Иными словами, данная технология позволяет определить, есть ли в кадре человеческое лицо, но не может идентифицировать по нему личность. Тем не менее, это существенный шаг в биометрических методах аутентификации, который может послужить толчком для более сложных способов обработки изображений.

Пока неизвестно, собирается ли Apple внедрять эту разработку в будущие продукты, однако похожим решением сможет похвастаться iPhone 2017 года. По последним предсказаниям Минг-Чи Куо (Ming-Chi Kuo), в модель с OLED-экраном встроят «революционную» фронтальную камеру. Благодаря наличию дополнительных ИК-модулей такая система найдет применение во множестве задач, включая биометрическую аутентификацию и игровые приложения.