что такое сканер лица
Как работает технология распознавания лиц в смартфоне?
В современные смартфоны всё активнее внедряется система распознавания лиц. Но как она работает?
Можно сказать, что iPhone X открыл новую эпоху. Технология распознавания лиц — основная его «фишка». И никто не сомневается в том, что такой способ разблокировки будет внедряться и во многие другие смартфоны.
Чуть-чуть истории
Ещё в 1960-ых годах проводились специальные опыты, в ходе которых компьютер должен был научиться распознавать лицо человека. Тогда это ни к чему не привело, так как любая эмоция приводила к сбою. Также изобретенная система боялась изменения условий освещения.
Лишь в самом конце XX века появились системы, которые научились определять лица людей по фотографиям, запоминая их. При этом они перестали сбоить при появлении усов, бороды, очков и прочих «помех». Активнее всего подобные системы начали внедряться в цифровые фотоаппараты. Также они нашли себе место в охранном секторе.
У систем распознавания лиц долгое время был один существенный недостаток. Они сильно зависели от освещения и ракурса. Впрочем, в охранных сканерах эта проблема не была заметна. К ним лицо прикладывалось почти вплотную, освещаясь затем лампами. Избавиться же от вышеупомянутого недостатка помогло внедрение стереосъемки. Две камеры понимают глубину сцены, в связи с чем точность показаний вырастает в несколько раз.
Как работает технология распознавания лиц?
Постепенно новая функция начала появляться в смартфонах. Здесь биометрическая идентификация пользователя внедряется для того, чтобы разблокировать устройство не мог посторонний человек. В идеале получить доступ к персональной информации может только близнец. Переживать по этому поводу не стоит. Вряд ли кто-то будет всерьез скрывать что-то от родного брата или сестры. Да и никто не мешает установить для чтения каких-то особо секретных данных дополнительный пароль.
Работу системы распознавания лиц в смартфонах можно условно разделить на четыре этапа:
Функция распознавания лиц может быть реализована даже при помощи фронтальной камеры — лишь бы она имела два объектива. Однако в таком случае работа данной функции окажется нестабильной. Дело в том, что лишь специальные датчики обеспечат сканирование лица даже в темноте, тогда как «фронталке» требуется яркое освещение. Также особые датчики виртуально выводят на лицо большее количество точек, поэтому они срабатывают даже при появлении бороды, очков и других помех. Словом, в каком-нибудь DOOGEE Mix 2 система точно будет работать заметно хуже, чем в iPhone X. Другое дело — юбилейный продукт Apple стоит гораздо дороже, чем все остальные смартфоны с функцией распознавания лица.
За технологией будущее?
Нужные для сканирования лица датчики требуют идеальной установки. Сдвиг на сотые доли миллиметра приведет к тому, что работа функции перестанет быть идеальной — поэтому при производстве смартфона может наблюдаться повышенный выход брака, а это приводит к росту его стоимости. Да и сами датчики стоят весьма дорого, неспроста их использует только компания Apple, хотя никаких патентов на них у неё нет.
Одним словом, пока функцию распознавания лиц производители «андроидов» будут реализовывать посредством фронтальной камеры. Уже сейчас её можно встретить в Samsung Galaxy S8 и Note 8. Но владельцы этих устройств подтвердят вам, что работает она не лучшим образом — легче использовать сканер отпечатков пальцев. Поэтому пока о будущем функции ничего сказать нельзя. Нужно ждать, будет ли Apple внедрять соответствующие датчики в более доступные смартфоны, а также появятся ли они в устройствах на базе Android.
Заключение
Переживать по поводу сохранения ваших идентификационных данных не стоит. Созданный при сканировании лица шаблон находится в отдельном разделе памяти — чтение этого сектора компьютером или сторонними программами невозможно. Впрочем, это касается и отпечатков пальцев. А каким видом идентификации пользоваться удобнее — это выбирать только вам.
Держали ли вы когда-нибудь в руках смартфон, умеющий распознавать лицо? И ждете ли вы массового внедрения данной функции? Поделитесь своим мнением в комментариях, мы будем этому рады!
Как работает распознавание лиц? Разбор
Среднестатистический человек может идентифицировать знакомое лицо в толпе с точностью 97,53%. Вы скажете, это немало и будете правы. Но это ничто по сравнению с современными алгоритмами, которые добились точности 99,8% еще в 2014 году. А в последние несколько лет они достигли практически совершенства! Современный алгоритм, использующийся в камерах видеонаблюдения в Москве способен обрабатывать 1 миллиард изображений менее чем за полсекунды с точностью близкой к 100%.
Этот алгоритм насколько крут, что уже в этом году в Московском Метро планируют ввести систему прохода по лицу — FacePay. При этом нам обещают, что система будет работать даже если человек в медицинской маске.
Как вы понимаете, жизнь уже не будет прежней. Поэтому давайте разберемся:
Причины
Этап 1. Обнаружение
В первую очередь, для того, чтобы лицо распознать, надо его сначала обнаружить. Задача на самом деле не тривиальная. Для этого мы бы могли использовать натренированные нейросети, но это слишком долго, дорого и ресурсоемко. Поэтому для обнаружения лица используется очень простой метод Виолы — Джонса, разработанный еще в 2001 году.
Как эта штука работает?
Этот алгоритм просто сканирует изображение при помощи вот таких прямоугольников, они называются примитивами Хаара:
И еще вот таких прямоугольников:
Задача этих объектов — находить более светлые и темные области на изображении, характерных конкретно для человеческих лиц.
Например, если усреднить значения яркости область глаз будет темнее щек или лба, а переносица будет светлее бровей.
В общем таких характерных признаков много и естественно не только у человеческих лиц могут быть подобные паттерны. Поэтому алгоритм работает в несколько этапов:
Сначала находится первый признак, система понимает: «В этой области может быть лицо». Тогда она начинает там же искать второй признак, а потом третий. И если в одной области найдено 3 признака, уже можно уверенно сказать — да, это лицо! После чего система получает область изображения, в котором есть только лицо.
Этап 2. Антропометрические точки
Получив область для анализа, дальше в дело вступает главный секрет каждой системы распознавания — биометрический алгоритм.
Он расставляет на лице антропометрические точки, по которым впоследствии и будут вычисляться индивидуальные характеристики человека: разрез глаз, форма носа, подбородка, расстояние между ними и прочее. Таких признаков может быть много, вплоть до нескольких тысяч. Но в целом, таких точек должно быть как минимум 68.
Этап 3. Исправление искажений
А дальше начинается настоящая магия. В идеале нам нужно лицо, которое смотрит анфас, то есть прямо в камеру. Но такая удача бывает редко, особенно если речь идет о распознавании человека в толпе.
Поэтому система производит дополнительное преобразование изображения: устранятся поворот и наклон головы. А также проводится 3D-реконструкция лица из 2D-изображения. Таким образом, даже если человек на изображении смотрел вбок, мы всё равно можем получить четкий фронтальный снимок, что существенно повышает качество распознавания.
Этап 4. Вектор лица
Ну а дальше происходит самое главное. В бой вступает нейросеть, которая присваивает каждому лицу вектор признаков. Что это такое?
По сути, это просто какое-то число, которое складывается из суммы характеристик лица: расстояний между опорными точками, текстуры определенных областей на лице и прочее. Таких характеристик может быть множество. Основное правило: они должны описывать лицо независимо от посторонних факторов: макияжа, прически, возрастных изменений.
Этап 5. Идентификация
Ну а дальше остаётся сравнить полученный вектор с базой других векторов. И готово. Система вас идентифицировала.
Где и как используется?
Помимо очевидных кейсов применения, помимо обнаружения правонарушителей в общественных пространствах и оплаты билетов в метро. Где и как могут применяться эти технологии?
Во-первых, системы могут быть настроены не на идентификацию а на анализ поведения или настроения. В такси можно можно быстро вычислять неадекватных водителей или пассажиров. В магазинах, можно находить грустных покупателей и повышать уровень сервиса. Ритейлеры одежды или продуктовые магазины используют камеры для анализа поведения покупателя, чтобы проанализировать настроение покупателя на кассе. Или например в школах, можно искать скучающих детей и корректировать программу обучения. Так, кстати уже делают в Китае. Вот такой мир будущего, и мы уже в нём живём не зная этого.
Что будет в будущем?
Чего же нам ждать в будущем? Распознавание лиц для разблокировки iPhone, входа в Windows или во время конференций — это прекрасная, удобная технология, упрощающая жизнь и мы уже ей пользуемся. Но вот повсеместные камеры наблюдения в городах рисуют в воображении самые мрачные картины в духе Джорджа Оруэлла.
Отсюда возникает вопрос — можно ли защитить себя от систем видеонаблюдения? Конечно, с развитием технологий развиваются и средства обхода этих технологий.
Люди придумывают макияж и украшения, которые сбивают с толку алгоритм обнаружения лиц, тот самый из 2001 года, создают инфракрасные очки, засвечивающие сенсоры камер, а также делают всякую криповую одежду и маски.
Но по большому счету такой лук скорее больше привлечет внимания, а алгоритмы подстроятся под обманки. Поэтому единственный способ защиты — это закон. Бизнес активно не внедряет системы распознавания лиц только потому, что это несет большие юридические издержки. В ЕС активно разрабатывается новый закон, который уже прозвали GDPR 2: он будет строго регулировать системы распознавания лиц и прочие системы искусственного интеллекта, вызывающие законные опасения.
В России с этим пока что не так хорошо. Тем не менее отечественные компании, которые присутствуют на международном рынке также будут вынуждены соблюдать новые правила игры, как произошло с первым GDPR.
То есть, как вы поняли, есть светлая сторона технологии, которая упрощает нам жизнь и темная, что приближает нас к миру большого брата.
Камеры следят за вами всюду. Как работает система распознавания лиц и нужно ли ее бояться
Камеры уже повсюду. Как нейронные сети следят за нами, нарушает ли это наши права и как изменится пугающая технология в будущем – в материале The Guardian.
Программа распознавания лиц – что это такое?
Сегодня технология распознавания лиц используется повсеместно. Facebook, где вас отмечают на фото с встречи одноклассников, свадьбы вашего кузена или летней вечеринки на работе. В программы Google, Microsoft, Apple и так далее встроены приложения для накопления информации.
Программа распознавания лиц используется в аэропортах, она есть в вашем телефоне – с ее помощью вы можете его разблокировать. И если вам нужно подтвердить свою личность для банковского перевода в £1,000, просто посмотрите в камеру.
Новые приложения появляются все время. Хотите знать, кто стоит за дверью? Видео-дверной звонок с программой распознавания лиц сообщит вам, если вы заранее загрузили фотографии ваших знакомых.
Многочисленные системы используются для обнаружения пропавших без вести и ловли прогульщиков, которые не приходят вовремя на работу. Рекламодатели, конечно, тоже не остаются в стороне. Благодаря программам распознавания лиц на рекламных щитах сегодня появляется тот товар, который интересен именно вам, исходя из оценки вашего пола, возраста и настроения.
Большой Брат здесь? Программа распознавания лиц – инструмент контроля?
В определенных случаях, конечно. Китай использует программу для расового профилирования. Резкую критику получила правительственная практика использования программы для отслеживания и контроля над мусульманами-уйгурами. Камеры с программой распознавания лиц отслеживают и штрафуют пешеходов, отмечают учеников при входе в школу и контролируют выражение их лиц на уроках, чтобы те не отвлекались.
В России технология также используется.
Согласно источникам, Израиль использует распознавание лиц для слежения за палестинцами на Западном берегу реки Иордан. А в Британии полиция столицы и Южного Уэльса опробовала программу распознавания лиц, чтобы находить людей среди футбольных и регбийных толп, на городских улицах, а также на памятных мероприятиях и музыкальных фестивалях. Тейлор Свифт даже использовала программу на концерте в Калифорнии, чтобы отсеять нежелательных посетителей.
В магазинах программа все чаще используется для отпугивания и поимки воров. В следующем году она дебютирует на Олимпийских играх в Токио.
Как технология распространяется?
Большую роль сыграли достижения в трех областях: большие данные (big data), глубокие сверточные нейронные сети и мощные графические процессоры.
Благодаря Instagram, Facebook, Flickr, Google и другим системам в интернете находятся миллиарды фотографий лиц людей, которые были объединены в огромные наборы данных. Они используются для обучения глубоких нейронных сетей – главной опоры современного искусственного интеллекта – для обнаружения и распознавания лиц. Рутинная вычислительная работа обычно выполняется на графических процессорах, сверхбыстрых чипах, которые предназначены для обработки графики. Но за последнее десятилетие системы распознавания лиц распространились повсюду, и данные, собранные по ним, помогли компаниям отточить свои технологии.
Как это работает?
Во-первых, компьютер должен понять, что такое лицо. Научить его можно через алгоритм, обычно глубокой нейронной сети, на примере огромного количества фотографий в различных приложениях. Каждый раз, сталкиваясь с изображением, алгоритм оценивает, где находится лицо. Сначала будет много мусора, но постепенно алгоритм улучшается и в конечном итоге овладевает искусством определения лиц. Это шаг к функции распознавания лиц.
Следующая ступень – распознавание. Обычно используется вторая нейронная сеть. Она получает серию фотографий и учится отличать одно лицо от другого. Некоторые алгоритмы непосредственно отображают лицо, измеряя расстояния между глазами, носом и ртом и так далее. Другие отображают лицо, используя более абстрактные черты. В любом случае, сеть выводит вектор для каждого лица – строку чисел, которая однозначно идентифицирует человека среди других в обучающем блоке.
Программное обеспечение работает с видеоматериалами в режиме реального времени. Компьютер сканирует кадры видео, как правило в местах скопления людей, например на входе на футбольный стадион. И сначала он обнаруживает в кадре лица, а затем выдает векторы для каждого из них. Затем векторы лица сравниваются с векторами лиц людей в розыскном списке. Все совпадения, которые проходят предварительно установленный порог, затем ранжируются и отображаются.
Это не единственный способ, который использует полиция для распознавания лиц. Если подозреваемый замечен, офицеры могут загрузить снимки преступника из базы данных и искать записи с камер видеонаблюдения, чтобы проследить путь подозреваемого до места преступления.
Насколько это точно?
Независимые тесты Национального института стандартов и технологий США (NIST) показали, что за период с 2014 до 2018 года системы распознавания лиц улучшили показатели совпадения по базе портретных фото в 20 раз. Процент сбоев снизился с 4% до 0,2% за этот период, и такое значительное увеличение точности связано с глубокими нейронными сетями. В институте заявили, что сети привели к «промышленной революции» в распознавании лиц.
Но такая отличная производительность возможна в идеальных условиях: при наличии четкого и ясного снимка неизвестного человека, который проверяется по базе данных других высококачественных фотографий. В реальном мире изображения могут быть размытыми или снятыми при плохом освещении, люди могут отвести взгляд от камеры, надеть платок или шарф, или быть намного старше, чем на фотографии на аватарке.
И согласно тестам, проведенным институтом, даже при использовании лучших алгоритмов система дает сбои при попытке различить лица близнецов.
А как насчет системных ошибок?
Проблема возникает, когда нейронные сети обучаются на различном количестве лиц из разных групп людей. Например, если система обучается на миллионе белых мужских лиц, но почти не использует лица женщин и людей с другим цветом кожи, она будет менее точна при попытке распознать последние две группы. Меньшая точность означает больше ошибочных идентификаций, и в результате большее количество людей будут ошибочно задержаны.
В прошлом году Американский союз защиты гражданских свобод (ACLU) обнаружил, что программное обеспечение от Amazon под названием Rekognition ошибочно идентифицировало 28 членов Конгресса как людей, которые ранее находились под арестом. Оно непропорционально и неправильно идентифицировало афроамериканцев и латиноамериканцев. Но в Amazon сказали, что в ACLU просто использовали неправильные настройки.
Судебные тяжбы также выявили недостатки программы распознавания лиц. Исследование Кардиффского университета в Южном Уэльсе показало, что действенность системы NEC NeoFace снизилась, когда на экране было много людей, и она хуже работала в пасмурные дни и вечером, когда светочувствительность камеры повышалась и кадры становились более «шумными».
За 55 часов работы система отметила 2 900 потенциальных совпадений, из которых 2 755 были ложными. Основываясь на показаниях системы, полиция произвела 18 арестов, но в докладе университета не говорится, были ли кому-либо предъявлены обвинения.
Уэльский суд выделил еще одну проблему при распознавании лиц: овцы. Так называют людей из списка подозреваемых, которые не имеют особых примет и похожи на многих других людей. Во время сканирования толпы на матчах по регби в Уэльсе система NeoFace 10 раз обнаружила женщину из списка подозреваемых полиции Южного Уэльса. Ни одна из них не была настоящей подозреваемой.
Кто владеет технологией?
Технологические фирмы по всему миру развивают программы распознавания лиц, но США, Россия, Китай, Япония, Израиль и Европа лидируют. В некоторых странах технология применяется с большей готовностью, чем в других.
В Китае миллионы камер подключены к программному обеспечению распознавания лиц, а Россия заявила о планах использовать для наблюдения собственные сети. В Европе, как и везде, программа распознавания лиц используется в магазинах для задержания воров и в бизнесе для мониторинга персонала и посетителей, но распознавание лиц в режиме реального времени в общественных местах пока на стадии судебных разбирательств.
В США полиция обычно использует систему распознавания лиц для идентификации подозреваемых по видеозаписям с камер наблюдения, а не для сканирования толп людей в режиме реального времени. Но все равно система используется все больше. Согласно отчету 2016 года Центра права Университета Джорджтаун, половина всех американцев находится в полицейских базах данных по распознаванию лиц, а значит, алгоритмы выбирают подозреваемых из 117 миллионов виртуальных профилей законопослушных граждан.
Что говорит об этом закон?
Почти ничего. В Великобритании нет закона, который дает полиции право использовать программу по распознаванию лиц, и никакой государственной политики по ее использованию. Это привело к тому, что комиссар по биометрии Пол Уайлс назвал ситуацию выгодной для полиции, которая сама решает, где и когда целесообразно использовать программу распознавания лиц и что делать с изображениями, которые снимают камеры.
Компания «Свобода» призвала к полному запрету использования программы в режиме реального времени в общественных местах, заявляя, что она нарушает право на частную жизнь и принуждает людей менять свое поведение. Группа подала судебный иск против полиции Южного Уэльса в связи с использованием этой технологии. Подобные же претензии выразил Эссекский университет в ходе независимого обзора использования полицией программы распознавания лиц. Было доказано, что людей ошибочно задерживали, а значит, технология используется для выслеживания людей, которые вовсе не находятся в розыске. В заключении было сказано, что распознавание лиц в режиме реального времени нарушает закон о правах человека.
Еще одна область разногласий – списки людей, находящихся в розыске. Несмотря на решение Верховного суда 2012 года, что хранение изображений невинных людей незаконно, полиция постоянно создавала базу данных из задержанных 20 миллионов человек, многие из которых так никогда и не были осуждены. Фотографии из базы данных и из социальных сетей используются для создания списков людей, находящихся в розыске, и используются в системах распознавания лиц. В частном бизнесе ситуация еще хуже – владельцы магазинов и предприятий сами решают, кто входит в секретные списки находящихся в розыске и обмениваются фотографиями с другими фирмами.
В США ситуация не намного лучше. Только в пяти штатах есть законы, которые касаются использования программы по распознаванию лиц правоохранительными органами. Путаница в законе привела к тому, что в то время, как в полиции Сиэтла и Сан-Франциско запрещено использовать программу в режиме реального времени, в офисе шерифа в округе Марикопа, штат Аризона, каждое фото и водительские права жителей Гондураса проверяются по списку подозреваемых через программу распознавания лиц.
Как насчет других биометрических данных?
Конечно, технология распознавания лиц в центре внимания, но полиция и другие организации внимательно изучают новые биометрические данные, которые идентифицируют людей, помимо отпечатков пальцев и ДНК.
Говорят, что анализы текстуры кожи компенсируют проблемы при попытке распознать частично закрытые или искаженные лица, анализируя расстояние между порами кожи. Этот метод не часто тестировался, но разработчики утверждают, что, возможно, он позволит различать близнецов.
Еще один биометрический анализ, который интересует полицию, так как он применим на расстоянии и без взаимодействия с человеком, – это анализ походки.
Алгоритмы идентифицируют людей по уникальному стилю их шага, отражая различия в анатомии, генетике, социальном происхождении, привычках и индивидуальности.
Алгоритмы идентифицируют людей по уникальному стилю их шага, отражая различия в анатомии, генетике, социальном происхождении, привычках и индивидуальности.
Есть еще распознавание вен, когда оптические сканеры составляют карту кровеносных сосудов на руке, пальце или в глазу. Считается, что сканеры трудно обмануть, так как наши вены находятся под кожей. Система PalmSecure Fujitsu использует карты вен для мониторинга сотрудников на различных предприятиях.
Идентификация голоса уже используется банками и Министерством по налогам и сборам для подтверждения личности. В отличие от распознавания речи, которое переводит звуки в слова, идентификация голоса обнаруживает уникальные акустические паттерны, созданные голосовым трактом человека и его речевыми привычками.
Что дальше?
Вполне возможно, что эта технология станет вездесущей. Американская фирма Vuzix объединилась с дубайской фирмой NNTC для производства смарт-очков для распознавания лиц. В оправу вставлена крошечная восьмимегапиксельная камера, которая сканирует лица прохожих и предупреждает владельца о любых совпадениях в базе данных из миллиона человек. В Великобритании беспроводное видеонаблюдение работает на полицейских нательных камерах, которые делают почти то же самое. В США недавно запатентована полицейская нательная камера, которая начинает запись, когда лицо подозреваемого опознано.
А между тем технические фирмы совершенствуют свои системы, чтобы работать быстрее, с большим количеством лиц и со все более сложными изображениями – сделанными при плохом освещении или если люди прикрывают лица. Ведется работа над алгоритмами, которые смогут идентифицировать людей в масках и с использованием маскировки. Чтобы сделать системы распознавания еще более эффективными, биометрия лица будет сочетаться с другими биометрическими анализами, такими как голос и походка.
Неудивительно, что гонка вооружений началась: исследователи из Университета Карнеги-Меллона в Питтсбурге разработали свои собственные солнцезащитные очки, чтобы обмануть систему распознавания лиц: так один испытатель в очках был идентифицирован как Мила Йовович.