Технологии распознавания лиц – это бизнес, очень быстро развивается. Десятки стартапов и технических компании продают услуги по распознаванию лиц отелям, магазинам, а также школам и летним лагерям. Бизнес расцветает благодаря новым алгоритмам, способным идентифицировать людей с гораздо большей точностью, чем еще несколько лет назад. Для того, чтобы улучшить точность этих алгоритмов, компаниям необходимо «натренировать» их на миллиардах лиц. Такие объемы изображений невозможно собрать, каждый раз спрашивая разрешение у человека, чье лицо изображено на фото. Поэтому, существующие базы данных, собранные с согласия изображенных на фото людей, очень маленькие и содержат обычно лишь несколько тысяч лиц.
Официальные базы данных имеют и ряд других недостатков – во многих базах не хватает разнообразия по признаку расы или мало фотографий, сделанных в нестандартных условиях – с тенями на лице, в шляпе или с макияжем. Если алгоритму не тренироваться на таких «осложненных» лицах, то он окажется совершенно неэффективным в реальном мире.
Поэтому, компании часто выбирают более легкий путь, просто берут из Интернета фотографии, где обозначены имена зафиксированных на них людей. На самом деле, достаточно высока вероятность, что и ваше лицо является частью «базы для тренировки» алгоритма распознавания лиц некой компании.
Фактически, для тренировки алгоритма необходима база данных, где к каждому человеку привязаны много фотографий с лицом в разных обстоятельствах, ракурсах и при разном освещении. Например, если пользователь делает много селфи, то получив доступ к этим фотографиям, компания имеет много различных фотографий, привязанных к одному человеку. Или же многие пользователи выкладывают множество фотографий в соцсети, обозначая на них себя и своих друзей. Такой информации тоже будет достаточно для тренировки алгоритма распознавания лиц.
Интересную историю имеет одна американская компания, которая запустилась в 2012 году под названием EverRoll как телефонное приложение для организации фотографий. Компания отличалась достаточно агрессивной маркетинговой политикой. Так, как только приложение запускалось, оно получало доступ ко всем контактам на телефоне, и заставлял пользователя отправить всем этим контактам сообщение с приглашением также загрузить это приложение. Следующим шагом этого приложения была загрузка всех фотографий с телефона в облачную среду. Такие агрессивные маркетинговые шаги даже заставили Apple убрать это приложение с Apple Store в 2016 году. Сегодня, это уже компания Ever AI, специализирующаяся на технологии распознавания лиц и занимает первые места в соревнованиях по точности распознавания людей в сложных условиях. Как отмечают эксперты, такому успеху компания обязана своей огромной базе данных, которая насчитывает около 13 млрд фотографий.
При этом, мало что можно сделать, чтобы остановить использование вашего лица таким образом. Ведь на сегодняшний день, почти не существует законодательных ограничений относительно технологий распознавания лиц.
Стоит отметить, что законодательное регулирование в этой сфере является важным не только из-за проблемы приватности, но и из-за большого количества ошибок, допускаемых системы распознавания лиц на данном этапе развития технологии. Интересно, что первым городом, который полностью запретит использование систем распознавания лиц государственных структур может стать Сан-Франциско – один из основных очагов разработки этих самых систем. Ведь именно разработчики лучше других понимают насколько ненадежными являются пока эти системы.
Действительно, многие алгоритмы, протестированных в реальных условиях, оказались поразительно неточными. Так, например, во время тестирования системы распознавания лиц на финальных матчах Лиги Чемпионов УЕФА, 92% совпадений были ошибочными.
Кроме ошибок, эти системы также часто выдают предвзятые результаты. Например, одно из недавних исследований показало, что системы распознавания лиц таких технических гигантов как Microsoft, IBM и Face ++ верно определяют пол 99.7% белых мужчин и только 65.3% черных женщин. Такие расхождения связаны с тем, что «тренируют» алгоритмы обычно на базах данных, где очень мало представлено темнокожих людей. Или же, например, в нескольких штатах США судьям перед вынесением приговора предоставляют результаты оценки лицо подозреваемого нейросетью, которая определяет с какой вероятностью этот человек совершит преступление повторно. Поскольку в базе преступников относительно больше темнокожих людей, то темная кожа для алгоритма автоматически становится фактором повышенного риска рецидива.
Итак, сегодня мы не можем уберечься от того, чтобы наши фото использовались для тренировки алгоритмов распознавания лиц. Однако, в мире уже поняли необходимость регулирования этой сферы и процесс создания соответствующих нормативных требований уже запущен. А пока, не стоит слишком доверять этим системам – они ошибаются так же как и люди.
Перевод: Екатерина Койдан; “ТИДЖЕНЬ“