Что такое файнд клон
Кто создал сайт FindClone, который ищет людей по лицу и деанонит силовиков У каждой технологической революции есть свои герои
— Надо размыть лица жены и ребенка. А так, да, устройте ему звездный чаc.
— Мне кажется, достаточно его фотографии с митинга, семейные выставлять некрасиво.
— Под него другие тоже будут копать. Одну семейную нужно, где он в майке с Путиным.
Конечно, мы не выложили семейную фотографию, ведь мы не уроды.
Кулишов Сергей Валерьевич, подполковник. Я нашел его в два клика и отхлебнул из чашки: 27 июля, здесь, в кафе, играет музыка из лифтов, едят лапшу, а за окном полицейские зачищают бульвар — это значит избивают людей. Другой наш репортер, Андрей, работает в самой гуще толпы : он описывает Кулишова как «низкого мужчину в белой кепке, с лицом ребенка». Сегодня подполковник решил не надевать форму, ведь ему с подчиненными предстоит задержать тысячу триста семьдесят три человека — больше, чем на любой другой протестной акции в России за 26 лет. Он сделает этот день историческим, но не хочет, чтобы его заметили. Пробегая через толпу, подполковник указывает пальцем на случайных людей, а через секунду ОМОН заламывает им руки. Андрей погнался за ним по переулку с камерой: «Кто вы такой? Да кто вы такой?!». «Мужчина с лицом ребенка» не ответил, но это было уже не важно — теперь его лицо было у меня.
Дальше все журналисты делают одно и то же, никакого секрета. Берешь стоп-кадр, заходишь на FindClone.ru, загружаешь картинку — мгновение — поиск выдает страницы похожих людей во «ВКонтакте» с именами, ссылками, фотографиями с семьей у бассейна. Скандальные проекты по деанонимизации силовиков — «Русский слон», «Сканер», «Глазок» — все делают то же самое — просто пробивают через FindClone.
За полгода работы сайт взлетел до миллиона просмотров в месяц. Как и его предшественник FindFace, он уже стал национальным достоянием: такого публичного сервиса нет больше нигде в мире. Было лишь вопросом времени, когда его начнут использовать для политики. Редактор The Village Кирилл Руков нашел тех, кто его создал.
Математики из Дагестана
Гаджи Саидов и Юрий Зданович — ученые до мозга костей. Вместе учились в Махачкалинском физико-техническом лицее до 2002 года, позже уехали в Москву и поступили в разные институты (МФТИ и МИРЭА), но дружбу сохранили. «Есть люди, которые в детстве садятся за пианино и понимают, что ничем другим заниматься уже не смогут. Мы такие же ребята, только открыли в школе учебник по математике, — рассказывает Гаджи. — Это теперь склад ума, когда идешь по улице и видишь сечения, считаешь угол, под которым деревья растут. Профессиональная деформация: человек разговаривает со мной, а я раскладываю его лицо на параметры. Могу всем распедалить, какие матрицы лучше всего, почему такое-то отображение N-мерного пространства в манифолд — какое красивое слово, да? — почему оно ведет нас в никуда и так далее. С удовольствием ходил бы кругами по кабинету и просто думал. Я кайфую от этого. А сейчас приходится возиться с бумагами и вникать в какие-то юридические стороны контрактов», — создатель FindClone нескромно жалуется: у команды уже появились первые заказы от бизнеса на системы распознавания лиц, вот-вот подпишут контракт с сетью бутиков.
«Ученым остается сделать пару шагов, которые сделали мы. И они, конечно, дойдут. Не сомневаюсь, что не один я такой умный»
Начиналось все как хобби, без инвесторов, только на свои деньги. Как двое ученых при этом зарабатывали на жизнь, они не рассказывают, но кое-что можно найти в интернете. Директору FindClone Юрию Здановичу 34 года, он радиотехник, с 2006-го упоминался как ведущий инженер научной лаборатории в НИИДАРе. Этот институт в советское время создавал систему раннего обнаружения межконтинентальных ракет (знаменитые гигантские антенны «Дуга», «Воронеж» и «Заслон»). Сейчас НИИДАР, конечно, уже не тот, но это по-прежнему крупнейшее частное оборонное предприятие: получает заказы от военных, входит в корпорацию «Система» (владелец бренда МТС). Работает ли там Зданович до сих пор и знают ли в компании о его стартапе FindClone — неизвестно, но забавно, что сама «Система» тоже вкладывалась в технологию распознавания лиц, причем в одного из лидеров рынка — компанию VisionLabs.
Гаджи Саидов — создатель ядра FindClone, то есть самого алгоритма — очень осторожен в интернете. Ему тоже 34, но в отличие от Юрия, который постоянно путешествует, вписывает гостей на каучсерфинге, выступает на конференциях, Гаджи называет себя «хиккующим математиком» и почти не оставляет следов. Известно, что 11 класс он заканчивал в республиканском лицее для одаренных детей, а в 2002 упоминался как первый в истории Дагестана победитель всероссийской олимпиады школьников. Еще в сети есть одна научная публикация за 2016 год: вместе с братом он сделал простую нейросеть, которая отличала грязные водоемы от чистых по форме раковин мидий на фотографиях. Я был восхищен, когда прочитал это, но Саидов засмеялся: «Не тролльте меня, пожалуйста. Это совсем не тот уровень, к которому я бы хотел стремиться».
Когда на его глазах запустился первый культовый поисковик по лицам FindFace (с чудовищной вирусной пиар-кампанией, завязанной на травле женщин из порно), Гаджи был в восторге, потому что сервис оказался слабым: «Загружаешь человека в солнцезащитных очках — нейросеть сразу падает и показывает тебе просто кучу других людей в темных очках». К тому моменту Саидов разрабатывал свой собственный алгоритм уже несколько лет.
Почему закрылся предыдущий поисковик по лицам FindFace? В этом замешаны власти?
В отличие от героев этой статьи, команду FindFace сложно было назвать независимыми энтузиастами. Еще год назад The Village выяснил, что из пяти владельцев NtechLab — разработчика сервиса — четверо так или иначе были связаны с администрацией президента или обслуживали ее интересы. При этом NtechLab сыграл роль Apple для рынка распознавания лиц, а его скандальные методы пиара реально сработали — в отрасль полились большие деньги и крупные заказы. Скорее всего, именно инвесторы (крупнейший — «Ростех») в итоге потребовали закрыть поисковик FindFace весной 2018 года: хотели очистить имидж стартапа от грязи в новостях, чтобы продаваться иностранцам. Параллельно через инвестиции госкомпаний вроде Сбербанка и «Газфонда» власти взяли под мягкий контроль и всех остальных лидеров технологии. Так вышло, что с одной стороны оказались крупняки — с госзаказами от силовиков на слежение за митингующими; с другой — энтузиасты, чьими алгоритмами силовиков на митингах теперь деанонят.
Сейчас FindClone удивительно хорошо срабатывает «в диких условиях», даже если лицо снято в пол-оборота. Он узнает выросших подростков из фотоальбомов 90-х и находит их свежие страницы (забавно, что именно так я нашел самих создателей — по выпускным снимкам из лицея). Суть своего ноу-хау Саидов объяснять не хочет, но если грубо — он обучал нейросеть не так, как это делают конкуренты: «Я читал все последние научные публикации. Всем этим ученым остается сделать пару шагов, которые сделали мы. И они, конечно, дойдут рано или поздно. Не сомневаюсь, что не один я такой умный», — смеется Гаджи.
Читать сложное объяснение Гаджи
«У нас не применялся triplet loss. Стартовали мы вообще с softmax, но в итоге ничего не понравилось. Самая главная проблема триплета — он очень медленно сходится, это надоедает. Вторая проблема — регуляционные функции. Та же регуляция с помощью weight decay на самом деле ухудшает точность. Мы создали совсем другой loss, постарались взять лучшее от всего».
Конечно, сайт FindClone — это визитка для потенциальных покупателей алгоритма, мол, посмотрите, как мы можем. Ее сделал третий важный герой этой истории, Кирилл Каплин, и его небольшая саратовская компания «Профсофт»: «Мы просто хотели поучаствовать в проекте, который переворачивает сознание. Написали им на почту, мол, ребята, мы такие-то такие, давайте мы вам поможем, напишем оболочку и дизайн бесплатно, нам просто нравится ваш продукт. Сервис был еще совсем сырым, назывался SearchFace. Они ответили через месяц, что хотят нормально заплатить, и в итоге мы подписали контракт по рыночной цене (сколько точно, Каплин не говорит. — Прим. ред.). Помню, что релиз приложения FindClone для Android был в Саратове в апреле, на хакатоне „Оттепель“, мы прямо там дописывали его». Сейчас команда заканчивает работу над iOS-версией приложения, и скоро выпустит его.
Команда вообще не планировала зарабатывать на публичном сервисе, но потом все-таки внедрила тарифы по достижении лимита в 25 запросов. В итоге платных — меньше 10 % от всех поисков. «Главное, что этих денег хватает на оплату серверов и даже иногда на вино остается», — шутит Саидов.
Если очень коротко — как нейросети различают лица?
Нет, алгоритмы не измеряют ширину носа или длину бровей. Компьютерное зрение вообще так не работает: нейросеть не сравнивает привычные нам черты, а самостоятельно, много раз пробуя и ошибаясь, находит те параметры, которые полезны именно ей — такие взаимосвязи называют фичами. Каждая нейросеть в итоге уникальна. Потом цифровой слепок лица — «фичамапу» — записывают буквально в виде набора чисел, чтобы затем арифметически сравнивать этот набор с рядами чисел от других портретов. Чем ближе числа, тем больше схожесть. По такому принципу работают вообще все нейросетевые поисковики, например Shazam для музыки. Пионерами нейросетей считают математиков Яна Лекуна и Джеффри Хинтона. А русские ученые и сейчас делают лучшие алгоритмы в мире. Мы сделали подробный разбор этого механизма на пальцах в фирменном гиде The Village по технологии распознавания лиц.
FindClone — новый сервис поиска людей по фотографии Вконтакте
Понравилась девушка на улице? Сфотографируй её на телефон, загрузи фотографию в сервис и получи ссылку на её профиль в VK! Примерно так работает сервис по поиску людей в социальной сети Вконтакте (VK) FindClone, являющийся полным аналогом более не доступного простым смертным поискового сервиса FindFace. С недавних пор FindFace сотрудничает только с правительством и спец. службами РФ, а свято место, как говорится, пусто не бывает.
Есть бесплатная альтернатива Findclone без регистрации и ограничений!
Как работает FindClone
К Вам никогда не ломились в друзья Вконтакте какие-то незнакомые люди, которых Вы даже отдалённо не можете знать? Это — боты, которые собирают информацию для подобных сервисов. Так как у многих в настройках приватности видимость информации о себе доступна только друзьям, ботам подобных сервисов приходится идти на хитрость и проситься в друзья чтобы получить всю возможную информацию о человеке. Бот может собирать информацию как для одного, так и для разных заказчиков. Например, текстовую информацию для рекламного агенства, фотографии — для того же FindClone.
После того, как данные были собраны, они скармливаются обученной нейросети, которая распознаёт на фотографиях лица и их черты, и добавляет полученные данные их в БД сервиса.
Теперь самое интересное: поиск людей Вконтакте по их фотогоафиям. После того, как пользователь авторизовался в FindClone и загрузил фотографию с интересующим его человеком, данная фотография снова скармливается нейросети для определения параметров лица, выходные данные специальным алгоритмом сравниваются с базой накопленных ботами данных, а результат выдаётся пользователю в виде ссылки на профиль VK, в котором была замечена фотография с искомым человеком.
Как можно использовать FindClone?
Как искать людей
Для начала нужно зарегистрироваться в сервисе. Регистрация осуществляется по номеру мобильного телефона, на который звонит робот, 5 крайних цифр номера телефона которого и есть код подтверждения.
После регистрации логинимся под своим аккаунтом и видим кнопку с надписью «Загрузите Ваше фото».
Жмём на кнопку, выбираем и фотографию.
Готово! Получаем список «клонов» — аккаунтов, где имеются фотографии искомого человека.
Особенности работы сервиса
Ограничения бесплатной версии
При достижении любого из этих условий пробный период заканчивается, и приходится либо регистрировать новый аккаунт на новый номер, либо платить за платные подписки.