Ученые из университета в Колумбии придумали автоматизированный метод, с помощью которого можно разгадать большую половину капч из гуглвского сервиса reCAPTCHA. С этого сервиса берут капчи очень многие сайты, включая и сам Google
Ученые из университета в Колумбии придумали автоматизированный метод, с помощью которого можно разгадать большую половину капч из гуглвского сервиса reCAPTCHA. С этого сервиса берут капчи очень многие сайты, включая и сам Google.
Имеется ввиду тот тип капч, где для прохождения требуется выбрать картинки соответствующие установленному условию: это может быть фото природы, напитки или что-либо другое.
Проблему можно решить в 2-е ступени.
Первая ступень.
Нужно чтобы система получила куки, используя которые Google уже отслеживает в дальнейшем её движения. После чего, необходимо чтобы поведение не выходило за рамки человекоподобного, то есть заходило на различные сайты в хаотическом порядке и в разные периоды постоянно. В этом случае, гугл не сможет определить, что это бот.
Вторая ступень.
Происходит разгадывание капчи, попытки разобрать что показано на установленных фото. В этом случае, система воспользуется несколькими методиками. В первую очередь, она обратится к обратному поисковому механизму фото в GoogleImages. Когда поисковой механизм подаст сигнал о том, что ему это фото знакомо, то он отправит соответствующее уведомление об этом в виде текста. Во вторую очередь уже, система будет перенаправлять её сквозь какое-то количество классификаторов, которые доступны в форме свободных web-сервисов и библиотек. И в третью очередь, проверяется фото на предмет знакомства системе (наиболее часто повторяемые фотографии были расписаны разработчиками «вручную»).
В конечном счёте, системка подбирает описания для каждого фото в виде текста. Правда тут есть свой небольшой нюанс, а именно то, что вот эти самые подобранные описания иногда не соответствуют с подсказками. Но и это решается путём дополнительного классификатора, определяющего совпадение слов в описании и тексте подсказки.
Таким образом, при тестировании системы, сделали вывод, что в 71% случаев можно обойти капчу в Google и в 84% случаев — в Facebook.
Комментарии