Умное распознавание капчей

Сегодня мне в голову пришла отличная и вместе с тем элементарная мысль, как можно сделать технологию которая может самообучатся и узнавать капчи со сущим итогом. Однако сперва картина в тематику:

Таким образом имейте ввиду, я не лгал когда сообщал что любую капчу можно обогнать :D

Так вот, возвратимся к делу. Рекомендуемый мною способ пока подходит не для любой реализации капчи, в связи с тем что не все их реализации чувствительны к моей атаке, однако на ранимых капчах мой способ обеспечивает почти 100%-ое распознавание, плюс позволяет самообучать технологию определения. Если вас интересует капча распознавание сервис советую пройти по ссылке.

Какие реализации чувствительны?

В случае если разъяснить словами, то документ который потом пишется на иллюстрации, записывается в сессию. При вторичном запросе скрипта будет применен этот же самый документ из сессии, впрочем при этом картина производится незначительно по другому.

Другими словами в случае если закончить, то чувствительны реализации, которые дают возможность получить несколько видов капчи с одним и аналогичным текстом на ней.

Как провести атаку?

Как вы поняли для этого нам нужно скачать несколько видов одной капчи. Как правило для этого довольно прибегнуть к скрипту генерации капчей с одним и аналогичным индетификатором сессии (находится в зависимости от ее реализации).

После этого каждую из принятых картинок нам нужно различить (более подробно сантиметров Режем капчу на примере либо Тест алгоритмов генерации CAPTCHA). В связи с тем что все же знаки различных габаритов, имеют наклоны, плюс далеко не всегда выходит удачно их резать, то конечно же среди разобранных картинок будут ошибки.

Как же учить технологию?

Выше мы вроде сориентировались как обучится узнавать капчу с большой правильностью, однако пунктуальность можно увеличить при помощи изучения системы свежим маскам знаков. Для этого забираем маски тех знаков которые неправильно распознались и дополняем их в суммарный соглашение масок. Ну например возьмем нераспознанные маски первых знаков (эти маски были распознанны как числа 5 и 6 вместо 8):

Существенно что определенные маски похожи между собой, это прийдется разбирать и похожие удалить, в связи с тем что чем больше масок в пуле тем продолжительнее будет идти опознание. В конечном итоге останется всего 2 свежих маски:

Аналогичную процедуру ведем и для других знаков и также дополняем их в соглашение. И в какой-то момент мы станем иметь маски всех видов любой числа, что увеличит суммарный правильный % распознания.

Если рассматривать идеальный вариант, разумеется, технология обязана иметь обратную зависимость, другими словами дополнять маски в соглашение лишь после того как мы удостоверились что капча была распознанна точно, т.е. после отправки формы на целевой компьютер. В связи с тем что в случае если вдруг в соглашение масок попадет маска не того знака, то вся технология может предоставить сбой.

Добавить комментарий

Ваш e-mail не будет опубликован. Обязательные поля помечены *

Можно использовать следующие HTML-теги и атрибуты: <a href="" title=""> <abbr title=""> <acronym title=""> <b> <blockquote cite=""> <cite> <code> <del datetime=""> <em> <i> <q cite=""> <strike> <strong>