Les Captcha sont ces petites boîtes qu'on nous demande souvent de remplir après une inscription ou l'envoi d'un commentaire pour vérifier que nous ne sommes pas des robots. Il nous est simplement demandé de recopier une série de chiffres et de lettres dessinés bizarrement (tordus, moirés, barrés etc.), ce qui est censé prouver au système que nous avons bien deux yeux pour voir ce dessin et l'interpréter.
Mais les robots sont de plus en plus performants et parviennent de mieux en mieux à lire ces dessins. La solution consiste alors à les complexifier pour rendre leur lecture de plus en plus difficile par les robots... mais du coup pour les humains aussi.
Les captcha commencent ainsi à trouver leur limite. Alors Microsoft a imaginé un nouveau modèle : la reconnaissance de forme, partant d'un constat insolite : à ce jour, seul l'homme sait distinguer le chien du chat !
Le projet se nomme Asirra (Animal Species Image Recognition for Restricting Access = Reconnaissance par image des espèces animales pour les accès restreints), et utilise une base de donnée de deux millions de photos fournie par le site Petfinder (site d'adoption d'animaux).
Les robots à ce jour ont un mal de chien à identifier clairement les formes. Les algorithmes de reconnaissance de forme échouent environ une fois sur 2. Avec 12 photos, le nombre d'images à reconnaître chez Assira, un logiciel qui répondrait au hasard a une chance sur 4 096 (2 puissance 12).
A quoi ça sert ?
Le web regorge de sites proposant des services gratuits (adresses emails, comptes clients, espaces de stockage, conversation, etc.), mais des petits malins profitent souvent de ces services pour lancer des campagnes massives de publicité (spam sur un espace de discussion, utilisation d'email gratuits pour spammer, etc.)
Les CAPTCHA (Completely Automated Public Turing test to tell Computers and Humans Apart = Test de Turing completement automatique pour distinguer les hommes des machines) ou HIP (Human Interactive Proof) sont des outils qui permettent normallement d'empêcher les scripts automatiser d'avoir accès à ces espaces gratuits.
Mais devant les performances toujours meilleures des outils de reconnaissance de texte, l'imagination est sollicitée pour protéger plus efficacement ces espaces.