Si pour un humain normal reconnaître des personnes ou du texte sur des photos est une tâche banale, pour un ordinateur c’est extrêmement difficile. Jusqu’ici, de nombreuses approches ont été expérimentées pour donner aux machines des capacités de perception visuelle proche de celles des humains. Pratiquement, on a toujours été loin du compte.
Des chercheurs ambitieux de Google, ont pris sur eux de relever ce défi. Traditionnellement, la reconnaissance des images implique trois étapes distinctes (localisation, segmentation et reconnaissance) qui sont implémentées avec des algorithmes différents.
Ian J. Goodfellow, Yaroslav Bulatov, Julian Ibarz, Sacha Arnoud et Vinay Shet ont combiné ces trois étapes dans un seul algorithme d’apprentissage, un réseau de neurones à convolution profond qui opère au niveau de chaque pixel d’image fourni en entrée.
L’algorithme a été testé avec les numéros de maison de la banque de données de Street View. Il s’en sort avec un taux de réussite de 96%. Et ce n’est pas tout ! Les chercheurs ont poussé le bouchon en soumettant leur algorithme au reCAPTCHA, là où échouent les systèmes de reconnaissance optique des caractères (OCR). Ils ont obtenu un taux de réussite de 99,8% (pratiquement la performance d’un sujet humain).
En termes de réussite, le nouvel algorithme de Google représente le « nec plus ultra » dans le domaine de la reconnaissance optique des caractères. On espère tout simplement que de nouvelles applications utilisant cet algorithme verront rapidement le jour.
Source: Rapport PDF de l'étude
Et vous ?
Qu'en pensez-vous ?
Des chercheurs de Google créent un algorithme de reconnaissance de caractères
Avec un taux de réussite de 99,8% sur les textes de reCAPTCHA
Des chercheurs de Google créent un algorithme de reconnaissance de caractères
Avec un taux de réussite de 99,8% sur les textes de reCAPTCHA
Le , par Cedric Chevalier
Une erreur dans cette actualité ? Signalez-nous-la !