Reconnaissance de formes

Reconnaissance de forme à partir de modélisation en 3D

La reconnaissance de formes (ou parfois reconnaissance de motifs) est un ensemble de techniques et méthodes visant à identifier des régularités informatiques à partir de données brutes afin de prendre une décision dépendant de la catégorie attribuée à ce motif^[1]. On considère que c'est une branche de l'intelligence artificielle qui fait largement appel aux techniques d'apprentissage automatique et aux statistiques.

Le mot forme est à comprendre dans un sens très général, pas seulement celui de « forme géométrique » mais plutôt de régularités ou motifs qui peuvent être de nature très variée. Il peut s'agir de contenu visuel (code-barres, visage, empreinte digitale…) ou sonore (reconnaissance de parole), d'images médicales (rayon X, EEG, IRM…) ou multispectrales (images satellitaires) et bien d'autres.

Histoire

Méthodes

La reconnaissance de motifs peut être effectuée au moyen de divers algorithmes d'apprentissage automatique tels :

un réseau de neurones ;
une analyse statistique ;
l'utilisation de modèles de Markov cachés ;
une recherche d'isomorphisme de graphes ou sous-graphes.

Les formes recherchées peuvent être des formes géométriques, descriptibles par une formule mathématique, telles que :

Elles peuvent aussi être de nature plus complexe :

Les algorithmes de reconnaissance peuvent travailler sur des images en noir et blanc, avec en blanc les contours des objets se trouvant dans l'image. Ces images sont le fruit d'algorithmes de détection de contours. Ils peuvent aussi travailler sur des zones de l'image prédéfinies issues de la segmentation de l'image.

Méthodes de reconnaissance de formes :

Mise en correspondance de graphes ;
Méthode bayésienne ;
Estimation paramétrique ;
Classifieur linéaire ;
Réseau de neurones ;
Local feature focus ;
Support vector machine (SVM);
Polytopes de contrainte ;
Méthode des hypercubes.
Méthodes prétopologiques.

Un algorithme bien connu pour la détection de formes, la transformée de Hough, est une méthode d'estimation paramétrique.

Méthode globale

Cette méthode caractérise une forme et extrait des paramètres caractéristiques de l'objet et les compare par une méthode de classification ou de mise en correspondance à une base d'apprentissage. Par cette méthode, il est impossible d'extraire plusieurs formes de la même image sans pré-traitement.

Méthode multiple à partir de point d'intérêt

Dans cette approche, on extrait des points caractéristiques d'objets comme les coins via les détecteurs de Harris puis on extrait des caractéristiques au voisinage de ce point. Avec ces caractéristiques, il est possible d'extraire plusieurs objets et de faire la reconnaissance de ceux-ci via un classifieur.

Applications

Jeu de go par ordinateur
Reconnaissance vocale
Recherche d'images par le contenu
Classification de documents
Reconnaissance de l'écriture manuscrite
Reconnaissance optique de caractères

Bibliographie

(en) Richard O. Duda, Peter E. Hart, David G. Stork, Pattern Classification, Wiley-interscience, 2001 (ISBN 0-471-05669-3) [détail des éditions]
(en) Dietrich Paulus and Joachim Hornegger (1998), Applied Pattern Recognition (2^e édition), Vieweg. (ISBN 3-528-15558-2)
(en) J. Schuermann, Pattern Classification: A Unified View of Statistical and Neural Approaches, Wiley & Sons, 1996, (ISBN 0-471-13534-8)
(en) Sholom Weiss and Casimir Kulikowski (1991), Computer Systems That Learn, Morgan Kaufmann. (ISBN 1-55860-065-5)
(en) Christopher M. Bishop, Pattern Recognition And Machine Learning, Springer, 2006 (ISBN 0-387-31073-8) [détail des éditions]
(fr) Mohammed BOUAYAD, "Prétopologie et Reconnaissance des Formes", Thèse de doctorat, Insa de Lyon, 1998 (N° d'ordre 98ISAL0120).[2] [archive]

Références

↑ (en) Richard O. Duda, Peter E. Hart, David G. Stork, Pattern Classification, Wiley-interscience, 2001 (ISBN 0-471-05669-3) [détail des éditions].