le site d'un prof d'informatique

Utilisation d'heuristiques


Pour éviter d'avoir le même problème que les méthodes de binarisation à seuil global, les recherches se sont tournées vers des méthodes adaptatives. Ainsi, la méthode de Messelodi prend en compte différents paramètres pour fusionner les composants connexes [MM99]. Afin d'obtenir les composantes connexes, l'image est d'abord binarisée pour ensuite regrouper les pixels en groupes connexes. La méthode de binarisation utilisée est un seuillage global, réalisé deux fois pour extraire le texte noir sur fond clair et le texte clair sur fond sombre. Les deux images sont ensuite traitées séparément.
Ensuite, en partant de l'hypothèse que les composants connexes contiennent tout le texte mixé avec du bruit, des heuristiques permettent de trier les bonnes composantes des mauvaises. La première heuristique sert à détecter le bruit et se base sur le nombre de pixels de la composante. En effet, le bruit produisant de petites tâches, il suffit de fixer un seuil au-dessous duquel la composante est classée comme bruit (en faisant attention aux ponctuations). Ensuite, la taille de la composante comparée avec la taille de l'image permet de pondérer la probabilité d'être en présence du texte. D'autres critères sont utilisés, comme la densité ou le contraste, pour essayer de supprimer au maximum les composantes n'étant pas du texte. Ensuite, les composantes sont regroupées en ligne en utilisant d'autres heuristiques, comme la distance, l'alignement ou la taille comparée.

Bien que cette méthode soit efficace pour trouver le texte dans une image sans a priori sur l'orientation du texte, la binarisation utilisée empêche la détection de texte dans le cas de documents mal éclairés.
En 2006, Wang proposa une nouvelle méthode permettant de mieux traiter la segmentation, tout en conservant cette approche basée sur des heuristiques [WPH06]. La méthode se place en amont de la détection de zones de texte et suppose connu les boîtes englobantes des zones d'intérêt. Cette approche est intéressante pour la segmentation car elle propose de nombreuses heuristiques pour caractériser les boîtes, heuristiques qui pourront être réutilisées pour améliorer les performances d'une technique de segmentation. Le but du projet est de classer correctement le type des blocs dans neuf classes, dont le texte "petit " (moins de 18 points), le texte "grand " (plus de 19 points), les formules mathématiques, les logos, etc. Afin de réaliser la classification, un ensemble de 69 caractéristiques est calculée, parmi lesquelles le "run length", l'auto-corrélation ou encore le ratio entre la longueur et la largeur, sur lesquels un arbre binaire de classification étiquette le bloc. Le but n'est pas de segmenter l'image, cependant, la méthode est facilement adaptable à une approche acsendante, et permettrait d'ajouter des caractéristiques pour traiter plus efficacement les fusions de régions.


Bouygues ImmobilierGuides Cours informatiqueHit-Parade des sites francophones Annuaire gratuit Compare le Net