
Conclusion.
Afin de garder une trace des différentes techniques, nous avons conservé les tableaux résumant les différentes techniques de segmentation présentés dans mon premier état de l'art. Le tableau 2.2 énumère les différentes techniques de segmentation par approche ascendante, le tableau 2.3 résume les différentes techniques de segmentation par approche descendante et le tableau 2.4 les approches Texture. Pour plus de détails, le lecteur pourra se reporter à mon précédent état de l'art.
Nom | Année | Principe | Inconvénients |
---|---|---|---|
Wong K.Y. Wong, R.G. Casey, and F.M. Wahl. Document analysis system.IBM Journal of Research and Development [WCW82]26(6) :647–656, 1982. |
1982 | Noirci les espaces blancs entre deux pixels noirs verticalement et horizontalement puis fait un ET logique entre les deux images noircies. | Nécessite une orientation horizontale du texte. |
Antonacopoulos A. Antonacopoulos. Page segmentation using the description of the background.Computer Vision and Image Understanding, [Ant98]70(3) :350–369, 1998. |
1998 | Utilise des tuiles sur le fond pour estimer les interlignes. | Très sensible au bruit de fond. |
Messelodi S. Messelodi and C.M. Modena. Automatic identification and skew estimation of text lines in real scene images.Pattern Recognition [MM99]32(5) :791–810, 1999 |
1999 | Utilisation d'heuristiques pour classer les composants connexes. | La binarisation utilisée n'est pas très efficace. |
Lienhart R. Lienhart and W. Effelsberg. Automatic text segmentation and text recognition for video indexing.Multimedia Systems [LE00]8 :69–81, 2000. |
2000 | Accroissement de régions où les frontières se déplacent en fonction du gradient. | plus adapté à la segmentation de vidéos. |
Wang Y. Wang, I. T. Phillips, and R. M. Haralick. Document zone content classification and its performance evaluation.Pattern Recognition, [WPH06]39(1) :57–73, 2006. |
2006 | Utilisation d'un vecteur de 69 caractéristiques, réduction à 23 par un algorithme de classification pour ensuite identifier le type de la boîte. | L'intérêt de la méthode n'est pas de segmenter mais de classifier. |
Nicolas S. Nicolas, T. Paquet, and L. Heutte. Extraction de la structure de documents manuscrits complexes à l’aide de champs markoviens.In Actes du 9ème Colloque International Francophone sur l’Ecrit et le Document, [NPH06]pages 13–18, 2006. |
2006 | Utilisation des champs de Markov pour caractériser le texte. | L'apprentissage ne rend la méthode valable que pour un type de document à la fois. |
Caponetti L. Caponetti, C. Castiello, and P. Gorecki. Document page segmentation using neuro-fuzzy approach.Applied Soft Computing [CCG07]In Press, Corrected Proof :–, 2007 |
2007 | Utilise deux réseaux de neurones flou pour segmenter une image. | La phase d'apprentissage est très lourde à mettre en place en raison du type de réseau. |
Nom | Année | Principe | Inconvénients |
---|---|---|---|
Horowitz S. L. Horowitz and T. Pavlidis. Picture segmentation by a traversal algorithm.Comput. Graphics Image Process. [HP72]1 :360–372, 1972. |
1972 | Commence par découper l'image en quatre, récursivement puis fusionne les zones de caractéristiques proches. | Nécessite une organisation horizontale de l'image. |
Nagy G. Nagy and S. Seth. Hierarchical representation of optically scanned documents.International conference on Pattern Recognition, [NS84]7 :347–349, 1984. |
1984 | Découpe l'image horizontalement puis verticalement, récursivement. Le découpage se fait dans le creux des projections. | Il existe des documents impossibles à segmenter. |
Kim H.K. Kim. Efficient automatic text location method and content-based indexing and structuring of video database.Journal of Visual Communication and Image Representation, [Kim96]7(4) :336–344, 1996. |
1996 | Utilise les pics de l'histogramme pour sélectionner les pixels de couleurs proches. Regroupe ensuite les composants proches et utilise des heuristiques pour classer les composantes. | L'utilisation de l'histogramme est trop générale pour donner de bons résultats. |
Jain A. K. Jain and B. Yu. Automatic text location in images and video frames. Pattern Recognition [JY98]31(12) :2055–2076, 1998 |
1996 | Réduit le nombre de couleurs en fonction des couleurs les plus proches. Regroupe ensuite les composantes de couleurs proches et utilise des heuristiques pour classer les composantes. | Pas de prise en compte spatiale des couleurs. |
Nom | Principe | Avantages | Inconvénients |
---|---|---|---|
Fourier [ZZJ00] Y. Zhong, H. Zhang, and A. K. Jain. Automatic caption localisation in compressed video. IEEE Trans. Pattern Anal. Mach. Intell., 22(4) :385 – 392, 2000. K.Y. Wong, R.G. Casey, and F.M. Wahl. Document analysis system.IBM Journal of Research and Development [WCW82]26(6) :647–656, 1982. |
Passe l'image dans le domaine fréquentiel. | Rapide, utilisé dans les images JPEG. | Perte de la localisation. Nécessite une fenêtre d'analyse. |
Dérivée V. Wu, R. Manmatha, and E. M. Riseman. Textfinder : An automatic system to detect and recognize text in images.IEEE Transactions on Pattern Analysis and Machine Intelligence, [WMR99,21(11) :1224–1229, 1999. T. Sato, T. Kanade, E. K. Hughes, and M. A. Smith. Video ocr for digital news archive.In International Workshop on Content-Based Access of Image and Video Databases (CAIVD ’98), SKHS98]pages 52–60, 1998. |
Met en avant les variations dans l'image. | Rapide, permet de localiser les contours. | Nécessite une taille adaptée de la fenêtre d'analyse. |
Gabor C. Datong, K. Shearer, and H. Bourlard. Text enhancement with asymmetric filter for video OCR. In ICIAP ’01 : Proceedings of the 11th International Conference on Image Analysis and Processing, [DSB01]page 192, Washington, DC, USA, 2001. |
Met en avant les variations dans l'image. | Sensibles à un certain type de fréquence avec une certaine orientation. | Assez coûteux en calculs. Nécessite un paramétrage adapté pour la fréquence et l'orientation. |
Les ondellettes V. Wu, R. Manmatha, and E. M. Riseman. Hybrid chinese/english text detection in images and video frames.Proceedings of the 16th International Conference on Pattern Recognition, [WMR02]2 :31015, 2002. |
Met en avant les variations dans l'image. | Analyse non sensible à l'échelle et à l'orientation. | Très coûteux en calculs. |
Auto-corrélation N. Journet. Analyse d’images de documents anciens : Catégorisation de contenus par approche texture.PhD thesis, [Jou06]Université de La Rochelle, 2006. |
Met en avant l'orientation générale et la périodicité de la texture. | Permet de créer une rose des directions. | Très coûteux en calculs. La taille de la fenêtre d'analyse est un paramètre critique. |
![]() ![]() | ![]() | ![]() |