Introduction

Présentation de la problématique

Le problème que rencontrent les bibliothèques numériques est proche de celui auquel sont confrontés les moteurs de recherche. En effet, il ne s'agit pas seulement de récupérer l'information, car les moyens de communication permettent un accès rapide et fiable, mais bien de la trouver parmi des millions de candidats potentiels. Généralement, ce qui est proposé est un accès au catalogue des images numérisées ; accès rendu possible grâce à la mise en place d'outils de recherche fonctionnant par mots-clefs. La mise en place et l'accès à ces bibliothèques numériques permettent d'introduire deux notions importantes que sont l'indexation des images et la notion d'aide à la navigation. Ces deux concepts sont complémentaires. L'indexation consiste à trouver un moyen d'associer aux images une information pertinente (métadonnées sur l'ouvrage, index de mots, index d'illustrations ...). La notion d'aide à la navigation touche au problème de l'accessibilité d'une information recherchée dans une masse de données de taille conséquente. La phase d'indexation doit faciliter l'extraction d'une grande quantité d'information, qu'il faut analyser et structurer, pour permettre finalement l'accès à ce que recherche un utilisateur.

Il existe deux manières d'appréhender l'indexation. La question est avant tout de savoir comment extraire de l'information des images de textes numérisées ? Certaines bibliothèques numériques ont fait le choix d'indexer manuellement leurs images alors que d'autres ont fait le pari de se lancer dans des solutions incluant de l'indexation automatique. Dans le premier cas, de nombreux défauts comme la lourdeur de la tâche ou encore la subjectivité des mots-clefs choisis pour indexer les documents rendent difficile sa mise en oeuvre. Mais la deuxième approche, bien que résolvant les deux précédents problèmes, n'est pas plus simple à mettre en place. En effet, les documents sont parfois en mauvais état, mal numérisés et/ou dans un alphabet ne permettant pas de retrouver facilement le texte dans les images.

Parallèlement à cette indexation de documents des bibliothèques, une autre difficulté se rapprochant de cette problématique a été soulevé par les bases de données multimédias. Les sites comme YouTube où tout le monde peut déposer une vidéo, ou encore les bases de données d'images, sont des sources intarissables de documents multimédias qu'il est parfois difficile d'indexer. Une bonne manière d'ajouter de l'information sémantique (par opposition à l'information bas niveau, comme une couleur, une texture...) est d'utiliser le texte présent dans l'image

C.Wolf. Détection de textes dans des images issues d’un flux vidéo pour l’indexation sémantique.
PhD thesis, INSA de Lyon, 2003.

[Wol03]. Il est alors possible d'obtenir le nom du présentateur, la ville, le sujet...