Système de recherche et XML

Tim Bray du site OnGoing vient de publier un article sur les systèmes de recherche et la technologie XML : On Search: XML. Dans cet article, il est rappelé les vertus de l’XML en tant que technologie de gestion d’une couche sémantique ainsi que le potentiel d’un système de recherche basé sur les méta données par rapport à un système de recherche plain texte. Cependant, l’auteur se fait l’avocat du diable et précise deux inconvénients majeurs à l’utilisation d’XML :

  • Premièrement, les systèmes de recherche basés sur les méta données ne peuvent révéler leur potentiel que si les requêtes sont conformes à la sémantique utilisée par les méta données. En d’autres termes, si vous avez utilisé une liste de mots contrôlés ou un thesaurus pour décrire des ressources d’informations, vous devrez forcement utiliser ce même vocabulaire pour vos recherches.
  • Deuxièmement, la syntaxe même des recherche devra être très précise pour obtenir un résultat des plus efficace. Si vous deviez faire une recherche sur les mots ‘Utilisabilité’ ou ‘Architecture de l’information’ sur mon site, presque toutes les pages serait inclus dans les résultats. Il y a donc tout un travail à faire, soit en éduquant les utilisateur à bien structurer leurs équations de recherche soit en mettant au point un moteur de recherche en langage naturel suffisamment souple pour orienter les utilisateurs vers la bonne information. Vous par exemple qui lisez ces lignes, à quoi ressemblent vos équations de recherche sur Google ? Utilisez-vous les opérateurs booléens (+ – =) ? Utilisez vous les guillemets et autres options de recherche avancée ? N’oublions pas que les utilisateurs sont des fainéants et qu’ils n’aiment pas trop se creuser la tête. Pour la majeure partie d’entre eux les ordinateurs et l’Internet en général est un monde magique ou l’ordinateur doit être capable de satisfaire tous leurs besoins même s’ils sont mal formulés.
  • Enfin, l’utilisation d’XML et des méta données en général est très coûteuse : entre la mise en point d’une liste de mots clés ou d’un thesaurus, le marquage des sources d’informations (pages, documents…) avec les bonnes méta données, l’implémentation et le paramétrage de l’outils de recherche, l’addition est assez élevée pour peu que l’on veuille faire les choses correctement.

Bref, je vous recommande vivement cet article pour bien appréhender les enjeux des méta données, d’XML et des systèmes de recherche intelligents.

Laisser un commentaire