L’art de la taxonomie

Un jour ou l’autre, vous serez forcement confronté au web sémantique. Mais si, je vous en avais déjà parlé. Le web sémantique est l’avenir de nos sites, ou plutôt des contenus de nos sites. Plus précisément, le web sémantique consiste à apporter de l’intelligence au contenu d’un site et d’associer ainsi des méta-données aux pages. Ainsi, chacuns des billets que vous êtes en train de lire est décrit comme un item avec un titre, un auteur, une date, un lien, un sujet et une description. Pourquoi ? Tout simplement pour faciliter la réutilisation du contenu. Cette couche sémantique (les méta-données) permettent ainsi à des logiciels de ne récupérer que les informations pertinentes d’un site (en l’occurrence les billets), ce sont les fameux news reader.

Mais là je m’égare un peu, hum.. hum… Tout ça pour dire que la FING vient de publier un article intéressant sur l’art de la taxonomie. Et là vous vous demandez : mais c’est quoi une taxonomie ?, et moi je vous répond : une taxonomie est ensemble de termes définis par un groupe (une communauté de pratiques) organisés selon une structure hiérarchique. Le meilleur exemple de taxonomie est celle des animaux : nous avons les vertébrés et les invertébrés. Dans les invertébrés nous retrouvons les mammifères, les ovipares… et ainsi de suite, le vocabulaire est ainsi structuré selon une hiérarchie précise avec un ensemble de catégories et de sous-catégories. Pour une explication plus précise, je vous recommande les très bon article suivant : Ontologie, thésaurus, taxonomie et Web sémantique.

Une étude de cas sur l’implémentation de meta-données

Le NSW Office of Information and Communications Technology (l’office des technologies de communication et de l’information australien) nous offre sont retour d’expérience sur un projet de gestion de contenu des plus intéressant : Metadata based search and browse functionality on the NSW Office of Fair Trading intranet: a Case Study. Pour résumé, cette agence gouvernementale décrit comment elle a refondu le système de recherche de son intranet en implémentant une couche sémantique. concrètement, chacune des pages et des documents a été indéxé à l’aide de différents critères descriptifs : ‘creator’, ‘publisher’, ‘title’, ‘subject’, ‘description’, ‘language’, ‘date’, ‘type’, ‘format’ et ‘identifier’. Il est a noté que les administrateurs du système utilisent actuellement un thésaurus de plus de 4.000 termes pour le champ ‘subject’. Pour les techniciens, les outils utilisés sont les suivants : Intervowen Teamsite pour la gestion de contenu, Metatagger pour la gestion des meta-données et Verity K2 pour le moteur de recherche. Une bien belle étude de cas comme on aimerait en voir plus souvent…

Et on reparle du BPMN

Je vous avais déjà parlé du BPMN dans un précédent billet. Et bien figurez vous que cette norme de modélisation des processus métiers progresse et s’est trouvé tout un tas de partenaires motivés. Soulignons le fait que la Business Process Modelng Initiative (BPMI), qui est à l’origine de la norme BPMN, est soutenue par le W3C et par le consortium OASIS. C’est un signe de sérieux puisque OASIS est l’organisation qui soutien d’autres projets d’envergures comme les Web Services, ebXML ou LegalXML. Allez donc voir dans la section ‘BPMN Articles and Papers’ pour voir à quoi ressemble cette notation.

BPMN

En ce qui me concerne, je trouve cette initiative intéressante mais avec des conditions : que ce système de notation soit utilisé dans le cadre d’un projet web à la fois par la maîtrise d’ouvrage (côté fonctionnel) et par la maîtrise d’oeuvre (côté technique); et que ce système permettent aux équipes de spécifier de façon précise et rigoureuse mais en leur faisant gagner du temps. Comprenez par là que ces beaux schémas de modélisation soient traités par des outils qui vont derrière générer des squelettes de codes ou autres. C’est à priori le cas puisque plusieurs éditeurs de logiciels sont d’hors et déjà partenaires de la BPMI. A suivre de très près…

Plein de ressources sur XForms

Si vous vous intéressez au web sémantique et à la révolution en cours (évolution ?), alors vous devez forcement avoir entendu parler d’XForms. Rappelons qu’XForms est un nouveau standard W3C de structuration des formulaires en ligne permettant de séparer la présentation et le mécanisme de fonctionnement du formulaire. Les objectifs sont les suivants : une meilleure portabilité, une ré-utilisation assurée des réponses et des données et une structuration sémantique plus intelligente des formulaires. Bref, tout ça pour dire que je vous propose un site avec plein de ressources sur XForms, mais également sur les technologies concurrentes comme InfoPath : eForms Resources.

Tout ce que vous avez toujours voulu savoir sur le Web sémantique…

… sans jamais avoir osé le demander. Le très bon site LaGrange.net nous propose un article de vulgarisation sur le Web sémantique : Ontologie, thésaurus, taxonomie et Web sémantique. Là où cet article est très intéressant, c’est dans la description claire des différences entre des thermes barbares comme ‘vocabulaire contrôlé’, ‘taxonomie’, ‘thesaurus’ ou encore ‘ontologie’. Si comme moi vous n’êtes pas documentaliste, je pense qu’une lecture de cet article vous aidera à y voir plus clair. Et si vous êtes en forme, je vous recommande également un article un peu plus technique mais très instructif : Metadata? Thesauri? Taxonomies? Topic Maps! Making sense of it all.