Connaissez-vous le GRDDL ?

Oui môsieur, GRDDL comme Gleaning Ressource Descriptions from Dialects of Languages. Pour faire simple, GRDDL est un mécanisme mis au point par le W3C qui sert à extraire les informations présentes sur une page web au format XHTML et les transformer en RDF. Pour avoir une explication plus détaillée, je vous recommande cet article : Sémantique et XHTML.

Un peu complexe tout ça, non ? Effectivement, j’avoue être un peu perdu dans tout ces formats. Néanmoins, il semble que le débat tourne autour des microformats et de RDF. Je cite l’auteur de l’article : XHTML n’est pas fait a-priori pour sémantiser l’information, mais pour la structurer. En d’autres termes, si vous souhaitez donner du sens à vos pages web, la bonne pratique consiste à utiliser des balises descriptives de metadonnées (comme le Dublin Core que j’utilise) ou à associer des éléments RDF beaucoup plus complets… mais plus lourds à implémenter. D’où l’intérêt d’une solution intermédiaire comme GRDDL. (merci à Gauthier pour le lien)

Un commentaire sur “Connaissez-vous le GRDDL ?

  1. >comme le Dublin Core que j’utilise Mmm, je voulais déjà te le signaler mais tes données Dublin Core sont identiques pour tous les articles, ce qui les rend pas très exploitables. L’idéal serait que chaque article ait des données DC propres pour par exemple s’en servir pour tagger automatiquement l’article dans delicious en se basant sur l’élément subject.

  2. Oh mais c’est génial tout ça ! On embarque des informations Dublin Core directement dans la structure de la page (merci le RDF embarqué) et on utilise GRDDL (merci XML+XSL) pour extraire ces informations et générer du RDF automatiquement, sans s’être pris la tête à devoir le générer. Du coup XHTML structure l’information et lui ajoute quelques doses de sens sans créer de doublons. Merci pour ces informations et ces liens, je vais me plonger là-dedans !

  3. Juste pour info, théoriquement les tags dublin core sont déjà intégrés dans le RSS de ton fil de syndication. Je n’ai pas vérifié mais le minimum devrait être là. C’est aussi à ça que ça sert RSS, à sémantiser, parce qu’on oublie bien souvent que RSS est un dialecte RDF.

  4. Attention, toutes les versions de RSS ne sont pas des vocabulaires RDF. RSS 1 dit RDF site Summary constitue un vocabulaire RDF ce qui permet d’insérer facilement (vive la modularité de RDF) des propriétés issues d’autres vocabulaires RDF comme Dublin Core (qui au passage propose plusieurs façons d’être exprimées : embarquer dans le HTML ou dans un fichier RDF d’où GRDDL comme l’a très bien résumé JMG). En revanche, RSS 0.92 et RSS 2 sont des schémas XML, la possibilité d’intégrer des éléments issus d’autres schémas est possible par l’intermédiaire des namespaces, mais pas aussi simple car il faut que cette possibilité soit déclaré dans ton schéma ce que prévoit visiblement RSS 2.

  5. Oui, mais les méta-données sont des données à propos de la donnée. Ca peut donner un titre au texte, dire dans quelle collections on peut le trouver, donner sa date, son auteur, plein de choses intéressantes. On sait qualifier la donnée par rapport à son environnement, on peut savoir de quoi sa parle, à quoi ça ressemble mais … ce qu’il y a à l’intérieur n’a toujours pas de sens. C’est un peu comme une bibliothèque super bien rangée mais où on n’a lu que les couvertures et les résumés. Bref, les DC pour les billets c’est bien, mais ça ne remplace pas tout ce qui peut donner du sens à … ce qu’il y a à l’intérieur.

  6. Je suis tout à fait d’accord avec Eric Daspet et c’est tout l’enjeu du Web sémantique et de RDF. Dublin Core n’est qu’une application simple et une première étape des possibilités de RDF. Pour dépaser cela, il faut plutôt regarder du côté du système des ontologies qui permettent de structurer la connaissance. On pourrait ainsi rattacher les mots dans une page Web à une instance d’une ontologie et, ainsi de désambiguïser le sens des mots pour améliorer les recherches. A cet égard, on peut voir les idées qui existent du côté de Wikipedia qui étudie la possibilité de créer une ontologie.

Laisser un commentaire