Retour à la page principale --> Etude préalable --> Les techniques



RDF



- Principe

RDF (Resource Description Framework) est un moyen d’encoder, d’échanger et de réutiliser des métadonnées structurées. C’est un idiome XML développé par le W3C (Consortium du World Wide Web) et ayant fait l’objet d’une première Recommandation en 1999.

L’objectif principal de cet idiome est de décrire le contenu de ressources pour rendre possible des recherches « intelligentes », c'est-à-dire des recherches en fonction de critères précis. Le RDF est une technique de description de documents du Web sémantique.

RDF ne précise pas la sémantique des ressources décrites par les différentes communautés d’utilisateurs de métadonnées. A l’instar d’XML, RDF est un langage extensible, un métalangage ; c’est un cadre (framework) de description des ressources applicable à n’importe quel domaine d’application. Ainsi, RDF peut être assimilé à un cadre prêt à recevoir les métadonnées du Dublin Core, et permet d’intégrer et d’emboîter (principe des poupées russes) dans l’en-tête d’un fichier plusieurs normes de métadonnées.

Le principe

Comme nous le montre la figure ci-dessus, RDF est une couche qui repose sur la syntaxe XML. Chaque schéma RDF précise le type de métadonnées à inclure dans une ressource.


- Les concepts du RDF


  • Les graphes étiquetés orientés

RDF est basé sur des triplets :
- sujet – prédicat – objet
- ou ressource – propriété – valeur

La ressource est l’objet présent sur le web et accessible grâce à un URI (Uniform Resource Identifier). Il peut s’agir d'un site web, d’une page web, ou encore d'élément composant la page (image, texte,...).
La propriété représente les caractéristiques de la ressource. Par exemple, le nom du l’auteur, la date de création, le format...
La déclaration est le rapport entre la ressource, la propriété et l’objet, faisant apparaître les relations entre les éléments.

exemple

Ces triplets sont modélisés à l’aide de graphes orientés étiquetés.

graphe simple

Les ressources sont identifiées par des URI (Unified Ressource Identifier). Les URI peuvent être considérés comme un « stock de noms » utilisés pour désigner des choses ou des concepts.
Les URL habituels sont des URI. Ainsi, dans notre exemple, le document Les orchidées en Corse peut être identifié naturellement par l’URI :
http://www.tela-botanica.org/LesOrchideesEnCorse.pdf

Les prédicats (propriétés) sont également représentés par des URI.

URI

Un sujet (ressource) peut posséder plusieurs prédicats (propriétés).

plusieurs prédicats


  • La syntaxe RDF

Le graphe orienté étiqueté précédent se traduit en syntaxe RDF par :

syntaxe RDF

  • Les ressources complexes

Les ressources décrites peuvent être imbriquées :

graphe complexe

Dans cet exemple, l’auteur n’est pas une valeur, mais une autre ressource. La ressource auteur est identifiée par une URI propre à l’association.


  • Notion de Schéma RDF

Un schéma RDF permet de décrire un vocabulaire et une sémantique des types de propriétés utilisées par une communauté d’utilisateurs. Un schéma RDF précise les propriétés valides pour une description RDF particulière, ainsi que les caractéristiques et contraintes du vocabulaire descriptif.

Il faut bien distinguer les deux notions suivantes :
- Schéma XML (dont le rôle est plus ou moins analogue aux DTD) qui exprime des contraintes sur la structure et la syntaxe XML.
- Schéma RDF qui exprime des contraintes sur la sémantique des expressions d’un modèle RDF.

Exemple : le schéma RDF du Dublin Core

- L’usage du RDF pour les images

Une description RDF peut être incluse dans un fichier externe à la ressource ou à l’intérieur même d’une ressource. L'incorporation de métadonnées internes est plus complexe que l’emploi de métadonnées externes (qui nécessitent simplement l’écriture dans un fichier texte). C’est pourquoi, des applications spécifiques sont nécessaires pour effectuer cette dernière opération. Pour intégrer des données dans une image, un seul logiciel existe : RDFPic.

  • Le logiciel RDFPic

RDFPic est un programme développé par le W3C pour permettre d’incorporer des métadonnées au format RDF (simplifié) au sein d’une image. Il n’a jamais dépassé le stade expérimental. Cependant, ce logiciel est multiplate-forme, puisqu’il a été écrit en Java. Mais il n’est pas facile d’installation pour des non-informaticiens.

image plante

La description ci-dessous montre la définition RDF contenue dans cette image :

code RDF correspondant

  • Le RDF et le HTML

Nous pouvons inclure une description RDF dans du HTML. Mais le plus simple est de placer la totalité du contenu de description RDF dans un fichier externe à la ressource décrite, et de l’appeler depuis le fichier HTML via l’instruction suivante :

<LINK rel="META" href="monDocumentRDF.rdf">

- Critique

Le RDF permet d’associer des métadonnées à un document indépendamment du type de contenu. Cette technique s’applique aussi bien à un document texte qu’à une image. L’objectif principal du RDF est de définir un mode standard de description de ressources à partir de n’importe quel domaine d’application : scientifique, littéraire…

D’autre part, le RDF a reçu une dernière recommandation du W3C en février 2004 pour décrire des métadonnées sur des documents. Selon de nombreuses sources, il semblerait que le RDF soit l’avenir du Web sémantique. Le RDF facilite et rend plus fiable l’indexation dans les moteurs de recherche grâce au mécanisme de recherche « intelligente ». Il décrit le contenu dans le catalogage et le rapport avec une ressource particulière disponible sur le Web. Ainsi, il facilite le partage et l’échange de connaissances. Cependant, cette technique de référencement des pages Internet n’est pas encore utilisée par les moteurs de recherche tels que Google. L'emploi du RDF permettrait d’anticiper les utilisations futures du Web sémantique en associant à chaque contenu une description RDF. La possibilité d’inclure du RDF à l’intérieur même d’une image n’a jamais dépassé le stade expérimental et nécessite de passer par l’intermédiaire du logiciel RDFPic pour ne pas altérer les données d’une image.