Le Dublin Core
Le Dublin Core Metadata est un jeu de mĂ©tadonnĂ©es qui a Ă©tĂ© mis au point par le Dublin Core Metadata Initiative (forum ouvert composĂ© de personnes de disciplines variĂ©es et de toutes les rĂ©gions du monde), en 1995. La norme Dublin Core dĂ©finit des champs de mĂ©tadonnĂ©es utilisables par les pages Web. Elle se veut facile et assez gĂ©nĂ©rale pour ĂȘtre pertinente quelque soit le domaine dÂapplication. Elle dĂ©finit les types dÂinformations Ă enregistrer pour bien dĂ©finir une ressource sans toutefois prĂ©ciser comment reprĂ©senter ces donnĂ©es en pratique. Le Dublin Core a Ă©tĂ© approuvĂ© comme norme ANSI et ISO et a Ă©tĂ© adoptĂ© entre autres par le gouvernement canadien, britannique et australien.
Les champs de mĂ©tadonnĂ©es sont appelĂ©s Ă©lĂ©ments et ces deniers peuvent ĂȘtre approfondis Ă lÂaide d'affinements. Un affinement restreint la signification dÂun Ă©lĂ©ment sans la changer fondamentalement.
De plus, les valeurs associĂ©es aux champs de mĂ©tadonnĂ©es peuvent ĂȘtre dans un format libre ou ĂȘtre conforme Ă un format de donnĂ©es bien dĂ©fini. Le Dublin Core rĂ©fĂ©rence un certain nombre de formats de donnĂ©es officiels.
Champs de métadonnées
Le Dublin Core est un ensemble de 15 éléments de métadonnées ayant trait au contenu, à la propriété intellectuelle et à la version.
Nous prĂ©senterons ici une liste exhaustive des champs de mĂ©tadonnĂ©es du Dublin Core qui peuvent ĂȘtre encodĂ©s dans des balises HTML <meta>.
ĂlĂ©ment | Description et liste des raffinements |
---|---|
title | Titre du document : il s'agit a priori du titre principal du document. Pour indiquer un autre type, on peut utiliser le raffinement suivant :
|
creator | Créateur du document : nom de la personne, de l'organisation ou du service à l'origine de la rédaction du document. |
subject | Sujet et mots-clefs : mots-clefs, phrases de résumé, ou codes de classement. Il est préférable d'utiliser des mots-clefs choisis dans le cadre d'une politique de classement. |
description | Description du document : rĂ©sumĂ©, table des matiĂšres, ou texte libre. Le type de description peut ĂȘtre prĂ©cisĂ© Ă l'aide des raffinements suivants :
|
publisher | Publicateur du document : nom de la personne, de l'organisation ou du service Ă l'origine de la publication du document. |
contributor | Contributeur au document : nom d'une personne, d'une organisation ou d'un service qui contribue ou a contribué à l'élaboration du document. |
date | Date d'un évÚnement dans le cycle de vie du document : il peut s'agir par exemple de la date de création ou de la date de mise à disposition. Il est recommandé de spécifier la date au format W3CDTF(AAAA-MM-JJ). Pour préciser de quelle date il s'agit, on utilise les raffinements suivants :
|
type | Nature ou genre du contenu : grandes catégories de document. Il est recommandé d'utiliser des termes clairement définis au sein de son organisation. |
format | Format du document : format physique ou Ă©lectronique du document. Par exemple, type de mĂ©dia ou dimensions (taille, durĂ©e). On peut spĂ©cifier le matĂ©riel et le logiciel nĂ©cessaires pour accĂ©der au document. Il est recommandĂ© d'utiliser des termes clairement dĂ©finis, par exemple le type MIME(Multi Purpose Mail Extension : standard permettant dÂĂ©tendre les possibilitĂ©s du courrier Ă©lectronique. Les raffinements suivants sont disponibles :
|
identifier | Identificateur non ambigu : il est recommandé d'utiliser un systÚme de référencement précis, par exemple les URI (Uniform Resource Identifier) ou les numéros ISBN. |
source | Ressource dont dérive le document : le document peut découler en totalité ou en partie de la ressource en question. Il est recommandé d'utiliser une dénomination formelle des ressources, par exemple leur URI. |
language | Langue du document : il est recommandé d'utiliser un code de langue conforme au format RFC3066 (qui définit la syntaxe des étiquettes linguistiques à utiliser sur Internet). |
relation | Lien vers une ressource liée : il est recommandé d'utiliser une dénomination formelle des ressources, par exemple leur URI. On précise le type de lien avec des raffinements :
|
coverage | PortĂ©e du document : la portĂ©e inclut un domaine gĂ©ographique, un laps de temps, ou une juridiction (nom d'une entitĂ© administrative). Il est recommandĂ© d'utiliser des reprĂ©sentations normalisĂ©es de ces types de donnĂ©es. Le type de couverture peut ĂȘtre prĂ©cisĂ© :
|
rights | Droits relatifs à la ressource : permet de donner des informations sur le statut des droits du document, par exemple la présence d'un copyright, ou un lien vers le détenteur des droits. L'absence de cet élément ne présume pas que le document est libre de droits. |
audience | Audience du document : l'audience représente le groupe de personnes à qui le document est destiné. L'audience est déterminée par l'auteur, le publicateur, ou un tiers. On peut utiliser les raffinements suivants :
|
Exemple
Voici en pratique un extrait d'un exemple de document dans lequel on a inséré des métadonnées.
<!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Strict//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-strict.dtd"> <html> <head> <title>Un document en HTML</title> <meta http-equiv="Content-type" content="text/html; charset=iso-8859-1" /> <link rel="schema.DC" href="http://purl.org/dc/elements/1.1/" /> <meta name="DC.Title" lang="fr" content="Un document en HTML" /> <meta name="DC.Date.created" scheme="W3CDTF" content="2003-04-03" /> <meta name="DC.Date.modified" scheme="W3CDTF" content="2003-04-27" /> <meta name="DC.Subject" lang="fr" content="HTML, document, Dublin Core" /> <meta name="DC.Language" scheme="RFC3066" content="fr-FR" /> <meta name="DC.Description" lang="fr" content="Mon premier document HTML avec métadonnées" /> </head> <body>  </body> </html>
La balise <link  > rĂ©fĂ©rence la liste officielle des Ă©lĂ©ments et des affinements du Dublin Core. Elle permet aux logiciels de savoir Ă quoi exactement correspond le prĂ©fixe DC, en spĂ©cifiant son schĂ©ma. Pour faire rĂ©fĂ©rence Ă un Ă©lĂ©ment du Dublin Core, il est conseillĂ© dÂutiliser le PURL (Persistent Uniform Resource Locator) dĂ©fini pour le Dublin Core afin dÂavoir une meilleure stabilitĂ© rĂ©fĂ©rentielle. Un PURL est un URL rĂ©putĂ© persistant et qui est redirigĂ© vers un service de rĂ©solutions de noms.
Ainsi, lÂĂ©lĂ©ment « Creator » du Dublin Core selon la version 1.1, fait rĂ©fĂ©rence univoquement Ă http://purl.org/dc/elements/1.1/creator, redirigĂ© par le systĂšme PURL vers http://purl.org/2003/03/24/dces#creator (pourrait ĂȘtre redirigĂ© vers un autre URL dans le futur).
Commentaires
Les terminologies du Dublin Core peuvent ĂȘtre dĂ©routantes car certains champs peuvent ĂȘtre trĂšs gĂ©nĂ©ralisĂ©s : le Dublin Core parle de crĂ©ateur (Creator) dÂune ressource et non pas dÂAuteur.
Le Dublin est trĂšs utile lors de la description de ressources peu complexes. Cependant, cet ensemble de mĂ©tadonnĂ©es ne couvre pas les besoins potentiels de tous les utilisateurs et sÂavĂšre insuffisant pour des applications qui vont au-delĂ de recherches simples de ressources.
Le Dublin Core est un point de dĂ©part utilisable comme un noyau auquel viendront se rajouter des extensions en fonction des besoins de diffĂ©rentes disciplines ou des utilisateurs. NĂ©anmoins, en pratique, les choses se font souvent dans lÂautre sens :
Un musée peut utiliser une norme propre à une discipline pour documenter et gérer ses collections. Puis il extrait un sous-ensemble de ses enregistrements qui correspond aux éléments de la norme Dublin Core. Ces enregistrements conformes à la norme Dublin Core peuvent servir à des fins d'échange de données et de recherches simples. Cela est particuliÚrement important dans des projets conjoints ou lorsqu'il s'agit de partager des données de plusieurs disciplines.
Dans le cas de la gestion dÂimages, des champs additionnels ou des schĂ©mas complĂ©mentaires sont nĂ©cessaires pour dĂ©finir des structures comme : la gestion administrative, les droits associĂ©s .