Retour à la page principale --> Etude préalable --> Les normes


Le Dublin Core



Le Dublin Core Metadata est un jeu de mĂ©tadonnĂ©es qui a Ă©tĂ© mis au point par le Dublin Core Metadata Initiative (forum ouvert composĂ© de personnes de disciplines variĂ©es et de toutes les rĂ©gions du monde), en 1995. La norme Dublin Core dĂ©finit des champs de mĂ©tadonnĂ©es utilisables par les pages Web. Elle se veut facile et assez gĂ©nĂ©rale pour ĂȘtre pertinente quelque soit le domaine d’application. Elle dĂ©finit les types d’informations Ă  enregistrer pour bien dĂ©finir une ressource sans toutefois prĂ©ciser comment reprĂ©senter ces donnĂ©es en pratique. Le Dublin Core a Ă©tĂ© approuvĂ© comme norme ANSI et ISO et a Ă©tĂ© adoptĂ© entre autres par le gouvernement canadien, britannique et australien.
Les champs de mĂ©tadonnĂ©es sont appelĂ©s Ă©lĂ©ments et ces deniers peuvent ĂȘtre approfondis Ă  l’aide d'affinements. Un affinement restreint la signification d’un Ă©lĂ©ment sans la changer fondamentalement.
De plus, les valeurs associĂ©es aux champs de mĂ©tadonnĂ©es peuvent ĂȘtre dans un format libre ou ĂȘtre conforme Ă  un format de donnĂ©es bien dĂ©fini. Le Dublin Core rĂ©fĂ©rence un certain nombre de formats de donnĂ©es officiels.

Champs de métadonnées

Le Dublin Core est un ensemble de 15 éléments de métadonnées ayant trait au contenu, à la propriété intellectuelle et à la version.

Nous prĂ©senterons ici une liste exhaustive des champs de mĂ©tadonnĂ©es du Dublin Core qui peuvent ĂȘtre encodĂ©s dans des balises HTML <meta>.

Liste des éléments du Dublin Core
ÉlĂ©ment Description et liste des raffinements
title Titre du document : il s'agit a priori du titre principal du document. Pour indiquer un autre type, on peut utiliser le raffinement suivant :
  • alternative : alternative pour le titre, par exemple une abrĂ©viation ou une traduction.

creator CrĂ©ateur du document : nom de la personne, de l'organisation ou du service Ă  l'origine de la rĂ©daction du document.
subject Sujet et mots-clefs : mots-clefs, phrases de rĂ©sumĂ©, ou codes de classement. Il est prĂ©fĂ©rable d'utiliser des mots-clefs choisis dans le cadre d'une politique de classement.
description Description du document : rĂ©sumĂ©, table des matiĂšres, ou texte libre. Le type de description peut ĂȘtre prĂ©cisĂ© Ă  l'aide des raffinements suivants :
  • tableOfContents : table des matiĂšres ;

  • abstract : rĂ©sumĂ©.

publisher Publicateur du document : nom de la personne, de l'organisation ou du service Ă  l'origine de la publication du document.
contributor Contributeur au document : nom d'une personne, d'une organisation ou d'un service qui contribue ou a contribuĂ© Ă  l'Ă©laboration du document.
date Date d'un Ă©vĂšnement dans le cycle de vie du document : il peut s'agir par exemple de la date de crĂ©ation ou de la date de mise Ă  disposition. Il est recommandĂ© de spĂ©cifier la date au format W3CDTF(AAAA-MM-JJ). Pour prĂ©ciser de quelle date il s'agit, on utilise les raffinements suivants :
  • created : date de crĂ©ation ;

  • valid : date ou pĂ©riode de validitĂ© ;

  • available : date ou pĂ©riode de mise Ă  disposition ;

  • issued : date de publication ;

  • modified : date de modification ;

  • dateAccepted : date d'acceptation (par exemple, acceptation d'une thĂšse par une universitĂ©, d'un article par un journal, etc.) ;

  • dateCopyrighted : date du copyright ;

  • dateSubmitted : date oĂč le document a Ă©tĂ© soumis (par exemple, soumis Ă  un comitĂ© de lecture s'il s'agit d'un article).

type Nature ou genre du contenu : grandes catĂ©gories de document. Il est recommandĂ© d'utiliser des termes clairement dĂ©finis au sein de son organisation.
format Format du document : format physique ou Ă©lectronique du document. Par exemple, type de mĂ©dia ou dimensions (taille, durĂ©e). On peut spĂ©cifier le matĂ©riel et le logiciel nĂ©cessaires pour accĂ©der au document. Il est recommandĂ© d'utiliser des termes clairement dĂ©finis, par exemple le type MIME(Multi Purpose Mail Extension : standard permettant dÂ’Ă©tendre les possibilitĂ©s du courrier Ă©lectronique. Les raffinements suivants sont disponibles :
  • extent : taille ou durĂ©e ;

  • medium : support physique.

identifier Identificateur non ambigu : il est recommandĂ© d'utiliser un systĂšme de rĂ©fĂ©rencement prĂ©cis, par exemple les URI (Uniform Resource Identifier) ou les numĂ©ros ISBN.
source Ressource dont dĂ©rive le document : le document peut dĂ©couler en totalitĂ© ou en partie de la ressource en question. Il est recommandĂ© d'utiliser une dĂ©nomination formelle des ressources, par exemple leur URI.
language Langue du document : il est recommandĂ© d'utiliser un code de langue conforme au format RFC3066 (qui dĂ©finit la syntaxe des Ă©tiquettes linguistiques Ă  utiliser sur Internet).
relation Lien vers une ressource liĂ©e : il est recommandĂ© d'utiliser une dĂ©nomination formelle des ressources, par exemple leur URI. On prĂ©cise le type de lien avec des raffinements :
  • isVersionOf : on a affaire Ă  une nouvelle version, une modification ou une adaptation du document liĂ©. Les changements concernent le contenu et pas seulement la forme ;

  • hasVersion : rĂ©ciproque d'isVersionOf. Le document liĂ© est une version modifiĂ©e du prĂ©sent document ;

  • isReplacedBy : le prĂ©sent document a Ă©tĂ© remplacĂ© par le document liĂ© ;

  • replaces : rĂ©ciproque de replaces. Le prĂ©sent document remplace le document liĂ© ;

  • isRequiredBy : on a besoin du prĂ©sent document pour interprĂ©ter correctement le document liĂ© ;

  • requires : rĂ©ciproque d'isRequiredBy. Le prĂ©sent document a besoin du document liĂ© pour ĂȘtre correctement prĂ©sentĂ©, transmis, ou pour assurer sa cohĂ©rence ;

  • isPartOf : le document est une partie (physique ou logique) d'un autre document ;

  • hasPart : rĂ©ciproque d'isPartOf : le document inclut le document liĂ©, physiquement ou logiquement ;

  • isReferencedBy : le document courant est rĂ©fĂ©rencĂ©, citĂ©, ou liĂ© par le document indiquĂ© ;

  • references : rĂ©ciproque d'isReferencedBy : le document courant rĂ©fĂ©rence, cite ou pointe vers le document indiquĂ© ;

  • isFormatOf : le prĂ©sent document a le mĂȘme fond que le document indiquĂ©, mais prĂ©sentĂ© sous une forme diffĂ©rente ;

  • hasFormat : rĂ©ciproque d'isFormatOf : le prĂ©sent document possĂšde une variante sous une forme diffĂ©rente ;

  • conformsTo : rĂ©fĂ©rence Ă  un standard Ă©tabli auquel se conforme le prĂ©sent document.

coverage PortĂ©e du document : la portĂ©e inclut un domaine gĂ©ographique, un laps de temps, ou une juridiction (nom d'une entitĂ© administrative). Il est recommandĂ© d'utiliser des reprĂ©sentations normalisĂ©es de ces types de donnĂ©es. Le type de couverture peut ĂȘtre prĂ©cisĂ© :
  • spatial : couverture spatiale. On peut utiliser les codages Point (point gĂ©ographique), ISO3166(codes de pays Ă  deux lettres), Box (rĂ©gions gĂ©ographiques), ou TGN(dictionnaire de noms de lieux) ;

  • temporal : couverture temporelle. On peut utiliser les codages Period (intervalle de temps) ou W3CDTF(dates).

rights Droits relatifs Ă  la ressource : permet de donner des informations sur le statut des droits du document, par exemple la prĂ©sence d'un copyright, ou un lien vers le dĂ©tenteur des droits. L'absence de cet Ă©lĂ©ment ne prĂ©sume pas que le document est libre de droits.
audience Audience du document : l'audience reprĂ©sente le groupe de personnes Ă  qui le document est destinĂ©. L'audience est dĂ©terminĂ©e par l'auteur, le publicateur, ou un tiers. On peut utiliser les raffinements suivants :

Exemple

Voici en pratique un extrait d'un exemple de document dans lequel on a inséré des métadonnées.

  • <!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Strict//EN"
      "http://www.w3.org/TR/xhtml1/DTD/xhtml1-strict.dtd">
    
    <html>
      <head>
        <title>Un document en HTML</title>
        <meta http-equiv="Content-type"
          content="text/html; charset=iso-8859-1" />
        <link rel="schema.DC"
          href="http://purl.org/dc/elements/1.1/" />
        <meta name="DC.Title" lang="fr" content="Un document en HTML" />
        <meta name="DC.Date.created" scheme="W3CDTF" content="2003-04-03" />
        <meta name="DC.Date.modified" scheme="W3CDTF" content="2003-04-27" />  
        <meta name="DC.Subject" lang="fr" content="HTML, document, Dublin Core" />
        <meta name="DC.Language" scheme="RFC3066" content="fr-FR" />
        <meta name="DC.Description" lang="fr"
          content="Mon premier document HTML avec métadonnées" />
      </head>
      <body>
        …
      </body>
    </html>
    

La balise <link …> rĂ©fĂ©rence la liste officielle des Ă©lĂ©ments et des affinements du Dublin Core. Elle permet aux logiciels de savoir Ă  quoi exactement correspond le prĂ©fixe DC, en spĂ©cifiant son schĂ©ma. Pour faire rĂ©fĂ©rence Ă  un Ă©lĂ©ment du Dublin Core, il est conseillĂ© d’utiliser le PURL (Persistent Uniform Resource Locator) dĂ©fini pour le Dublin Core afin d’avoir une meilleure stabilitĂ© rĂ©fĂ©rentielle. Un PURL est un URL rĂ©putĂ© persistant et qui est redirigĂ© vers un service de rĂ©solutions de noms.
Ainsi, lÂ’Ă©lĂ©ment « Creator » du Dublin Core selon la version 1.1, fait rĂ©fĂ©rence univoquement Ă  http://purl.org/dc/elements/1.1/creator, redirigĂ© par le systĂšme PURL vers http://purl.org/2003/03/24/dces#creator (pourrait ĂȘtre redirigĂ© vers un autre URL dans le futur).


Commentaires

Les terminologies du Dublin Core peuvent ĂȘtre dĂ©routantes car certains champs peuvent ĂȘtre trĂšs gĂ©nĂ©ralisĂ©s : le Dublin Core parle de crĂ©ateur (Creator) d’une ressource et non pas d’Auteur.
Le Dublin est trĂšs utile lors de la description de ressources peu complexes. Cependant, cet ensemble de mĂ©tadonnĂ©es ne couvre pas les besoins potentiels de tous les utilisateurs et s’avĂšre insuffisant pour des applications qui vont au-delĂ  de recherches simples de ressources.
Le Dublin Core est un point de dĂ©part utilisable comme un noyau auquel viendront se rajouter des extensions en fonction des besoins de diffĂ©rentes disciplines ou des utilisateurs. NĂ©anmoins, en pratique, les choses se font souvent dans l’autre sens :
Un musée peut utiliser une norme propre à une discipline pour documenter et gérer ses collections. Puis il extrait un sous-ensemble de ses enregistrements qui correspond aux éléments de la norme Dublin Core. Ces enregistrements conformes à la norme Dublin Core peuvent servir à des fins d'échange de données et de recherches simples. Cela est particuliÚrement important dans des projets conjoints ou lorsqu'il s'agit de partager des données de plusieurs disciplines.
Dans le cas de la gestion d’images, des champs additionnels ou des schĂ©mas complĂ©mentaires sont nĂ©cessaires pour dĂ©finir des structures comme : la gestion administrative, les droits associĂ©s….