Aucune page n'a de lien vers Biocase.

Qu'est-ce que le projet BioCASE ?


Présentation faite par Nicolas Bailly et Gaël Lancelot (Nœud National France, MNHN, Paris), le 20 mars 2003 au Muséum National d'Histoire Naturelle

DĂ©finition


BioCASE est un programme européen « Biodiversity Collection Access Service for Europe » qui vise à mettre les collections au service des chercheurs et de la société à l’échelle de l’Europe

BioCASE est un projet soutenu par la Commission Européenne (5ème PCRD), qui vise à établir une interface d’interrogation de toutes les collections européennes, accessible par le web, et facile à utiliser. Pour cela, ce projet traite principalement des données sur les collections, et non pas sur chaque spécimen qui y est rangé. Ces données sont appelées métadonnées (metadata), et sont le premier pas vers la recherche d’informations précises sur les spécimens dans les collections. Un processus d’indexation, permettant l’harmonisation de l’accessibilité aux données internes des collections, et un thésaurus, permettant à l’utilisateur de préciser sa requête à partir de termes imprécis , améliorent le processus et le facilitent, y compris au niveau de la langue.

Historique


BioCASE est lui-même le produit de plusieurs années de recherche, effectuée par trois programmes européens : CDEFD, un programme d’informatisation des données en botanique dont le résultat principal est un modèle de données théorique mais très complet ; son descendant, BioCISE, ayant établi un inventaire des collections et une enquête sur les besoins des utilisateurs ; ENHSIN, clos en mars 2003, sur l’accessibilité aux informations sur les spécimens par la réalisation d’un prototype de démonstration de portail commun pour 7 bases de données de collections, dont deux du MNHN, et une de Paris 6 (publication en cours).

Ces projets ont tous trois apporté des enseignements vitaux à la conception de BioCASE. L’inventaire réalisé par BioCISE a permis de localiser plus de 5000 collections en Europe, dont 2500 ont été référencées dans une base de données, mais 500 seulement avec des métadonnées détaillées. La réalisation de cet inventaire a montré que la manière centralisée utilisée, à partir de Berlin, était très coûteuse en temps, pour trop peu de résultats. D’où l’idée de hiérarchiser le travail par l’établissement de nœuds nationaux.

EHNSIN a permis de tester des protocoles informatiques, et d’optimiser un schéma XML tiré du Darwin Core développé aux Etats Unis. Ces travaux, entre autres, ont conduit à une collaboration internationale dans le groupe ABCD (Access to Biological Collection Data) au sin de TDWG (Taxonomic Database Working Group), groupe financé par CODATA (Committee on Data for Science and Technology), pour établir un standard XML d’échange de données de collection (encore en discussion) qui sera utilisé pour la restitution des données après interrogation, le Darwin Core restant utilisé pour les requêtes.

DĂ©roulement


Comme dans la majorité des projets européens, le travail est divisé en lots (9 pour BioCASE), appelés modules de travail (wordpackages ou WP), et organisés en réseau :

  • WP1 concerne la centralisation de lÂ’information. Pour cela BioCASE va utiliser un certain nombre de nÂśuds chargĂ©s de rassembler les mĂ©tadonnĂ©es pour les transmettre au NÂśud Central, gĂ©rĂ© Ă  Berlin. La majoritĂ© de ces nÂśuds sont des NÂśuds Nationaux, Ă  raison dÂ’un pour chacun des 31 pays participant Ă  BioCASE. Les pays de lÂ’Union EuropĂ©enne, ainsi que les pays en voie dÂ’accession et quelques autres nations associĂ©es pour la recherche, sont tous impliquĂ©s dans le projet et organisent chacun un nÂśud national qui doit ĂŞtre le lien entre les organisations locales possĂ©dant les collections et lÂ’organisation centrale du projet. Il existe aussi des nÂśuds virtuels associĂ©s au projet, qui prĂ©existaient et fĂ©dèrent les spĂ©cialistes et amateurs de domaines ou de taxons donnĂ©es. Le premier module comprend ainsi une importante coordination et une animation du rĂ©seau de tous ces NÂśuds.

  • WP2 consiste en la rĂ©union dÂ’un panel dÂ’utilisateurs pour mieux comprendre les besoins des utilisateurs des divers domaines qui peuvent avoir besoin des collections en complĂ©tant les enquĂŞtes dĂ©jĂ  rĂ©alisĂ©es dans BioCISE et EHNSIN. Il est question ici de recherche et dÂ’experetise en systĂ©matique, de gestion des ressources et de conservation de la biodiversitĂ©, de recherche en parasitologie ou en virologie dans le domaine mĂ©dical, dÂ’industrie pharmaceutique, des domaines lĂ©gaux, des mĂ©dias, etc.. Cette connaissance des besoins est vitale pour la conception de lÂ’interface elle mĂŞme. Ce panel dÂ’utilisateurs comprend un certain nombre de chercheurs travaillant sur dÂ’autres aspects de BioCASE, mais surtout beaucoup dÂ’utilisateurs potentiels Ă©trangers Ă  la recherche en systĂ©matique. Son dĂ©veloppement est dirigĂ© par lÂ’IsraĂ«l Nature and National Parks Protection Authority.

  • WP3 : BioCASE a pour but de rendre accessible les informations sur les collections, et pour cela, il faut dÂ’une part savoir prĂ©cisĂ©ment ce que lÂ’on veut connaĂ®tre, et dÂ’autre part, comment transmetre les informations en question. WP3, organisĂ© par le NH% de Londres, doit concevoir les structures (en xml) et les protocoles permettant de transmettre les donnĂ©es entre NÂśuds, et le dialogue entre NÂśuds nationaux et institutions locales. Après vient le problème de la dĂ©finition des termes.

  • WP4 sÂ’occupe de la crĂ©ation dÂ’un ThĂ©saurus, permettant Ă  lÂ’utilisateur de mieux dĂ©finir le but prĂ©cis de ses recherches.

  • WP5 crĂ©e alors un index informatisĂ© aidant Ă  la connaissance mĂŞme des informations internes aux collections. Ainsi, non seulement lÂ’utilisateur va pouvoir trouver la ou les collections dont il a besoin, mais de plus Ă  travers BioCASE, il va pouvoir avoir accès au moins Ă  une partie des informations contenues dans celles-ci. Ces deux modules, très liĂ©s lÂ’un Ă  lÂ’autre, ont aussi une forte composante informatique, et sont rĂ©alisĂ©s au NHM de Londres et au laboratoire LIS (Informatique et SystĂ©matique) de  Paris6, respectivement.

  • WP6 sÂ’occupe de la conception informatique et de la rĂ©alisation de lÂ’interface, produit « tangible » le plus important du projet. Ce portail web doit ĂŞtre dÂ’utilisation facile pour les utilisateurs de langues et de niveaux de connaissances diffĂ©rents et variĂ©s, tant sur les collections que sur lÂ’accès informatique aux donnĂ©es. CÂ’est pourquoi il devra sÂ’agir dÂ’une structure flexible mais fiable, qui permette la mise Ă  jour constante de lÂ’information. Cette mise Ă  jour, cruciale si lÂ’on souhaite maintenir le portail au delĂ  de la fin du projet, reste entièrement de la responsabilitĂ© des entitĂ©s possĂ©dant les collections, et devra donc ĂŞtre facilement rĂ©alisable par le web. Il sÂ’agit lĂ  aussi dÂ’un module Ă©laborĂ© par le LIS  Paris6.

  • WP7 reprĂ©sente le Noeud central, au BGBM Ă  Berlin (Botanischer Garten und Botanisches Museum Berlin-Dahlem, Frei Universität Berlin). Il sÂ’agit dÂ’harmoniser les rĂ©sultats, de centraliser les donnĂ©es, mais aussi de rĂ©gler les diffĂ©rents si besoin est CÂ’est aussi le meilleur moyen dÂ’avoir un point de vue sur lÂ’ensemble du projet et de rĂ©gler les problèmes qui surgissent, non au sein des unitĂ©s de travail, mais entre elles, et dans le flux dÂ’informations qui les relie.

  • Les WP8 et 9 sÂ’occupent du statut juridique et lĂ©gal des informations passant par BioCASE, et de son aspect Ă©conomique et financier, respectivement. BioCASE a vocation Ă  continuer son existence en tant quÂ’entitĂ© viable après la complĂ©tion du projet et la mise en place de lÂ’interface sur le web, et de tout le rĂ©seau dÂ’information qui la sous-tend. Pour cela, un modèle Ă©conomique et juridique doit ĂŞtre proposĂ© pour une entitĂ© qu fera vivre le portail au delĂ  de 2004. Le module 8 est dĂ©veloppĂ© par les Jardins Botaniques de Kew, et le module 9 par lÂ’UniversitĂ© dÂ’Amsterdam.

Dans le cadre de cette coopération, de nombreuses rencontres entre unités de travail ont lieu, voire des réunions globales de BioCASE (1ère à Oeiras, Portugal, 2002). Des réunions nationales sont aussi prévues, notamment celle des 20-21 mars organisée par le MNHN Paris (et la SFS), le Muséum faisant office de Nœud National pour la France.

Résumé du projet


Durée: 01/11/2001 au 31/10/2003
Coordinateur : Walter BERENDSOHN, BGBM de Berlin
35 institutions dont 31 Noeuds Nationaux
Budget : env. 2 M€
7 contractants principaux : FUB-BGBM (Berlin), NHM (Londres), USOTON (Southampton), UPMC/LIS (Paris 6), INPA (Tel-Aviv),  UvA (Amsterdam), RBG (Kew)

Quelques liens importants pour en savoir plus


Noeud National BioCASE
EHNSIN
TDWG
CODATA
CDEFD