XPER – BOTANICA, projet sélectionné dans le cadre du deuxième appel à propositions sur les Usages de l’Internet
Le projet XPER BOTANICA de développement d’un outil informatique d’aide à la détermination des végétaux à l’usage du grand public et des professionnels de la botanique et de l’environnement a été retenu par le jury du Ministère de la Recherche dans le cadre de l’appel à proposition sur les usages de l’Internet.
Ce projet est conduit en partenariat entre Tela Botanica et le Laboratoire Informatique et Systématique de Jussieu (Université Pierre et Marie Curie), il se déroulera sur deux ans, de 2005 à 2006.
Contexte de l’étude
La détermination des plantes par les botanistes (floristes) repose aujourd’hui entièrement sur l’usage de flores « papier ». Ces ouvrages utilisent tous le même mode de reconnaissance par clés d’identification, c’est à dire une suite de questions, dont le cheminement des réponses conduit normalement à la plante recherchée. En cas d’échec, il faut « remonter » dans les clés pour trouver l’erreur qui a été commise et recommencer le cheminement en avant.
Une autre approche est envisageable avec l’usage d’outils informatiques permettant de tester simultanément un grand nombres de caractères sans avoir besoin de suivre un chemin prédéterminé. Cette approche est plus robuste : une erreur sur un caractère n’invalide pas totalement le résultat et l’on peut obtenir des réponses même en l’absence d’informations sur certains d’entre eux. Par ailleurs, les clés de détermination imposent à l’utilisateur une très bonne connaissance du vocabulaire utilisé, rebutant souvent les néophytes. Une approche par modèle informatique permet de résoudre en partie cet obstacle par des présentations graphiques sur lesquels on « clique » pour faire ses choix.
Par contre, toute l’expérience acquise pour la génération des clés de détermination utilisées actuellement n’est pas directement utilisable dans ces nouveaux outils et il est nécessaire de passer par une étape préalable de collecte d’informations sur l’ensemble des caractères diagnostics.
Il est par ailleurs nécessaire de prendre en compte l’exploitation de ces nouveaux outils sur plusieurs types de machines. En allant du plus lourd au plus mobile nous avons :
l’accès via Internet grâce à des outils fonctionnant à distance sur un serveur (phases de tests, bases de données en évolutions…)
l’utilisation en local sur micro-ordinateur disposant des logiciels (mises à jour périodiques des bases de données par téléchargement ou cédérom)
l’exploitation sur le terrain avec un PDA (organisateur de poche de type Palm), actualisable via un micro-ordinateur.
Une utilisation complémentaire de ces outils pourra être de générer des clés de déterminations « dynamiques », c’est à dire optimisées sur un nombre restreint de taxons (flores locales, application à un milieu écologique particulier…) ou de caratères (plantules, fleurs, fruits…)
Il convient donc de prendre en compte dès le départ du projet l’ensemble de ces possibilités perçues comme complémentaires et alternatives.
De même, le projet devra intégrer la phase initiale de collecte des données sur les caratéristiques des végétaux (morphologie, phénologie, écologie, chorologie…) afin de pouvoir répartir le travail de saisie sur un grand nombre de personnes.
Objectif visé
Concevoir, réaliser puis tester des outils de déterminations des plantes à base de tables de descriptions des végétaux dans différents contextes (Internet, micro, PDA), permettant également la génération automatique de clefs d’identification voire de descriptions « dynamiques ».
Le projet intégrera les phases de collecte initiale des données (méthodes, outils), de réalisation des logiciels sur les diverses plateformes et leur test dans le cadre du réseau Tela Botanica.
Détails du projet
La dimension informatique prend une place de plus en plus importante dans la recherche systématique ainsi que dans l’accès à l’information taxinomique. Depuis les années 1980, des formats de données ont été développés (XPER, DELTA) afin d’organiser les descriptions d’organismes de manière à pouvoir générer des clefs d’identification, des outils de détermination ou des descriptions de manière automatique.
Par ailleurs le développement des réseaux coopératifs et des systèmes portables constitue un phénomène majeur dans l’évolution des moyens de communication permettant de répartir certaines tâches entre de nombreux acteurs.
Dans ce cadre, nous souhaiterions que des interfaces de saisie et d’identification via le web soit réalisées à partir du système XPER utilisé par le Laboratoire d’Informatique et Systématique (Equipe CEB, Université Pierre & Marie Curie). Elle doit également permettre le remplissage des données hors ligne, voir même directement à partir d’un document en format texte tabulé (copié-collé d’un tableau sous Excel avec les taxons en lignes et les caractères en colonnes).
L’ajout de taxons et de caractères doit être possible et une méthode permettant de faire ressortir directement et uniquement les caractères non renseignés (quelque soit le taxon) devrait également être disponible. Dans la description des états de caractères, des illustrations doivent pourvoir être intégrées de manière simple, ces illustrations pouvant être visualisées directement à partir de l’état de caractère (cf. figure ci après).
L’interface d’identification devrait dériver de celle actuellement utilisée par XPER, tout en permettant d’exploiter les illustrations servant à documenter les états de caractères.
Les dispostifs pourront être testés dans un premier temps sur quelques groupes restreints de taxons, homogènes (une famille) ou hétérogène (un milieu).