Une nouvelle manière d’évaluer la fiabilité des observations de Flora Data
La semaine dernière, une coupure temporaire des services de Flora Data (Carnet en Ligne, IdentiPlante, PictoFlora, etc.) nous a permis de travailler sur la base de données afin d’y ajouter un « indicateur de fiabilité » pour chaque donnée d’observation.
Pour commencer, un petit rappel sur ce que l’on entend par « donnée d’observation botanique » dans l’article suivant :
Afin d’évaluer plus facilement les données d’observations, des grades de fiabilité ont été définis en fonction de leur caractère complet ou non et de la fiabilité de l’identification taxonomique.
Les critères utilisés pour calculer ces grades sont les suivants :
1. Donnée incomplète et/ou incohérente
- Un critère (ou plusieurs) du grade 2 n’est pas rempli
2. Donnée complète
- Observation liée à une adresse mail valide
- Date non nulle
- Lieu renseigné (coordonnées ou localité)
- Nom du taxon non nul et ne continent pas de « ? »
- Le cas échéant, cohérence entre code INSEE et coordonnées géographiques
3. Donnée complète et fiabilité de l’identification minimale
- Tous les critères du grade 2
- Certitude de l’identification ni « douteuse » ni « à déterminer »
- Note de l’identification sur IdentiPlante ≥ 0
4. Données complète et probablement bien identifiée
- Tous les critères du grade 3
- Note de l’identification ≥ 10 ou identification validée sur IP
Le travail de réflexion ayant mené à la mise en place de cet indicateur a débuté en 2018 – après de nombreux échanges sur le sujet au sein du Conseil Scientifique et Technique de Tela Botanica. Il a porté notamment sur les différentes manières d’évaluer la fiabilité d’une observation, les critères à prendre en compte, la pertinence de l’usage des grades, etc.
L’évaluation de la fiabilité des données d’observations publiées sur le site de Tela Botanica a plusieurs intérêts :
- permettre à tout un chacun de juger de la confiance que l’on peut accorder à une donnée ou un jeu de donnée
- permette à Tela Botanica de filtrer les données affichées suivant les interfaces (dans eFlore par exemple, masquer les données les moins fiables)
- permettre aux contributeurs de connaitre les critères importants, auxquels il faut prêter attention lors de la saisie ou l’utilisation de données d’observation
Comme son nom le laisse présager, cet indicateur ne fait que donner une indication quant au caractère complet et valide de l’observation, ce n’est en aucun cas une preuve définitive de qualité.
Les grades de l’indicateur sont consultables lorsque vous exportez des données (champs avancés).
Lorsque le grade 3 au moins est atteint par une données d’observation, celle-ci est considérée comme « standard ».
Cette notion est utilisée :
- Sur eFlore : les photos affichées sont seulement celles liées à une observation standard
- Sur les cartes des observations : par défaut les cartes n’affichent que les données standards
- Dans l’export : filtre sur les observations standards