Données

IMPORTANT: DU BON USAGE DES DONNEES

Vous pouvez utiliser librement les données mises à disposition sur ce site. Nous vous remercions de les citer en bonne et due forme avec le DOI : 10.17882/85178

Il est fortement recommandé de contacter le producteur de données : vous trouverez le contact sur la page de la station concernée.

UTILISATIONS/MODIFICATIONS/TRAITEMENTS : toutes les données téléchargeables sur ce site sont disponible sous la licence Creative Commons CC-BY-SA 2.0

Site web et gestion des données

Le site web et la gestion des données sont portés par l'Ifremer et par le CDS-IS-SBR (plateforme ABiMS, Station Biologique de Roscoff, CNRS, Sorbonne Université)

Au sujet des fichiers

Les fichiers de données sont disponibles en téléchargement à partir de l'adresse : https://data.phytobs.fr/files. Ces fichiers contiennent les comptages associés à chaque taxon (ou groupe de taxons) labellisé, complétés par des mesures de paramètres physico-chimiques pour les stations faisant également partie du réseau SOMLIT ou REPHY.   Ils sont organisés de la façon suivante :

  •  Au premier niveau, il y a un dossier par version comportant le nom de l'année et le numéro de version (ex. : 2021-01), ainsi qu'un dossier latest qui fait toujours référence à la version la plus récente.
  •  Chacun des dossiers de premier niveau contient une liste de sous-dossiers : un sous-dossier par station, ainsi qu'un sous-dossier all_sites qui contient l'agrégation des données de toutes les stations.
  •  A leur tour, ces sous-dossiers contiennent trois types de fichiers disponibles chacun à deux formats différents.
  • Les types de fichiers sont ;
    • Analyst avec les noms de taxons tels que les analystes les ont identifiés
    • Phytobs avec les regroupements labellisés de taxons faits par PHYTOBS-Network : le meilleur niveau d'identification de la communauté des analystes PHYTOBS-Network
    • Combined reprend les deux niveaux d'identification précédents avec les deux valeurs de dénombrement
  • Les formats sont  :
    • CSV (avec l'extension .csv ) : les champs sont séparés par un point-virgule (;). Ces fichiers contiennent une simple en-tête et les lignes de résultats.
    • ODV (avec l'extension _odv.txt ) : les champs sont séparés par une tabulation. Ces fichiers contiennent une en-tête (lignes qui commencent par '//' ) avec les métadonnées (basées sur les vocabulaires contrôlés SeaDataNet), suivie d'une ligne avec les en-têtes de colonnes, puis de la série de données.

Les fichiers sont encodés avec des caractères en Unicode (UTF-8), il faut donc sélectionner cet encodage lors de l'ouverture d'un fichier dans votre tableur afin que les caractères s'affichent correctement (voir ici pour l'import de ces fichiers dans Excel).

Utilisation des codes qualité.

Un certain nombre de paramètres mesurés sont accompagnés d'un code qualité. Ces codes se retrouvent dans une colonne qui suit immédiatement la colonne de valeurs auxquelles ces codes qualité s'appliquent (leurs en-têtes contiennent les caratères _qv ). Les codes utilisent le référentiel des codes qualité de SeaDataNet (L20). Il a été décidé d'utiliser les codes qualités suivants pour les champs qui concernent les comptages dans les fichiers au format ODV :

  • La procédure de détermination du taxon repose sur l'expertise des thématiciennes et thématiciens, et ne s'appuie pas sur un processus automatisé, le niveau de qualité 0 (no quality control) lui a été associé (colonne R)
  • Le nombre d'individus par unité de volume repose sur un comptage manuel, le niveau de qualité 2 (probably good value) lui a été associé (colonne V)