Caractéristiques et choix des données
Comme indiqué précédemment, les bases de données sont structurées de manière différente. Une comparaison de données entre différentes bases ne peut donc être réellement efficiente que par le biais de la standardisation des méthodes de collectes de données et du format d'enregistrement utilisé. Un format standard existe actuellement, il s'agit du format Spold, qui est réalisé conformément aux spécifications de la norme ISO 14048[1].
Ce format "open source" a pour but de simplifier la communication entre les utilisateurs des bases de données ou de logiciels d'ACV et il permet de convertir tout type de données indépendamment de leur provenance.
On peut se poser, en tant qu'utilisateurs, des questions par rapport à la qualité des données, afin de faire un choix pertinent pour leur utilisation. Un des premiers critères à prendre en compte dans ce cadre est leur disponibilité. Une Analyse de Cycle de Vie effectuée sans avoir à disposition toutes les données nécessaires (en faisant des hypothèses par exemple) sera forcément différente d'une étude pour laquelle on a pu collecter la totalité des informations.
Pour palier le manque de données et gérer toutefois les études pour lesquelles des données manquent, on peut procéder à des estimations faites par des experts ou utiliser des valeurs approximatives, représentatives des données réelles indisponibles.
Un deuxième paramètre permettant de juger la qualité des données (provenant des bases de données ou collectées par la personne qui réalise l'étude ACV) est l'incertitude des valeurs prise en compte. Une analyse s'impose en ce contexte ; elle peut être faite sur les incertitudes concernant les entrants, la variabilité de données, ou encore par rapport aux modèles d'évaluation des impacts environnementaux.
Une indication importante relative à la qualité d'une donnée est fournie par l'étude détaillée des informations relatives à son obtention. Selon le fait que la donnée est agrégée, mesurée ou estimée, ou selon la provenance géographique des informations (région/pays où elle a été collectée), on peut encore juger la fiabilité des données et estimer leur qualité. Des méthodes d'évaluation qualitative existent également, on rappelle en ce sens la méthode "Data Quality Indicators", proposée par Wang, Reddy et Kon. Ce modèle hiérarchique permet de comparer entre elles un maximum de données en fonction de leur catégorie. Les critères qui doivent être pris en compte sont illustrés sur l'organigramme ci-après.
Il est également important, pour faire un choix de données, de regarder leur structure. La décision sera prise par rapport au nombre d'entrées et de sorties : plus il y en aura plus la modélisation comportera d'incertitude.
En ce qui concerne la structure d'une donnée, celle-ci est illustrée sur la figure suivante. On remarque une hiérarchisation des valeurs sur la verticale, en partant de la première étape du cycle de vie, extraction des matières premières et production des énergies vers le produit final dont on indique l'Unité Fonctionnelle et la quantité prise en compte pour la modélisation. Sur l'axe horizontal sont regroupés les flux entrants et sortants du système.
Enfin, il ne faut pas oublier le contrôle de cohérence par rapport aux objectifs fixés, contrôle qui a pour objectif de déterminer si les hypothèses, les méthodes et les données sont cohérentes avec l'objectif et le champ de l'étude. On rappelle les principales questions devant être abordées en ce contexte et qui sont indiquées dans les normes en vigueur :
Les différences de qualité de données tout au long du cycle de vie d'un système de produits et entre les différents systèmes de produits sont-elles cohérentes avec l'objectif et le champ de l'étude ?
Les différences régionales et/ou temporelles ont-elles été appliquées de manière cohérente ?
Les règles d'affectation et les frontières du système ont-elles été appliquées de manière cohérente à tous les systèmes de produits ?
Les éléments d'évaluation de l'impact ont-ils été appliqués de manière cohérente ? »
Un dernier critère de choix de données représente l'impact environnemental estimé. On peut ainsi considérer la donnée la plus impactante afin de maximiser les impacts possibles.
Dans tous les cas, il faut préciser dans le rapport d'ACV les critères sur la base desquels le choix de données a été réalisé.
Pour en savoir plus
Management environnemental. Analyse du cycle de vie – Format de documentation de données[1]
Toward quality data. An attribute-based approach[4]
Gestion des hypothèses des bases de données des logiciels d'ACV. Compatibilité des hypothèses et leur influence sur la variabilité des résultats d'impacts environnementaux[5]