Les données sont au cœur de l’activité économique. Mais qui les crée ? Qui les exploite ? Comment améliorer leur qualité ? Voici quelques questions que l’on est souvent amené à se poser en entreprise.
Les données peuvent servir notamment à la prospection, au reporting commercial, à la mise en conformité réglementaire, à la gestion de projet, etc.
La qualité des données est donc un enjeu crucial pour assurer la performance et la crédibilité d’une entreprise. Qui n’a pas été confronté à un reporting incohérent nécessitant des heures de recherche pour trouver d’où vient le problème ? L’erreur est souvent au cœur de la donnée, elle peut survenir à n’importe quel moment de son cycle de vie.
1) Comment définir le niveau de qualité d’une donnée ?
Nous pouvons définir 5 piliers qui caractérisent la qualité d’une donnée. Cette dernière est exploitable dans la mesure où elle est :
- Authentique : sa source est fiable,
- Actuelle : elle est valable à la date du jour,
- Exacte : la valeur de la donnée n’est pas discutable,
- Unique : elle se distingue d’une autre donnée,
- Complète : toutes les données obligatoires sont renseignées.
Le secteur de la logistique permet d’illustrer ces piliers. Ainsi, on conçoit aisément qu’il soit compliqué d’acheminer correctement un colis si :
- La douane le bloque pour cause de marchandise interdite : donnée non fiable sur le contenu officiel du colis communiqué lors de la demande de livraison,
- L’adresse correspond à un logement antérieur : donnée obsolète,
- Le numéro de téléphone « 1234 » n’existe pas et ne permet pas de joindre le destinataire du colis : donnée inexacte,
- Un numéro de suivi identique est utilisé pour deux colis différents : donnée en doublon (la traçabilité des deux colis sera mélangée donc erronée),
- L’adresse indique le nom de la rue sans le numéro : donnée incomplète.
2) Comment piloter la qualité des données ?
Entre une chaîne de restauration et un cabinet médical, les données utilisées et leur impact sur la performance de l’entreprise sont assurément très divers.
Le pilotage de la qualité des données s’appuie sur des indicateurs clés ou KPI (Key Performance Indicator), choisis en fonction des problématiques rencontrées. Il convient donc de déterminer les données critiques et les moyens de mesurer leur qualité.
Ces indicateurs devront être surveillés à une fréquence suffisante, sans quoi la qualité des données risquerait de partir à la dérive.
Si l’on se donne les moyens, notamment en termes de ressources humaines et matérielles, les indicateurs sont un vrai levier pour identifier les problèmes de qualité de données. Une analyse approfondie permet de remonter à la source des problèmes pour ensuite mettre en place des plans d’actions et ainsi contribuer à l’amélioration continue.
A titre d’exemple, on peut mesurer périodiquement :
- Le nombre de données créées et validées,
- Le nombre de corrections effectuées,
- Le nombre d’anomalies métier déclarées.
3) Ma donnée est mauvaise, comment faire ?
Face à une donnée erronée, plusieurs démarches peuvent être adoptées.
Selon les systèmes en place et les évolutions envisagées, les données sont corrigées par des mesures soit préventives soit curatives. Les bases de données internes et externes sont utilisées pour :
- Le contrôle à la création des données (masques de saisie, appels vers des fournisseurs de données),
- Le blocage des données créées tant qu’elles n’ont pas fait l’objet d’une validation,
- La reprise de données existantes pour des mises à jour ou corrections en masse, etc.
Les opérations se font soit manuellement, soit par des robots, soit par d’autres outils, en fonction de la complexité des vérifications à effectuer et des ressources à disposition.
Attention toutefois à ne pas cantonner la qualité de données aux services informatiques. Les équipes métier ont leur part de responsabilité dans la qualité des données, ce qui requiert à la fois de la pédagogie et un accompagnement au changement. Les bonnes pratiques de gestion de la donnée sont l’affaire de tous.
4) La gouvernance des données
L’équipe marketing et l’équipe développement sont en désaccord sur une donnée : alors qui a raison ?
Lorsque plusieurs acteurs interagissent sur un système, une même donnée peut être utilisée à différentes fins. Pour éviter des écrasements de données en boucle, il est préférable que les données soient éditables par un nombre très restreint d’utilisateurs : les droits d’édition étendus à plusieurs acteurs impliquent une coordination avancée pour parvenir à un accord sur les mises à jour.
En cas de divergence d’opinion sur la qualité d’une donnée il convient d’effectuer un arbitrage. Il est donc important que la responsabilité de chaque donnée soit clairement définie, par exemple à l’aide d’un RACI (matrice de responsabilités). Il est également conseillé d’établir des standards de qualité de données qui explicitent les conditions à remplir pour que la donnée soit qualitative.
5) Conclusion
La gestion de la qualité de données s’effectue selon les enjeux de l’entreprise et le budget à sa disposition. C’est un sujet d’amélioration continue qui requiert des ressources et de la maintenance. Comme la plupart des sujets à traiter dans une entreprise, la qualité des données ne peut pas se faire sans une coordination entre les équipes.
La qualité de données n’est pas une fin en soi, elle est au service de l’entreprise et si la donnée est de qualité, c’est déjà le début de la performance !
Anne-Laure Bottreau