Le data management (gestion des données) est une priorité pour l’entreprise « data driven » qui souhaite mettre la data sur chaque point de ses process. C’est précisément la raison d’être du data quality management.
Quel en est donc l’intérêt et comment mettre en place un Data Quality Management au sein de votre entreprise ? Nous vous exposons en quelques lignes son impact, son application, ses enjeux et en comprendre les process.
I. QU’EST-CE QUE LE DATA QUALITY MANAGEMENT ?
La data quality management ou la gestion de la qualité des données est l’ensemble des actions et procédures visant à :
- Assurer et maintenir la qualité des données répondant aux besoins métiers et techniques des utilisateurs au sein d’une entreprise,
- Les sécuriser et les rendre disponibles à des fins opérationnelles.
Il s’agit d’un processus continu. Ce process répond à deux objectifs :
- Examiner la fiabilité et la pertinence des données, essentielles et structurantes pour l’entreprise, sur la base de critères de qualité d’une part,
- Élaborer des stratégies et des outils pour éliminer les données ne répondant pas à ces exigences d’autre part.
L’entreprise qui entame un projet de Data Quality suit un unique fil rouge durant tout le projet : transformer des données de qualité en renseignements utiles
Comment alors déterminer la quality data ?
Téléchargez le livre blanc sur la gouvernance des données
II. COMMENT DÉFINIR LA QUALITÉ DES DONNÉES ?
La circulation des données incombe à l’ensemble des collaborateurs de votre entreprise, il est impératif que la notion de donnée s’intègre à tous les niveaux.
Selon une étude de la PWC, la qualité des données désigne l’aptitude de l’ensemble des caractéristiques intrinsèques des données à satisfaire des exigences internes à l’organisation comme le pilotage ou la prise de décision et des exigences externes telles que les réglementations.
III. Les piliers de la qualité des données
Parmi ces caractéristiques intrinsèques, il faut pouvoir compléter chaque case parmi les suivants :
- La fraîcheur : La donnée est par nature un bien périssable. Un cycle de donnée fraîche permet une meilleure appréhension des réalités d’une situation à l’instant opportun afin d’optimiser les prises de décision.
- La disponibilité : On entend par disponibilité, la trouvabilité (findability en anglais) et l’accessibilité des données. Celle-ci peut toute fois être influencée par la puissance du réseau informatique des supports de stockage, du classement ou encore de la présentation des données.
- La cohérence : Il s’agit de l’harmonie fonctionnelle et/ou technique des données reçues dans la constitution d’une information.
- La traçabilité : Elle permet de reconstituer le parcours des données depuis sa collecte jusqu’à sa restitution, en passant par toutes les étapes de traitement.
- La sécurisation : Elle comprend les mesures prises contrela perte de données et les fuites d’informations à l’instar de la gestion des droits d’accès aux données surtout les données sensibles.
- L’exhaustivité : Ceci permet la mise à disposition en totalité de l’information, surtout la plus récente.
IV. POURQUOI la qualité des données est-elle importante ?
La digitalisation est devenue un standard à suivre à travers l’utilisation des CRM (Customer Relationship Management), des ERP (Enterprise Ressource Planning) ou PGI (Progiciels de Gestion Intégré), des différents logiciels de paie, etc. Si nécessaire, votre entreprise devra gérer des données en grande quantité, provenant des sources de données différentes.
Ces données sont collectées par plusieurs de vos utilisateurs issus de différents canaux à l’instar du web, des réseaux sociaux, des CRM, etc. L’établissement d’une politique de gouvernance des données s’impose.
En effet, la qualité des données constitue une dimension majeure pour les organisations. Des données de mauvaise qualité ou négligées peuvent altérer les prises de décisions, nuire à l’image de l’entreprise voire engendrer des sanctions légales.
« Les données de mauvaises qualités conduit potentiellement à de grandes pertes qui se chiffrent en termes d’opportunités manquées, de temps et de ressources gaspillées. Selon une étude du MIT, ces coûts s’élèvent jusqu’à 15 à 25% de votre chiffre d’affaires. »
V. Cas d’usage de GESTION des données : les casinos
Les casinos utilisent depuis des années des pratiques de gestion de la data quality afin de conserver leur clientèle et de protéger leurs intérêts financiers. Les casinos ordinaires et les machines à sous doivent établir un processus qui est suivi en permanence et affiné au fil du temps pour gérer efficacement leurs données.
Ce processus commence par la compréhension des types de données qu’ils collectent et qu’ils utilisent comme intrants dans leurs processus décisionnels. Ils doivent également suivre l’exactitude de ces données afin de pouvoir apporter des modifications si nécessaire.
Enfin, ils doivent s’assurer que toutes les parties prenantes se conforment à leur politique de gestion des données. En suivant ces étapes, ils peuvent s’assurer que les informations qu’ils collectent sont fiables et exactes.
VI. Quelles sont les étapes de mise en place d’un data quality management efficace ?
- Évaluation initiale : analysez l’état actuel de vos données pour identifier les lacunes et les points forts.
- Définition des objectifs : établissez des objectifs clairs alignés sur les besoins métiers et les exigences réglementaires.
- Mise en place d’une gouvernance des données : créez des politiques et des procédures pour gérer la qualité des données, en définissant des rôles et des responsabilités.
- Implémentation d’outils technologiques : utilisez des solutions logicielles pour automatiser la surveillance, le nettoyage et la gestion des données.
- Formation et sensibilisation : éduquez les employés sur l’importance de la qualité des données et les meilleures pratiques à adopter.
- Surveillance continue : mettez en place des indicateurs de performance pour suivre l’évolution de la qualité des données et ajuster les stratégies en conséquence.
Quels sont les outils et technologies pour le data quality management ?
Il existe plusieurs outils qui peuvent faciliter la gestion de la qualité des données :
- Solutions de nettoyage de données : Ils permettent de détecter et corriger les erreurs.
- Logiciels de profilage de données : ils analysent les ensembles de données et identifier les anomalies.
- Plateformes de gouvernance des données : ils centralisent les politiques et assurer la conformité.
- Outils de surveillance en temps réel : Ils suivent la qualité des données en continu. Vous pouvez consulter notre article sur l’observabilité des données.