la data intelligence

Les 3 clés d’un data-management performant

Les 3 clés d’un data-management performant

data-management : les 3 clés

La notion de data-management a le vent en poupe. On cherche des data-managers de toute part, les diplômes apparaissent. Mais de même que le mot “data” a tendance à devenir un mot un peu valise, il faut faire attention à ne pas croire qu’on a apporté une réponse définitive quand on a dit : il nous faut mettre en place un bon data-management. 

Quand on dit cela on doit au contraire accepter d’avoir prononcé une phrase qui appelle quantité d’autres questions. Des questions qui ne sont pas seulement de l’ordre de la technique des systèmes d’information, mais bien de l’ordre de la stratégie d’entreprise.

Dans ces conditions, quelles sont les clés ? 
 

 
Clé numéro 1 : le data-management n’est pas la data-governance 

La première chose à comprendre est le rôle du data-management. Le data-manager n’est pas le penseur et le stratège en chef de la donnée dans l’entreprise. Il ne peut y avoir de grand manitou en la matière. Ne serait-ce que pour des raisons liées à la réglementation (RGPD, missions du DPO, etc.). Mais surtout pour une raison que le sens commun connaît très bien : “Quand on a la tête dans le guidon, on ne regarde pas la route”. 

Comme expliqué dans cet article, sur la différence entre data-governance et data-management, le data-management, c’est le cheval, la data-governance, c’est la cariole. Sans le cheval, la cariole n’ira nulle part. Sans la cariole et celui qui la conduit, le cheval ne saura pas où aller. Les deux avancent en équipe, en cohérence. La gouvernance des données doit savoir guider, dire quelles données on conserve, quelles données on recherche, quelles règles du jeu on met en place, etc. Elle doit avoir une vision à la fois stratégique et réglementaire. Le data-management rassemble lui toutes les missions qui permettent aux données d’être productives, utiles, efficaces. 

 

Clé numéro 2 : il est au service des métiers. 

Mais il ne peut s’agir, de nos jours, de disposer d’un département, d’une plateforme ou d’un dispositif technique ou organisationnel unique qui ferait que toutes les données de l’entreprise passent par lui. Un cerveau central de la donnée, quelle que soit sa formule. 

Une bonne vision centralisatrice à l’ancienne, avec des gens qui centralisent tout parce que ….” la data, c’est une affaire de spécialistes”. Une conception qui ferait que seuls les data-scientists, gonflés aux statistiques et à l’algorithmique pourraient “faire le job”.  

C’est le contraire. Le data-management doit pouvoir faire en sorte que tout le monde, dans l’entreprise, puisse s’emparer des données…sans pour autant faire d’erreur. Toute la difficulté est là. La data va vite devenir comme la sociologie. Tout le monde se croit data-scientist, comme tout le monde prétend pouvoir théoriser sur la société. Surtout au café du commerce. 

Hélas, sans un minimum de réflexes et de techniques d’analyse, on enfonce des portes ouvertes. Dans les deux cas, sociologie et data-science, on passe à côté de la vérité et de la valeur de ce qu’aurait dû apporter la donnée. La data-manager doit donc savoir apporter autant une facilité d’utilisation des données partout (notamment via l’interopérabilité des données) qu’une aide à la lecture et à l’évitement des erreurs. 

 

Clé numéro 3: il s’intéresse beaucoup aux méta-données. 

Le catalogue de données est devenu une technologie- clé en data-management en quelques années. Il permet l’utilisation multiple, y compris l’analyse en libre-service, la préparation de données et la multi-localisation. 
 
De quoi s’agit-il et pourquoi en avez-vous besoin ?  

L’essor du catalogue de données est étroitement lié à l’émergence de nouvelles approches en matière de traitement agile des données et de stockage de données à faible coût. À l’époque où l’entrepôt de données régnait en maître, les données étaient modélisées et les schémas définis en vue de maximiser la performance des requêtes connues avant que les données ne soient chargées dans une base de données analytique.  

Apache Hadoop a encouragé une approche plus agile. Les données peuvent être stockées, la façon dont on y fait appel modélisée, le schéma mémorisé et appliqué ultérieurement en tant que de besoin, en réponse à des besoins d’interrogation spécifiques. 

Il s’agit alors de fournir un étiquetage et une conservation des données axés sur les métadonnées. Ces données sur les données permettent aux entreprises de suivre leur richesse. Qu’est-ce qui est stocké où (situation de multi-sites, de clouds, etc.), d’où provient telle data, quand et où a-t-elle déjà été utilisée, etc. ?
 
L’enjeu des métadonnées devient essentiel. La méta-donnée contient une grande part des explications qui vont permettre à la donnée de fournir sa pleine valeur. Gérer les méta-données est donc une des missions majeures du data-manager. Un de ses meilleurs moyens de répondre aux demandes de la data-governance de l’entreprise. Et ce, avec une agilité opérationnelle immense. 

Leave a Reply

Your email address will not be published.

Share This

Copy Link to Clipboard

Copy