Mégadonnées : comment trouver et supprimer les angles morts dans vos données?

Quand on travaille sur les mégadonnées, le terme français pour Big Data (validé par la commission de terminologie et de néologie en 2014 et conseillé par le Journal officiel de la République française), bref, lorsqu’on s’attaque aux données massives, les angles morts doivent être une préoccupation majeure.  

Voici ce dont il s’agit, comment trouver ces angles morts des mégadonnées et les éliminer. 

La quantité de données disponibles augmente de façon exponentielle dans les entreprises. Les outils de gestion des données au service de l’intelligence décisionnelle se multiplient.

Il y en a partout. D’où la notion de mégadonnées.

Seulement voilà : plus le volume de données augmente, plus il devient difficile d’obtenir une vue complète de ces mégadonnées. Se créent alors fatalement des “angles morts”.

On a mis tellement de rétroviseurs et de capteurs qu’on ne réussit pas à tout capturer. Ce qui est gênant pour la prise de décision. On se voudrait analytique, parfait sur l’analyse de données, l’étude prédictive et prospective, excellent sur la visualisation et l’exploitation des données, irréprochable sur les outils d’analyse permettant d’afficher des informations pertinentes… 
Et on se retrouve à ne pas être sûr de soi quant à la qualité des données retenues et la prise en compte de toutes les sources de données. 

On ne peut donc pas être totalement confiant dans les résultats des analyses de ces mégadonnées, si on ne tient pas compte de ces angles morts.  

Comment faire ? Etudions quelques pistes ici. 

 

 

1.Localisez vos données sombres (DarkData) 

Lorsque les analystes évoquent des angles morts en matière de masses de données ou big datails évoquent souvent “les données sombres”.  
 
Ces données invisibles sont également appelées «données non classifiées».

Il s’agit des informations que votre entreprise possède mais qu’elle n’utilise pas à des fins d’analyse ou pour toute autre raison liée à son exploitation. C’est en fait « l’ensemble des données que les entreprises collectent, analysent et sauvegardent dans le cadre de leurs tâches quotidiennes, mais qu’elles n’arrivent que très rarement à utiliser à d’autres fins. » Souvent, elles échappent aux procédures organisées de stockage de données. On ne sait pas où elles sont, même si on sait qu’elles existent dans ces mégadonnées.

Si vous n’avez aucune idée de la quantité de données sombres dont dispose votre entreprise, du type d’information qu’elle implique et de l’endroit où votre entreprise les stocke, cette méconnaissance pourrait créer des angles morts. A quoi bon alors mettre en place des algorithmes, faire de l’analyse prédictive, créer des entrepôts de données, de la visualisation de données, procéder à de la segmentation si on n’a pas tout répertorié ? Et si tout projet nouveau devra commencer par aller faire à nouveau de la fouille de données, car il y a des manques ? 

Autrement dit, on se retrouve à passer plus de temps à rechercher des données qu’à les analyser. A faire de la fouille, de l’archéologie plutôt que du traitement de données et de l’extraction efficace. Des données invisibles peuvent également exposer votre entreprise à des risques réglementaires si vous ne pouvez pas récupérer les informations demandées au cours d’un audit. 

 

Outils logiciels pour les mégadonnées

De même, certaines données sombres contiennent des informations sensibles que les pirates pourraient essayer d’obtenir. S’ils réussissent, vous ne saurez peut-être pas qu’une violation de données s’est produite avant plusieurs mois – voire pas du tout. 

Heureusement, il existe des options logicielles spécialisées (telles que Nuix Enginepermettant de découvrir les données de votre entreprise, qu’elles soient sombres ou non, et de les nettoyer afin que vous puissiez éventuellement les utiliser pour atteindre vos objectifs d’analyse commerciale. 

 

2. Faites attention aux données stockées sur les mobiles et dans le cloud public

Il est de plus en plus courant d’utiliser des smartphones et des tablettes au cours de sa journée de travail. Certains le font particulièrement souvent s’ils participent à des travaux sur le terrain ou rendent visite à des clients chez eux. Ces données-là n’entrent pas forcément dans les modèles de données conçus à l’avance et ne sont pas injectées dans les bases de données relationnelles avec enjeu de prédiction et d’amélioration de l’intelligence d’affaires. 
 
Non. Elles mènent une sorte de vie parallèle. 

Vanson Bourne a mené une étude pour Veritas afin d’en savoir plus sur les données sombres et a fini par s’intéresser aux données mobiles, entre autres.

Les résultats sont fascinants. Premièrement, en moyenne, 52% des données au sein des organisations ne sont ni classées ni étiquetées. Ce problème constitue un risque pour la sécurité, car il laisse des informations potentiellement critiques en accès facile aux pirates informatiques. 
 

Deuxième leçon de ces études : les données stockées sur des appareils mobiles sont particulièrement susceptibles d’être darkSeulement 6% des entreprises interrogées classent la totalité de leurs données issues des appareils mobiles. 67% ont admis en classer moins de la moitié. 
 

Mégadonnées et cloud public

D’autres découvertes intéressantes concernent le cloud computing et les données stockées dans le cloud public. C’est un autre point faible pour les entreprises qui souhaitent éviter les problèmes de sécurité. Seulement 5% des entreprises ont déclaré ne pas disposer de données sombres dans le cloud public, et 61% ont classé moins de la moitié d’entre elles. 

Conclusion : si vous souhaitez réduire les angles morts de vos mégadonnées, les appareils mobiles et le cloud public de votre entreprise sont des priorités.  
Il convient de travailler un peu plus la protection des données et de sensibiliser un peu les équipes à la gestion des données. 
 

3. Combattez les angles morts qui découlent d’un biais de confirmation

Le comportement humain naturel peut également causer des angles morts spécifiques dans les mégadonnées. 

Si les gens qui lancent des enquêtes s’attendent déjà à une conclusion particulière, telle que celle qui corrobore leur hypothèse, ils se débrouilleront dans les process d’acquisition pour ignorer les données qui ne correspondent pas à leurs attentes. Les équipes du marketing digital s’intéresseront à tel aspect de l’expérience client ou de la satisfaction qu’ils récupèreront dans les données Analytics (analytiques de Google) mais oublieront d’étudier la corrélation avec le prix, par exemple. 

Ce phénomène bien connu des neurosciences et des sciences humaines et sociales est appelé « biais de confirmation». Il joue à fond en enterprise, même dans les analyses de données et explique pourquoi les gens s’intéressent si fermement à certains éléments de preuve tout en prétendant que d’autres éléments n’existent pas. 
 

La meilleure approche pour éviter ce biais consiste à déterminer les questions importantes à poser avant de rechercher des données. D’éviter le réflexe de plongée en apnée dans les données numériques, tout simplement parce que les volumes de données disponibles sont tels qu’on pense pouvoir y trouver la preuve irréfutable de ce qu’on avance.  

 

Passez a minima par une réunion d’information, au mieux par de la formation continue. Même pour ceux qui sont sortis des Grandes écoles, ont fait de longues études universitaires ou possèdent un doctorat. Un peu de répétition ne leur fera pas de mal. 
Expliquez et réexpliquez à vos équipes, qu’à chaque fois qu‘elles envisagent de consulter des volumes de données ou de procéder à des analyses de donnéeselles doivent se poser la question suivante: « Y a-t-il quelque chose qui me manque ?»  
Ou bien :  « Y a-t-il une autre façon de l’interpréter ? »  
Se forcer à penser de manière critique est un moyen pratique d’éviter les angles morts que votre inconscienvous pousse à ne pas voir… parce que ça l’arrange. Privilégiez la véracité des chiffres sur vos désirs. 

 
 4. Éliminez les angles morts dans les modèles statistiques avec l’apprentissage automatique(machinelearning) 

Des angles morts liés aux données pourraient également exister dans vos modèles statistiques. 

 

RiskSpan est une entreprise qui a mis au point un algorithme d’apprentissage automatique capable de signaler les parties d’un modèle statistique sujettes aux erreurs et d’indiquer les sorties associées susceptibles de ne pas être fiables. Elle a également constaté que l’application de l’apprentissage automatique de cette manière pouvait empêcher la précision du modèle de se dégrader avec le temps. 
 

Cette façon d’utiliser l’apprentissage automatique en est encore à ses débuts. Mais si vous soupçonnez que des angles morts peuvent compromettre l’efficacité de vos modèles statistiques, un algorithme d’apprentissage automatique sur mesure pourrait aider à réduire ce problème. 

 

5.Évaluer si le manque d’outils adéquats crée des angles morts

Votre entreprise peut également avoir des angles morts à identifier si elle ne dispose pas des outils nécessaires pour mesurer le retour sur investissement de manière appropriée. 

Une infographie de DialogTech datant de 2015 indique que les spécialistes du marketing peuvent rencontrer des angles morts s’ils ne disposent pas de méthodes permettant de suivre le retour sur investissement des clients click-to-call : ceux qui obtiennent des informations sur une entreprise sur leurs appareils mobiles, puis les appellent directement après. 

Cela génère des masses de données qu’on ne peut corréler avec les décisions concrètes des clients. Dommage ! 

Les statistiques de DialogTech ont montré que seulement 21% des entreprises se considéraient efficaces pour mesurer le retour sur investissement mobile. Les données ont également montré que d’ici fin 2019, 162 milliards d’appels téléphoniques proviendraient de personnes ayant initialement rencontré des entreprises sur des canaux mobiles. Les recherches sur mobile et les médias sociaux ont été les principaux moteurs de cette activité. C’est considérable. 

De plus, le coût par prospect a été réduit de plus de 100 dollars américains lorsque les spécialistes du marketing ont pu calculer le retour sur investissement du mobile. Ece, parce qu’ils ont pu tracker avec précision les prospects provenant d’appareils mobiles par rapport à d’autres canaux, puis ajuster leurs dépenses en conséquence. 

Essayez de déterminer si votre entreprise risque d’avoir des angles morts, car elle ne permet pas de suivre les pistes d’acquisition aussi bien qu’elle le pourrait, ou si vos outils ne fonctionnent pas d’une autre manière. Effectuer un sondage interne pour déterminer le type de données que les travailleurs souhaitent pouvoir mesurer est un bon point de départ pour déterminer vos angles morts et déterminer comment investir dans des ressources qui les minimisent. 

Éliminer les angles morts est une bonne affaire 

Les lignes qui précèdent le prouvent.  

Plus on est conscient des angles morts potentiels lorsque l’on travaille avec des données, plus il est facile de se sentir confiant quant aux résultats – et mieux on se sent sûr de soi pour montrer les données à des supérieurs ou à des décideurs. 

 

Envie d’approfondir le sujet ? Des inquiétudes sur  vos angles morts ? Contactez-nous. 

 

Ces réflexions sur les big data vous intéressent ?
Suivez notre série d’articles sur le sujet.

Et pour cela , abonnez-vous à notre newsletter “En direct des bacs à sable”.
Cette newsletter vous informera de ce que nous publions ici et de ce qui se publie ailleurs sur ce type de sujets..

Abonnez-vous au plus vite.
Découvrez les trésors des bacs à sable, cliquez sur l’image….

Vous aimerez aussi sans doute lire aussi :

Big data vs Business intelligence : ce qu’il faut comprendre

Le premier V du Big data vvv

Innovation et Big data : devez-vous suivre ces 5 tendances ?

Téléchargez les bonnes feuilles du livre de Redouane Labdoui

Couverture bonnes feuilles livre Redouane Labdoui

Téléchargez les bonnes feuilles du livre de Redouane Labdoui

  • Et découvrez-le en avant-première
 


Prénom
Nom

Vous pourrez vous désinscrire à tout moment de la plateforme de gestion des téléchargement que nous utilisons, Mailchimp.
En acceptant de télécharger cet ouvrage, vous acceptez que vos informations personnelles soient transférées au système automatique de traitement Mailchimp. La politique de confidentialité de cet outil peut être consultée ici.

* champ obligatoire