Big data les 3 V Variété

Le deuxième « V » du Big Data VVV

Big data les 3 V Variété

V pour Variété

3V, 4V, 5V… Avec le big data, la surenchère ne manque pas. Cette accumulation de « V » est en fait une tentative de définition la plus précise possible de ce qu’est l’énormité du big data. Volume, Variété, Vélocité sont les trois piliers essentiels de la data… Auxquels certains ajoutent encore parfois Véracité, voire Valeur.  

Pour vous y retrouver, voici ce que vous devez savoir du big data, et donc, éventuellement, ce que vous devez apprendre

Après le Volume, le deuxième « V » du big data correspond à la variété. C’est-à-dire qu’il n’y a ni une seule forme, origine, contenu et même usage de la donnée : celle-ci est profondément multiple. Et cela ne va pas aller en se réduisant !

Les tweets du Président à la Maison Blanche, les photos de nos voisins sur Instagram, les données de fonctionnalité des machines-outils d’une usine, le nombre de pas ou de calories brûlées comptabilisées par les montres électroniques, les vidéos postées sur Youtube ou les caméras infrarouges à l’entrée des stades, la température ou le poids des balances et thermomètres connectés…  La data se définit par sa variété.

Variété de provenance

L’IT est partout. Le numérique atteint tous les secteurs de la vie professionnelle, personnelle, sociale…

Le secteur de la santé à lui seul génère des milliards de données en France, où l’on compte environ 260 bases de données publiques dans ce domaine. Rien que dans ce secteur, les provenances sont déjà multiples : pharmacies, établissements de santé, caisses d’assurances maladies, dispositifs de soins connectés, programmes de recherches, etc. collectent et produisent de la donnée.

Tous secteurs confondus, les  entreprises sont de plus en plus connectées, du monde de la construction jusqu’aux machines-outils équipées de capteurs intelligents, voire des entrepôts de stockage équipés de thermomètres numériques pour contrôler la température sur place.

Par ailleurs, nous produisons tous des données en nous entourant de toujours plus d’objets connectés. Bracelets, montres, thermomètres, balances, etc. créent des millions de data à chaque seconde.

Sans compter nos usages des réseaux sociaux, les vidéos que nous postons sur Youtube, les photos sur Instagram, les tweets ou les messages sur Facebook…

Variété de forme

La représentation de ce qu’est une « donnée » a énormément changé avec l’essor du big data. Pendant longtemps, on a communément considéré comme « données » ces informations qui allaient remplir les cases de nos tableurs Excel. Des résultats, des numéros, des bénéfices, le nombre de clients et les transactions effectuées, etc. Bref, des quantités chiffrables.

Le big data a en quelque sorte fait entrer les vidéos, les fichiers texte, les photos, les sons et jusqu’à la calligraphie dans nos tableurs.

En réalité, avec le big data, tout peut devenir de la donnée. Cela signifie que tous ces formats sont désormais stockables, possibles à transformer et, surtout, à analyser.

On peut par exemple considérer aujourd’hui que cette fameuse feuille d’ordonnance illisible du médecin traitant (parce qu’écrite à la main), entre dans le champ de la data. En effet, l’application du machine learning sur un modèle d’analyse neuronal permet désormais la reconnaissance d’écriture manuscrite. On peut donc imaginer que ces documents, d’ordinaire difficiles à déchiffrer, peuvent eux aussi entrer dans nos feuilles de calculs analytiques… Et devenir une matière traitable et utilisable dans le cadre d’une stratégie big data d’entreprise

Variété de contenu

Le contenu lui-même ne cesse de s’enrichir, à mesure que nous sommes capables de capter de l’information.

Aujourd’hui, la variété de contenu est énorme : données mobiles, données de connexion, de géolocalisation, données de machines, captages infrarouges, capture de vidéosurveillance encryptée ou non, contenu écrit publié sur tweeter, photo partagée depuis Instagram, information journalistique, contenu de newsletter partagé dans un e-mail… 

Variété d’usage

Il faut enfin considérer que des données de format, contenu et origines similaires feront l’objet d’un traitement très différent selon l’objectif défini par et avec vos data scientists.

Il vous faudra d’abord de bons data ingénieurs pour construire l’architecture pertinente de votre base de données… D’autant plus si vous faites appel à une très grande variété de data. Et décider des questions de traitement et stockage qui pourraient détruire ou réduire la donnée.

Par la suite, vous pourriez faire une multitude d’usages différents de ces données… Ce qui, sans une stratégie appliquée à chaque secteur de votre entreprise utilisant ces data, vous ferait en réalité perdre beaucoup de temps et d’argent.

Pour rester dans le secteur de la santé, par exemple, cela veut dire choisir d’orienter le traitement des data vers la prévention ou le diagnostic, l’innovation ou encore la réduction des coûts… 

En somme, la variété n’est une richesse pour votre entreprise que si vous avez déjà prévu son usage futur. 

Si vous vous posez encore des questions sur ce que vous devez apprendre du big data, lisez cet article.

Ces réflexions sur les big data vous intéressent ?
Suivez notre série d’articles sur le sujet.

Et pour cela , abonnez-vous à notre newsletter “En direct des bacs à sable ».
Cette newsletter vous informera de que nous publions ici et de ce qui se publie ailleurs sur ce type de sujets..

Abonnez-vous au plus vite.
Découvrez les trésors des bacs à sable, cliquez sur l’image….

A propos de data vous aimerez aussi sans doute lire :

Le premier V du big data vvv

Big data : que devez-vous apprendre

Big data pour les nuls : notions de base

Leave a Reply

Your email address will not be published.

Share This

Copy Link to Clipboard

Copy