Le premier V du Big data vvv

On le sait (voir notamment cet article), le big data est souvent associé à la notion de 3 V ou vvv : volume, variété et vélocité.

Autrement dit, le big data se caractériserait par le fait que l’on traite beaucoup de données (volume), de natures très différentes (variété), et ce, à une très grande rapidité (vélocité). 

Raconté comme cela, on peut avoir l’impression que, dans son entreprise, son organisation à propos de n’importe quel sujet …. on a de quoi trouver les 3 V en question.

On a beaucoup de données, elles sont de nature très variées, compte tenu de la façon dont on les récolte et on a besoin de les traiter de façon la plus rapide possible. Bingo ! On a un projet Big data à lancer.   

En réalité, il faut pouvoir prendre la mesure de cette notion de volume.
Beaucoup de données est-ce vraiment du volume ?

La réponse n’est pas aussi simple. Le mot “big” dans Big data n’est pas aussi facile à comprendre que cela. Ou en tout cas, à imaginer. 

Gros plan sur le 1er V des 3 V

Gros plan donc sur le 1er V des 3 V du Big data : que veut-on dire par volume ?

La meilleure façon de mettre cela en perspective, nous l’avons trouvée dans un article de ZDNet dont nous traduisons quelques extraits ci-après. 

“Facebook, par exemple, stocke des photographies. Mais savez-vous que Facebook compte plus d’utilisateurs que la Chine a d’habitants ?
Chacun de ces utilisateurs a stocké de nombreuses photos. Facebook stocke environ 250 milliards d’images.

Faites le test

Essayez d’imaginer 250 milliards d’images autour de vous.
C’est impossible.

Ainsi, dans le monde du Big Data, lorsque nous commençons à parler de volume, nous parlons de quantités de données incroyablement grandes. À mesure que nous avancerons, nous aurons de plus en plus d’énormes collections.

Par exemple, si nous ajoutons des capteurs connectés à presque tout, toutes les données de télémétrie s’additionneront.

Comment vont-elles s’additionner ? Gartner, Cisco et Intel estiment qu’il y aura entre 20 et 200 périphériques IoT connectés autour de chacun de nous d’ici peu de temps.

Le sujet n’est pas tellement la quantité d’appareils.

Le sujet est la quantité de données qui proviennent de chacun.
J’ai un capteur de température dans mon garage. Même avec un niveau de granularité d’une minute (une mesure par minute), il reste 525 950 points de données par an, et ce n’est qu’un seul capteur !

Supposons que vous ayez une usine avec mille capteurs, un demi-milliard de points de données, rien que pour la température !

Ou alors, prenons l’univers d’applications connectées dans lequel nous sommes désormais.

Liste de tâches



Tout le monde a un smartphone.

Prenons une application de liste de tâches. De plus en plus de fournisseurs gèrent les données d’applications dans le cloud, afin que les utilisateurs puissent accéder à leurs listes de tâches sur plusieurs appareils.

Étant donné que de nombreuses applications utilisent un modèle freemium, dans lequel une version gratuite est utilisée comme pallier vers une version premium, les fournisseurs d’applications en mode SaaS ont généralement beaucoup de données à stocker.

Todoist, par exemple (le gestionnaire de tâches que j’utilise) compte environ 10 millions d’installations actives, selon Android Play.

Cela ne comprend pas toutes les installations sur le Web et iOS.

Chacun de ces utilisateurs a des listes d’éléments et toutes ces données doivent être stockées.

Todoist n’est certes pas l’échelle de Facebook, mais cette seule appli stocke à elle seule plus de données que presque toutes les applications ne faisaient il y a à peine dix ans.”

C’est cela le véritable sens du vecteur volume des 3 v du Big data. 

Votre projet est-il donc de cette nature ? 
Avez-vous besoin de stocker et traiter des données dont le volume augmente de façon exponentielle compte tenu du nombre de points de collecte et de leur fréquence ? 

 

 

 

Ces réflexions sur la Data Intelligence vous intéressent ?
Suivez notre série d’articles sur le sujet.

Et pour cela , abonnez-vous à notre newsletter “En direct des bacs à sable”.
Cette newsletter vous informera de que nous publions ici et de ce qui se publie ailleurs sur ce type de sujets..

Abonnez-vous au plus vite.
Découvrez les trésors des bacs à sable, cliquez sur l’image….

A propos de Data Intelligence vous aimerez aussi sans doute lire :

De la BI à la data-intelligence

Data-intelligence : pourquoi c’est le concept de l’avenir

Data Intelligence : pourquoi c’est le concept de l’avenir -suite

 

Business Intelligence : les outils BI d’Oracle

La BI en self-service : un concept qui a toujours le vente en poupe

Couverture bonnes feuilles livre Redouane Labdoui

Téléchargez les bonnes feuilles du livre de Redouane Labdoui

  • Et découvrez-le en avant-première


Prénom
Nom

Vous pourrez vous désinscrire à tout moment de la plateforme de gestion des téléchargement que nous utilisons, Mailchimp.
En acceptant de télécharger cet ouvrage, vous acceptez que vos informations personnelles soient transférées au système automatique de traitement Mailchimp. La politique de confidentialité de cet outil peut être consultée ici.

* champ obligatoire