Erreurs de data-visualisation : quand les camemberts ont faux !

Suite de notre série sur les erreurs de data-visualisation. Nous avons déjà vu le piège de la moyenne qui ne dit rien (voir premier article ici). Continuons sur notre tentative de faire parler une moyenne et tentons une opération de sauvetage. Par le camembert. Là encore, il y a des pièges.

Erreurs de data-visualisation : quand l’arbre cache la forêt

Prenons l’exemple d’un problème de panier moyen dans un point de vente ou une chaîne de distribution. La première courbe montre que les choses vont bien, puisque ce panier moyen augmente régulièrement, mois par mois.

Pourtant, si on analyse les différents types de moyennes (les paniers moyens par catégories de clients), on se rend compte d’où provient le fait que les choses vont bien.

Le panier moyen chez les clientes de chaussures explose et vient combler les trous d’air dans les ventes des autres catégories.

Ne pas voir cela est dommage pour l’entreprise qui ne pourra adapter ses ressources en fonction de la demande et corriger les endroits où apparaissent des difficultés.

 

Décrivons l’arbre avec un camembert

 

Pour mieux faire parler les chiffres, il peut être tentant dans la situation ci-dessus de faire la synthèse de ces données en créant un camembert reprenant les différents paniers moyens.
L’idée paraît judicieuse

Mais quel est le sens d’un tel graphique ?

Un camembert n’a d’intérêt que s’il représente les différentes parts d’un tout. Mais comment pouvez-vous présenter les différentes parts d’une moyenne ?

La “contribution de chaque département au panier moyen global” que représente ce camembert perd beaucoup plus d’informations qu’il n’en apporte et fait travailler le cerveau du lecteur pour… rien !

Data-visualisation : erreur courante

Autre risque : le cerveau humain n’est pas aussi neutre que les data

 

D’un strict point de vue statistiques, l’ordre dans lequel vous allez présenter les différents acteurs qui se “répartissent” un tout n’a aucune importance.

Si, sur le marché des colas, Coca et Pepsi se taillent la part du lion, suivis par tout un tas de petites marques bien loin derrière, peu importe dans quel ordre vous présentez les données.

Enfin, ça, c’est sans doute ce que vous disait le prof de maths en terminale.

Mais le cerveau des lecteurs à qui vous allez présenter la chose ne “captera” pas du tout la même information selon l’ordre que vous choisirez pour présenter votre camembert “qui détient quelle part de marché”.

 

Hubspot a ainsi identifié deux possibilités pour présenter un camembert “qui parle”.

Option 1: placez le numéro 1 à midi, et étalez la part qu’il représente dans le sens des aiguilles d’une montre. Placez le numéro 2 à midi et étalez le morceau du camembert qu’il représente dans le sens inverse des aiguilles d’une montre. Les suivants, se placent donc au-dessous.

Dataviz : ordre des données

Option 2:  placez  le numéro 1 à midi et étalez la part du morceau qu’il représente dans le sens des aiguilles d’une montre, puis le numéro 2 dans le même sens, et ainsi de suite, par ordre décroissant.

Dataviz : l'ordre des données compte

Regardez ces images et demandez-vous quelle conclusion vous en tirez dans la demi-seconde qui suit le moment où vos yeux se posent sur le graphique.
Immédiatement, vous vous rendrez compte que votre cerveau a besoin de moins d’effort pour interpréter ce que disent les camemberts que hubspot a cochés en vert.

Oui. En matière de data visualisation, la psychologie intervient presque autant que les chiffres bruts. Et même s’il ne s’agit pas d’erreur au sens mathématique, il s’agit d’erreur au sens de l’aide à la décision. Or, c’est pour cela qu’est faite la data visualisation, non ?

 

Ces réflexions sur la data visualization vous intéressent ?
Suivez notre série d’articles sur le sujet.

Et pour cela , abonnez-vous à notre newsletter “En direct des bacs à sable”.
Cette newsletter vous informera de que nous publions ici et de ce qui se publie ailleurs sur ce type de sujets..

Abonnez-vous au plus vite.
Découvrez les trésors des bacs à sable, cliquez sur l’image….

Vous aimerez aussi : 

Cette erreur de data-visualisation qu’adorent les publicitaires

Erreurs de data-visualisation : ne tombez pas dans le piège de la moyenne