Data visualisation : cette erreur qu'adorent les publicitaires

Data visualisation : l’astuce

Voici l’erreur de data visualisation préférée des publicitaires. Elle sert à vendre bien qu’à rendre compte des faits. C’est en fait plus une astuce de présentation “orientée” qu’une façon objective de rendre compte des chiffres. 

Regardez cette auto-promotion du Times.

Cette exemple est donné dans un article de sisense.com. L’infographie vise à expliquer à quel point les ventes à plein tarif du Times sont en avance sur celles du Daily Telegraph.
Côté gauche, le bloc semble avoir la taille d’un lectorat au moins deux fois plus important que celui du bloc de droite.
Et lorsqu’on lit la légende, en effet, 485 720, c’est beaucoup plus que 446 954.

La raison retient que le Times est en avance sur le Daily Telegraph, c’est factuel.  Dit comme cela, c’est juste.

Mais que retient l’inconscient ?
Psychologiquement, le lecteur du graphique  aura le sentiment que la diffusion du Times est plus du double de celle du Daily Telegraph, puisque l’image du bloc du Times est deux fois plus importante que celle du Daily Telegraph.

L’astuce est judicieuse. 

En réalité, il n’en est rien. Cette impression est liée au fait que l’échelle des ordonnées est tronquée.
Le graphique élimine tout ce qui se passe en dessous de 420 000. En d’autres termes, c’est comme si l’on zoomait sur le haut du graphique. 

Le véritable graphique, celui dont l’échelle des Y commence à zéro n’a rien à voir. Il suffit de prendre une feuille excel, d’y reporter les deux chiffres de diffusion affichés et de se mettre en mode graphique.
On obtient ceci. 

Le véritable graphique sans cette erreur de data visualization qu'adorent les publicitaires

L’effet rendu est bien différent, n’est-ce pas ? 

Sans cette erreur de data visualization, volontaire sans aucun doute, on se rend compte que Le Times a un peu d’avance, certes, mais pas tant que cela non plus. 

D’ailleurs, il suffit de continuer sur la feuille excel et de demander au logiciel de proposer une représentation en mode “camembert” ou “part de marché” (ce qui revient, certes, à supposer que le marché de la presse en Grande Bretagne, se limite à ces deux journaux, ce qui n’est pas le cas, bien sûr, mais nous n’avons pas les données des autres acteurs concernés, le périmètre étudié se limite donc à ces deux titres-là). 

Nous obtenons alors ceci.

camembert data visualisation Times Guardian

Rien à voir, n’est-ce pas ? L’avance phénoménale du Times semble tout à coup bien fragile. 

Voilà donc pourquoi l’erreur consistant à tronquer un des deux axes pour créer un effet de zoom est l’astuce de data visualization préférée des publicitaires ou des responsables de communication. 

Pour en savoir plus sur les erreurs courantes en matière de data visualisation, lisez aussi cet article