Reconnaissance de forme : l'art du feature engineering

La reconnaissance de forme consiste à identifier des objets, des situations, des personnes ou même des comportements. C’est une des applications les plus intéressantes du machine-learning.
La reconnaissance de forme peut permettre de faire de l’analyse prédictive et de proposer de prendre des décisions liées à une situation (déclenchement d’un service supplémentaire, envoi de messages, etc.).
C’est un pan entier de la data-science. Sans doute un des plus dynamiques et un de ceux dont le potentiel semble aujourd’hui infini.

Reconnaissance de forme : le point-clé du feature engineering

Tout projet de machine learning comporte grosso-modo cinq étapes : la formulation du problème, l’obtention de données brutes utilisables, le choix d’un algorithme de machine learning qui va effectuer la tâche-clé, enfin la vérification de la qualité du résultat et sa traduction dans une forme compréhensible pour l’utilisateur.

Dans ce dispositif, l’étape numéro 2 est capitale. Il s’agit de la phase dite de feature engineering pendant laquelle les données sont reformatées, traitées, enrichies ou calibrées et que l’on va définir le(s) “feature(s)” qui nous intéressent, autrement dit les “traits” ou les modèles à identifier et analyser.

A-t-on besoin de connaître tous les noms et les modèles de véhicules pour identifier qu’il s’agit d’un taxi ? Pas forcément. 

C’est de la qualité du travail dans cette étape-là que va dépendre la qualité du modèle prédictif ensuite et de ses résultats. Au fond, c’est  dans la mise au point de ces “features” que le data-scientist montre réellement son talent et sa capacité d’analyse du problème posé. Plus ces “features” sont pertinents, mieux la machine apprendra des données en les analysant à l’aulne de ces “features”, mieux le dispositif fonctionnera.

C’est exactement ce que résume Julien Fricou dans la vidéo ci-dessus.

Ne pas se transformer en Big Brother


On comprend donc que l’un des grands sujets quand on travaille sur de la reconnaissance de forme “à l’Européenne”, c’est-à-dire en respectant l’anonymat des personnes et sans entrer dans un systématisme de la reconnaissance faciale et de l’identification des individus, bref quand il s’agit d’éviter le syndrome Big Brother, sera précisément la qualité du feature ingeneering.

Imaginez

Imaginez un nouveau concept store qui vient d’ouvrir. La marque peut collecter des données parfaitement anonymes comme le nombre de clients qui pénètrent dans le magasin, le chiffre d’affaires, le nombre d’invendus, etc. Mais elle peut aussi aller plus loin avec une analyse qui lui permettra de mieux adapter sa stratégie commerciale : mesurer le degré de satisfaction de ses clients à la sortie. Cela grâce à un système d’identification des émotions (une caméra), programmé pour ne capter que les réactions de type sourire, sur les visages.

A la chinoise

Un tel projet s’il est mené à l’américaine ou à la chinoise ne comporte que des risques. A peine l’information aura-t-elle filtré dans la presse que l’entreprise identifie ses clients pour savoir s’ils sourient en sortant du magasin, et c’en sera fait de la réputation de la marque. D’ailleurs, la réglementation européenne s’y oppose a priori.

Si le projet est mené dans une optique de mesure de l’expérience-client, il devient passionnant. Pas besoin de savoir comment s’appelle la personne qui sourit à la caméra. Seul compte le fait qu’elle sourie … ou pas.
A quels “features” correspondent quels types d’émotions et quels types d’expressions sur les visages ? Nul doute qu’il y aura énormément de choses à apprendre pour l’entreprise qui se lancera dans ce type de projet tout en préservant l’anonymat, avec toutes les garanties possibles. 
 

Anonymat garanti


Comment garantit-on l’anonymat ? Lorsque l’IA capte une image, il s’agit de lui faire reconnaître des pixels qu’elle compare aussitôt avec une énorme matrice de données, puis remet à plat et classifie enfin pour identifier l’objet ou la forme. De cette façon, elle peut capter une partie d’un visage seulement ou un geste permettant d’analyser un comportement ou une situation, sans identifier la personne pour autant.

De plus, cette anonymisation est irréversible. Impossible de dépixelliser ou déflouter une image captée telle quelle par l’algorithme

Voilà pourquoi la reconnaissance de forme, même quand il s’agit de reconnaissance faciale partielle représente un potentiel énorme, à condition, comme nous l’avons analysé ici, que le marché soit guidé par la créativité et non par l’obsession sécuritaire.

Le cercle vertueux du machine learning

Tout le challenge réside dans la capacité à rendre les données “propres” et utilse au dispositif d’apprentissage de la machine. Tout est donc bien dans l’art du feature engineering.

Envie de vous consacrer à cet art ? Contactez-nous. 

 

Ces réflexions sur le machine-learning vous intéressent ?
Suivez notre série d’articles sur le sujet.

Et pour cela , abonnez-vous à notre newsletter “En direct des bacs à sable”.
Cette newsletter vous informera de que nous publions ici et de ce qui se publie ailleurs sur ce type de sujets..

Abonnez-vous au plus vite.
Découvrez les trésors des bacs à sable, cliquez sur l’image….

A propos de data vous aimerez aussi sans doute lire :

Data science : à quoi s’attendre pour 2019 ?

data-management et data-governance, c’est quoi la différence ?

Innovation et Big data : devez-vous suivre ces 5 tendances

Couverture bonnes feuilles livre Redouane Labdoui

Téléchargez les bonnes feuilles du livre de Redouane Labdoui

  • Et découvrez-le en avant-première


Prénom
Nom

Vous pourrez vous désinscrire à tout moment de la plateforme de gestion des téléchargement que nous utilisons, Mailchimp.
En acceptant de télécharger cet ouvrage, vous acceptez que vos informations personnelles soient transférées au système automatique de traitement Mailchimp. La politique de confidentialité de cet outil peut être consultée ici.

* champ obligatoire