Data Science : à quoi s’attendre pour 2019 ?

La data science évolue rapidement. Les nouvelles avancées de l’IA et de l’apprentissage automatique impliquent que les données peuvent être utilisées de manière inédite, et dans des systèmes de modélisation sans précédent, pour faire beaucoup plus qu’il n’était possible il y a seulement quelques années. 

Le cloud inaugure également une nouvelle ère de la data science, en rendant les applications plus flexibles et polyvalentes.

Voici ce à quoi nous pourrons nous attendre cette année.

La demande d’applications analytiques intelligentes redéfinira l’utilisation données des entreprises : elles font la course pour devenir des entreprises basées sur les données, mais seule une petite fraction de la valeur de l’analyse avancée a été exploitée. Durant cette année 2019, il y aura une forte demande pour des innovations autour des applications analytiques intelligentes, basées sur les interactions en temps réel, les analyses intégrées et l’IA.

L’ingénieur de données place l’IA au premier plan de l’entreprise

La montée en puissance de l’ingénieur de données place l’IA au premier plan de l’entreprise : l’année dernière a été l’année du data scientist ! Les entreprises ont concentré leurs efforts sur le recrutement et la montée en compétences des data scientists sur les données afin de créer des modèles avancés d’analyse et d’apprentissage automatique. 

Les développeurs apprendront qu’ils ont besoin d’un ami data scientist. Les développeurs ne vont pas devenir des data scientists – l’un écrit du code, l’un pense en mathématiques et en modèles. Mais les développeurs auront de plus en plus besoin de comprendre les méthodologies de la data science et d’intégrer ses modèles dans leur flux de travail. Les données rendent les logiciels plus intelligents, leur permettant de prédire les résultats ou d’anticiper les besoins des utilisateurs grâce à l’apprentissage automatique. Les développeurs ont donc de plus en plus besoin d’un nouveau niveau de partenariat avec les scientifiques de données, pour produire le meilleur résultat possible. Les développeurs peuvent exposer les modèles des data scientists via des API et les intégrer à des applications spécifiques à un domaine, afin de générer un réel changement.

En 2019, l’intelligence artificielle et l’apprentissage automatique atteindront presque leur plein potentiel, en connectant et en traitant les données plus rapidement sur une distribution mondiale de plate-formes de pointe. Les informations de l’IA et du ML ont toujours été disponibles, mais ont peut-être été utilisées un peu plus lentement que nécessaire sur les plates-formes cloud ou les centres de données traditionnels. Nous pouvons maintenant rapprocher les capacités de calcul et de stockage du lieu où les données sont récupérées et traitées, ce qui permet aux entreprises, aux organisations et aux agences gouvernementales de prendre des décisions plus sages et plus rapides. Nous le constatons déjà dans la manière dont les compagnies aériennes construisent et desservent les avions, dans la manière des agences de défense gouvernementales, de répondre aux pirates informatiques et dans la manière dont les assistants personnels formulent des recommandations pour les futurs achats en ligne. Cette année, grâce à l’IA et au ML, nous saurons enfin si quelqu’un veut vraiment un gâteau aux fruits ou une laveuse à pression.

2019 semble être l’année de l’analyse, de l’apprentissage automatique et de l’IA

2019 semble être l’année de l’analyse, de l’apprentissage automatique et de l’IA. Ces outils sont déjà disponibles, mais leur adoption a souvent été retardée en raison de l’incapacité de faire correspondre ces nouvelles fonctionnalités aux nouveaux flux de travail et pratiques de sécurité appropriés. L’année prochaine, certains prétendants – ceux qui prétendent utiliser ces techniques, mais qui utilisent en réalité les techniques de corrélation et d’alerte déguisées de la dernière génération – devraient disparaître, permettant ainsi aux véritables innovateurs dans ce domaine de commencer à dominer. Cela risque de conduire à certaines acquisitions, car les grands opérateurs historiques, qui ont eu du mal à développer cette technologie, cherchent plutôt à l’acheter. 2019 est l’année des investissements dans les startups de machine learning en sécurité,n qui démontrent de réelles capacités.

À mesure que l’IA et le ML seront généralisés, une nouvelle génération de data scientists spécialisés en sécurité émergera en 2019. La préparation, le traitement et l’interprétation des données exigeant des data scientists qu’ils soient polyvalents. Ils ont besoin de connaissances en informatique, en data science et avant tout, de compétences dans les métiers pour pouvoir distinguer les données erronées des bonnes données et les mauvais résultats, des bons résultats. Ce que nous avons déjà constaté, c’est la nécessité pour les experts en sécurité qui comprennent la data science et l’informatique, d’être en mesure de donner un sens aux données de sécurité dont nous disposons aujourd’hui. Une fois que ces données sont préparées, traitées et interprétées, elles peuvent ensuite être utilisées par les techniques d’IA et de ML pour automatiser la sécurité en temps réel.

En développement logiciel, la grande histoire en 2019 sera l’apprentissage automatique et l’IA. La qualité des logiciels dépendra autant de ce que l’apprentissage automatique et l’intelligence artificielle pourront accomplir. Auparavant, les processus de livraison étaient conçus de manière à alléger et à réduire, ou à éliminer les déchets c’est désormais une façon obsolète de voir le processus. Cette année, si nous voulons tirer pleinement parti de ces deux technologies, nous devons comprendre que le contraire du gaspillage est la valeur, et que devenir plus efficace signifie augmenter la valeur plutôt que réduire le gaspillage.

Une fois que ce point de vue sera enraciné dans notre M.O., nous pourrons nous concentrer sur l’amélioration continue, la réactivité et l’anticipation des besoins des clients. Au fur et à mesure que nous intégrons et tirons parti de l’apprentissage automatique et de l’intelligence artificielle, nous nous rendrons compte que l’amélioration de la valeur nécessite une analyse prédictive. L’analyse prédictive permet de simuler le pipeline de livraisons en fonction des paramètres et des options disponibles. Ainsi, vous n’avez pas à « écraser » l’organisation pour trouver le chemin à suivre pour l’améliorer. Vous pourrez vous améliorer virtuellement, tirer des leçons grâce à des simulations et, le cas échéant, mettre en œuvre de nouvelles versions qui, vous en serez convaincu, fonctionneront.

Les entreprises, en 2019, seront proactives par la simulation

Les entreprises, en 2019, seront proactives par la simulation. S’ils peuvent simuler des améliorations du pipeline, elles continueront à s’améliorer plus rapidement.

En 2019, recherchez des équipes de données de plus en plus sophistiquées au fur et à mesure de l’évolution de leur domaine, évoluez pour fonctionner avec des ensembles de données plus volumineux et intégrez de nouvelles techniques dans leur flux de travail. Les langages avancés tels que R et Python sont devenus une partie plus critique de l’analyse quotidienne, et devraient constituer une pièce maîtresse de la stratégie du « jour zéro » lors de la construction de toute pile technologique.

On s’attend cette année à voir l’adoption généralisée d’une méthode récemment décrite, l’apprentissage mixte. Cela permet aux entreprises de créer des systèmes d’intelligence artificielle avec une précision exceptionnelle et une quantité nulle, ou infime de données d’entraînement. Du point de vue des matières premières, la quantité de données nécessaire à la formation et au test des solutions d’intelligences artificielles, empêche de nombreuses entreprises de participer à la course à l’intelligence artificielle.

Au moins deux entreprises : Google et Glynt.ai, ont démontré des résultats spectaculaires en utilisant l’apprentissage mixte. Glynt.ai utilise cette méthode pour extraire des données de documents non structurés comportant moins de 10 exemples d’entraînement. Le résultat est une précision d’environ 98% : meilleure qu’une équipe de deux, dédiée à la saisie de données. Les implémentations précédentes seraient fières si elles avaient besoin de 1 000 exemples pour effectuer la même tâche avec une précision de 95%.

Nous verrons de bien meilleurs assistants virtuels et de meilleurs chatbots

En 2019, nous verrons de bien meilleurs assistants virtuels et de meilleurs chatbots. Ce qu’il faut savoir avec l’intelligence artificielle, c’est que les consommateurs ne sont au courant du rythme de croissance de la technologie et de ses applications, car elle fonctionne en coulisse.

De plus, la blockchain est importante, et elle grossit. Pour le moment, elle n’a pas d’applications en data science, mais il ne sera pas surprenant si en 2019, il commence à y avoir des applications. Bien sûr, tout ce stockage décentralisé pourrait être exploité pour servir le Big Data.

Les récents investissements massifs dans la data science devraient modifier considérablement le paysage des médias sociaux au cours des prochaines années. Un intérêt croissant pour les technologies de reconnaissance d’images basées sur l’IA a été constaté. Ces techniques sont déjà utilisées par certaines marques qui ont rapidement adopté et innové, pour être prêtes à répondre à la demande mondiale.

Cette technologie apporte un tout nouveau niveau de connaissances marketing aux marques et agences grand public. Cela les aide à mieux comprendre les goûts de leurs consommateurs, même si la marque n’est pas explicitement mentionnée dans leurs publications sur les réseaux sociaux. C’est un excellent moyen pour les spécialistes du marketing et des médias sociaux d’en savoir plus sur les situations de consommation de produits et de découvrir des informations précieuses sur les consommateurs.

En 2019, nous constaterons une augmentation spectaculaire de la demande de plates-formes proposant des pipelines dédiées à la data science. Nous comparons souvent la data science au boom du développement logiciel, où GitHub et d’autres plates-formes de développement logiciel ont eu un impact considérable sur le domaine du développement. Nous constatons une montée en puissance des plates-formes de data science et une valorisation du domaine.

Voilà donc quelques exemples, de ce qui est susceptible d’arriver au cours de cette année en 2019.