Le Machine Learning ou apprentissage automatique est un sous domaine de l’intelligence artificielle. Au cœur du métier des Data Scientists, le machine learning permet aux algorithmes d’apprendre ou d’améliorer leurs performances en fonction des données qu’ils reçoivent.
Nous sommes en interaction constante avec des applications de machine learning, que ce soit lorsque nous utilisons les réseaux sociaux, interagissons avec un chatbot, ou lorsque nous consultons les moteurs de recommandations.
L’histoire du Machine Learning
Les débuts du Machine Learning sont souvent associés à ceux de l’IA avec la création du célèbre test de Turing en 1950. Mais c’est en 1959 que le terme “machine learning” apparait pour la première fois, utilisé par Arthur Samuel pour son programme créé en 1952 capable d’apprendre à jouer aux dames au fil des parties.
En 1957, le premier réseau de neurones fait son apparition avec le “perceptron”, un classificateur binaire développé par Frank Rosenblatt. Néanmoins, l’absence de résultats de l’ensemble de ses travaux créera “l’hiver de l’IA”, une crise autour de l’intérêt porté à l’IA qui se conclut par un arrêt des travaux de recherche autour de l’intelligence Artificielle et du Machine Learning.
Dans les années 1990, on observe un retour de l’intérêt porté à l’IA et au machine learning, fondamentalement lié à l’émergence d’internet qui offre aux chercheurs de nouvelles possibilités d’interactions et un accès à de la donnée en grande quantité, essence même des bonnes applications de Machine Learning.
Le Machine Learning
Le machine learning est une sous-branche de l’IA. En effet, un projet d’intelligence artificielle n’implique pas nécessairement un apprentissage de la machine, même si actuellement très peu de modèles d’IA n’utilisent pas le Machine Learning.
L’objectif de l’IA est de copier le comportement humain sur un aspect logique, ordonné et raisonné, mais dans le cadre de l’utilisation du Machine Learning, l’application est capable d’apprendre et de répondre de façon adaptée. C’est ce que l’on appelle l’Intelligence artificielle neuronale ou subsymbolique. Cette IA forte nécessite une large volumétrie de donnée pour s’entrainer, apprendre et se développer. En ce sens, le Big Data est l’essence même du Machine Learning.
Mais il n’est pas aisé de produire un résultat seulement grâce à l’accès à une grande volumétrie de données, le cerveau humain n’étant pas en mesure de la traiter et d’en distinguer des axes de décisions stratégiques. Le Machine Learning est non seulement capable de comprendre les schémas enfouis dans les grandes volumétries de données, mais aussi de les analyser. C’est ainsi que le machine learning et la communication machine to machine accompagnent les entreprises dans la compréhension de leurs données pour relever les défis de leurs marchés.
A. Les deux principales catégories de Machine Learning
- Le machine learning non supervisé
Aussi appelée feature learning, le machine learning non supervisé permet de catégoriser les données en fonction des évènements ou comportements passés, sans savoir à l’avance quels résultats on souhaite obtenir (par opposition au ML supervisé). Par exemple, dans le cadre de la détection de fraude, l’ordinateur apprend à détecter les fraudes sur la base des comportements frauduleux déjà enregistrés par l’entreprise.
Il existe deux types de machine learning non supervisé
- Clustering : l'ordinateur a pour objectif de créer des groupes de données.
- Association de données : l'ordinateur a pour objectif d'identifier les règles permettant de créer des groupes de données. - Le machine learning supervisé
Le machine learning supervisé est un ensemble d’algorithmes permettant à l’ordinateur d’apprendre à prédire un résultat en se basant sur des données annotées pendant l’entraînement. L’ordinateur doit développer la bonne fonction qui permettra de prédire la variable de sortie attendue par rapport aux variables reçues en entrée, et ainsi produire des valeurs les plus proches possibles des valeurs de référence.
Il existe deux types de machines learning supervisé
- Classification : la variable de sortie attendue est une variable qualitative. (ex : chat ou chien)
- Régression : la variable de sortie attendue est une variable quantitative. (ex : prix d’une maison)
B. 5 cas d'usage du Machine Learning
Aujourd'hui, les cas d’usage du machine learning sont multiples, et les algorithmes de ML sont au cœur de la majorité des applications web ou mobile. Voici 5 solutions développées par Sicara pour répondre aux différentes problématiques des entreprises.
- Moteur de recommandation :
Dans le cadre d’une mission pour le Pass Culture, Sicara a développé un algorithme capable de recommander des évènements culturels aux jeunes de moins de 18 ans en fonction de leurs centres d’intérêts. - API Prédictive
Pour une grande marque retail, nous avons développé un POC d’API prédictive permettant d’inférer le niveau de rides d’une personne à partir de sa photo. - Facturation Automatique
Pour un acteur industriel de la restauration d’entreprise, nous avons construit une application de facturation automatique des plateaux repas en utilisant des algorithmes qui sont à l’état de l’art de la recherche en reconnaissance visuelle. - Solution logicielle embarquée de reconnaissance visuelle
Dans le cadre d’une mission pour le ministère des Armées, nous avons construit une application de reconnaissance automatique des cartes électroniques fonctionnant sur un smartphone en temps réel et même sans connexion. - Maintenance Prédictive appliquée au Rail
Dans le cadre d'une évaluation de ses poteaux, le bureau d'étude Colas Rail s'est associé à Sicara afin d'automatiser une des étapes du projet : la mise en plan 3D des poteaux générés par un LIDAR puis son intégration 2D à un logiciel métier interne. L'étape qui prenait manuellement 15 min, a été réduite à 45s.
Si vous aussi, vous avez un projet de Machine Learning ou des questions sur les différents cas d’usages, n’hésitez pas à nous contacter, nos équipes seront ravies de vous accompagner dans le développement de solutions complexes !