Qu'est-ce que l'AutoML ?

Le machine learning automatisé, ou AutoML, rend le machine learning accessible aux non-experts en leur permettant de créer, de valider, d'itérer et d'explorer des modèles ML dans un contexte d'automatisation. L'AutoML prépare et nettoie automatiquement les données, crée et sélectionne des caractéristiques, choisit la famille de modèles appropriée, optimise les hyperparamètres et analyse les résultats. Il facilite également la visualisation des données, la génération d'insights, l'explicabilité et le déploiement des modèles.

Pourquoi l'AutoML est-il important ?

Les modèles de machine learning (ML) fournissent des insights précieux, mais la responsabilité de leur création incombe souvent à ceux qui n'ont pas une grande expertise en matière de ML. Bien que l'AutoML ne remplace pas le data scientist, il le rend plus productif et lui permet (ainsi qu'à d'autres) d'automatiser des étapes de codage intensif et de se concentrer sur le test des modèles et les insights. Des utilisateurs moins expérimentés (dits « citizen data scientists ») utilisent souvent l'AutoML pour générer des insights et pour apprendre rapidement la Data Science.

Comment fonctionne l'AutoML ?

Le machine learning automatisé comprend généralement ce qui suit.

 

Prétraitement et évaluation des données
Évaluation et prétraitement des données : les données sont préparées, nettoyées et transformées pour créer un jeu de données d'entraînement de modèles utile.

 

Feature engineering
Ingénierie des caractéristiques : de nouvelles colonnes de données sont ajoutées aux données d'entraînement du modèle pour mieux représenter les prédicteurs du phénomène décrit par les données, ou tout simplement pour mieux fonctionner avec les algorithmes de machine learning.

 

Sélection de caractéristiques
Sélection des caractéristiques : une fois les nouvelles caractéristiques créées, l'AutoML sélectionne uniquement celles qui sont utiles à la génération d'un modèle.

 

Sélection d'algorithmes
Sélection d'algorithmes : les modèles candidats sont examinés afin de sélectionner le plus performant selon les métriques souhaitées (p. ex., optimisation pour la précision, rappel ou exactitude équilibrée).

 

Réglage des hyperparamètres
Réglage des hyperparamètres : un ensemble d'hyperparamètres optimaux est choisi pour un algorithme d'apprentissage.

Exemples d'application de l'AutoML

Le machine learning automatisé peut vous aider à relever une multitude de défis, notamment :

Personnalisation

S'adresser à une base de consommateurs ne suffit plus. Il faut maintenant s'adresser à chacun d'eux. L'AutoML rend la personnalisation plus évolutive en apprenant les préférences et les comportements individuels, ce qui permet aux entreprises d'offrir des recommandations et des contenus personnalisés. La base de consommateurs est ainsi plus engagée et les ventes sont multipliées.

Nettoyage des données relatives aux clients

Fautes d'orthographe, mises à jour et informations incohérentes peuvent créer des doublons dans votre base de données. L'AutoML facilite la recherche et la correction de ces valeurs aberrantes afin que les données disponibles soient de bonne qualité, justes et exploitables.

Perte de clients

Toute entreprise a besoin d'attirer de nouveaux clients. Mais il est tout aussi important de conserver ceux qu'elle a déjà. L'AutoML peut déceler des tendances dans l'activité des clients pour prédire ceux qui sont susceptibles de passer à la concurrence. Ces informations permettent de cibler les efforts de rétention pour accroître les bénéfices et la valeur de la marque.

Détection des fraudes

La fraude coûte chaque année environ 80 milliards de dollars au gouvernement américain. Presque toutes les agences fédérales sont touchées et manquent de ressources pour examiner chaque plainte. Si les délinquants deviennent plus malins, les solutions le doivent aussi. Le machine learning automatisé s'intègre aux systèmes existants et exploite les données des fraudes précédentes pour déceler les signaux d'alarme et traiter rapidement les problèmes.

Bien démarrer avec l'AutoML

Alteryx offre une expérience de machine learning automatisé accessible grâce à une approche pédagogique et guidée, qui tire profit des capacités techniques utilisées par les data scientists traditionnels. Avec Alteryx Machine Learning, l'AutoML est intégré à chaque étape du processus d'analyse des données, notamment la préparation, la fusion et l'enrichissement.

À son niveau le plus élémentaire, Alteryx Machine Learning peut :

  • Automatiser les étapes de machine learning et de data science
  • Entraîner plusieurs modèles prédictifs sur ces données
  • Fournir des métriques sur la performance de ces modèles (par ex., caractéristiques opérationnelles du destinataire, précision, rappel, exactitude ou exactitude équilibrée)

Alteryx fournit aussi :

  • Des visualisations interactives
  • Des rapports clairs pour les différents intervenants
  • La possibilité de déployer des modèles dans un système d'opérationnalisation
  • Des leçons et glossaires intégrés
  • L'évaluation automatisée des données d'entraînement
  • Des suggestions pour améliorer les données d'entraînement ou ajuster automatiquement ces données.