Nouvelles

Cycle de vie des processus de ML - Partie 1 : Ce qu'il est et pourquoi nous en avons besoin

Il s'agit de la première partie d'une série de trois articles sur le cycle de vie des processus de ML. Lire Partie 2 et partie 3.

L'apprentissage machine (ML) connaît une croissance explosive en popularité en raison de sa capacité à apprendre automatiquement des données avec un minimum d'intervention humaine. Comme l'apprentissage automatique est de plus en plus mis en œuvre et appliqué dans les entreprises, les praticiens de l'apprentissage automatique doivent développer des méthodes pour décrire le calendrier de leurs projets à leurs employeurs ou clients.

Un outil particulièrement utile à cet égard est le ML Process Lifecycle, un cadre de processus adapté par l'équipe Amii (voir note ci-dessous). Dans cette série de blogs en trois parties, nous allons explorer ce qu'il est, pourquoi il est important et comment vous pouvez le mettre en œuvre.

Qu'est-ce que la MLPL ?

Le ML Process Lifecycle (MLPL) est un cadre qui capture le processus itératif de développement d'une solution ML pour un problème spécifique. 

Le développement et la mise en œuvre de projets de ML est un processus exploratoire et expérimental où différents algorithmes et méthodes d'apprentissage sont essayés avant de parvenir à une solution satisfaisante. Le voyage pour atteindre une solution de ML qui répond aux attentes de l'entreprise est rarement linéaire - à mesure qu'un praticien de ML avance dans les différentes étapes du processus et que plus d'informations sont générées ou découvertes, il peut avoir besoin de revenir en arrière pour apporter des changements ou recommencer complètement. 

La MLPL tente de capturer ce flux dynamique entre les différentes étapes et la séquence dans laquelle ces étapes sont réalisées. 

Quelle est la place de la MLPL ?

Lorsque les entreprises développent de nouveaux systèmes logiciels ou introduisent de nouvelles fonctionnalités dans des systèmes existants, elles passent par deux phases majeures : 

  1. l'analyse commerciale : faire des évaluations et prendre des décisions commerciales concernant la valeur et la faisabilité d'un nouveau produit logiciel ou d'une nouvelle fonction ; et 
  2. Développement du produit : développement de la solution (généralement en suivant l'une des méthodologies de développement logiciel existantes) et mise en production. 

Cependant, lorsqu'une entreprise envisage d'adopter la ML - soit pour compléter ses produits/services logiciels actuels, soit pour résoudre un nouveau problème commercial - il y a une phase d'exploration supplémentaire entre l'analyse commerciale et les phases de développement du produit. La MLPL rationalise et définit ce processus.

Graphique illustrant la relation circulaire de la MLPL entre les "décisions commerciales", l'"exploration des ML" et le "développement, le déploiement et la maintenance".

La MLPL est une méthodologie itérative pour exécuter des tâches d'exploration ML, en généralisant le processus afin qu'il soit suffisamment flexible et modulaire pour être appliqué à différents problèmes dans différents domaines, tout en ayant suffisamment de modules pour décrire complètement les points de décision et les étapes importantes.

En quoi consiste un processus d'exploration ML ?

Idéalement, une organisation voudrait connaître toutes les possibilités et les conséquences d'une solution de ML avant de l'introduire dans un système. Le processus d'exploration de la ML vise à déterminer si une solution de ML est ou non la meilleure décision commerciale en répondant aux questions suivantes :

  1. Le ML peut-il répondre à mon problème commercial ?
  2. Existe-t-il des données justificatives ?
  3. Les algorithmes peuvent-ils tirer parti des données ?
  4. Quelle est la valeur ajoutée par l'introduction de la ML ?
  5. Quelle est la faisabilité technique d'une solution avec ML ?

Qu'est-ce que la MLPL ne saisit pas ?

Lorsqu'une entreprise commence à envisager l'adoption de la ML, la première chose qu'elle fait est souvent d'effectuer une analyse commerciale. Cela implique l'identification des flux de travail, des problèmes de l'entreprise, l'évaluation des ressources, l'identification des tâches et des points de décision dans lesquels les solutions de ML pourraient s'intégrer et apporter de la valeur à l'entreprise. La MLPL ne prend pas en compte tous les aspects de cette analyse, mais seulement les éléments qui ont un impact direct sur la définition des problèmes de ML.

Une fois l'exploration ML terminée, une organisation peut décider de développer la solution ML en un produit ou un service en tant que composant tangible, en le déployant en production et en le maintenant. Cette phase n'est pas non plus prise en compte dans la MLPL. 

Le MLPL ne traite que de la phase d'exploration, au cours de laquelle différentes méthodes sont essayées pour parvenir à une solution de validation de concept qui peut être adaptée ultérieurement pour développer un système ML complet.

Pourquoi avons-nous besoin de la MLPL ?

Nous avons vu un aperçu de ce que la MLPL capture et de ce qu'elle ne capture pas. Mais pourquoi avons-nous besoin d'un processus pour capturer une tâche d'exploration ? Il existe quelques raisons importantes pour lesquelles une organisation devrait utiliser la MLPL :

  • Atténuation des risques: La MLPL standardise les étapes d'un projet de ML et définit des modules standards pour chacune de ces étapes, minimisant ainsi le risque de passer à côté de pratiques importantes de ML. 
  • Standardisation: La normalisation du flux de travail entre les équipes par le biais d'un cadre de bout en bout permet aux utilisateurs de construire et d'exploiter facilement des systèmes de ML tout en étant cohérents, et permet aux tâches inter-équipes d'être exécutées en douceur.
  • Suivi: La MLPL vous permet de suivre les différentes étapes et les modules à l'intérieur de chacune des étapes. Ceci étant une tâche d'exploration, il y a beaucoup d'essais qui ne seront jamais utilisés dans la solution ML finale, mais qui ont nécessité un investissement important. Le MLPL vous permet de suivre les ressources qui ont été dépensées sur ces expériences et de les évaluer pour les itérations futures.
  • Reproductibilité: l'existence d'un processus normalisé permet à une organisation de créer des pipelines pour la création et la gestion d'expériences, qui peuvent être comparées et reproduites pour de futurs projets.
  • Évolutivité: Un flux de travail standard permet également à une organisation de gérer plusieurs expériences simultanément.
  • Lagouvernance: Des étapes et des modules bien définis pour chaque étape permettront d'améliorer les audits pour évaluer si les systèmes de ML sont conçus de manière appropriée et fonctionnent efficacement.
  • Lacommunication: Un guide standard permet de définir les attentes et de faciliter efficacement la communication entre les équipes sur le déroulement des projets.

Sur deuxième partie de la série MLPLnous examinons en profondeur le cadre de la MLPL et passons en revue les aspects clés de chaque étape.


Le cadre MLPL d'Amii s'appuie sur les connaissances déjà acquises par les équipes d'organisations telles que Microsoft, Uber, Google, Databricks et Facebook. Le MLPL a été adapté par les équipes d'Amii pour être un cadre indépendant de la technologie, suffisamment abstrait pour être flexible à travers les types de problèmes et suffisamment concret pour être mis en œuvre. Pour répondre aux besoins de nos clients, nous avons également découplé les phases de déploiement et d'exploration, fourni des modules de processus au sein de chaque étape et défini les artefacts clés qui résultent de chaque étape. La MLPL garantit également que nous sommes en mesure de capturer tous les apprentissages qui surviennent tout au long du processus global mais qui ne sont pas utilisés dans le modèle final.

Si vous souhaitez en savoir plus sur ce sujet et sur d'autres sujets intéressants liés à l'apprentissage automatique, nous vous recommandons vivement le cours en ligne d'apprentissage automatique récemment lancé par Amii : Algorithmes dans la spécialisation du monde réel, enseigné par notre directrice générale des sciences appliquées, Anna Koop. Visitez la page Formation pour en savoir plus sur toutes nos offres de formation.

Derniers articles d'actualité

Connectez-vous avec la communauté

Participez à l'écosystème croissant de l'IA en Alberta ! Les demandes de conférenciers, de parrainage et de lettres de soutien sont les bienvenues.

Explorer la formation et l'enseignement supérieur

Vous êtes curieux de connaître les possibilités d'études auprès de l'un de nos chercheurs ? Vous voulez plus d'informations sur les possibilités de formation ?

Exploiter le potentiel de l'intelligence artificielle

Faites-nous part de vos objectifs et de vos défis concernant l'adoption de l'IA dans votre entreprise. Notre équipe Investissements & Partenariats vous contactera sous peu !