Il y a les fans occasionnels de ramen et puis il y a les amateurs de ramen. Il y a des gens qui sont tous tonkotsu tout le temps, et d’autres qui jurent par tsukemen. Et puis il y a l’apprentissage machine, qui, d’après une étude de cas récente au Japon, pourrait bien être le plus grand aficionado de ramen de tous.

Récemment, le spécialiste des données Kenji Doi a utilisé des modèles d’apprentissage machine et AutoML Vision pour classer les bols de ramen et identifier le magasin exact où chaque bol est élaboré, parmi 41 magasins de ramen, avec une précision de 95 %. Cela semble fou (aussi délicieux), surtout quand on voit à quoi ressemblent ces bols :

Avec 41 établissements autour de Tokyo, Ramen Jiro est l’un des restaurants franchisés les plus populaires au Japon, en raison de ses généreuses portions de garnitures, de nouilles et de soupes servies à bas prix. Ils servent le même menu de base dans chaque magasin, et comme vous pouvez le voir ci-dessus, il est presque impossible pour un humain (surtout si vous êtes nouveau chez Ramen Jiro) de dire à quel magasin chaque bol est fait.

Mais Kenji pensait que l’apprentissage profond pouvait discerner les moindres détails qui font que le bol de ramen d’un magasin est différent de celui d’un autre. Il avait déjà construit un modèle d’apprentissage machine pour classer les ramen, mais il voulait voir si AutoML Vision pouvait le faire plus efficacement.

AutoML Vision crée des modèles ML personnalisés automatiquement pour identifier les animaux dans la nature, ou reconnaître des types de produits pour améliorer un magasin en ligne, ou dans ce cas, classer les ramen. Vous n’avez pas besoin d’être un scientifique des données pour savoir comment l’utiliser – tout ce que vous avez à faire est de télécharger des images bien taggées et de cliquer sur un bouton. Dans le cas de Kenji, il a compilé un ensemble de 48 000 photos de bols de soupe de Ramen Jiro, ainsi que des tags pour chaque magasin, et les a téléchargées dans AutoML Vision. Le modèle a mis environ 24 heures à s’entraîner, le tout automatiquement (bien qu’un mode « de base », moins précis, avait un modèle prêt en seulement 18 minutes). Les résultats ont été impressionnants : le modèle de Kenji a obtenu une précision de 94,5 % sur la prédiction du restaurant à partir des photos.

La Matrice de confusion du classificateur de magasins de Ramen Jiro par AutoML Vision (mode avancé).
Ligne = magasin réel, colonne = magasin prévu.
Vous pouvez voir qu’AutoML Vision a mal identifié l’emplacement du restaurant dans quelques cas seulement pour chaque cas de test.

AutoML Vision est conçu pour les personnes sans expertise ML, mais il accélère considérablement les choses pour les experts. L’élaboration d’un modèle de classification des ramen à partir de zéro serait un processus qui prendrait beaucoup de temps et nécessiterait plusieurs étapes – étiquetage, réglage hyperparamétrique, tentatives multiples avec différentes architectures de réseaux neuronaux, et même des cycles d’entraînement ratés – et de l’expérience en tant que scientifique des données. Comme le dit Kenji, « Avec AutoML Vision, un scientifique des données n’aurait pas besoin de consacrer beaucoup de temps à la formation et à la mise au point d’un modèle pour obtenir les meilleurs résultats. Cela signifie que les entreprises pourraient étendre leur travail d’IA même avec un nombre limité de spécialistes des données ». Nous avons écrit à propos d’un autre exemple récent d’AutoML Vision à l’œuvre dans ce billet de blog Big Data, qui contient également plus de détails techniques sur le modèle de Kenji.

Quant à la façon dont AutoML détecte les différences dans les ramen, ce n’est certainement pas au goût. La première hypothèse de Kenji était que le modèle regardait la couleur ou la forme du bol ou de la table – mais cela semble peu probable, puisque le modèle était très précis même lorsque chaque magasin utilisait le même design de bol et de table. La nouvelle théorie de Kenji est que le modèle est assez précis pour distinguer des différences très subtiles entre les coupes de viande ou la façon dont les garnitures sont servies. Il prévoit de continuer à expérimenter avec AutoML pour voir si ses théories sont vraies. Cela ressemble à un projet qui pourrait impliquer plus que quelques bols de ramen.

En attendant, on a les tags pour cela.

 

 

Laisser un commentaire

Ce site utilise Akismet pour réduire les indésirables. En savoir plus sur comment les données de vos commentaires sont utilisées.