Aborder la dynamique des matériaux granulaires par une approche couplant automates cellulaires et transferlearning

NB: Ces travaux ont été publiés dans JITIPEE

L’importance de la dynamique des matériaux granulaires pour l’industrie

La dynamique des matériaux granulaires est un domaine d’étude qui revêt une importance certaine pour de nombreuses industries, et qui nous intéresse donc chez R&D Médiation.

Figure 1: Tas de maïs (source Wikipédia)

En effet, les procédés de formulation nécessitant d’admettre des matériaux granulaires dans un silo ou un réacteur sont présents dans des secteurs aussi variés que l’agroalimentaire, la cosmétique, l’industrie du bâtiment, la pharmacie ou encore la métallurgie … En outre, l’angle de talus naturel, aussi appelé angle de repos, conditionne des phénomènes complexes tels que l’érosion des côtes ou la constitution de formations géologiques.

Pouvoir anticiper la dynamique de ces matériaux (en l’occurrence leur empilement) est donc une contrainte industrielle qui échappe largement à la modélisation classique, notamment du fait que les grains ou poudres se comportent à la fois comme des solides et des liquides [1], et que les interactions (collisionelles) complexes entre les grains peuvent être assimilées à celles de gaz [2].

Deux approches actuelles pour appréhender approximativement la dynamique des matériaux granulaires

Deux approches de modélisation classique sont aujourd’hui utilisées pour la prédiction de la dynamique des matériaux granulaires :

  • Figure 2: Modélisation de la dynamique des matériaux granulaires par DEM (source Hustrulid Technologies)

    La première, dite « discrète » est la DEM (Discrete Element Method), c’est la plus répandue. Elle consiste à décrire l’écoulement grain par grain, en considérant des interactions complexes ainsi que des formes et des géométries complexes [1].

Cette méthode a l’avantage de pouvoir tenir compte des propriétés microscopiques des matériaux granulaires, mais est limitée par un coût important lié à la caractérisation de chaque grain par un laboratoire et l’impossibilité de l’appliquer à l’échelle industrielle ou environnementale où le nombre de particules est trop important.

 

  • La seconde méthode, dite « continue » ou appelée CMM, consiste à assimiler le matériau granulaire comme un corps continu soumis à des lois spécifiques et dont l’écoulement peut être résolu par les équations de la mécanique des fluides. Cette méthode implique des approximations et de la modélisation physique, mais, corrigée par des données réelles, peut donner de bons résultats. Elle exclut en revanche les considérations microscopiques (forme et géométrie des particules notamment) alors qu’il s’agit de paramètres importants, ce qui peut conduire à de mauvais résultats.

Les professionnels ne disposent donc aujourd’hui que d’outils de modélisation approximatifs dont l’applicabilité générale ne peut être démontrée et qui ne peuvent tenir compte de tous les facteurs internes ou externes à l’origine de la complexité des interactions régissant les écoulements granulaires.

Une nouvelle approche qui couple automate cellulaire et réseaux de neurones

Nous avons décidé de développer une solution originale et innovante pour prédire l’ange de repos (ou angle de talus), un des aspects de la dynamique des matériaux granulaires.

Cet angle étant difficilement modélisable en raison de la complexité du comportement des matériaux, il était raisonnable de penser pouvoir développer un réseau de neurones capable, à partir de données réelles, de développer lui-même son propre algorithme de prédiction de l’angle.

Or, un des verrous auquel il faut faire face est le manque de données disponibles, autrement dit le manque de mesures d’angles de repos, ce qui empêche notre réseau de neurones d’apprendre efficacement.

Développer des réseaux de neurones avec du « small » data est un enjeu important pour l’industrie, où la quantité de données est plus faible puisqu’elle coûte plus cher à acquérir que sur un réseau social. Et oblige donc à trouver des subterfuges. Nous avons pour cela décidé d’appliquer une méthodologie de transfert learning.

Le transfer learning consiste à préentrainer un réseau de neurones sur un corpus de données à faible coût d’acquisition, comme par exemple celles issues d’un modèle analytique ou numérique puis à terminer l’entraînement sur des données réelles plus coûteuses.

Pour générer ce corpus de données artificielles, notre approche a consisté en la programmation d’un automate cellulaire.

Génération de données artificielles par automate cellulaire

Un automate cellulaire consiste en une grille régulière de cellules contenant chacune un « état » choisi et qui peut évoluer à chaque pas de temps. Cette évolution à t+1 dépend de l’état des cellules voisines au temps t. Dans les années 70, l’essor des calculateurs a permis l’émergence des automates cellulaires, dont le plus connu est le « jeu de la vie » d’abord développé par Ulam et Von Neuman pour une application à des cristaux dans les années quarante [3].

Ici, le modèle de particules sur treillis développé consiste en l’enchevêtrement de n réseaux correspondants à autant de classes granulaires de particules.

Les particules peuvent évoluer selon des règles simples, comme dans le cas des automates cellulaires de Conway.

Figure 3: Insertion des particules sur les réseaux

Figure 4: Représentation des règles de l’automate cellulaire

 

 

 

 

 

 

 

 

 

 

Les particules sont introduites dans le treillis selon une distribution de n classes déterminées à l’avance. Ces règles (Figure 4) sont :

  • Une particule de classe n ne peut se situer que sur un nœud du réseau de classe n
  • Une particule ayant un site vide en dessous le rejoint avec une probabilité de 1
  • Une particule empêchée de descendre se déplace latéralement avec une probabilité p

Le modèle a été codé en python, dans une classe héritée de openAI GYM. L’empilement peut ainsi être représenté visuellement :

Figure 5: Création d’un empilement de matériau granulaire artificiel avec Python

  • Le modèle s’arrête quand l’ensemble atteint une fraction de déplacement inférieur à une valeur déterminée à l’avance. L’angle est alors calculé (Figure 5).
  • Les coupes granulométriques sont représentées comme des séquences de leur fraction dans le mélange, soit [0.1,0.8,0.1] pour une séquence à trois classes.

L’angle de repos est alors calculé puis de nouveaux empilements sont générés jusqu’à obtention d’un dataset suffisamment grand pour entraîner notre réseau de neurones.

Transfer learning : entraînement du réseau de neurones sur les données artificielles

Le dataset est constitué de cas d’entraînement correspondant à une séquence de taille de grains croissante. Ces séquences peuvent être représentées par une couche Long Short Term Memory (LSTM)[4][5] de Tensorflow [6].

Prédiction des angles de talus sur des données artificielles

Deux configurations sont ici présentées : l’une a été élaborée sur une grille de 4000×4000 avec 8 tailles de grains différentes pour 4000 grains empilés, l’autre avec une grille de 1000×1000, 16 tailles de grains différentes et 2000 grains empilés…

Les calculs sont réalisés sur une instance virtuelle de 16 cœurs CPU et 1920 cœurs GPU.

Configuration 1 : Modèle à 8 tailles de grains

L’automate cellulaire a été utilisé pour générer un dataset de 1600 expériences pour 8 classes de particules dans un treillis de 4000×4000 mailles et 4000 particules introduites selon la distribution des classes.

Les granulométries étant une séquence, une architecture de réseau de neurones LSTM a été choisie. L’entraînement du réseau a été fait sur 1391 expériences et la validation sur 199.

 

Figure 6: Prédiction des angles dans un modèle à 8 tailles

La prédiction des angles sur le dataset d’entraînement montre une bonne corrélation (R2=0.999) de même que pour les données de validation non utilisées pour l’apprentissage (R2=0.985) (Figure 6)

Configuration 2 : Modèle à 16 tailles de grains

Un modèle de plus petite taille (1000×1000) et 2000 grains de 16 tailles a été implémenté pour un temps de calcul complet de 45h.

Figure 7: Prédiction des angles dans un modèle à 16 tailles

Le modèle montre une bonne corrélation pour les données d’entraînement Figure 7.

Échantillon de validation :

Sur des données non connues du modèle, la précision demeure convenable (Figure 8).

Figure 8: Prédiction des angles sur un échantillon de validation

Ces travaux sont des travaux préliminaires et qui nécessitent d’être complétés (entraînement sur données réelles, compléter les paramètres d’entrée, utilisation de cellules GRU, etc.) mais qui ouvrent de belles perspectives d’opportunités pour les industries agroalimentaires, pharmaceutiques ou encore extractives.

Si votre entreprise doit elle aussi mettre en relation des causes complexes à des effets complexes dans le cadre de ses procédés, il est très probable que l’IA apporte de nouvelles opportunités d’améliorer vos process. Si ce n’est pas déjà fait, il est plus que temps de préparer votre Roadmap IA ou de nous contacter directement.

 

Bibliographie:

[1]  C. J. Coetzee, “The Modelling of Granular Flow Using the Particle-in-Cell Method,” p. 357.

[2]  H. Id, “Numerical methods for the simulation of continuum granular flow models,” p. 191.

[3]  J. Von Neumann and A. W. (Arthur W. Burks, Theory of self-reproducing automata. Urbana, University of Illinois Press, 1966.

[4]  S. Hochreiter and J. Schmidhuber, “Long Short-Term Memory | Neural Computation | MIT Press Journals.” [Online]. Available: https://www.mitpressjournals.org/doi/10.1162/neco.1997.9.8.1735. [Accessed: 11-Dec-2018].

[5]  I. Goodfellow, Y. Bengio, and A. Courville, Deep Learning. MIT Press, 2016.

[6]  M. Abadi et al., “TensorFlow: Large-Scale Machine Learning on Heterogeneous Distributed Systems,” ArXiv160304467 Cs, Mar. 2016.

 

Télécharger cet article au format PDF ou ePub

Laisser un commentaire

Votre adresse de messagerie ne sera pas publiée. Les champs obligatoires sont indiqués avec *

Ce site utilise Akismet pour réduire les indésirables. En savoir plus sur comment les données de vos commentaires sont utilisées.