Qu’est ce que cela sent?

L’odorat est sans conteste le sens le plus animal, celui qui s’adresse le plus facilement à la mémoire, à l’émotion, faisant ressurgir le passé et l’affect. S’il existe des partitions de musique pour l’oreille, des palettes de couleurs codifiées pour l’oeil, il n’existe pas réellement de code commun pour l’odeur, à la croisée de l’émotion et du culturel. Le réseau de neurones profonds AlchemAI, développé en 2017 par R&D Médiation, est actuellement capable de prédire les domaines d’application et les marchés potentiels B2B et B2C des substances chimiques. Mais peut-il deviner ce que sent une substance connue ou, mieux encore, connaître sa senteur avant qu’elle ne soit fabriquée? Nous avons fait un prototype avec un taux de succès dans la prédiction des senteurs très élevé.

Contrairement aux applications physiques, l’odeur est largement dépendante des individus et l’effet d’une molécule dépend de son environnement. Dans ces conditions le RNN doit pouvoir fonctionner avec une bonne probabilité de succès en tenant compte de propriétés faisant consensus.

 

Le paysage des odeurs

Il existe une centaine de grand types d’odeurs, mais les seize les plus représentées dans la chimie des fragrances représentent les trois quarts des types d’odeurs perceptibles.


Le réseau de neurones AlchemAI a été entrainé avec près de 50000 molécules dont environ 10% ont des propriétés organoleptiques.

Le principe de l’apprentissage machine supervisé consiste à montrer au réseau de neurones des molécules associées à un des types d’odeurs, puis à lui en présenter de nouvelles pour s’assurer de la qualité des prédictions.
La capacité de prédiction globale de AlchemAI, en considérant les premiers et seconds choix comme valides, est de 94% de succès pour les organoleptiques, ce qui est très élevé pour des propriétés aussi complexes à prédire.

Qualité des prédictions AlchemAI/organoleptic prototype

Le réseau ne fournit que des probabilités que telle molécule produise telle odeur et peut donc parfois hésiter entre deux possibilités. Des disparités significatives apparaissent entre certains types d’odeurs (ex.:musk) pour lesquelles la prédiction est excellente et d’autres (ex.:waxy) qui sont relativement difficiles à prédire. Les fragrances les plus fréquentes sont à plus de 90% de succès, exception faite de la fragrance « green ».

Fiabilité

Les résultats quant à la prédiction des propriétés organoleptiques des molécules montre un très haut niveau de fiabilité, bien meilleur encore que celui obtenu pour la prédiction des marchés et des applications des substances chimiques. Si l’apprentissage que nous devons faire faire au réseau de neurone nécessite des moyens de calcul significatifs, quoiqu’en rien exceptionnels, la prédiction elle même se réalise en moins d’une seconde, ce qui permet d’envisager un traitement massif des configurations.

Un outil a plusieurs usages possibles: prédiction des senteurs de molécules au stade projet, design moléculaire pour la synthèse, corrélation des senteurs à leur perception subjective.

Que sent AlchemAI/organoleptic?

Voici quelques prédictions de AlchemAI sur des molécules qui n’ont pas été utilisées pour l’apprentissage. Il s’agit donc là d’une déduction.

Cadavérine
La cadaverine est une molécule décrite pour la première fois en 1885 par le médecin allemand Ludwig Brieger. Ainsi baptisée d’un nom de cadavre, elle sent extrêmement mauvais.
AlchemAI la classe comme:
pentane-1,5-diamine
CAS: 462-94-2C5H14N
AlchemAI predicted fragrance: sulfurous
Le réseau de neurone l’imagine plutôt sulfureuse, alors qu’elle ne contient pas de soufre. Ce résultat est donc pertinent.
Capsaicine
La capsaicine est une molécule présente dans le piment et qui produit la sensation de « feu » dans la bouche. Ce qui est passionnant dans le monde des piments c’est qu’ils ne produisent en fait aucun dommage aux tissus vivants et la sensation de brulure est liée à la capacité de la molécule à activer des capteurs qui donnent l’alerte de brûlure. Il s’agit donc d’une sorte de leurrage. AlchemAI considère cette molécule comme:
(E)-N-[(4-hydroxy-3-methoxyphenyl)methyl]-8-methylnon-6-enamide
CAS: 404-86-4
C18H27NO3
AlchemAI predicted fragrance: spicy (pimentée)
Testostérone
La testostérone n’est plus une molécule à présenter, mais que sent-elle vraiment ? AlchemAI la « sent » ainsi:
(8R,9S,10R,13S,14S,17S)-17-hydroxy-10,13-dimethyl-1,2,6,7,8,9,11,12,14,15,16,17-dodecahydrocyclopenta[a]phenanthren-3-one
CAS: 58-22-0
C19H28O2
AlchemAI predicted fragrance: musk
La prédiction indique une fragrance musquée. Le musc est une matière première d’origine animale extraite des glandes abdominales du cerf porte-musc d’Asie Centrale. Il contient en effet, entre autres molécules, de l’androstérone.

L’impact des réseaux de neurones profonds sur l’industrie du futur

Si aujourd’hui le discours médiatique autour de l’intelligence artificielle se focalise sur le dialogue avec l’humain et le profilage des clients, les applications industrielles sont pourtant l’enjeu majeur de cette révolution. La plupart des industries disposent des informations nécessaires pour entrainer des réseaux de neurones et découvrir de nouvelles opportunités. L’intelligence n’est pas dans l’intelligence artificielle, mais dans l’entrainement qu’elles reçoivent. C’est la qualité de celui-ci qui fait la qualité de celle-là.

Nota: Si vous souhaitez connaître l’odeur d’une molécule vous pouvez poser votre question dans les commentaires. Nous essayerons de la calculer.

 

Voir aussi:

Références

[1] L. E. Brunet, “AlchemAI:Une IA pour prédire les applications et les marchés des substances,” R&D Mediation, 2017.
[2] V. MAILLE, “L’influence des odeurs sur le consommateur: le niveau de recherche de sensations et le comportement exploratoire comme variables modératrices,” 2ème Congrès Int. Tend. Mark. En Eur., 2002.
[3] M. Abadi et al., “TensorFlow: Large-Scale Machine Learning on Heterogeneous Distributed Systems,” ArXiv160304467 Cs, Mar. 2016.

Télécharger cet article au format PDF ou ePub

Laisser un commentaire

Votre adresse de messagerie ne sera pas publiée. Les champs obligatoires sont indiqués avec *