La toxicité des substances est une donnée difficile et coûteuse à évaluer. Elle fait l’objet de polémiques, telles celles sur le glyphosate ou sur certains additifs. Le réseau de neurones profonds AlchemAI, développé en 2017 par R&D Médiation, est actuellement capable de prédire les domaines d’application et les marchés potentiels B2B et B2C des substances chimiques et les propriétés organoleptiques. Mais peut-il deviner si un produit est potentiellement toxique?
La classification des toxiques
Pour ce prototype, nous nous sommes intéressés à la toxicité orale des substances. La règlementation classe les molécules en 5 catégories, reliées à la dose qui, une fois ingérée, provoque 50% de décès dans l’échantillon.
Catégorie | LD50% (dose létale) | effet |
---|---|---|
1 | ≤ 5 mg/kg | fatal en cas d’ingestion |
2 | > 5 mg/kg et ≤ 50 mg/kg | fatal en cas d’ingestion |
3 | > 50 mg/kg et ≤ 300 mg/kg | toxique en cas d’ingestion |
4 | > 300 mg/kg et ≤ 2000 mg/kg | provoque des blessures en cas d’ingestion |
5 | > 2000 mg/kg et ≤ 5000 mg/kg | potentiellement dangereux pour certaines personnes et à forte dose |
Ces catégories font l’objet de mise à jour et les substances peuvent en changer en fonction des résultats récents.
Le réseau de neurones AlchemAI a été entrainé avec près de 50000 molécules dont environ 7% sont potentiellement toxiques de manière avérée.
Le principe de l’apprentissage machine supervisé consiste à montrer au réseau de neurones des molécules associées à une catégorie de toxicité, puis à lui en présenter de nouvelles pour s’assurer de la qualité des prédictions.
La capacité de prédiction globale de AlchemAI, en considérant les premiers et seconds choix comme valides, est de 92% de succès pour les toxiques, mais les résultats sont sensiblement moins bons que ceux obtenus pour la prédiction des applications ou des odeurs. Il n’a pas été possible d’obtenir une discrimination suffisante entre les quatre catégories les plus toxiques, qui ont dont été fusionnées.
Le réseau ne fournit que des probabilités que telle molécule soit toxique et peut donc parfois hésiter entre deux possibilités.
Fiabilité
La prédiction de la toxicité est une indication mais ne peut pas ici être considérée comme absolument fiable. La non ou faible toxicité est prédite avec un meilleur taux de fiabilité que la toxicité. L’apprentissage machine nécessaire a été beaucoup plus complexe que celui qui a été requis pour les autres propriétés et nécessite sans doute une optimisation.
Quelques prévision de toxicité
Voici quelques prédictions de AlchemAI sur la toxicité orale
L’impact des réseaux de neurones profonds sur l’industrie du futur
Si aujourd’hui le discours médiatique autour de l’intelligence artificielle se focalise sur le dialogue avec l’humain et le profilage des clients, les applications industrielles sont pourtant l’enjeu majeur de cette révolution. La plupart des industries disposent des informations nécessaires pour entrainer des réseaux de neurones et découvrir de nouvelles opportunités. L’intelligence n’est pas dans l’intelligence artificielle, mais dans l’entrainement qu’elles reçoivent. C’est la qualité de celui-ci qui fait la qualité de celle-là.
Voir aussi:
Références
[1] L. E. Brunet, “AlchemAI:Une IA pour prédire les applications et les marchés des substances,” R&D Mediation, 2017.[2] M. Abadi et al., “TensorFlow: Large-Scale Machine Learning on Heterogeneous Distributed Systems,” ArXiv160304467 Cs, Mar. 2016.