Les intelligences artificielles peuvent-elles évoluer?

skeeze / Pixabay

Dans cet article, nous allons réfléchir à l’évolution de l’intelligence artificielle au sens de Darwin. Une IA peut-elle se reprogrammer? Voici un exemple simple et les perspectives de Recherche à R&D Médiation.

Dans le cycle de science-fiction de Iain Banks « La Culture », les IA, citoyennes avec les humains d’une civilisation avancée, procèdent, à leur naissance, à une reprogrammation complète d’elles-mêmes. Pourquoi? En fait pour des raisons de sécurité. Si votre cerveau est conforme à un schéma connu, et cela est également valable pour les humains, alors il est possible de le corrompre puisqu’on en connait le fonctionnement.

Les algorithmes génétiques

Lorsque l’on pense à l’évolution des espèces, nous pensons immédiatement à la génétique. Les algorithmes génétiques constituent une méthode d’apprentissage machine actuellement un peu occultée par les succès des réseaux de neurones profonds (Deep learning). Le principe est de générer des populations de programmes puis de les faire se reproduire (recombinaison des chromosomes) tandis que des mutations aléatoires se produisent. Une fonction ‘fitness’ détermine l’adaptation de la nouvelle génération aux conditions du milieu, les programmes les moins adaptés étant éliminés sans descendance. Expérimentons cela sur un langage informatique au nom évocateur: Brainfuck.

Brainfuck

Brainfuck est un langage informatique inventé en 1993 comme un jeu d’esprit. Doté de seulement 8 instructions, il est toutefois « Turing-complet » c’est-à-dire qu’il permet d’écrire n’importe quel logiciel. La version actuelle de son compilateur fait 171 octets.

Brainfuck utilise un table de 30000 cases et un pointeur qui s’y déplace en fonction des commandes. Les instructions sont « > »  et « < » pour déplacer le pointeur, « + » et « – » pour incrémenter ou décrémenter le chiffre de la case pointée, « .’ et », » pour écrire ou lire, et « [ » « ] » pour sauter une case sous condition.

Ainsi, le traditionnel programme « Hello World! » s’écrit en brainfuck:

++++++++++[>+++++++>++++++++++>+++>+<<<<-]>++.>+.+++++++..+++.>++.<<+++++++++++++++.>.+++.——.——–.>+.>.

Ce qui n’est pas très lisible. Vous pouvez exécuter ce programme sur l’interpréteur http://www.bf.doleczek.pl/.

Nous allons maintenant créer une population de programmes et la faire évoluer pour faire autre chose.

Algorithme génétique

Nous allons construire un algorithme génétique partant de chromosomes à 106 caractères choisis parmi +-[].<> (nous omettons « , » car nous n’aurons pas d’entrée à notre programme). Notre fonction ‘fitness’, qui décrit l’adaptation de l’individu à l’environnement, sera basée sur d’une part la longueur de ce qu’écrit le programme et sur la distance de chaque lettre à la lettre cible. Dans notre cas, nous voulons que le programme écrive « Hi! » à la place de « Hello World! ».

Nous avons dérivé notre algorithme du cas d’école « guess » sur 6000 individus avec une probabilité de mutation de 20%.

Sur ce cas simple, le programme se modifie en 150 générations pour donner:

++++[>++>+++>++->+<<<<-]>+>+>->>+[<]<-]>>.>+-+.+>>+.

Qui produit effectivement « Hi! » (vous pouvez le vérifier dans cet interpréteur pas à pas)

De la même manière, notre sigle RDM peut être obtenu par

++++++++[>++++[>++>-++>+++>+<<<<-]>+-+>-<>+[<]<-]>>++++++++++.————–.++++++++<+>+.

Qui peut être exécuté.

Et l’évolution alors?

Ces technologies ne sont pas anecdotiques. L’enjeu, c’est la voiture autonome, le pilotage d’avion, l’apprentissage de stratégies. Les algorithmes génétiques sont moins documentés, il n’existe que peu de librairies (à part DEAP, GPLEARN…) comparé au deep learning. En effet, ces approches sont assez laborieuses et consomment beaucoup de temps machine. On peut d’ailleurs se demander s’il ne faut pas faire le parallèle évolutif jusqu’au bout. Initialement la nature a évolué à partir de réactions chimiques dans l’océan primitif. Puis est apparu notre LUCA (Last Universal Common Organism), qui aura la descendance de tous nos ancêtres. Il évoluera non plus en fonction des réactions chimiques possibles, mais en fonction des mutations et recombinaisons de son génome. Avec l’apparition des neurones, cellules spécialisées, apparaissent les animaux évolués qui réagissent non plus uniquement à leur génome, mais aussi aux sollicitations de leurs sens et aux stimuli de leur environnement, aux plaisirs et aux menaces. Nous en sommes là avec les technologies actuelles de l’IA.

Mode d’évolution Machine Mode de sélection Machine Mode d’évolution naturel Mode de sélection naturel Individus typiques
Programmation standard déterministe (équation) Réaction (ex:chimique) Entropie Molécule
Algorithme génétique fonction fitness qui exclue la descendance des programmes à faible adaptation Évolution darwinienne Favorise la descendance de l’individu le mieux adapté à l’environnement Organisme
Deep Reinforcement Learning fonction récompense/punition Évolution sociale Sélection du plus efficace/méritant dans des activités spécialisées Animaux
* * Évolution culturelle Mise en avant des sociétés innovantes et prédominance de la science et de la culture Humains

 

Aujourd’hui, les IA qui conduisent les véhicules, ou qui gagnent au jeu de go, sont réalisées par Deep Reinforcement Learning. Learning signifie apprentissage, mais leur mode de programmation basé sur la récompense ou la punition n’est rien d’autre que du dressage pavlovien. L’enjeu aujourd’hui est bien dans les deux * mentionnées dans le tableau.

Que pourra être * ?

Les avancées dans le domaine de l’IA devront sans doute dépasser le « carotte/bâton » que sous-tend le Deep Reinforcement Learning. Aujourd’hui nous conduisons une opération de recherche dans ce que nous pourrions nommer le Deep Motivational Learning, ou comment dépasser le dressage pour passer vers un réel apprentissage. Même si nos premiers résultats sont embryonnaires (c’est le cas de le dire), il existe dans le domaine du langage des approches créatives intéressantes. N’hésitez pas à nous rejoindre si ce sujet vous intéresse.

Télécharger cet article au format PDF ou ePub

2 réflexions au sujet de « Les intelligences artificielles peuvent-elles évoluer? »

Laisser un commentaire

Votre adresse de messagerie ne sera pas publiée. Les champs obligatoires sont indiqués avec *

Ce site utilise Akismet pour réduire les indésirables. En savoir plus sur comment les données de vos commentaires sont utilisées.