Intelligence artificielle: la partie n’est pas (encore) perdue

Le rapport Villani est sorti, avec son lot de propositions destinées à susciter un élan national pour compenser notre retard en intelligence artificielle, dénoncé depuis longtemps par Laurent Alexandre. Il faut chercher les pépites dans l’océan des « puissances de l’Etat », des « Mutualisation », « partenariats public-privé »… et autres mojo. Quelque soit le talent de Villani, il a dû se plier au processus de consultation de ce genre de rapport. Comme souvent dans notre pays, la production des analyses passe par l’interview d’apparatchiks et on obtient majoritairement des réponses d’apparatchiks. Il y a pourtant plusieurs raisons de penser que la partie n’est pas finie pour nous:

  • L’Etat avoue enfin que son administration de la recherche n’est pas au niveau, réussissant à réaliser le paradoxe de coûter cher tout en payant mal. Comme en Union Soviétique qui a réussi à tenir la dragée haute aux USA dans le spatial en dissimulant que cet effort lui coûtait dix fois plus cher et la conduisait à la faillite, la France commence à découvrir sa rigidité et réagit en créant des instituts, des SATT en espérant faire marcher à côté ce qui ne marche pas à l’intérieur, quitte à dépenser plus sans dépenser mieux. Six nouveaux instituts sont donc prévus pour l’IA;
  • En choisissant 5 domaines pour cibler son effort sur l’IA (éducation, santé, agriculture, transports, défense et sécurité), l’Etat libère la créativité dans les autres domaines et, notamment, l’industrie 3.0 en se recentrant sur ce qui le regarde: la sécurité, la santé, l’éducation et la nourriture

En fait, la raison de l’espoir vient entre autre des mathématiques, les plus précisément de la « dimension de Valpnik-Cervonenkis » dont l’implication politique est cruciale. Pour l’écrire en mots et non en formules, pour qu’une IA fonctionne il faut l’éduquer en lui fournissant des données.

Une explication sur la chaine Youtube de Lê

Malheureusement, ces données peuvent être de mauvaise qualité ou bien polluées par des informations qui n’ont rien à voir avec ce que l’on cherche.  Cela conduit les GAFA à collecter des masses énormes de données dans l’espoir de savoir si vous préférez les chaussures rouges ou les T-shirts bleu. On va dire que cela revient un peu à chercher une aiguille dans une meule de foin en faisant rentrer plus de foin.

Ce que l’on appelle ‘bigdata’ est en fait essentiellement du ‘fatdata’, c’est à dire des données en infini surplus qui mangent du temps de calcul, de l’énergie et de l’argent.

Le fatdata est aussi le fruit de la paresse (les moyens de calculs sont immenses donc pourquoi trier?) et de l’ignorance (les données sont traitées par des informaticiens qui ignorent quasiment tout de ce que ces données signifient en réalité). Cette ignorance peut, dans les cas simples, être facilement détectée (paradoxe de Simpson), mais elle devient impossible à déterminer dans des cas complexes, ce qui est vrai pour l’IA mais aussi pour les plans d’expériences.

DeepL, une société berlinoise qui a largement dépassé Google dans la traduction, a utilisé une stratégie différente de « mathématique contre bons sens ». En utilisant les textes de loi européens pour entrainer leur IA, ils ont fourni une base d’apprentissage de grande qualité puisque faite par des traducteurs patentés, certifiés par l’Union Européenne. Alors que Google disposait d’une masse de données considérable, mais essentiellement constituée du galimatias des réseaux sociaux, deepL a élevé son IA avec des produits de qualité.

Ce qui change avec l’IA, et d’ailleurs avec blockchain, c’est que n’importe qui, dans son garage, peut concurrencer n’importe qui. Il n’y a plus de barrière d’entrée, cette force de Porter qui évite l’accès au marché des nouveaux entrants par la nécessité de ressources inaccessibles. Une instance GPU peut se louer à l’heure chez OVH, vous pouvez créer des réseaux virtuels de stockages depuis un ordinateur de bureau, vous connecter à d’autres IA. C’est facile et finalement peu coûteux.

A R&D Mediation par exemple nous travaillons sur l’IA en chimie et en procédé, un domaine où nos anciens nous ont légué des trésors d’expérimentations de qualité. Nous n’avons donc pas besoin, pour faire une IA qui prédit l’odeur des parfums, de récupérer les horaires des trains à la gare de New-York.

Donc laissons l’Etat penser et agissons. Le moteur de l’innovation c’est la curiosité et le désir, pas l’administration.

Télécharger cet article au format PDF ou ePub

Laisser un commentaire

Votre adresse de messagerie ne sera pas publiée. Les champs obligatoires sont indiqués avec *

Ce site utilise Akismet pour réduire les indésirables. Apprenez comment les données de vos commentaires sont utilisées.