Nous venons à peine de découvrir les possibilités de GPT-4 que l’on nous annonce déjà l’avènement d’Auto-GPT. Les agents intelligents sont de retour, mais cette fois ils bénéficient de la formidable puissance des larges modèles de langage. Faut-il se réjouir ou se méfier de l’avènement des IA générative ? La question n’est pas simple, car il faut pour cela se pencher sur les notions d’intelligence artificielle ou sur la signification de l’intelligence et de l’informatique. Au final, comme c’est souvent le cas, le coeur du sujet n’est pas technologique, mais culturel, politique et sociétal. Faut-il pousser la réflexion aussi loin pour se faire un avis éclairé sur les IA génératives ? Oui j’en suis persuadé, car les enjeux sont à la hauteur du potentiel.

Depuis quelques mois, nous pouvons constater une incroyable effervescence autour des IA génératives. Un énorme brouhaha médiatique, mais également un tsunami de nouvelles startups qui nous donnent l’impression qu’une énergie nouvelle a été insufflée dans le secteur des NTIC. C’est également un nouvel élan pour les objets connectés avec la promesse d’intelligences artificielles pervasives que vous pouvez solliciter à tout moment avec par exemple ce petit appareil accroché à votre poche : Watch the first demo of buzzy startup Humane’s wearable AI assistant.

Dans la mesure où il y a déjà eu de nombreux précédents de technologiques trop miraculeuses pour être vraie (façon “Fake it until you make it“), je ne suis pas certain de pouvoir extrapoler des usages à partir de la courte démonstration de l’objet en question. Mais ce qui est certain, c’est que les IA génératives comme ChatGPT s’imposent au fil des semaines comme la pierre angulaire de nos futurs usages numériques. Non pas que les utilisateurs aient spécifiquement réclamé la possibilité de générer des contenus, mais dans le sens où tous les grands éditeurs de contenus et services en ligne semblent bien décidés à l’intégrer systématiquement à leur offre.
J’ai déjà eu l’occasion de vous rappeler que ces chatbots animés par des modèles de langage sont une reformulation du principe d’assistant numérique qui existe depuis 10 ans, en fait depuis le lancement d’Alexa (cf. Usages et enjeux des interfaces vocales publié en 2016 à l’apogée de leur popularité). Des assistants numériques qui n’ont manifestement pas su s’imposer comme les smartphones, car les utilisateurs ont été rapidement déçus par les limitations de cette façon de consommer des contenus et services en ligne : non pas directement à l’aide d’un navigateur, mais à travers le prisme réducteur d’une interface naturelle qui limite le champ des possibles par rapport à l’immuable combo clavier + souris + écran.
La situation est-elle différente aujourd’hui ? Oui je pense, car le temps s’est contracté : nous sommes piégés dans l’instant présent. De ce fait, nous n’avons plus le temps de chercher ou de comparer, il faut agir / profiter au plus vite. Ce sentiment d’urgence permanente se traduit par une recherche systématique de la simplification des choix (Pour 87 % des Français, le volume et le nombre croissant de sources de données rend la prise de décisions trop compliquée). TikTok est ainsi la figure emblématique de cette civilisation en quête de simplicité extrême : pas le temps (ni l’envie) d’identifier des comptes et de s’abonner, il faut profiter au plus vite du flux de micro-vidéos, quitte à perdre la maitrise de ce à quoi on est exposé. Formulé autrement : face à cette période anxiogène alimentée par l’incertitude et la méfiance qui les empêchent de se projeter, les utilisateurs privilégient la simplicité à la maitrise : Grosse fatigue et épidémie de flemme, quand une partie des Français a mis les pouces.

C’est dans ce contexte que les IA génératives et leurs interfaces conversationnelles trouvent un second souffle : il suffit de leur dire ce que l’on veut et elles génèrent directement la réponse. Un principe qui s’applique aux textes, images, sons, musiques, vidéos… et même au code informatique, rendant possible l’élaboration d’agents intelligents capables d’interroger plusieurs langages de modèles, voir des les faire travailler en concurrence (Auto-GPT and BabyAGI: How ‘autonomous agents’ are bringing generative AI to the masses).
Nos usages numériques vont-ils être très bientôt dominés par des agents intelligents ? Pour répondre à cette question, il faut dans un premier temps s’intéresser à la notion même d’intelligence artificielle.
Les IA sont-elles réellement intelligentes ?
Rassurez-vous, je ne vais pas me lancer dans une grande argumentation philosophique, je vais simplement utiliser deux analogies pour expliquer la subtilité de la perception des outils inventés par l’homme et des besoins et usages qui y sont associés.
Diriez-vous qu’un avion sait voler ?
S’il y a effectivement des avions dans le ciel, c’est parce que l’on sait les faire voler, à condition d’avoir un pilote, des moteurs en état de fonctionner, du carburant, une piste de décollage et d’atterrissage, un plan de vol… Donc oui, si tous les pré-requis sont réunis, nous pouvons faire voler des avions, mais dans les faits, ce sont juste des machines qui attendent qu’on se serve d’elles.
Diriez-vous qu’une calculatrice est intelligente ?
Nous les utilisons (quasiment) tous les jours, elles nous sont très utiles, mais à aucun moment nous ne pouvons considérer que les calculatrices sont intelligentes. En revanche, elles sont capables de calculer vite sans jamais se tromper, et c’est tout ce qui importe.
Ce que j’essaye de mettre en évidence, c’est la différence entre les capacités mécaniques d’une machine vis-à-vis des capacités naturelles d’un être vivant (ex : un oiseau qui sait voler par lui-même), ainsi que la différence entre les capacités simulées d’une machine et les capacités intuitives des êtres vivants (les calculatrices sont programmées alors que les animaux agissent selon leur instinct).
L’instinct se définit comme les comportements innés présents chez les animaux et les humains, qui leur permettent de répondre de manière adaptée à des situations spécifiques sans avoir besoin d’apprendre ces comportements par l’expérience (ex : instinct de survie, instinct maternel…). Il est à noter que si les instincts sont innés, ils peuvent être modifiés ou influencés par l’environnement et l’apprentissage (ex : dressage d’un chien ou éducation d’un enfant). C’est cette absence d’instinct qui différencie les machines des êtres vivants. C’est parce que les machines n’ont pas l’instinct de reproduction (trouver un partenaire, s’accoupler et assurer la survie de l’espèce) que les scénarios de type Terminator ne sont pas crédibles.

Néanmoins, la généralisation d’agents intelligents n’est pas sans risque, car il faut un minimum de recul pour ne pas chercher à faire des comparaisons entre l’intelligence des machines et celles des humains.
Qu’est-ce que l’intelligence ?
L’intelligence est un concept qui englobe diverses capacités et compétences cognitives (apprendre, comprendre, raisonner, planifier, résoudre des problèmes, penser de manière abstraite, s’adapter à de nouvelles situations…). Si les intelligences artificielles peuvent simuler de très fortes capacités d’apprentissage, de compréhension, de raisonnement, de planification… elles sont en revanche tout à fait inaptes aux autres formes d’intelligences (notamment sociales et émotionnelles).

Pourquoi donc s’émerveiller de l’intelligence de ChatGPT alors que nous savons pertinemment qu’elle est artificielle (les capacités des IA génératives ne reposent que sur de la puissance de calcul) ? L’ambiguïté vient du fait que nous n’attendons pas des IA qu’elles nous aident à gérer nos relations sociales ou émotions, mais à mieux comprendre, analyser, planifier… De ce fait, nous nous laissons facilement éblouir par les formidables capacités de traitement des larges modèles de langage, très largement supérieures à celles des meilleurs humains. Le problème est que les IA ne sont pas dotées de conscience ou d’émotions, ce qui les rend hautement irresponsables (lire à ce sujet ce tragique fait divers : ‘He Would Still Be Here’: Man Dies by Suicide After Talking with AI Chatbot, Widow Says).
Pour mémoire, il faut une vingtaine d’années pour qu’un bébé passe au stade adulte, c’est à dire pour qu’il arrive au terme de sa croissance physique et atteigne un certain niveau de maturité mental et émotionnel. L’âge adulte est généralement caractérisé par l’autonomie (prise de décision et action), la responsabilité (assumer les conséquences de ses décisions et comportements) ainsi que la capacité à gérer des situations complexes. Sous cet angle, les intelligences artificielles ne sont ni autonomes, ni adultes et elles ne le seront jamais, au même titre que les logiciels. Mais ils / elles restent néanmoins très utiles, voire indispensables dans notre quotidien où le numérique est omniprésent. L’important est de bien comprendre leurs limites pour définir un cadre d’utilisation pertinent, ce qui est le cas pour les logiciels, mais pas pour les IA génératives que l’on considère comme omniscientes et omnipotentes. Ce côté “magique”, pousse certains à penser qu’ils peuvent potentiellement déléguer de nombreuses tâches et responsabilités aux IA en pleine confiance.

Comme vous l’aurez compris, je ne suis pas forcément à l’aise avec les discours ultra-optimistes des apôtres des IA génératives, à la limite de la naïveté (The generative AI market is projected to grow from USD 11.3 billion in 2023 to USD 51.8 billion by 2028). Ceci étant dit, cette approche critique ne m’empêche en rien de percevoir le formidable potentiel disruptif des IA génératives en tant que ressources informatiques.
L’évolution logique des logiciels ?
Si l’intelligence artificielle est un concept, sa matérialisation passe nécessairement par des logiciels. Dis comme ça c’est un peu décevant, mais c’est une réalité : au même titre que le web ou le métavers, les IA sont des programmes informatiques combinés entre eux. ChatGPT et les IA génératives n’échappent pas à cette règle, car ce sont des briques logicielles, mais néanmoins avec une autre approche de l’informatique.
Pour bien comprendre cette nouvelle approche, il faut revenir aux fondements de l’informatique : au commencement, il y avait les algorithmes (dont la paternité est attribué à Abu Jaffar Al Khwarizmi, un mathématicien perse du IXe siècle, avec la publication d’un traité d’arithmétique qui introduit pour la première fois dans l’histoire de l’humanité un algorithme de calcul de la racine n-ième de n’importe quel nombre). Ces algorithmes sont une méthode pour calculer plus vite, une façon de traiter plus rapidement de l’information.

Les algorithmes ont ensuite été utilisés dans des machines comme le métier à tisser de Jacquard, puis dans la machine analytique de Charles Babbage et on enfin été agrégés dans des programmes, notamment la première fois par la comtesse de Lovelace au XIXe siècle. Un programme informatique est une séquence d’instructions écrites dans un langage de programmation, conçue pour être exécutée par un ordinateur. Ces instructions indiquent à l’ordinateur comment effectuer une tâche en réalisant des opérations telles que des calculs, des manipulations de données…
Les programmes informatiques sont donc exécutés par des utilisateurs dans le but de réaliser une tâche précise selon des instructions données à l’aide d’une interface (textuelle ou graphique) et de périphériques (clavier, souris…). Ce sont des outils que l’on manipule avec nos mains, comme un marteau ou une pince. Les intelligences artificielles avec une interface conversationnelle comme ChatGPT reposent sur un nouveau paradigme, puisque les interactions sont naturelles (il suffit de parler, inutile d’apprendre à manipuler des boutons ou menus) et puisque l’on ne donne pas d’instructions précises (contrairement aux assistants vocaux), mais on se contente de poser des questions, d’exposer des besoins ou problèmes et d’attendre que l’IA génère une réponse.

La différence par rapport à l’informatique traditionnelle, celle des programmes, est double : les interactions sont naturelles et le fonctionnement est intuitif. Voilà pourquoi je suis persuadé que les intelligences artificielles ne sont pas des outils, mais des ressources informatiques : elles ne servent pas à la réalisation d’une tâche découlant d’un besoin précis, mais permettent de soutenir une activité plus complexe.
Selon cet angle, ChatGPT et consorts représentent une nouvelle étape majeure dans l’évolution de l’informatique. Vous noterez au passage que les modèles de langage sont comme un retour aux sources puisque le terme “informatique” vient de la contraction des mots “information” et “automatique” et désigne un traitement automatisé de l’information à l’aide de logiciels, exactement ce que font les modèles de langage.
Les IA de dernière génération sont donc une avancée majeure, car elles vont donner accès à des ressources informatiques gigantesques à des personnes qui ne maitrisaient pas forcément les interfaces et périphériques (Illectronisme : Un Français sur 3 reste éloigné du numérique). Des ressources informatiques qui sont potentiellement illimitées si on donne accès aux agents intelligents à l’ensemble des contenus et services en ligne. C’est justement la promesse des plugins introduits par OpenAI le mois dernier qui permettent aux IA génératives de se connecter à des services en ligne pour vous assister dans une activité.
Avec les plugins, nous ouvrons une infinité de possibilités supplémentaires puisque les capacités des IA ne reposent plus seulement sur leur modèle de langage, mais sur les ressources d’autres systèmes, qui peuvent eux-mêmes reposer sur d’autres modèles de langage.
Est-ce une révolution ? Oui tout à fait : un changement fondamental dans l’approche de l’informatique, qui risque cependant d’avoir des répercussions énormes sur les structures économiques, sociales ou culturelles de notre société, voilà pourquoi le sujet devient politique (Generative AI: how will the new era of machine learning affect you?).

Un changement de paradigme
Nombreux sont ceux qui comparent ChatGPT à l’iPhone et à l’impact qu’il a eu sur notre quotidien (Comment les smartphones ont changé le monde en 15 ans). Ce ne sont que des conjectures, mais la comparaison est intéressante dans la mesure où l’iPhone a introduit deux changements majeurs dans notre façon d’exploiter l’outil informatique : une interface tactile et une multitude d’applications (pour travailler, mais aussi apprendre, se divertir, socialiser…). En ce sens, l’iPhone a participé de façon active au basculement vers un nouveau paradigme de l’informatique, une nouvelle façon d’utiliser les contenus et services en ligne. D’autres vont plus loin et considèrent que ChatGPT est l’équivalent de la presse de Gutenberg : le point de départ d’une révolution culturelle qui va faire basculer l’humanité dans une nouvelle ère.
Je refuse de commenter ces assertions, car nous manquons clairement de recul pour pouvoir apprécier le potentiel réel et surtout l’impact des intelligences artificielles génératives. Ce qui est certain, c’est que le marché s’emballe et nous annonce une révolution de la révolution tous les mois. Ce mois-ci, la nouvelle coqueluche des experts en IA de Twitter est Auto-GPT, une application qui est capable de “piloter” ChatGPT en l’aidant à accomplir des tâches complexes : What is Auto-GPT and why does it matter? Le principe de fonctionnement est plutôt simple : l’agent demande à ChatGPT de décomposer une tâche complexe en étapes simples, puis il transforme chacune de ces étapes en tâche qu’il demande à ChatGPT d’exécuter les unes à la suite des autres : Hype grows over “autonomous” AI agents that loop GPT-4 outputs.
Dans les faits, Auto-GPT n’est qu’un script qui récupère les réponses pour les soumettre à nouveau sous forme de questions, mais dans l’absolu, si l’on combine les capacités analytiques des IA génératives (qui sont simulées, mais pourtant opérantes) à l’exhaustivité des contenus et services en ligne disponibles à travers les plugins, on obtient des agents autonomes capables de rendre de sacrés services.

Il y a quelques mois, nous avons assistés au retour triomphal des chatbots, nous assistons maintenant au retour des concierges numériques, l’équivalent des services qui existaient il y a quelques années par SMS (ex : Magic, Butler…), mais où les opérateurs sont remplacés par une IA (cf. cet article publié en 2015 : Des services de conciergerie mobiles aux applications transparentes). Dans cette nouvelle configuration, les agents les plus populaires sont Auto-GPT et BabyAGI, mais il en existe beaucoup d’autres : The easter innovation in AI and LLM with AutoGPT, BabyAGI and Langchain.
Ces agents intelligents motorisés par des IA génératives se présentent sous la forme de scripts python qu’il faut télécharger et exécuter, mais il existe des versions en ligne comme AgentGPT.

S’ils restent perfectibles (Auto-GPT and BabyAGI Are AI’s New Hotness, But They Suck Right Now), il ne va pas falloir bien longtemps à la communauté des développeurs pour proposer des agents plus sophistiqués et surtout des interfaces plus ergonomiques. Dans l’absolu, nous pourrions demander à ChatGPT d’écrire le code d’un agent plus performant, voire de concevoir lui-même un agent qui l’aiderait à accomplir des tâches plus complexes, à résoudre des problèmes de plus haut niveau.
C’est en ça que les IA génératives ouvrent une nouvelle ère dans l’informatique, car s’il était impossible de demander à Word comment rédiger un meilleur document ou à Excel comment calculer un bilan de façon plus efficace, c’est maintenant possible grâce aux IA génératives (notamment via l’intégration de Copilot dans Office). La façon dont Microsoft nous présente son agent intelligent est parfaitement équivoque (“A whole new way to work“), car ce principe ouvre effectivement de nouvelles façons de travailler en binôme avec les intelligences artificielles (Quel modèle de collaboration à l’heure des IA génératives ?).

10 ans après les premiers assistants numériques, les agents intelligents vont-ils envahir notre quotidien ? Pas certain, car comme toujours, il n’est pas que question de technologie.
Le nouveau dilemme de l’innovateur : doit-on laisser l’humanité se bruler les ailes ?
La lettre publiée il y a deux semaines par une partie de la communauté scientifique pour demander un moratoire sur le développement de nouveaux modèles de langage a fait beaucoup de bruit. Effectivement, il y a de quoi : cela fait 25 ans que je travaille dans le numérique et je n’avais jamais ressenti auparavant de sentiments aussi ambivalents. D’un côté je suis extrêmement enthousiaste sur les innombrables possibilités offertes par les IA génératives ; mais de l’autre, je suis très inquiet quant aux dérives potentielles, et je ne suis pas le seul : The New Risks ChatGPT Poses to Cybersecurity et Intelligences Artificielles génératives et désinformation : bienvenue en post-vérité ?
Faut-il interdire l’utilisation des AI générative ? Non en aucun cas. Faut-il laisser les kamikazes de la Silicon Valley inonder le marché avec des technologies semi-expérimentales ? Certainement pas. Je ré-affirme ma position déjà exprimée dans un précédent article : tous les marchés sont régulés afin de protéger les consommateurs et d’éviter des accidents industriels. N’importe quelle société désirant lancer sur le marché un nouveau produit dans l’automobile, l’alimentaire, l’électronique, le jouet, l’habillement… doit d’abord se conformer aux normes, pourquoi devrions-nous faire une exception pour ChatGPT ?
Le problème ne vient pas des IA génératives, mais bel et bien des potentielles utilisations malveillantes (très probables) et surtout des utilisations maladroites ou non-avisées (extrêmement probables). Visiblement je ne suis pas le seul à émettre des réserves : Plus de 80 % des Français s’inquiètent des dérives de l’intelligence artificielle. Ainsi, je soutiens l’initiative de la CNIL italienne qui exige plus de transparence de la part d’OpenAI, notamment sur le corpus utilisé pour entrainer le modèle (Italy gives OpenAI initial to-do list for lifting ChatGPT suspension order). La question de la transparence sur le corpus initial est d’autant plus importante que les réponses formulées par les IA génératives ne sont pas neutres, mais influencées par le penchant politique des contenus ayant servi à son entrainement (IA isn’t partisan yet).
Mais outre la question de la confidentialité, de la légitimité ou de la transparence, il y a également des considérations éthiques et philosophiques que l’on ne peut pas ignorer : doit-on laisser les IA génératives proliférer sans un minimum de contrôle ? Est-ce de ça dont l’humanité à réelleemnt le plus besoin ? Pour répondre à cette question, je vous invite à visionner cette conférence qui aborde tous les paramètres de l’équation avec beaucoup de pédagogie :
Il est notamment fait dans cette conférence une analogie très pertinente : les intelligences artificielles sont l’équivalent de la fission atomique du XXIe siècle : indispensables (comme le sont les centrales nucléaires dan notre mix énergétique), mais extrêmement dangereuses (l’arme atomique est autant une force de dissuasion qu’un épouvantail agité par les régimes autoritaires). Tout comme nous avons règlementé le clonage humain ou le développement du nucléaire de classe militaire, il nous faut une règlementation sélective pour les intelligences artificielles (principe de précaution) afin de limiter les dérives potentielles qui ne manqueront pas d’arriver, mais au moins nous en aurons limiter les impacts.
—
Pour conclure cet article, je vais répéter ce que j’ai déjà dit : ce dont nous avons le plus besoin, c’est de pédagogie, pour bien comprendre le potentiel et les limites des IA génératives. Essayons ensuite d’apprendre de nos erreurs et de ne pas reproduire par exemple la situation explosive qui a été créée avec la prolifération des smartphones et médias sociaux : exposer nos enfants (et adultes) sans aucun garde-fou pour des conséquences que nous commençons seulement à comprendre : Coincés dans la grande dépression des plateformes.
Et comme si la situation n’était pas assez compliquée, il va maintenant falloir faire face au raz-de-marée de contenus synthétiques et chatbots sur les médias sociaux. J’espère sincèrement que cet article vous aura ouvert les yeux et que vous appréhenderez le sujet des IA génératives avec un peu plus de discernement…