Plus les semaines passent et plus les promesses faites autour des IA génératives prennent de l’ampleur. Si les progrès sont manifestes, j’ai comme l’impression que nous tournons en rond dans la description précise de ce que peuvent faire ces fameuses intelligences artificielles. Au-delà des prédictions délirantes, les mêmes formulées il y a 6 ans à l’époque où les médias généralistes découvraient le deep learning, il me semble important de replacer les modèles génératifs dans le contexte de l’entreprise et des problématiques très concrètes auxquelles elles sont confrontées : lutter contre l’infobésité et essayer de faire sortir les collaborateurs du paradigme fichiers / emails.

Après une période d’euphorie, nous commençons à lire des avis plus mesurés sur les IA génératives, notamment cette pétition aux États-Unis qui appelle à un moratoire sur le développement de nouveaux modèles de langage : FTC should stop OpenAI from launching new GPT models, says AI policy group. Une pétition largement commentée par la communauté de spécialistes (Faut-il mettre en pause l’avancée de l’IA ?) avec des prises de position nuancées par les différentes protagonistes : A misleading open letter about sci-fi AI dangers ignores the real risks et Policy makers: Please don’t fall for the distractions of #AIhype (bon résumé ici : Un moratoire pour aller où ?).
Le moins que l’on puisse dire est que le sujet ne laisse personne indifférent, notamment les consommateurs qui craignent de se faire inonder de publicités synthétiques (Consumers Are Worried About Marketers Using Generative AI). Des craintes partagées par la CNIL italienne qui a décidé de bloquer ChatGPT en invoquant une violation du RGPD (Italy orders ChatGPT blocked citing data protection concerns).
Ce que nous constatons ici est un logique retour du balancier, la conséquence directe d’une surchauffe médiatique autour de ChatGPT. Le problème mis en évidence dans ce débat est que ce sont des outils extrêmement puissants que l’on ne peut pas mettre entre toutes les mains sans un minimum de garde-fous, littéralement ! Ce qui est vrai pour les particuliers l’est également pour les professionnels. J’avais déjà abordé ce point le mois dernier (Intelligence artificielle : Nous n’avons pas besoin de plus de contenus, mais de meilleures analyses), mais je souhaite aller plus loin dans mes explications et surtout illustrer la façon dont ces modèles génératifs pourraient être bénéfiques aux travailleurs du savoir.
Un évident besoin pour les cols blancs de repenser le travail
Si les travailleurs manuels, les cols bleus, ont connu leur révolution au début du siècle dernier (l’Organisation Scientifique du Travail), pour les travailleurs du savoir, les cols blancs, c’est plus compliqué, car leur organisation est au mieux générique, au pire empirique.
Pour schématiser, nous avons d’un côté dans les grands groupes une organisation générique du travail imposée par l’ERP avec des processus rigides, des formulaires à rallonge et l’éternel cycle de forecast / reporting. Peut-être qu’à une époque cette façon très rigoureuse de travailler était une forme d’optimisation (l’objectif était de diminuer les erreurs), mais dans le contexte d’incertitude et de permacrise que nous traversons, c’est un sacré handicap (la conséquence est une extrême rigidité).
De l’autre côté, nous avons des PME et TPE avec une organisation empirique du travail due à un flou ou une absence de volonté de définir et d’adopter une méthodologie unique qui se traduit par un déluge d’emails et de fichiers bureautiques qui accompagnent les activités quotidiennes. Certes, cette non-organisation autorise une grande souplesse, mais elle est très compliquée à optimiser, car rien n’est formalisé (ni les flux d’informations, ni les séquences de travail). La conséquence de tout ça est que la seule façon d’augmenter le rendement est de travailler plus (faire des heures supplémentaires). Si vous êtes comme la très large majorité des entreprises pour lesquelles j’interviens, alors vous devez souffrir des conséquences cumulées de ces deux modèles. 😖

Repenser la façon dont les travailleurs du savoir produisent de la valeur est un authentique serpent de mer, un sujet que j’ai déjà abordé à de nombreuses reprises, notamment en 2019 (De nouveaux modes de collaboration requièrent de nouveaux outils) et en 2021 (Futur du travail : parler moins pour mieux collaborer et produire plus). La question de la productivité n’est pas récente, mais avec la prolifération des logiciels en ligne et la pandémie, la situation a empiré (Le travail hybride signe la fin du micro-management et le début de la supervision à distance et Quels outils et pratiques pour gérer les activités et connaissances à l’ère numérique ?) et devient maintenant réellement critique : Quel modèle de collaboration et de cohésion à l’heure du télétravail hybride (et des crises / guerres) ?

La promesse des outils de collaboration dopés aux IA génératives est de nous soulager des tracas quotidiens en réalisant à notre place une partie du travail. Des outils comme Read qui s’interface avec Zoom pour créer des synthèses des visioconférences sont ainsi particulièrement attractifs : Read’s AI-powered summary feature squeezes a meeting into a two-minute clip.

La limite de ces services est qu’ils apportent une solution aux conséquences du manque d’organisation, mais ne règlent pas le problème à la source. Ainsi, ils n’éduquent pas les utilisateurs à une meilleure utilisation de la visioconférence, au contraire : ils donnent l’illusion de pouvoir compenser les défauts des autres (puisque bien évidemment, ce sont les autres le problème).
Nous avons également des solutions extrêmement intéressantes comme Motion qui fusionnent emails, calendrier et liste de tâches pour fluidifier les flux de travail (à ne pas confondre avec Notion dont on parle plus bas).

Je suis réellement impressionné par l’ingéniosité de cet outil, mais il faut être réaliste : aucune DSI ne se risquera à remplacer le sacrosaint Outlook par une solution comme celle-ci, ça serait un trop gros changement pour les utilisateurs. Vous noterez d’ailleurs que ce qui est vrai pour Motion, l’est également pour la vague de solutions collaboratives de ces dernières années (Asana, Trello, Slack, Notion, Monday…) qui sont de très bons outils, mais qui vivent en périphérie du SI, car ils ne sont adoptés que par une minorité des collaborateurs, “l’élite numérique” de l’entreprise.
Bref, nous sommes en 2023, on nous annonce une révolution tectonique avec les IA génératives (celles qui ont la capacité de faire bouger les plaques de la croute terrestre et de changer la face du monde 🙄), mais la seule façon que les éditeurs de solutions miracles ont de nous vendre cette révolution est de nous promettre de faire le travail à notre place : Microsoft announces Copilot, the AI-powered future of Office documents. Une vision extrêmement réductrice de la façon de travailler, et qui en plus ne règle pas le problème, au contraire, car plus d’emails ou de fichiers ne changera pas la donne.
Il est largement temps de regarder la réalité en face : il n’y a qu’une seule façon de réduire notre dépendance aux emails et fichiers bureautiques, c’est de se débarrasser de Outlook et Office. Une mesure radicale qui semble impossible à appliquer tant la mainmise de Microsoft sur les DSI est forte. À moins que la solution ne vienne justement de Microsoft…
Avec Loop, Microsoft nous propose la seule alternative viable à Office
Il y a 15 ans déjà nous étions nombreux à phosphorer sur l’évolution des modes de travail pour les knowledge workers, les collaborateurs de savoir (Qu’est-ce que l’Entreprise 2.0 ?). Depuis cette époque, de nombreuses solutions alternatives ont été expérimentées comme les intranet sociaux (ex : Jive, SocialText…), les réseaux sociaux d’entreprise (ex : Talkspirit, Jamespot, Workplace…), les solutions de collaboration en ligne (ex : Confluence, Podio…), les outils de communication / collaboration intégrées (ex : Teams, Zoom…). Toutes ces solutions sont fois très intéressantes, mais elles n’ont fait qu’éparpiller les conversations, informations et données en cohabitant avec les éternels Outlook et Office.
La situation est aujourd’hui plus confuse que jamais, car les entreprises se retrouvent à jongler avec une multitude d’outils : les solutions hébergées adoptées spontanément par des équipes isolées et les solutions de Microsoft qui se chevauchent (Office365, Yammer, SharePoint, OneDrive, Teams…). Une situation intenable, car on essaye de faire cohabiter tant bien que mal des outils issus de l’ère informatique (ex : emails dans Outlook, fichiers bureautiques dans Office…) avec des outils issus de la culture numérique (ex : Visio-conférences avec Zoom, communautés transverses avec Slack…). En théorie, l’héritage d’Office est un formidable tremplin pour Microsoft, mais en pratique, c’est aussi un énorme boulet : Microsoft, Slack, Zoom, and the SaaS Opportunity.

Le plus gros défi pour les entreprises est aujourd’hui de s’extraire du paradigme fichiers / emails :
- basculer tous les fichiers bureautiques dans le cloud pour pouvoir les indexer en profondeur afin d’en extraire les données et connaissances ;
- déporter les conversations vers des espaces de discussions ou des groupes de travail afin d’en extraire les informations et d’historiser les décisions.
C’est en théorie ce que sont censés faire des logiciels comme SharePoint ou Teams, sauf que… ça piétine, car Microsoft ne fait que reproduire l’existant, mais en ligne (ex : Outlook Web Access ou Office365), donc de déplacer les mauvaises habitudes de travail dans le cloud.

Croyez-le ou non, mais les choses sont en train de changer avec le lancement officiel d’un tout nouveau produit : You can now try Microsoft Loop, a Notion competitor with futuristic Office documents.
Une nouvelle approche de la collaboration de proximité avec Loop
Si durant la période où Microsoft était dirigée par Steve Balmer, l’essentiel de la stratégie a été de renforcer la position sur les produits stars (Windows, Office, Outlook…), la période qui a suivi a permis à la firme de Redmond de restructurer son offre autour du cloud et surtout d’expérimenter de nouveaux outils comme Sway ou Planner, des applications complémentaires aux éternels Word, Excel, Powerpoint…
Avec Loop, c’est une autre approche, car Microsoft propose enfin une solution en rupture avec Office pour repartir sur de nouvelles façons de travailler : New Microsoft Loop app is built for modern co-creation.
Comme vous pouvez le constater, les utilisateurs ne seront pas trop perdus, car l’interface et le fonctionnement font vaguement penser à un mélange entre Office, SharePoint et Teams, une sorte de mini-intranet plutôt intuitif à prendre en main.
La rupture introduite par Loop est d’abandonner l’idée d’un espace de travail en ligne avec des documents, tableaux et présentations sous forme de fichiers pour ne conserver que des pages dans lesquelles on retrouve du texte, des images, des tableaux, des discussions…

Les anciens vous diront que ça fait furieusement penser à Wave que Google avait essayé de lancer en 2009 : Google Wave = Email + IM + Wiki + Mashup.

Outre la volonté de fusionner documents et messages, la comparaison avec les outils de Google ne s’arrête pas là, car ce nouveau Loop repose sur le principe de composants partagés entre différents documents, une fonctionnalité intégrée à Workspace en 2021 : Google Workspace turns to ‘smart chips’ to weave Docs, Tasks, and Meet together.
Mais rendons à César ce qui lui appartient, car ce principe a pour la première fois été dévoilé l’année d’avant sous forme d’expérimentation technique : Introducing the first Microsoft Fluid Framework experiences in Outlook and Office.com.
3 ans après, les components semblent parfaitement maitrisés et offrent un grand confort d’utilisation en évitant la duplication des informations et données. Ici, un tableau est transformé en composant pour être partagé dans d’autres pages :

Une fois un composant créé et indexé, il peut être utilisé par les autres applications de la suite. Dans l’exemple suivant, un tableau de gestion des tâches est partagé dans une conversation Teams, avec la possibilité d’accéder aux autres emplacements où ce tableau est utilisé :

Loop propose également une gestion fine des notifications pour être prévenu (ou pas) en cas de modification ou de commentaire sur une page ou un composant :

Cerise sur le gâteau, il est également possible d’invoquer Copilot, le nouvel assistant de Microsoft dopé à l’IA générative, pour pouvoir vous aider à rédiger, synthétiser ou analyser des contenus ou données :

Des capacités que l’on retrouvera bientôt dans tous les produits Office, mais qui me semble particulièrement pertinent avec l’application de prise de notes : OneNote is getting Microsoft’s new AI Copilot to help you write your notes.
Visiblement, plusieurs entreprises ont déjà testé avec succès cette nouvelle solution : Customer Stories : Clipchamp teams stay in sync using Microsoft Loop to collaborate across apps for richer insights.
Se pourrait-il que ce Loop apporte une proposition de valeur suffisamment forte pour inciter les utilisateurs à tourner la page de plusieurs décennies d’utilisation de Office ? Oui je le pense. Vous pourriez me dire : OK, mais quid des emails ? Là encore, Microsoft apporte une solution intéressante avec Copilot qui peut se charger de rédiger une réponse selon plusieurs tonalités, de résumer une conversation ou un document, de faire des suggestions de traitements…

À partir du moment où Copilot s’immisce dans tous les échanges et équipes de travail, il a la possibilité d’accompagner les utilisateurs dans l’adoption de nouvelles façons de travailler, c’est-à-dire de les aider à décrocher de leur addiction aux emails et fichiers.
Copilot is the new Clippy
Souvenez-vous à une époque pas si lointaine, le trombone présent dans Office était là pour vous aider à prendre en main les logiciels bureautiques et à découvrir de nouvelles fonctionnalités. 25 ans après, ce principe de compagnon ou d’assistant profite de l’engouement médiatique autour des chatbots et des IA génératives pour revenir sur le devant de la scène.
Je sais qu’il existe de nombreux autres assistants numériques censés vous aider au quotidien dans l’automatisation de tâches répétitives, mais le fait que Copilot soit intégré à l’environnement Microsoft lui garantit un accès direct à l’ensemble des ressources de l’entreprise (son système d’information) et des collaborateurs (leur ordinateur). Un avantage concurrentiel que Microsoft bâtit depuis des années par l’intermédiaire de son Work Graph.

À partir de là, nous pouvons lister tout un tas de cas d’usage très concrets pour Copilot :
- Suggérer la constitution de groupes de travail en fonction de sujets, projets ou activités ;
- Animer ces groupes de travail avec des suggestions de publications issues d’un travail de veille automatisé ;
- Extraire des données ou informations-clés de conversations ou de fichiers pour les capitaliser dans une base de connaissances (un référentiel commun aux groupes cités plus haut) ;
- Structurer les connaissances et affiner les données en faisant contribuer les membres du groupe (petit à petit sur la base de confirmation de suggestions) ;
- Modéliser les flux de travail selon des schémas pré-établis (s’il s’agit d’un travail de veille sur un sujet, de suivi de projet ou de pilotage d’une activité récurrente) ;
- Aider à la définition d’objectifs et automatiser la mesure et le suivi ;
- Fusionner tous ces flux de travail et objectifs en un ensemble plus vaste dans le cadre d’une démarche OKR…
Cette liste n’est bien évidemment pas exhaustive, loin de là, et préfigure une véritable révolution dans la façon de travailler au quotidien. Ce Loop serait la pierre angulaire d’un basculement de l’ère informatique de Microsoft (avec Office, SharePoint…) vers l’ère numérique (avec Teams et Viva).
Encore une fois, je ne dénigre pas les solutions mentionnées plus haut, je constate simplement qu’il est très difficile, voire carrément impossible de se débarrasser d’Outlook et Office. Le seul éditeur à pouvoir y parvenir à grande échelle est Microsoft lui-même, qui par l’intermédiaire de Loop et de Copilot pourrait aider les utilisateurs à se libérer de l’héritage infernal de Windows.
La question que tout le monde se pose maintenant est de savoir si oui ou non les IA génératives peuvent nous faire gagner du temps.
IA génératives < IA déductives < IA sectorielles
Il n’existe pas beaucoup d’études sérieuses capables de démontrer l’intérêt des IA génératives, car nous manquons de recul. Voilà pourquoi j’apprécie particulièrement la dernière publication du très sérieux Nielsen Norman Group : ChatGPT Lifts Business Professionals’ Productivity and Improves Work Quality. Dans cette étude, réalisée auprès de plus de 440 professionnels du marketing, des ressources humaines et de la communication, il ressort que l’utilisation de ChatGPT augmente de 59% la productivité dans les tâches de rédaction. L’hypothèse formulée par des nombreux observateurs et spécialistes des NTIC est donc correcte : les IA génératives permettent de travailler plus vite.

Ceci étant dit, nous parlons ici de rédaction de textes. Cet accroissement de la productivité n’est donc pas directement transposable à d’autres activités. En ce sens, je suis tout à fait en phase avec cette analyse publiée par le fond Andreessen Horowitz qui prédit un grand avenir dans le BtoB non pas pour les IA génératives, mais pour les IA déductives, celles capables de résumer des documents ou conversations et d’analyser des données : For B2B Generative AI Apps, Is Less More?

Nous sommes bien ici tout à fait dans les cas d’usage décrits plus haut, à savoir un assistant chargé de produire des synthèses (connaissances), de résumer des discussions (informations) et de compiler / structurer des chiffres (données). Tout ce dont les travailleurs du savoir ont besoin.
Idéalement, ce travail d’analyse et d’extraction d’informations / données devrait être fait par une IA déjà familiarisée avec le secteur d’activité et de préférence avec un modèle affiné à l’aide des données de l’entreprise. Croyez-le ou non, mais c’est exactement ce sur quoi travaillent les grands éditeurs, à commencer par Bloomberg qui vient d’annoncer la complétion d’une IA générative dédiée aux métiers de la finance : Introducing BloombergGPT, Bloomberg’s 50-billion parameter large language model, purpose-built from scratch for finance. D’après les informations fournies par l’éditeur, les capacités d’analyse et de rédaction de ce modèle seraient significativement supérieures à celles de modèles génériques équivalents en taille, ce qui n’est pas très surprenant (What if ChatGPT was trained on decades of financial news and data? BloombergGPT aims to be a domain-specific AI for business news).

J’anticipe à court terme la sortie de nombreux modèles sectoriels entrainés grâce à des données dont les éditeurs seraient les propriétaires, créant ainsi un avantage concurrentiel évident par rapport aux modèles généralistes comme GPT qui invente des réponses dans 10 à 15% des cas, un taux d’erreur absolument inacceptable dans le milieu BtoB. Cette perspective de marché est comme une aubaine pour de nombreux éditeurs (journaux, magazines, portails…) dont les revenus étaient en baisse. Il ne leur reste maintenant plus qu’à soigneusement enrichir leur base de connaissances pour commercialiser des licences auprès des professionnels du secteur, une source de revenus réguliers permettant de payer les salaires des journalistes qui écrivent des articles de qualité. Un cercle vertueux qui profiterait à tous !
Dans ce scénario, les grands gagnants seraient les propriétaires des données servant à l’entrainement (ex : médias BtoB) et les éditeurs chargés de la commercialisation du modèle en l’intégrant à leur offre. C’est tout à fait ce que proposent Adobe avec Firefly (un modèle génératif s’appuyant sur le fond d’images propriétaires de Adobe Stock) ou NVIDIA avec un modèle capable de générer des objets 3D à partir du fond de Turbosquid (Nvidia and Shutterstock to build AI text-to-3D service). Les grands perdants seraient les éditeurs d’IA génératives non-spécialisées qui n’en sont qu’au tout début des leurs déboires juridiques : Stable Diffusion copyright lawsuits could be a legal earthquake for AI.
L’ultime étape pour les entreprises serait de s’abonner à un modèle pré-entrainé à l’aide de contenus sectoriels, puis de l’affiner avec des données propres à l’entreprise, puis de le réduire pour qu’il puisse être exécuté en local sur les ordinateurs des collaborateurs. Pour cela, il faudrait qu’elles puissent disposer d’une infrastructure technique adéquate et surtout des outils permettant de réaliser ces opérations simplement. Ça tombe bien, c’est justement ce qui a été présenté la semaine dernière par NVIDIA : NeMo Framework.
L’été de l’IA va être chaud !
Tous les indicateurs sont au vert pour faire des IA génératives la priorité de toutes les entreprises et gouvernements afin de ne pas passer à côté de ce qui va être un formidable accélérateur de création de valeur. Pourtant, le long parcours de maturation de l’intelligence artificielle n’a pas toujours bénéficié d’une telle vague d’enthousiasme. Les professionnels de ce domaine de recherche se souviennent ainsi des périodes de vache maigre des années 80-90 où l’on ne croyait plus aux promesses du machine learning (on parlait alors d’hiver de l’IA : AI winter).
De même, après une période d’euphorie il y a 5 ou 6 ans, les outils et services reposant sur du deep learning étaient “passés de mode”, car ils n’avaient pas su délivrer leurs promesses. Essayons de toujours garder en mémoire ces hauts et bas pour ne pas reproduire les erreurs du passé et pouvoir avancer sereinement dans l’intégration des IA génératives dans nos outils quotidiens. Et de préférence en s’inscrivant dans les cadres rigoureux de la souveraineté et de la sobriété numérique !
Mais c’est une autre histoire, car je vous rappelle que la priorité est de lutter contre notre dépendance aux emails et fichiers bureautiques, ceux que nous trainons comme des boulets et qui nous empêchent de nous projeter dans le 21e siècle.