Les IA génératives (re)lancent le segment des accessoires connectés

Au commencement, il y avait les ordinateurs et leurs logiciels. Puis il y a eu les sites et applications en ligne. Puis les smartphones. Puis les objets connectés. Aujourd’hui, startups et géants numériques sont dans une phase exploratoire pour tenter de mettre au point le prochain paradigme de l’outil informatique. Qui des accessoires connectés ou des casques de réalité mixte saura convaincre le grand public en premier ? Il est trop tôt pour le dire, mais dans tous les cas de figure, l’intelligence artificielle est la prochaine étape logique.

Une semaine après le grand chamboulement survenu chez OpenAI, la course à l’innovation reprend de plus belle autour des IA génératives, principalement dans deux directions : les modèles et les interfaces. Si la compétition pour sortir le modèle le plus puissant (avec le plus grand nombre de paramètres) bat son plein, ça ne se bouscule pas trop du côté des interfaces, et encore moins des terminaux (quoi que : Designer Jony Ive and OpenAI’s Sam Altman Discuss AI Hardware Project).

Pour le moment, l’essentiel des usages se fait donc à travers les sites web et les applications mobiles des éditeurs (ChatGPT, Bard, Copilot, Claude…), mais le segment des accessoires connectés est petit à petit en train de se développer.

J’ai pendant plusieurs années édité le panorama des terminaux alternatifs qui avait pour objectif de lister les différentes catégories d’appareils offrant une alternative aux ordinateurs (cf. la dernière édition en date : Panorama des terminaux alternatifs 2020). Nous sommes maintenant en 2023 et les smartphones semblent avoir remporté la bataille. Comprenez par là qu’ils s’imposent comme LE terminal de référence pour les usages numériques, devant les ordinateurs. Mais avec les progrès aussi rapides que spectaculaires des chatbots propulsés par les modèles génératifs, le segment des accessoires connectés est relancé avec l’ambition de grignoter l’hégémonie des smartphones.

Commençons par le commencement et essayons dans un premier temps de comprendre la différence avec les terminaux alternatifs que nous connaissons déjà.

Des objets aux accessoires connectés

Les objets connectés sont des appareils électroniques qui peuvent envoyer et recevoir des données, les rendant capables d’interagir avec d’autres appareils ou systèmes. Cette description est tout à fait correcte, mais elle englobe des appareils et terminaux de toutes formes et natures (des smartphones aux thermostats connectés) correspondant à des usages et des contextes très différents.

Les objets connectés qui nous intéressent aujourd’hui sont plus spécifiques, car complémentaires d’appareils existants. Ainsi, les accessoires sont des éléments ajoutés à quelque chose d’autre dans le but de le compléter ou de l’améliorer. Les accessoires ne sont pas essentiels en soi, mais ils peuvent améliorer la fonctionnalité, l’esthétique, ou le confort de l’objet principal (ex : une capuche sur un blouson) ou de la personne qui les utilise dans un contexte spécifique (ex : un kit ains-libres quand on est au volant ou en train de faire du sport). C’est ce qui a fait le succès des montres connectées, le parfait accessoire complémentaire aux smartphones : 6 Types of Useful Smartwatch Interactions.

Les accessoires connectés les plus emblématiques de ces dernières années sont sans conteste les enceintes et oreillettes connectées. Force est de constater qu’elles rendent de fiers services… mais restent limitées. Ça c’était avant, car avec la déferlante ChatGPT, la donne a changé.

Capitalisant sur une décennie de retour d’expériences, Amazon est ainsi le premier fabricant à annoncer une mise à niveau majeure de sa gamme d’objets connectés, et de son célèbre assistant numérique : Amazon is set to supercharge Alexa with generative AI.

Il n’en fallait pas moins pour relancer la machine à innover.

Des accessoires connectés indissociables des IA génératives

Grâce à la miniaturisation des composants, aux progrès réalisés en matière de connectivité et bien évidemment d’intelligence artificielle, les fabricants peuvent maintenant concevoir une nouvelle génération d’accessoires connectés dotés d’une interface vocale enrichie grâce aux modèles génératifs.

Tous les accessoires connectés vont bientôt être dotés d’une interface naturelle pour pouvoir comprendre leur environnement et répondre aux besoins des utilisateurs. Ou plutôt : plus aucun accessoire connecté ne sera viable s’il n’offre pas la possibilité d’interagir avec une IA. C’est en tout cas le constat que l’on peut faire en analysant l’offre actuelle : oreillettes, montres, lunettes, caméras, badges, pendentifs… l’IA est devenue un pré-requis.

Pour le moment, les oreillettes et montres connectées sont la chasse gardée des leaders historiques du marché des smartphones (Apple, Google, Samsung), mais les anciens « nouveaux entrants » sont très ambitieux et proposent une offre complète beaucoup plus abordable : Xiaomi Takes on Tech Accessories With Watch S1 Pro and Buds 4 Pro Launch at MWC 2023.

Pour ce qui est des lunettes connectées, nous sommes sur un créneau encore balbutiant que se disputent Meta, Amazon et Snap avec respectivement les Ray-Ban, Echo Frames et Spectacles. En l’état, rien de très spectaculaire, car les fonctionnalités sont limitées, mais la valeur d’usage risque bien de décupler une fois que ces lunettes embarqueront de quoi interagir visuellement avec un modèle génératif, et c’est visiblement pour dans quelques mois (cf. Réalité mixte : Meta contre-attaque). Entre-temps, vous pouvez tester les lunettes connectées d’Amazon qui proposent une interface vocale tout à fait crédible.

L’inconnu reste bien évidemment les Google Glass, ou plutôt leur hypothétique troisième itération, mais ça ne semble pas être la priorité de Google qui monopolise toutes ses ressources pour éviter de se faire distancer par OpenAI ou Microsoft.

Outre oreillettes, montres et lunettes connectées qui faisaient déjà partie du paysage, nous commençons à voir émerger de nouveaux accessoires comme les pendentifs connectés, notamment celui de Rewind qui enregistre tout ce que vous dites pour la prospérité : Rewind Pendant is a wearable AI microphone that records and transcribes your conversations.

L’intérêt d’un tel accessoire n’est pas de pouvoir simplement enregistrer votre quotidien, mais bien de l’analyser : de retranscrire les conversations (pour en faire des résumés ou des rappels), d’historiser les contacts (reconnaissance vocale des interlocuteurs) ou les déplacements (signature sonore des lieux).

Dans le même genre, il y a également les caméras corporelles qui équipent les forces de l’ordre : elles peuvent filmer, mais également diffuser pour un stockage dans le cloud.

Là encore, l’important n’est pas l’accessoire en lui-même, mais l’IA qui lui est associée. En l’occurence, via des services spécialisés comme celui proposé par Truleo, une société d’analyse qui assure la traduction d’un flux vidéo en une série d’événements qui sont consignés dans un journal de bord numérique afin de documenter d’éventuelles infractions aux règles d’engagement.

Ce type de caméra corporelle associée à une IA se justifie dans le cadre des forces de l’ordre pour… améliorer le contact avec la population, mais il existe aussi des versions plus légères chez Motorola pour équiper les employés en charge de l’accueil et du service client, avec potentiellement une analyse ultérieure à des fins statistiques et d’historisation des interactions.

Vraisemblablement, un tel dispositif est destiné à améliorer le service client, du moins je l’espère, mais il semble disproportionné pour des circuits de distribution à faible marge (ex : alimentaire). En revanche, dans le luxe, pourquoi pas… du moment que ça ne met pas les clients mal à l’aise.

Tout ceci nous amène à parler de LA grande nouveauté de ce dernier trimestre : le badge connecté de Humane. Plus discret, mais également plus puissant, ce badge est doté de fonctions avancées de reconnaissance vocale et visuelle pour pouvoir assister le porteur dans son quotidien : Humane Launches Ai Pin, Marking A New Beginning for Personal AI Devices.

Si le produit est encore perfectible (Humane’s AI Pin seems to be forgetting what makes a good wearable), il a le mérite d’exister et de proposer en prime un mini-projecteur capable d’afficher des informations dans le creux de votre main et même d’interpréter des gestes subtils.

Je ne suis pas certain que ce badge connecté ait le potentiel pour devenir le nouvel iPhone, mais l’intention est bonne. Il y a ainsi toutes les chances pour que le AI Pin devienne la référence de facto des badges connectés.

Dans tous les cas de figure, gardez bien en tête que ces accessoires connectés sont les évolutions d’objets connectés déjà positionnés sur ces cas d’usage il y a quelques années. Croyez-le ou non, mais déjà en 2016 le patron de Google parlait de terminaux « AI First » : Du SoLoMo au VoCloAI.

Et l’année suivante, ils présentaient même leur premier accessoire connecté : une mini-caméra prévue pour être portée en permanence afin de documenter son quotidien : Google Clips is a new $249 smart camera that you can wear. C’était il y a presque 8 ans, mais la promesse était la même : The Google Clips camera puts AI behind the lens.

Les équipes de Google avaient-elles raison trop tôt en lançant le Clips ? Oui clairement, comme avec Wave, mais c’est une autre histoire…

Revenons à nos moutons (numériques), ou plutôt à nos accessoires connectés qui peuvent vous sembler bien superflus, mais qui préfigurent un véritable paradigme de l’informatique et des outils numériques : les interfaces conversationnelles (dont il est un peu question ici : AI Models in Software UI).

Déjà la cinquième génération d’interfaces informatiques

Saviez-vous que la première version de Windows avait été lancée il y a 38 ans (le 20 novembre 1985) ? À l’époque, les équipes de Microsoft ne se doutaient pas de la formidable épopée que ce système d’exploitation allait vivre, mais elles savaient qu’elles avaient accomplies un grand pas dans l’évolution de l’outil informatique en livrant une des premières interfaces graphiques grand public (bien que le Lisa d’Apple était sorti deux ans plus tôt, au début de l’année 1983).

Je ne vais pas vous refaire toute l’histoire, mais sachez que l’outil informatique est passé par différents stades de maturité :

  • Les premiers ordinateurs proposant une interface textuelle et des logiciels que l’on manipulait à l’aide de raccourcis clavier (il n’y avait pas de souris) ;
  • Les ordinateurs « modernes » proposant une interface graphique et des logiciels que l’on manipulait à la souris grâce à des menus et boutons ;
  • Les ordinateurs actuels permettant de se connecter à Internet pour accéder à des pages web et applications en ligne que l’on manipule avec des boutons, liens et formulaires ;
  • Les smartphones qui proposent une interface tactile et des applications mobiles que l’on manipule avec des barres d’actions ou de navigation ;
  • Les chatbots, dernière itération en date, qui proposent une interface conversationnelle qui est pilotée à l’aide de commandes naturelles (dictées oralement ou tapées à l’aide du clavier).

L’avènement des assistants numériques n’est pas seulement une cinquième étape dans l’évolution des outils informatiques, c’est un véritable changement de paradigme : un changement de perspective radical qui remet en question les fondements d’une discipline.

Jusqu’à présent, il fallait apprendre à se servir des ordinateurs (et smartphones) pour avoir accès à un ensemble de ressources dans le but de réaliser une tâche :

  • avec les ordinateurs, il faut analyser son besoin pour savoir quelle fonction de quel logiciel va pouvoir le couvrir (et le cas échéant, l’installer) ;
  • avec l’internet, il faut analyser son besoin pour savoir quel site ou service en ligne utiliser et s’y rendre (saisir une URL dans un navigateur) ;
  • avec les smartphones, il faut analyser son besoin pour savoir quelle application utiliser (et l’installer depuis une place de marché d’applications).

Avec le paradigme des assistants numériques, il suffit de lui dicter votre besoin pour qu’il trouve la solution (quelles ressources utiliser), voir qu’il l’anticipe (via des alertes et recommandations). ChatGPT et consorts peuvent ainsi dérouter les nouveaux utilisateurs , car il n’est plus question de cliquer sur les liens et menus pour accéder aux contenus ou de cliquer sur des boutons pour réaliser des actions, mais d’une unique boite de dialogue dans laquelle on tape des commandes textuelles en langage naturel, des « prompts » comme disent les jeunes sans trop savoir ce que c’est exactement (ce n’est pas l’endroit pour en débattre).

ChatGPT a-t-il amorcé une révolution informatique ? Non pas réellement, car le chatbot d’OpenAI n’est que l’héritier de services précurseurs comme Google Now qui proposait déjà ce paradigme d’assistant numérique pro-actif en 2013 : Google ambitionne-t-il de devenir notre système d’exploitation personnel ? Là encore, les équipes de Google étaient en avance de phase (c’est une constante).

Non, le grand public n’est pas prêt

Si mes sources sont exactes, il n’y a qu’une centaine de millions d’utilisateurs de ChatGPT. C’est beaucoup pour le créneau des chatbots, mais c’est très peu à l’échelle de la planète. La raison de ce relatif petit nombre d’utilisateurs est justement ce changement de paradigme. Passer des sites web aux applications mobiles n’était qu’un basculement dans les supports et formats. Avec les assistants, nous parlons de modalités d’interactions complètement différentes : des commandes en langage naturel interprétées et exécutées à la volée.

A realistic scene depicting a man sitting on his couch in his living room, engaging in conversation with a futuristic, cybernetic assistant (j’espère que personne ne se rendra compte qu’il n’a qu’un seul pied).

Encore une fois : manipuler un chatbot est extrêmement déroutant pour un utilisateur lambda sur un ordinateur (avec un grand écran et un clavier), ça l’est encore plus à travers un accessoire connecté ! Pour vous donner un ordre d’idée, c’est un peu comme d’essayer de se faire entendre dans une réunion téléphonique, sauf que vous parlez à un badge. 😕

Si je salue l’exploit technique réalisé par Humane avec la mise au point et la commercialisation du AI Pin, je doute fortement qu’il suscite l’adhésion du grand public ou même des professionnels. Mais ce n’est pas grave, car la boite de Pandore est maintenant ouverte : nous n’en sommes qu’au tout début d’une nouvelle phase exploratoire pour les terminaux numériques et plus particulièrement les accessoires connectés.

Ce qui est certain, c’est que des progrès significatifs devront être réalisés à la fois sur les modèles (capacités de compréhension et de raisonnement) et sur les interfaces (restitution / visualisation des réponses et manipulation) pour que ce segment ait une petite chance.

Peut-être que les masques de réalité mixte avec leur interface gestuelle vont nous permettre de progresser plus rapidement… Ceci fera l’objet d’un autre article.