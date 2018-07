En premier, il y a eu Siri, puis Google Now, puis Alexa, puis Cortana… Aujourd’hui, les assistants personnels accessibles à travers une interface vocale sont rentrés dans le paysage numérique. Si les usages restent très basiques, l’adoption progresse petit à petit, tandis qu’Amazon et Google sont lancés dans une course contre la montre pour imposer leur écosystème vocal aux entreprises et annonceurs. À mesure que les assistants gagnent en sophistication, la sortie d’offres verticales centrées sur une industrie (ex : Alexa for Hospitality) va permettre aux GAFAM d’assoir définitivement leur domination sur les usages numériques. Ceux qui n’y sont pas préparés en feront les frais…

Un segment à très forte croissance dominé par Amazon et Google

Voilà presque 4 ans qu’Amazon a mis sur le marché son enceinte connectée et son assistant personnel Alexa. Une ancienneté qui permet à Amazon de rafler la mise sur le créneau des enceintes connectées, mais qui relance surtout Amazon dans la bataille du dernier mètre numérique, successivement dominé par Microsoft (Windows / IE), Apple (iPhone), puis Google (Android). Le problème d’Amazon est que la société américaine ne dispose ni d’un système d’exploitation, ni d’un navigateur web. Les interactions qu’ils avaient avec les internautes se faisaient donc forcément sur le terrain d’autrui (Microsoft, Apple ou Google). Avec Alexa, Amazon regagne sa souveraineté numérique et dispose maintenant d’un lien direct avec ses clients (Les assistants personnels sont les nouveaux navigateurs web, et les GAFAM en sont les maitres absolus).

Si les débuts de l’enceinte Home d’Amazon se sont faits dans la quasi-indifférence, la gamme s’est maintenant bien étoffée et représente une partie de l’avenir d’Amazon (Les GAFAM à la recherche de nouveaux leviers de croissance). Certes, les ventes d’enceintes connectées représentent un tout petit volume par rapport aux smartphones, mais ce segment est le point de départ d’une nouvelle ère des contenus et services en ligne. C’est surtout un palier majeur franchi dans la transition numérique du quotidien des consommateurs.

Dans l’absolu, les assistants personnels ne sont pas si révolutionnaires, car ils offrent beaucoup moins de possibilités que les smartphones ou les ordinateurs. En revanche, ils représentent un tournant majeur dans l’histoire de l’informatique (Les GAFAM à la recherche du prochain paradigme numérique). Pour le moment, nous n’avons que très peu de recul sur l’impact réel de la généralisation de ces assistants personnels, mais dans 10 ans, nous nous rendrons compte qu’ils représentaient un changement encore plus radical que les smartphones. Il existe quantité d’articles et analyses sur ce sujet, mais je vous recommande particulièrement le dossier de la CNIL qui aborde les principaux enjeux de cette nouvelle génération d’outils : Assistants vocaux.

Pour ce qui est des chiffres, nous savons que le segment est dominé par Amazon, mais que Google fait une remontée spectaculaire : Amazon et Google pèsent plus de 70% du marché des enceintes connectées au 1er trimestre 2018. Un segment qui est loin d’être stabilisé avec le lancement officiel d’Alexa en France et les efforts considérables déployés par Google pour populariser son assistant.

Vous noterez que Microsoft n’est même pas mentionné dans le tableau ci-dessus, malgré un assistant très performant et surtout très bien intégré aux produits « maison » : Microsoft Teams will integrate with Cortana, add transcription and translation features. De même, Apple semble loin derrière les deux leaders aussi bien en termes de volume de ventes (Apple shipped an estimated 600,000 HomePods in the first quarter of the year) que de fonctionnalités (Siri wants to automate your life with “Shortcuts”). Quant à Facebook, ils se sont officiellement retirés de la course en début d’année (Facebook is shutting down its standalone personal assistant).

Pour le moment, les enceintes connectées, et indirectement les assistants personnels, semblent tenir leurs promesses, avec des usages et une confiance qui s’installent petit à petit, comme en témoigne la récente étude State of Digitale Lifestyles de Limelight.

Si le marché est dominé par Amazon et Google, cela n’empêche pas des nombreux projets concurrents de voir le jour, que se soit avec un focus sur la confidentialité (Snips AIR: a Private-by-Design, Open-Source, Decentralized Voice Assistant), la régionalisation (Sherpa, the Spanish personal assistant, launches an API for its predictive AI with Porsche as 1st customer) ou une approche centrée sur un produit (ex : Einstein de Salesforce, Sensei de Adobe ou Ava de Autodesk).

Google essaye de tuer le jeu avec Duplex, Mozilla de réinventer le navigateur web

Dévoilée lors de la grande conférence annuelle de Google, l’interface vocale de prise de RDV avait scotché tout le monde (Google Duplex: An AI System for Accomplishing Real-World Tasks Over the Phone). Les deux démonstrations présentées étaient tellement impressionnantes, que l’opinion publique s’est inquiétée des dérives potentielles, forçant les équipes Google à faire preuve de beaucoup plus de transparence pour bien expliquer le fonctionnement de son système (A closer look at Google Duplex) et cadrer les applications potentielles.

Visiblement, les préoccupations soulevées étaient justifiées, car la combinaison de l’assistant Google avec Duplex semble extrêmement puissante (Talking to Google Duplex: Google’s human-like phone AI feels revolutionary).

Nous y voyons donc plus clair dans le positionnement des GAFAM :

Google essaye de se différencier avec un assistant toujours plus sophistiqué (Google Assistant’s ‘Continued Conversation’ feature is now live) ;

Apple préfère rester modeste et fait de Siri un argument de fidélisation plutôt que de conquête ;

Facebook se retire de la course pour éviter l’enlisement (Facebook said to postpone smart speaker reveal as data scandal continues);

Amazon essaye d’inonder le marché avec des objets connectés low cost (ex : Echo Dot) pour toucher un maximum de ses clients ;

Microsoft mise sur l’intégration avec le reste de son offre (Office, Outlook…).

Ce tableau ne serait pas complet sans la fondation Mozilla qui compte bien ne pas se contenter du fauteuil passager avec d’une part une gigantesque base de données linguistique collaborative (Mozilla goes multilingual with open source Common Voice speech recognition datasets) ; et d’autre part, un projet de navigateur web vocal : Firefox makers working on voice-controlled web browser called Scout. Un projet très intéressant, mais dont nous manquons cruellement de détails…

Les assistants vocaux simplifient l’accès aux contenus et services numériques

Si la compétition est aussi acharnée sur le segment naissant des assistants personnels, c’est que les autres moyens d’accès aux contenus et services en ligne sont saturés (ordinateurs, smartphones…). L’objectif poursuivi avec les assistants personnels à interface vocale est double : capter le 5eme milliard d’utilisateurs (ceux qui n’ont pas les moyens de se payer un ordinateur ou un smartphone) et aider les utilisateurs actuels à perdre passer moins de temps devant leurs écrans : We Have Reached Peak Screen, Now Revolution Is in the Air.

Certes, l’intention est louable, mais ne vous laissez pas leurrer par le discours de Google ou Apple : ils veulent vous aider à passer moins de temps devant l’écran de votre smartphone pour diminuer la mainmise de Facebook sur les mobinautes (l’essentiel du temps passé sur un smartphone se faisant sur Facebook, Instagram, Messenger ou WhatsApp). Formulé autrement : puisque Facebook a gagné la bataille des yeux, Google et Apple essayent de gagner celle des oreilles. Idem pour Amazon qui dans l’histoire gagnerait en prime un lien direct avec ses clients.

C’est dans ce contexte que la firme de Seattle a présenté le mois dernier une déclinaison d’Alexa destinée à l’industrie hôtelière : Amazon launches an Alexa system for hotels. Baptisé Alexa for Hospitality, le programme cible les chaînes d’hôtels avec un ensemble de services vocaux génériques : commander un repas ou un taxi, contrôler la musique ou la température de la chambre, obtenir des informations sur les équipements de l’hôtel ou les choses à faire dans le quartier…

À terme, il serait même possible pour les clients d’un hôtel d’avoir accès à leur propre Alexa dans leur chambre en connectant leur compte Amazon à celui de la chaine d’hôtel. Un scénario particulièrement intéressant pour Amazon qui garderait un contact permanent avec ses clients, qu’ils soient chez eux ou en déplacement.

Cette déclinaison verticale d’Alexa pourrait potentiellement être rapidement étendue à d’autres industries :

la restauration , avec de la prise de commande et des services invoqués directement depuis votre table (il suffit d’équiper chaque table d’une petite enceinte) ;

, avec de la prise de commande et des services invoqués directement depuis votre table (il suffit d’équiper chaque table d’une petite enceinte) ; la distribution , avec des services accessibles en tête de gondole ou dans les cabines d’essayage (ex : « Pouvez-vous m’apporter le même en rouge / en plus grand ?« ) ;

, avec des services accessibles en tête de gondole ou dans les cabines d’essayage (ex : « Pouvez-vous m’apporter le même en rouge / en plus grand ?« ) ; l’immobilier , avec de la prise / gestion de RDV automatisée ainsi qu’un certain nombre de questions qui pourraient être traitées de façon automatique lors ou en amont de la visite (ex : « Quelle est la surface en loi Carrez ? À combien s’élèvent les impôts locaux ? Quel était l’ordre du jour de la dernière AG ? À quelle distance se situe l’école maternelle / la boulangerie ?…) ;

, avec de la prise / gestion de RDV automatisée ainsi qu’un certain nombre de questions qui pourraient être traitées de façon automatique lors ou en amont de la visite (ex : « Quelle est la surface en loi Carrez ? À combien s’élèvent les impôts locaux ? Quel était l’ordre du jour de la dernière AG ? À quelle distance se situe l’école maternelle / la boulangerie ?…) ; l’éducation ou l’apprentissage des langues étrangères, avec des assistants pour aider les élèves à apprendre et réciter leurs leçons ou travailler leur accent)…

Quand on y réfléchit bien, les assistants vocaux concernent de nombreux domaines d’activité, tous ceux où il y a de nombreuses interactions basiques qui peuvent être automatisées. Dans l’absolu, nous ne parlons même plus d’interactions « basiques », car les GAFAM disposent de ressources techniques et financières colossales pour entrainer les IA et être en capacité à traiter des demandes de plus en plus complexes.

La première industrie visée est logiquement celle du télé-marketing où un bon nombre de télé-conseillers pourraient être remplacés par des machines : Google’s Duplex AI could kill the call center. Nous sommes tous d’accord pour dire que cette perspective est terrifiante (car les machines travaillent 24*7*365), mais cette éventualité permettait aussi de pallier à des défaillances humaines comme celle de cet opérateur du SAMU qui a conduit au décès de Naomi il y a deux mois.

Certes, c’est un exemple isolé, mais nous pourrions à partir de là envisager un ensemble d’applications dans le milieu médical ou du service à la personne, notamment l’utilisation d’assistants personnels dans les maisons de retraite pour lutter contre la solitude des pensionnaires ou pour aider ceux qui souffrent de la maladie d’Alzheimer (leur rappeler la date du jour, de prendre leurs cachets, d’appeler leur famille…). Ce cas d’usage soulève des questions qui ne sont pas d’ordre technique, mais plutôt psychologique ou émotionnel : si personne n’a envie de confier ses proches à des IA, les assistants personnels pourraient améliorer le quotidien de personnes âgées en soulageant le personnel des maisons de retraite.

Encore une fois, le sujet est complexe et je ne suis pas là pour lancer une polémique, même si j’ai mon avis sur la question. En revanche, ce cas d’usage précis nous montre que les assistants personnels à interface vocale permettent de grandement simplifier l’accès aux contenus et services en ligne, même dans des lieux auxquels nous n’avions pas pensé en première instance.

Conclusion : les assistants personnels numériques sont un facteur primordial de la transition numérique. Vous avez tout à fait le droit de pratiquer la politique de l’autruche en prétendant qu’ils ne sont pas au point ou que « les gens, ils préfèrent parler à une vraie personne« , mais tôt ou tard, vous vous ferez rattraper par l’accélération digitale, car les moyens considérables mobilisés par les GAFAM vont précipiter l’évolution des usages et des exigences des consommateurs.

Le meilleur conseil que je puisse vous donner est le suivant : profitez des vacances pour tester le ou les assistants personnels sur votre smartphone et constater par vous-même les progrès réalisés, ainsi que le potentiel disruptif des interfaces vocales dans un contexte contraignant (ex : au volant de votre voiture, ou au guidon de votre moto).