Comment les interfaces vocales vont accélérer la transformation digitale

En premier, il y a eu Siri, puis Google Now, puis Alexa, puis Cortana… Aujourd’hui, les assistants personnels accessibles à travers une interface vocale sont rentrés dans le paysage numérique. Si les usages restent très basiques, l’adoption progresse petit à petit, tandis qu’Amazon et Google sont lancés dans une course contre la montre pour imposer leur écosystème vocal aux entreprises et annonceurs. À mesure que les assistants gagnent en sophistication, la sortie d’offres verticales centrées sur une industrie (ex : Alexa for Hospitality) va permettre aux GAFAM d’assoir définitivement leur domination sur les usages numériques. Ceux qui n’y sont pas préparés en feront les frais…

Nobody-robot

Un segment à très forte croissance dominé par Amazon et Google

Voilà presque 4 ans qu’Amazon a mis sur le marché son enceinte connectée et son assistant personnel Alexa. Une ancienneté qui permet à Amazon de rafler la mise sur le créneau des enceintes connectées, mais qui relance surtout Amazon dans la bataille du dernier mètre numérique, successivement dominé par Microsoft (Windows / IE), Apple (iPhone), puis Google (Android). Le problème d’Amazon est que la société américaine ne dispose ni d’un système d’exploitation, ni d’un navigateur web. Les interactions qu’ils avaient avec les internautes se faisaient donc forcément sur le terrain d’autrui (Microsoft, Apple ou Google). Avec Alexa, Amazon regagne sa souveraineté numérique et dispose maintenant d’un lien direct avec ses clients (Les assistants personnels sont les nouveaux navigateurs web, et les GAFAM en sont les maitres absolus).

Si les débuts de l’enceinte Home d’Amazon se sont faits dans la quasi-indifférence, la gamme s’est maintenant bien étoffée et représente une partie de l’avenir d’Amazon (Les GAFAM à la recherche de nouveaux leviers de croissance). Certes, les ventes d’enceintes connectées représentent un tout petit volume par rapport aux smartphones, mais ce segment est le point de départ d’une nouvelle ère des contenus et services en ligne. C’est surtout un palier majeur franchi dans la transition numérique du quotidien des consommateurs.

digital-assistants.jpg

Dans l’absolu, les assistants personnels ne sont pas si révolutionnaires, car ils offrent beaucoup moins de possibilités que les smartphones ou les ordinateurs. En revanche, ils représentent un tournant majeur dans l’histoire de l’informatique (Les GAFAM à la recherche du prochain paradigme numérique). Pour le moment, nous n’avons que très peu de recul sur l’impact réel de la généralisation de ces assistants personnels, mais dans 10 ans, nous nous rendrons compte qu’ils représentaient un changement encore plus radical que les smartphones. Il existe quantité d’articles et analyses sur ce sujet, mais je vous recommande particulièrement le dossier de la CNIL qui aborde les principaux enjeux de cette nouvelle génération d’outils : Assistants vocaux.

Pour ce qui est des chiffres, nous savons que le segment est dominé par Amazon, mais que Google fait une remontée spectaculaire : Amazon et Google pèsent plus de 70% du marché des enceintes connectées au 1er trimestre 2018. Un segment qui est loin d’être stabilisé avec le lancement officiel d’Alexa en France et les efforts considérables déployés par Google pour populariser son assistant.

Smart-speakers-market-2018.png

Vous noterez que Microsoft n’est même pas mentionné dans le tableau ci-dessus, malgré un assistant très performant et surtout très bien intégré aux produits « maison » : Microsoft Teams will integrate with Cortana, add transcription and translation features. De même, Apple semble loin derrière les deux leaders aussi bien en termes de volume de ventes (Apple shipped an estimated 600,000 HomePods in the first quarter of the year) que de fonctionnalités (Siri wants to automate your life with “Shortcuts”). Quant à Facebook, ils se sont officiellement retirés de la course en début d’année (Facebook is shutting down its standalone personal assistant).

Pour le moment, les enceintes connectées, et indirectement les assistants personnels, semblent tenir leurs promesses, avec des usages et une confiance qui s’installent petit à petit, comme en témoigne la récente étude State of Digitale  Lifestyles de Limelight.

Digital-assistant-tasks.jpg

Si le marché est dominé par Amazon et Google, cela n’empêche pas des nombreux projets concurrents de voir le jour, que se soit avec un focus sur la confidentialité (Snips AIR: a Private-by-Design, Open-Source, Decentralized Voice Assistant), la régionalisation (Sherpa, the Spanish personal assistant, launches an API for its predictive AI with Porsche as 1st customer) ou une approche centrée sur un produit (ex : Einstein de Salesforce, Sensei de Adobe ou Ava de Autodesk).

Google essaye de tuer le jeu avec Duplex, Mozilla de réinventer le navigateur web

Dévoilée lors de la grande conférence annuelle de Google, l’interface vocale de prise de RDV avait scotché tout le monde (Google Duplex: An AI System for Accomplishing Real-World Tasks Over the Phone). Les deux démonstrations présentées étaient tellement impressionnantes, que l’opinion publique s’est inquiétée des dérives potentielles, forçant les équipes Google à faire preuve de beaucoup plus de transparence pour bien expliquer le fonctionnement de son système (A closer look at Google Duplex) et cadrer les applications potentielles.

Visiblement, les préoccupations soulevées étaient justifiées, car la combinaison de l’assistant Google avec Duplex semble extrêmement puissante (Talking to Google Duplex: Google’s human-like phone AI feels revolutionary).

Nous y voyons donc plus clair dans le positionnement des GAFAM :

Ce tableau ne serait pas complet sans la fondation Mozilla qui compte bien ne pas se contenter du fauteuil passager avec d’une part une gigantesque base de données linguistique collaborative (Mozilla goes multilingual with open source Common Voice speech recognition datasets) ; et d’autre part, un projet de navigateur web vocal : Firefox makers working on voice-controlled web browser called Scout. Un projet très intéressant, mais dont nous manquons cruellement de détails…

Les assistants vocaux simplifient l’accès aux contenus et services numériques

Si la compétition est aussi acharnée sur le segment naissant des assistants personnels, c’est que les autres moyens d’accès aux contenus et services en ligne sont saturés (ordinateurs, smartphones…). L’objectif poursuivi avec les assistants personnels à interface vocale est double : capter le 5eme milliard d’utilisateurs (ceux qui n’ont pas les moyens de se payer un ordinateur ou un smartphone) et aider les utilisateurs actuels à perdre passer moins de temps devant leurs écrans : We Have Reached Peak Screen, Now Revolution Is in the Air.

Screen-time.jpg

Certes, l’intention est louable, mais ne vous laissez pas leurrer par le discours de Google ou Apple : ils veulent vous aider à passer moins de temps devant l’écran de votre smartphone pour diminuer la mainmise de Facebook sur les mobinautes (l’essentiel du temps passé sur un smartphone se faisant sur Facebook, Instagram, Messenger ou WhatsApp). Formulé autrement : puisque Facebook a gagné la bataille des yeux, Google et Apple essayent de gagner celle des oreilles. Idem pour Amazon qui dans l’histoire gagnerait en prime un lien direct avec ses clients.

C’est dans ce contexte que la firme de Seattle a présenté le mois dernier une déclinaison d’Alexa destinée à l’industrie hôtelière : Amazon launches an Alexa system for hotels. Baptisé Alexa for Hospitality, le programme cible les chaînes d’hôtels avec un ensemble de services vocaux génériques : commander un repas ou un taxi, contrôler la musique ou la température de la chambre, obtenir des informations sur les équipements de l’hôtel ou les choses à faire dans le quartier…

À terme, il serait même possible pour les clients d’un hôtel d’avoir accès à leur propre Alexa dans leur chambre en connectant leur compte Amazon à celui de la chaine d’hôtel. Un scénario particulièrement intéressant pour Amazon qui garderait un contact permanent avec ses clients, qu’ils soient chez eux ou en déplacement.

Cette déclinaison verticale d’Alexa pourrait potentiellement être rapidement étendue à d’autres industries :

  • la restauration, avec de la prise de commande et des services invoqués directement depuis votre table (il suffit d’équiper chaque table d’une petite enceinte) ;
  • la distribution, avec des services accessibles en tête de gondole ou dans les cabines d’essayage (ex : « Pouvez-vous m’apporter le même en rouge / en plus grand ?« ) ;
  • l’immobilier, avec de la prise / gestion de RDV automatisée ainsi qu’un certain nombre de questions qui pourraient être traitées de façon automatique lors ou en amont de la visite (ex : « Quelle est la surface en loi Carrez ? À combien s’élèvent les impôts locaux ? Quel était l’ordre du jour de la dernière AG ? À quelle distance se situe l’école maternelle / la boulangerie ?…) ;
  • l’éducation ou l’apprentissage des langues étrangères, avec des assistants pour aider les élèves à apprendre et réciter leurs leçons ou travailler leur accent)…

Quand on y réfléchit bien, les assistants vocaux concernent de nombreux domaines d’activité, tous ceux où il y a de nombreuses interactions basiques qui peuvent être automatisées. Dans l’absolu, nous ne parlons même plus d’interactions « basiques », car les GAFAM disposent de ressources techniques et financières colossales pour entrainer les IA et être en capacité à traiter des demandes de plus en plus complexes.

La première industrie visée est logiquement celle du télé-marketing où un bon nombre de télé-conseillers pourraient être remplacés par des machines : Google’s Duplex AI could kill the call center. Nous sommes tous d’accord pour dire que cette perspective est terrifiante (car les machines travaillent 24*7*365), mais cette éventualité permettait aussi de pallier à des défaillances humaines comme celle de cet opérateur du SAMU qui a conduit au décès de Naomi il y a deux mois.

Certes, c’est un exemple isolé, mais nous pourrions à partir de là envisager un ensemble d’applications dans le milieu médical ou du service à la personne, notamment l’utilisation d’assistants personnels dans les maisons de retraite pour lutter contre la solitude des pensionnaires ou pour aider ceux qui souffrent de la maladie d’Alzheimer (leur rappeler la date du jour, de prendre leurs cachets, d’appeler leur famille…). Ce cas d’usage soulève des questions qui ne sont pas d’ordre technique, mais plutôt psychologique ou émotionnel : si personne n’a envie de confier ses proches à des IA, les assistants personnels pourraient améliorer le quotidien de personnes âgées en soulageant le personnel des maisons de retraite.

Encore une fois, le sujet est complexe et je ne suis pas là pour lancer une polémique, même si j’ai mon avis sur la question. En revanche, ce cas d’usage précis nous montre que les assistants personnels à interface vocale permettent de grandement simplifier l’accès aux contenus et services en ligne, même dans des lieux auxquels nous n’avions pas pensé en première instance.

Conclusion : les assistants personnels numériques sont un facteur primordial de la transition numérique. Vous avez tout à fait le droit de pratiquer la politique de l’autruche en prétendant qu’ils ne sont pas au point ou que « les gens, ils préfèrent parler à une vraie personne« , mais tôt ou tard, vous vous ferez rattraper par l’accélération digitale, car les moyens considérables mobilisés par les GAFAM vont précipiter l’évolution des usages et des exigences des consommateurs.

Le meilleur conseil que je puisse vous donner est le suivant : profitez des vacances pour tester le ou les assistants personnels sur votre smartphone et constater par vous-même les progrès réalisés, ainsi que le potentiel disruptif des interfaces vocales dans un contexte contraignant (ex : au volant de votre voiture, ou au guidon de votre moto).

12 commentaires sur “Comment les interfaces vocales vont accélérer la transformation digitale

  1. Enfin ca vient… manque plus que les salles holographiques et nous voici dans un épisode de Star Trek.. le pied quoi !
    Combien de fois je demande à Google d’éteindre ou allumer la lumière ! C’est mon esclave à la maison…
    C’est aussi une nounou pour mes enfants.. ‘Si tu sais pas quoi faire pose des questions à google ou demande lui une blague  » !
    C’est aussi mon chauffeur : « OK Tesla emmène moi à mon RDV du Vendredi ;)  »
    Mais c’est limité dans d’autres domaine : « OK Google comment fait on un clafoutis? » « OK Google comment fait on un Mojito? ».. car là sans explication visuel.. ca le fait pas du tout..

    Après que la technologies remplace l’être humain comme dans la prise de RDV ou les commerciaux ou le service après vente, c’est tout à fait normal… n’avez vous pas remarqué que depuis quelques années ces métiers n’ont aucune valeur ajoutée… les personnes ne font que suivre des processus définis, ils ne peuvent pas en sortir.. ce qui fait qu’ils sont tout à fait remplaçable.. on appel ca « l’industrialisation » tout doit être mesurable.. tout doit être transférable (en Inde par exemple)… Ex: ma portière de voiture avait besoin d’un coup de vis… j’ai appelé le garage qui me dit (un employé) qu’il faut prendre RDV.. OK.. une fois chez le garage.. « mais c’était pas la peine de prendre un RDV ! ca bloque 30min pour rien… fallait juste passer… » nous avons un bel exemple de suivi d’un processus en mettant sa cervelle de coté… alors oui dans ce cas.. l’ordinateur peut faire mieux !!

    bref… la techno avance.. l’humain stagne..
    et moi je vais demander à google : « OK google qui est le plus beau ? » comme ca ma journée va bien commencer ;)

    1. Il y a effectivement des questions à se poser : avons-nous vraiment besoin d’une interface vocale pour allumer la lumière ? Je ne suis pas sûr. Avons-nous besoin d’une interface vocale pour nous dicter une recette de cuisine ? Quand on a les mains dans la pâte, oui c’est très utile.

      Pour ce qui est de l’automatisation, la responsabilité est très clairement du côté de l’humain, celui qui a conçu toutes ces fameuses procédures (qui normalisent le travail et parfois font perdre du temps) et toutes celles et ceux qui les ont appliqués pendant des années sans se poser de questions (« vous savez chez nous, c’est très compliqué de changer les procédures… »). Les premières victimes de l’automatisation ne seront pas les emplois manuels (plombier ou agent d’entretien), mais plutôt les employés de bureau lambda.

    2. “C’est mon esclave à la maison … C’est aussi une nounou pour mes enfants”

      En réaction à votre commentaire, je vous invite à lire l’article « Bossy generation » : votre assistant vocal va-t-il transformer votre enfant en « connard »?
      http://www.ladn.eu/media-mutants/bossy-generation-votre-assistant-vocal-va-t-il-transformer-votre-enfant-en-connard/

      Je partage l’analyse de Fred Cavazza sur l’évolution des assistants vocaux mais je m’interroge toujours sur l’impact qu’ont mes échanges avec les assistants vocaux sur mes enfants, en bas âge. Quand on appelle les grands-parents, il leur arrive encore de montrer leurs jouets au téléphone, croyant le montrer à leurs grands-parents. Ils n’ont pas conscience de la technologie, et les voix féminines et réalistes des assistants vocaux n’ont rien des voix de robots dans les films des années 80.

      1. Pourquoi introduire la notion d’esclavagisme ? Est-ce que l’on se soucie de la condition d’un marteau ? Un assistant personnel, une IA ou un marteau sont des outils inventés et fabriqués par l’homme, ni plus ni moins.

        Pour ce qui est de la Bossy Generation, je crois savoir qu’il existe un mode « politesse » dans Google Home pour n’exécuter les demandes des enfants que s’ils disent « STP ». C’est déjà un bon début d’apprentissage de la politesse, non ?

      2. Est-ce qu’on aura une révolution de la condition des robots ?

        Est-ce qu’on aura un Président qui nous montrera le bon chemin de la parole : « Celles et Ceux et nos amis les robots…. »

  2. Bonjour,
    un point reste, à ma connaissance, pas ou peu abordé, et ce presque étrangement : la publicité.
    (je ne suis pas (encore?) utilisateur d’interfaces vocales, ni d’assistants personnels-enceintes connectées)
    Ces acteurs vont-ils l’intégrer dans l’usage?
    d’un point de vue UX ce serait détestable (et je crois qu’il y a qques contraintes légales obligeant à bien préciser qui fait la publicité, …).
    Avez-vous eu des échanges sur ce sujet avec des marques ou les GAFAM ?

    1. La réponse est simple : pas de publicité. Autant Google Search sur le web est un intermédiaire facultatif entre les utilisateurs et les contenus / services en ligne, autant Google Assistant est un intermédiaire obligatoire : il n’y a pas d’autres moyens pour accéder aux contenus / services vocaux. Ils peuvent donc imposer leurs conditions. Pour le moment, tout est gratuit, mais je pense que dans un futur (très) proche, ils conseillerons fortement d’héberger les contenus et services vocaux sur le cloud de Google, officiellement pour « améliorer l’expérience des utilisateurs », officieusement pour capter une commission. Idem pour Apple. Pour Amazon c’est différent, car c’est également une boutique en ligne, donc ils peuvent se rémunérer sur les achats réalisés à travers l’interface vocale.

  3. Pour l’instant je trouve les interfaces vocales toujours aussi casse-pied qu’avant alors qu’elles se sont énormément améliorées. Je vois l’intérêt que cela peut avoir pour tout ce qui est de l’ordre de la compétence langagière (comprendre, chercher de l’information, aide à la décision…) mais je reste pour l’instant convaincu que pour tout ce qui est de l’ordre et de la demande d’exécution, une interface tactile est bien plus efficace : je préfèrerai toujours (je crois) prendre un marteau plutôt que de lui décrire ce que j’attends de lui, et pour la restauration je préfère une tablette plutôt qu’une enceinte (je m’imagine très bien me mettre à lui crier dessus et me mettre à la frapper).
    Évidemment quand on a les mains prises, l’interface vocale est utile, mais à choisir je préfèrerais des bras supplémentaires.
    Suis-je le seul à m’énerver contre les interfaces vocales ?
    De toutes façons la véritable transformation digitale, c’est celle qui fait intervenir les doigts… :)

      1. C’est ça ! le holodeck de Star Trek ;)

        Pas mal aussi pour les poupée gonflabe high tech.. on a les mains occupées..

  4. « puisque Facebook a gagné la bataille des yeux, Google et Apple essayent de gagner celle des oreilles. »
    La bataille pour les utilisateurs des interfaces vocaux va inéluctablement créer une autre batailles, celle pour la conquête des annonceurs et des budgets marketing.
    En effet, il serait intéressant de voir comment Google et Amazon vont monetiser ces nouvelles audiences et cette nouvelle portée.
    J’avais écrit un article là-dessus en 2016, mais c’est toujours le cas : https://www.adviso.ca/blog/tech/dis-siri-comment-le-marketing-de-recherche-peut-il-sadapter-a-la-recherche-vocale/
    Pour le moment, il est possible de cibler une recherche textuelle faite sur Google ou Amazon, mais pas encore via leur outil publicitaire (Adwords – ou plutôt Google Ads – et AWS – Amazon Web Service). Mais quand cela sera possible, cela va sans doute changer considérablement la donne.

    1. Quand on domine un segment technologique, il y a toujours moyen de monétiser l’audience.. pas forcément avec de la pub.

      Ceci dit poser la question de la monétisation c’est poser en fait la bonne et unique question.. et de la réponse des GAFAM à cette question en découlera notre futur technologique.

Laisser un commentaire

Entrez vos coordonnées ci-dessous ou cliquez sur une icône pour vous connecter:

Logo WordPress.com

Vous commentez à l'aide de votre compte WordPress.com. Déconnexion /  Changer )

Photo Google+

Vous commentez à l'aide de votre compte Google+. Déconnexion /  Changer )

Image Twitter

Vous commentez à l'aide de votre compte Twitter. Déconnexion /  Changer )

Photo Facebook

Vous commentez à l'aide de votre compte Facebook. Déconnexion /  Changer )

w

Connexion à %s