Alors que le marché des enceintes connectées arrive bientôt à saturation, celui des assistants personnels ne fait que prendre son envol (les deux sont liés, mais il y a une distinction à faire). Les GAFAM et BATH sont en pleine course à l’innovation pour tenter de dominer ce marché à très fort potentiel, ou de ne pas accumuler trop de retard. Le problème est que les annonceurs commencent à peine à prendre le virage du mobile, pas étonnant qu’ils se montrent sceptiques vis-à-vis de ces nouveaux terminaux. Pourtant, les usages et technologies divergent réellement des smartphones et nécessitent une prise en compte de nouveaux contextes : les micro-moments vocaux.

Des assistants personnels toujours plus sophistiqués

Je ne sais pas si vous avez remarqué, mais les géants du numérique mettent les bouchées doubles pour enrichir leur assistant personnel avec de nouvelles fonctionnalités :

Non seulement les assistants sont toujours plus performants, mais en plus, il y a de nouveaux entrants tous les mois :

Si les acteurs occidentaux sont déjà connus depuis longtemps (Amazon avec Alexa, Google avec Assistant, Apple avec Siri, Microsoft avec Cortana) la bataille s’est très clairement déplacée vers la Chine où les géants du numérique se livrent à une course à l’armement pour ne pas se faire distancer : The Rise Of Chinese Voice Assistants And The Race To Commoditize Smart Speakers. En lice : Baidu, Alibaba, Tencent, Xaomi, Huawei…

S »il apparait comme évident que nous allons très rapidement atteindre le point de saturation pour le segment des enceintes connectées, en revanche, ce ne sera pas le cas pour les assistants personnels qui vont continuer de s’incruster dans tous les appareils de notre quotidien : TV, électroménager… (cf. Alexa now works with 20,000 devices).

Comme ce fut le cas pour les smartphones, la difficulté du point de vue des annonceurs ne viendra pas d’un marché trop faible en volume, mais d’une mauvaise compréhension des usages et attentes.

Des usages restreints, mais exclusifs aux « moments vocaux »

Comme précisé dans de précédents articles (Usages et enjeux des interfaces vocales, Les interfaces naturelles sont l’avenir du web), les assistants personnels et leurs interfaces vocales amènent des usages qui sont en rupture avec ce que l’on connait des supports numériques. Tout comme les smartphones ne sont pas « que » de petits ordinateurs sans clavier, les enceintes connectées ne sont pas « que » des tablettes sans écran : Les interfaces naturelles nous préparent à l’ère post-smartphone.

Nous commençons ainsi à avoir un bon retour d’expérience sur les usages des enceintes connectées, et les usages actuels ont de quoi rendre les annonceurs sceptiques : sans surprise, les utilisateurs préfèrent utiliser leur smartphone ou ordinateur pour les tâches complexes ou impliquantes : Surprise, no one buys things via Alexa. Dans la mesure où les utilisateurs se cantonnent aux usages les plus simples, ceux qui sont nativement pris en charge par l’assistant (questions de culture générale, météo, gestion de la musique, création d’une alarme ou d’un minutage, allumer / éteindre la lumière…), le nombre d’interactions potentielles entre une marque et un consommateur à travers une interface vocale est très réduit : Voice Marketing Tactics: There’s Only 100k Searches a Month Up For Grabs Anyway.

Des interactions très limitées qui proposent un très bon rapport effort / résultat. Parfait pour ceux qui ont la flemme de sortir leur smartphone et abandonnent à la moindre difficulté (en gros, les ados).

Cette interprétation rapide des usages actuels pourrait vous faire penser que les interfaces vocales nous rendent plus fainéants, mais ça serait passer à côté de nombreuses opportunités.

Des contenus et services en ligne inclusifs, parfaitement adaptés à la silver economy

À une époque pas si éloignée, l’accessibilité était un sujet de première importance. Mais depuis, le sujet est bizarrement tombé aux oubliettes (ne me demandez pas pourquoi). Pourtant, les personnes en situation de handicap ne se sont pas volatilisées. Grâce aux interfaces vocales, elles ont un moyen simple et efficace de pouvoir accéder à des contenus et exploiter des services en ligne. Parfait pour les non-voyants, encore mieux pour les analphabètes ou ceux qui n’ont pas accès à l’éducation, par exemple dans les pays émergents.

De même, les enceintes connectées se révèlent redoutablement efficaces pour les personnes âgées qui n’ont plus le courage d’apprendre à se servir d’un smartphone (ou d’un ordinateur) et qui s’en sont d’ailleurs passé toute leur vie. Mais ce n’est pas tout, car ces enceintes sont aussi un très bon moyen pour garder le contact (appels au quotidien) ou faire de l’assistance à distance : l’enceinte peut vérifier qu’une personne âgée est active en fonction des bruits qu’elle fait dans sa maison, elle peut aussi appeler les secours si elle détecte un bruit de chute.

Avec le vieillissement de la population, vous conviendrez qu’il y a un gigantesque marché potentiel, et pas que pour ces deux cibles.

Des micro-moments mobiles aux micro-moments vocaux

En 2014, Google a lancé l’idée des micro-moments, ces multiples courtes plages dans la journée où les internautes préfèrent utiliser leur smartphone que leur ordinateur (I-want-to-know, I-want-to-go, I want-to-do, I want-to-buy). L’idée étant que le smartphone apporte dans ces contextes précis une réponse rapide comblant des besoins ponctuels.

Nous pouvons faire un parallèle avec les assistants personnels : dans certains contextes, les utilisateurs préfèrent utiliser une interface vocale, car c’est plus simple que de chercher son smartphone ou de s’installer devant son ordinateur. C’est ce que l’on pourrait appeler les micro-moments vocaux : quand vous faites la cuisine, quand vous bricolez, quand vous êtes affalé dans votre canapé… bref, tous les moments où vous ne pouvez pas attraper votre smartphone (parce que vous avez les mains occupées) ou que cela vous demande un effort (ex : pour le retrouver). Dans ces moments bien précis, effectivement, les enceintes connectées ou autres objets du quotidien équipés d’interfaces vocales peuvent être très utiles (ex : télécommande).

Mais n’allez pas penser que la principale motivation pour exploiter les interfaces vocales est celle de la recherche du moindre effort. Il y a ainsi des contextes où vous ne pouvez pas ou n’avez pas le droit d’utiliser un smartphone, par exemple en voiture ou lorsque vous avez un casque de réalité virtuelle devant les yeux. Certes, les utilisateurs de casques de VR ne représentent pas une grosse cible, en revanche, les conducteurs sont une clientèle captive tout à fait intéressante, d’autant plus qu’il ne s’agit pas d’usages concurrents, mais complémentaires : de toute façon, vous n’aviez pas accès à cette cible à ces moments de la journée (les trajets en voiture), sauf grâce à des pubs à la radio ou à de l’affichage.

Par le biais des micro-moments vocaux, les assistants personnels offrent donc de très belles opportunités pour vos contenus, services ou offres. En revanche, ne rêvez pas, ça ne sera pas aussi simple qu’avec des bannières ou des mots-clés sponsorisés.

No pain, no gain

Si pour des tâches simples, les interfaces vocales demandent moins d’efforts que la manipulation d’un smartphone ou d’un ordinateur, elles ne rendent néanmoins pas les mêmes services. Ainsi, les navigateurs nous donnent accès à des contenus et services en ligne et nous permettent de publier et partager tout un tas de choses, à partir du moment où l’on sait les exploiter. À contrario, les interfaces vocales ne demandent quasiment pas d’efforts, mais elles n’offrent que des interactions très limitées : résultats de recherche uniques, difficultés à se faire comprendre pour des requêtes complexes, impossibilité de manipuler des données (ex : filtrer ou trier une liste)…

Cette restriction dans les interactions est parfaitement illustrée par cette nouvelle fonctionnalité de l’assistant Google qui filtre à votre place les actualités : Google Assistant’s latest feature delivers just the ‘good news’.

Je ne doute pas un seul instant que cette fonctionnalité a été conçue avec les meilleures intentions du monde, en revanche, elle pourrait être utilisée à d’autres fins. Par exemple, un assistant ne pourrait vous délivrer que des informations et actualités réjouissantes pour ne pas gâcher votre humeur et vous maintenir dans un état où vous seriez plus réceptif aux offres promotionnelles. Le phénomène de bubble filters rencontré sur les médias sociaux pourrait ainsi se propager aux assistants personnels : ils nous isoleraient de la réalité pour mieux nous faire consommer, ou du moins pour nous rendre plus disponibles (attractifs) aux yeux des annonceurs.

Suis-je paranoïaque ? Certainement, mais comme nous n’avons pas accès aux algorithmes qui filtrent et priorisent les actualités, nous ne pourrons jamais vérifier… Est-ce un réel danger pour l’humanité ? Non, pas pour le moment, car les usages sont faibles. Mais la situation pourrait rapidement changer : d’après une étude d’Adobe, la moitié des foyers US devraient être équipés d’ici à la fin de l’année, dont plus des 3/4 les utilisent au moins une fois par jour (32% of U.S. consumers now own a smart speaker, up from 28% at start of year).

Au rythme où vont les choses, les utilisateurs vont très rapidement prendre des habitudes, surtout si les assistants vocaux se généralisent dans les voitures ou sur les télécommandes de nos box et TV. Des habitudes qui vont immanquablement se transformer en dépendance, comme ça a été le cas avec les smartphones (Mobile Dépendance : 38% d’accros). Avec un léger effort d’imagination, nous pourrions même voir des cas de nomophobie (« no mobile-phone phobia« ) évoluer en novoassphobie (« no vocal assistant phobia« ).

Bon OK, je veux avouer être ultra-optimiste sur ce coup-là. Il n’empêche que la réflexion sur les interfaces vocales et plus généralement sur les assistants digitaux n’est pas dénué de sens dans la mesure où leur installation durable dans les habitudes des consommateurs ne va faire qu’augmenter la position dominante des GAFAM. Ne vous leurrez pas : il y aura un prix à payer et ce sont Google, Amazon & cie qui en fixeront le montant (Les assistants personnels sont les nouveaux navigateurs web, et les GAFAM en sont les maitres absolus). Je ne parle pas ici d’un coût à l’utilisation, mais d’un prix beaucoup plus insidieux : le dictat des algorithmes pour les utilisateurs finaux (qui ne décideront plus réellement des informations ou services auxquels ils accèderont) et une prime à la visibilité pour les annonceurs et éditeurs.

Les assistants digitaux seront des app stores / plateformes bien plus complexes à contourner que celles que vous subissez déjà. À vous de décider si vous en serez partiellement ou complètement dépendant.