À quoi va ressembler l’ère post-smartphone ?

J’ai vu passer la semaine dernière une donnée intéressante : Alexa, l’assistant personnel d’Amazon qui équipe ses enceintes connectées, pourrait générer d’ici à 4 ans plus de 10 MM$ : Amazon’s Echo and Alexa could add $11 billion in revenue by 2020. Un chiffre complètement hallucinant pour une catégorie qui vient tout juste d’être créée. Et pourtant… Amazon a toutes les cartes en main pour atteindre cet objectif et se positionner dès maintenant comme l’acteur dominant du web ambiant, coiffant au passage Google,  Apple et Microsoft.

jarvis

Les usages évoluent avec les terminaux

Le plus simple pour définir ce qu’est le web ambiant est de remonter dans le temps et d’étudier la façon dont l’évolution des terminaux a impacté les usages.

Tout a commencé il y a à peu près 20 ans avec la lancement du Web. À cette époque, la seule façon d’accéder aux contenus était d’utiliser un ordinateur. Ces derniers étaient majoritairement fixes, car considérés comme des outils de productivité. De ce fait, les sites leaders étaient ceux qui permettaient de maximiser le temps passé devant l’écran : les portails comme Yahoo permettaient d’accéder à une très grande quantité de contenus en un seul endroit, tandis que des moteurs de recherche comme Google servaient à trouver des contenus bien précis.

Avec la démocratisation des ordinateurs portables, cette vision très utilitaire du web a cédé la place à des usages plus diversifiés et surtout plus participatifs. Pouvoir emporter son ordinateur avec soi permettait de rester connecté et de pouvoir partager des choses 7 j./7 et plus seulement sur son lieu de travail. Nous avons alors connu l’expansion des médias sociaux comme Facebook et Youtube.

Avec la généralisation des smartphones, la plage de connexion des utilisateurs est encore plus grande : nous sommes connectés et en capacité de lire/produire quasiment du réveil au couché. Nous avons accès à une infinité de contenus à travers Twitter, Facebook / Instagram, Snapchat… mais cette surabondance force les utilisateurs à fractionner leur attention, et pousse les éditeurs à fournir des contenus très courts (listicles, micro-vidéos…) et des applications mono-tâches.

Nous sommes actuellement dans l’ère post-PC où les smartphones sont les terminaux numériques sur lesquels nous passons le plus de temps. De nombreux fournisseurs de contenus et services se sont déjà adapté à ce contexte de marché en adoptant une approche “mobile first”.

Vous pourriez penser qu’il n’est pas possible d’augmenter encore le temps de connexion dans la mesure où nous avons toujours nos smartphones à portée de main, mais ce n’est pas tout à fait vrai : ils sont coincés au fond de votre sac ou dans une autre pièce, vous êtes parfois dans l’impossibilité de les utiliser (au volant ou sous la douche), et il leur arrive même de tomber en panne de batterie. C’est dans les courtes périodes de non-utilisation de votre smartphone que les terminaux à commandes vocales trouvent leur utilité : en vous permettant de consulter des contenus ou d’exploiter des services à travers une interface naturelle : la voix.

web-ambiant

Est-il raisonnable de commencer à parler de l’ère post-smartphone alors que certains sont encore coincés dans celle du web desktop / laptop ? Oui, car il n’est pas ici question de substitution, mais de complément : Au travail ou en déplacement, nous utilisons toujours des ordinateurs, car ils offrent un confort inégalé, mais cela ne nous empêche pas de consulter à longueur de journée notre smartphone. Pour le web ambiant, ça sera la même chose : des usages complémentaires, voire simultanés.

Les scénarios d’usage des interfaces vocales

Les enceintes connectées à interface vocale d’Amazon et Google n’étant pas encore commercialisées en France, vous avez très certainement du mal à vous projeter dans un quotidien où les contenus et services en ligne sont accessibles simplement en les invoquant de vive voix, comme le fait Tony Stark avec Jarvis dans Iron Man. Pourtant ces terminaux sont quasi disponibles dans des pays frontaliers (Amazon Echo is coming to the UK and Germany this fall) et ceux qui les ont testés sont plus que convaincus (Amazon Echo is the most used gadget in my home).

Pour vous aider à comprendre l’intérêt des interfaces vocales et la façon dont ils peuvent s’insérer dans un quotidien où nous sommes déjà entourés d’écrans, je vous propose les deux scénarios d’usage suivants :

  • Vous êtes en train de rédiger un document sur votre ordinateur quand un collègue vous demande si vous êtes disponible pour une réunion le lendemain matin. Vous dégainez votre smartphone pour vérifier si le créneau est libre, puis vous demandez à Siri de créer un nouveau RDV et d’envoyer une invitation à telle ou telle personne. Le tout en moins de 10 secondes et sans avoir perdu le fil de votre travail.
  • Vous êtes tranquillement chez vous en train de regarder une série sur Netflix. Un ami vous envoie un message sur votre smartphone pour savoir si vous avez écouté le dernier morceau de Trentemøller. Vous demandez à votre box de mettre la diffusion de la série en pause, puis vous demandez à votre enceinte connectée de jouer le morceau en question sur Spotify.

Ces deux scénarios d’usage illustrent la complémentarité et la simultanéité des interfaces classiques (ordinateurs, TV…), tactiles (smartphones) et vocales (enceintes ou montres connectées). Nous pourrions même mentionner un cas d’usage mixte où pour ne pas interrompre la lecture d’un magazine (car vous êtes trop bien installé dans votre canapé) vous demandez à Siri ou Alexa des précisions sur le sujet de l’article.

La clé du web ambiant est de venir compléter les terminaux actuels en nous offrant un accès permanent à travers l’interface vocale équipant une nouvelle génération de terminaux : enceintes connectées, montres connectées, écouteurs intelligents… Ces interfaces vocales peuvent même nous réconcilier avec des équipements que nous sous-utilisons, à l’image des box qui sont très difficilement utilisables avec les télécommandes actuelles, mais largement domptables avec une télécommande vocale.

interfaces-vocales

Interfaces vocales et web ambiant sont donc les deux faces d’une même pièce. Le plus beau dans cette histoire, c’est qu’elles peuvent d’hors et déjà être exploitées sur votre ordinateur : que vous soyez sous PC, Mac ou Linux, il y aura toujours la possibilité d’invoquer Cortana, Siri ou Google Now. Mais comme je l’avais déjà expliqué précédemment, le véritable enjeu est de faire rentrer les contenus et services en ligne dans la voiture (cf. Usages et enjeux des interfaces vocales). Nous passons en moyenne entre 1 h et 2 h par jour dans un environnement où il n’est pas possible d’utiliser un ordinateur ou un smartphone. D’où l’énorme potentiel des interfaces naturelles.

Des services et contenus à repenser

Comme nous venons de le voir, les interfaces vocales sont déjà présentes dans notre quotidien, de façon très discrète, mais présentes quand même. Pour pouvoir les exploiter, les annonceurs, éditeurs de contenus et fournisseurs de services vont devoir fournir un gros effort d’adaptation dans la mesure où il n’y a pas de périphérique d’entrée ou de sortie, tout se fait à la voix.

Le challenge ici est double : simplifier à la fois l’accès et l’utilisation. L’accès devant se faire à travers un terminal tiers (enceinte, montre, télécommande connectée), les fournisseurs de contenus ou services devront nécessairement proposer des APIs (interfaces de programmation). Ils devront également faire un énorme effort pour pouvoir délivrer du contenu ou un service exploitable avec un simple commande vocale (ex : commander un Uber ou une pizza). De plus, il n’y a aucune possibilité de placer des bannières, de proposer des résultats sponsorisés ou de faire de l’affiliation. Il y a donc un modèle économique alternatif à trouver pour bon nombre de fournisseurs de contenus ou services.

La tâche semble complexe, mais pas impossible, car il existe déjà des milliers de services déjà disponibles pour Alexa : Amazon’s Alexa app store hits 3,000 “skills,” up from 1,000 in June.

Amazon en avance, Facebook à la ramasse

Il y a presque 2,5 MM de smartphones actuellement en circulation. Difficile d’imaginer écouler des milliards de ces nouveaux terminaux à interfaces vocales. Et pourtant… l’important n’est pas d’équiper tous les foyers, mais uniquement les plus rentables. Et en ce domaine, qui est mieux placé qu’Amazon pour identifier les foyers à plus fort potentiel ? Nous savons déjà qu’Amazon offre des Kindle à ses plus gros clients, il n’est pas impossible à court terme qu’Amazon propose également des Echo Dot à ses meilleurs clients Premium.

Amazon a donc pris une très grosse longueur d’avance grâce à son écosystème ouvert (CoWatch, the Alexa-enabled smartwatch, is now available), sa rapidité d’itération sur ses produits (Amazon’s Fire TV Stick gets updated with faster hardware and an Alexa-enabled remote) et sa gigantesque base de clients qui lui sont très fidèles.

Google et Apple sont bien évidemment dans la roue d’Amazon avec des produits similaires (cf. Google Home et Apple’s Siri-based Echo rival has reportedly begun prototype testing), mais n’oublions pas qu’ils sont extrêmement bien implantés dans les voitures (avec respectivement CarPlay et Android Auto) ainsi que dans le salon (Apple TV / Android TV).

Microsoft est également en embuscade avec un gros écosystème de développeurs (Microsoft’s bot platform is more popular than Facebook’s among developers) et de fortes compétences en matière d’intelligence artificielle et en matière de reconnaissance vocale (je vous rappelle que Skype est capable de faire de la traduction en temps réel).

Ce qui nous amène à parler de Facebook, qui malgré sa domination incontestable sur les smartphones ne semble pas avoir anticipé les interfaces vocales. À moins qu’ils nous réservent des surprises du côté d’Oculus et ses casques de réalité virtuelle…

Et merde, un autre canal dont il va falloir tenir compte !

À peine aviez-vous sorti votre application mobile que l’on commençait à vous dire que l’avenir est dans les chatbots. Et à peine commençons-nous à y voir plus clair dans les chatbots qu’il faut déjà penser à la prochaine étape. Mais ne vous découragez pas, car l’effort à fournir pour exploiter ce nouveau canal n’est pas si important (cf. Les chatbots ne sont qu’une étape intermédiaire vers les interfaces naturelles).

natural-ui

Bon de toute façon vous étiez déjà convaincu de l’intérêt d’adopter une organisation omnicanal, n’est-ce pas ?

2 commentaires sur “À quoi va ressembler l’ère post-smartphone ?

  1. achat prévu ce mois ci avec la sortie le 20 octobre du nouveau echo dot :)
    Tous mes amis qui ont Alexa a la maison m’ont totalement convaincu que ce n’est pas du tout un gadget

    1. Là tu es absolument obligé de nous faire un compte-rendu complet de la prise en main et des premiers jours d’utilisation !

Les commentaires sont fermés.