La semaine dernière, la frénésie autour de l’IPO de Facebook était a son apogée et qui a fait passé presque inaperçu un changement majeur pour le web : l’évolution du fonctionnement de la recherche de Google (Introducing the Knowledge Graph: things, not strings).
Google à l’assaut du web sémantique avec son Knowledge Graph

La raison majeure de cette évolution est la prise en compte de données sémantiques dans les résultats de recherche. Le principe est le suivant : plutôt que se fier à des chaînes de caractères, Google va maintenant travailler à partir de données structurées (“Things, not strings“). Ces données structurées sont la résultante des travaux de sémantisation des contenus initiés par les équipes de Google il y a de nombreuses années qui avaient déjà permis de faire des premières expérimentations (notamment la roue magique qui depuis a été mise hors ligne : Google Knowledge Graph, un pas vers la recherche sémantique).
Le Knowledge Graph est donc l’arme ultime de Google pour faire progresser la recherche. Une évolution qui s’est fait attendre, car le marché a beaucoup évolué ces derniers temps surtout avec les big data (Du contenu roi aux données reines). Ce graphe des connaissances repose sur la notion d’entités sémantiques qui représentent des personnes, des objets, des lieux, des ouvrages… Les informations et données sont alors associées à ces entités pour créer des bulles de connaissances qui sont affichées sur la droite de la page.

L’air de rien, cette colonne de droite est la plus grosse évolution de l’interface de Google depuis plus d’une décennie ! Non seulement elle va permettre d’enrichir la liste de résultats avec des données et informations structurées, mais elle va aussi permettre de dissocier les sujets de recherche qui ont le même nom.

De plus, la structuration des connaissances va permettre d’afficher des listes de résultats plus courtes, mais plus riches, ce qui est parfait pour les terminaux mobiles : The Knowledge Graph for mobile and tablet search.

Présenté de cette façon, ça à l’air très bien. Et pour cause, cette approche structurée de la connaissance est utilisée depuis de nombreuses années par Wikipedia, et notamment le projet DBpedia dont vous pouvez bénéficier au travers des infobox.

Encore une fois, il était grand temps que Google fasse évoluer le coeur de son moteur de recherche, car ils étaient en train d’accumuler du retard. Au cours de la décennie passée, nous avons ainsi été les témoins de quatre grandes étapes d’évolution :
- Le web centré sur les pages et les documents (le Page rank de Google a permis de les classer par score de pertinence) ;
- Le web centré sur les vidéos (YouTube et les autres plateformes de partage de vidéos ont bouleversé les usages, la réponse de Google a été d’introduire les images et les vidéos dans les listes de résultats de son universal search) ;
- Le web centré sur les utilisateurs (Facebook est aujourd’hui l’acteur central du web avec son social graph, et Google est clairement à la traine) ;
- Le web centré sur des données structurées (Wikipedia et Google ont beaucoup investi dans ce domaine pour ne pas rater le coche).
En sortant sont knowledge graph, Google jette-t-il implicitement l’éponge vis-à-vis du web social ? Oui et non. Oui, car la dimension sociale n’a qu’un intérêt limité pour améliorer la pertinence des résultats de recherche (Mythes et réalités de la social search). De plus, voilà des années que l’on nous annonce la mort de Google avec l’avènement de la recherche sociale chez Facebook (par opposition à la recherche algorithmique), mais nous n’en avons toujours pas vu la couleur (ceci est principalement dû à la qualité des contenus sur Facebook). Non ensuite, car avec Google+, ils se sont lancés dans un immense chantier de sociabilisation du web.
Donc si l’on résume, les résultats de recherche de Google vont donc (très prochainement) être classés selon :
- L’algorithme d’indexation reposant sur le page rank (qui a toujours son utilité) ;
- Les entités sémantiques reposant sur Freebase ;
- Les interactions sociales (conversations et interactions) associées à des auteurs référencés dans Google+.
Ils sont donc potentiellement positionnés sur les trois fronts de la recherche : algorithmique, social et sémantique.
Microsoft à l’assaut du web social avec Bing
De son côté, Microsoft vient également d’annoncer une nouvelle version de Bing exploitant la dimension sociale : Introducing the New Bing: Spend Less Time Searching. Si le nouveau Bing va appuyer ses résultats sur de nombreuses plateformes sociales (Facebook, Quora, Foursquare…), la dimension sémantique n’est pas en reste, car les équipes de recherche travaillent depuis de nombreuses années sur un moteur d’entités sémantiques baptisé Satori et dont on peut voir la partie visible de l’iceberg dans les snapshots, un panneau de détails des données structurées associés à un terme de recherche :

Mais c’est la dimension sociale qui est la plus mise en avant dans cette refonte avec une colonne de droite qui lui est entièrement dédiée.
Cette nouvelle version de Bing se situe donc logiquement dans la continuité de son positionnement d’outil d’aide à la décision (Le marché de la recherche relancé avec Bing et Wolfram ?).
Yahoo! tente un ultime retour avec sa recherche visuelle
Visiblement ils se sont passé le mot, car Yahoo! aussi tente d’innover avec Axis, une extension pour navigateurs permettant de faire de la recherche visuelle : Yahoo! launches Axis, a combined search and browsing product.

Je ne sais pas trop quoi penser de cette nouveauté. Il y a certes de l’ambition dans ce lancement (ils envisagent d’en faire une plateforme et même un navigateur dans le navigateur : Yahoo Axis, un nouveau navigateur web sur iOS), mais je reste sceptique sur le principe de recherche visuelle, car le filon a déjà été exploité par d’autres, et notamment Spezify, oSkope ou encore Cooliris.
J’ai toujours été un ardent défenseur de Yahoo! qui a joué un rôle prépondérant dans l’évolution du web que nous connaissons aujourd’hui… mais qui n’en finit pas de sombrer : The incredible shrinking Yahoo!. La meilleure chose qu’ils pourraient faire serait de revendre les parts qu’ils possèdent dans Alibaba et de racheter Twitter (Alibaba Buys Back 20% Stake From Yahoo for $7.1 Billion).
Plus que quelques leviers d’amélioration
Puisque l’on en parle (de Twitter), il est intéressant de constater qu’avec les changements que vont opérer Google et Microsoft, le marché se rétrécie et il ne va plus rester grand monde pour contrer l’hégémonie de ces mastodontes hormis les initiatives étranges comme DuckDuckGo.
Plus sérieusement, il ne reste selon moi, que trois acteurs pouvant réellement faire bouger les choses, et qui sont donc logiquement des rachats potentiels :
- Twitter, le roi incontesté du web en temps réel, posez une question à vos followers, et les réponses arrivent au bout de quelques secondes. En théorie, car en pratique, celles et ceux qui n’ont que quelques dizaines de followers n’obtiennent pas grand-chose. Toujours est-il qu’avec une bonne technologie d’analyse sémantique, les tweets sont une authentique mine d’or dans le cadre de la recherche d’informations ou de données. Reste encore à signer un gros chèque et surtout à bien appréhender la dimension culturelle de la tweetosphère.
- Quora, avec sa plateforme d’entreaide centrée sur les questions/réponses collaboratives. Là encore, Quora est une proie facile, mais sa richesse ne repose que sur la dynamique volontariste de sa communauté. Un rachat par Microsoft, Google ou Facebook pourrait tout ruiner…
- Wolfram Alpha, le moteur de recherche le plus sophistiqué avec ses innombrables possibilités de requêtes structurées (une visite du blog vous en donnerait un aperçu). Assurément l’interface de recherche la plus aboutie… pour les chercheurs ! Je doute que le grand public y trouve son compte, éventuellement les enseignants, mais seulement les plus motivés. Par contre, dans le monde de l’entreprise, il y aurait beaucoup de choses à faire.
Vous remarquerez que je n’ai volontairement pas citer de moteur de recherche marchand. Ceci s’explique par le fait que les principaux moteurs se sont déjà organisés pour couvrir se domaine de façon autonome et proposer une structuration des informations sur les produits (Rich Snippets for Ecommerce: Schema.org and GoodRelations).
Tout va changer, mais rien ne va changer
Au final, même si les changements annoncés ces dernières semaines vont irrémédiablement modifier la façon de travailler des moteurs de recherche, les habitudes et parts de marché ne risquent pas de beaucoup évoluer. Toujours est-il qu’avec ces nouveautés, le web vient d’entamer sa transition vers l’ère sémantique. Mais nous aurons laaaaaaaaaaaaargement l’occasion d’en reparler…
Bonjour Fred. Toujours aussi ravir de te lire.
En parlant de recherche sémantique, tu aurais pu citer ce que fait Orange sur sa recherche orange.fr (je ne vois pas les commentaires … peut être cela a été déjà mentionné) :
en posant une question, par ex. “quel est le maire de Villard de Lans ?”, la recherche s’appuie sur les données de Wikipedia pour donner une réponse pertinente.
Ca valait le coup de le souligner (Google serait-il la encore à la traine ?) ;-).