Voilà maintenant près de 5 ans que l’on parle du web 2.0 (ce terme a pour la première fois été utilisé en 2004 lors du Web 2.0 Summit) et depuis le grand jeu a été de savoir quand arrivera la prochaine itération. Pour faire simple disons que le web 2 .0 était le terme utilisé dans les années 2006/2007 pour décrire un changement majeur dans les usages de l’internet (voir ma dernière définition en date). Ce dernier repose sur deux notions fondamentales: l’intelligence collective, le web comme une plateforme (pour les utilisateurs et les services). Maintenant ce terme est passé de mode et l’on emploie plus volontiers celui de médias sociaux qui sonne moins “informatique” à l’oreille. J’ai également eu l’occasion de faire un panorama des différents services associés aux médias sociaux ainsi que de donner une définition.
L’étape suivante a logiquement été d’anticiper le web 3.0 (dont j’ai également tenté de donner une définition en 2006) qui repose sur le concept de web sémantique avec le découpage suivant qui est communément admis :
- Web 1.0 = plateforme pour les documents
- Web 2.0 = plateforme pour les individus
- Web 3.0 = plateforme pour les données
A la vue du chantier titanesque que représente la re-sémantisation du web (nous parlons d’un horizon à 5 ou 10 ans) et des avancées dans d’autres domaines, Tim O’Reilly et John Battelle ont proposé une appellation intermédiaire lors du dernier Web 2.0 Summit : Web Squared: Web 2.0’s Successor?
L’idée étant de regrouper différentes avancées majeures derrière un terme unique pour pouvoir capitaliser dessus et évangéliser le marché. D’où la nouvelle notion de Web² (Web au carré, “Web Squared” en anglais) qui étend la portée du web 2.0 au-delà de la frontière des ordinateurs et des utilisateurs pour lui trouver des domaines d’application dans le monde réel, comprenez par là le terrain.
Web² = Web 2.0 + World
Les explications autour de ce Web² sont résumées dans l’article fondateur suivant : Web Squared: Web 2.0 Five Years On, mais vous pouvez en trouver une lecture plus synthétique ici : The Evolving Web In 2009: Web Squared Emerges To Refine Web 2.0. C’est d’ailleurs de ce dernier article que je tire ce très bon schéma :
Le Web² est donc présenté comme un complément du Web 2.0, une forme de maturation qui va tranquillement nous mener vers la prochaine itération majeure (le fameux Web 3.0 dont les contours sont encore flous). Plusieurs notions fondamentales sont citées dans ce schéma que je vais essayer de vulgariser.
Implied Metadata : des métadonnées générées automatiquement et des systèmes auto-apprenants
Le web est aujourd’hui une véritable mine d’or d’informations. A tel point que le commun du mortel est confronté au problème d’infobésité : une surabondance d’informations qui perturbe la recherche d’informations à valeur ajoutée. Pour nous aider dans cette tâche de traitement de cette masse colossale d’informations, nous avons besoin de métadonnées (des données qui décrivent les données). Prenons l’exemple d’une photo de la Tour Eiffel, n’importe qui saura que cette photo a été prise à Paris, n’importe quel utilisateur humain mais pas les machines ! Pour qu’un service ou un agent intelligent puisse savoir que telle photo représente la Tour Eiffel et qu’elle a été prise à Paris, il faut lui préciser. Oui mais voilà, c’est un travail laborieux. Heureusement sont apparus des appareils photo numériques capables d’associer tout un tas de données aux photos comme par exemple les coordonnées GPS ou le modèle de l’appareil. Ces données ne sont pas directement accessibles à l’utilisateur mais elles sont disponibles pour qui veut bien se donner la peine de les chercher.
Ce type de métadonnées ne représente aux yeux de l’utilisateur que très peu de valeur, sauf si elles sont collectées et exploitées dans un contexte structurant comme par exemple sur FlickR où il est possible de parcourir les photos de la communauté en fonction de l’endroit où elles ont été prises (sur une carte du monde) ou en fonction du type d’appareil photo. Vous obtenez ainsi un très bon outil d’analyse du parc d’appareils photo numériques en circulation sans que les utilisateurs aient eu à saisir ces données, elle sont implicites (d’où la notion d'”implied metadata“).
Mais cela va plus loin avec les systèmes auto-apprenants qui sont capables de générer des métadonnées à partir de recoupements. Reprenons l’exemple de nos photos numériques : si vous souhaitez les classer en fonction des personnes qui sont prises en photo, il faut toutes les parcourir à la main pour mettre de côté celles qui vous intéressent. Sauf si vous avez recours à un logiciel de reconnaissance faciale qui va faire ce travail à votre place : vous lui donner 2 ou 3 exemples pour qu’il reconnaisse un visage et il vous propose ensuite une liste de suggestions à valider. C’est le principe mis en œuvre par iPhoto 09.
L’article de Tim O’reilly cite l’exemple d’un chauffeur de taxi en Nouvelle-Zelande qui a trouvé un façon très rentable d’exploiter les métadonnées implicites : ce dernier a enregistré pendant 6 semaines un certain nombre de données sur ses courses (nombre de passagers, coordonnées GPS des points de départ et arrivée, conditions climatiques, horaires…), en a fait une compilation puis une analyse afin de déterminer les quartiers le plus rentables en fonction de l’heure de la journée.
Les métadonnées implicites comme facteur de croissance du C.A., une belle promesse, non ? Et il est possible de trouver de nombreux autres domaines d’application grâce aux données potentiellement fournies par des capteurs (votre téléphone ou n’importe quel objet équipé d’une puce RFID ou ZigBee peut faire l’affaire). Il en va de même pour les compteurs intelligents qui vont remonter des données très précieuses sur les habitudes de consommation des foyers (notion de “Smart Electric Grid” possible car chaque appareil émet une signature électrique unique). Ce type d’équipement permet ainsi à votre fournisseur d’énergie de mieux anticiper la consommation (et donc son approvisionnement) ainsi que de vous faire des recommandations pour optimiser votre facture.
Bien évidemment tout ceci est encore en train de se mettre en place mais il semblerait qu’une norme commune soit déjà en train d’émerger : MQTT, un protocole pour standardiser les communications de machine à machine (cf. MQTT Poised For Big Growth – an RSS For Internet of Things?).
L’auteur nous met néanmoins en garde contre l’accumulation de ces données et les problèmes d’exploitation qui peuvent en découler : ce sont des données brutes, elles doivent être traitées et présentées de façon adéquate pour être compréhensibles et représenter une réelle valeur. D’où l’importance de systèmes de visualisation suffisamment souples et intuitifs pour permettre une manipulation aisée. Des services comme Gap Minder nous montrent ainsi la voie : mettre à disposition des données brutes (Ex : Data.gov) et fournir les outils pour les manipuler et en tirer du sens.
Information Shadow : des infos pour chaque objet, personne, lieu…
Autre notion importante, celle d’Information Shadow qui décrit l’ensemble des informations et données associées à un objet, une personne, un lieu, un événement… Ces informations sont disponibles n’importe où (data-on-the-cloud), il suffit juste d’avoir le bon lecteur pour les visualiser. Prenons un exemple que vous connaissez tous : le code barre. En passant un scanner dessus, vous obtenez la désignation, le prix… Même principe pour les mobile tags et autres flashcodes qu’il suffit de prendre en photo avec votre téléphone pour obtenir des infos complémentaires (cinémas les plus proches et horaires pour un film, ressources complémentaires pour un article…). Nous n’en croisons pas beaucoup pour le moment mais attendez-vous à une montée en puissance très rapide grâce notamment à des lecteurs universels comme le BeeTagg Multicode Reader ou à l’impulsion de gros acteurs comme Microsoft avec son Tag.
Autre possibilité et pas des moindres, le recours à des applications de réalité augmentée en situation de mobilité comme celle que propose Layar : en regardant le monde au travers de la caméra de votre téléphone, vous avez accès à une multitude de couches de données supplémentaires qui viennent enrichir la réalité.
Exemple d’application de réalité augmentée avec Layar
Ce ne sont que des exemples et encore une fois les domaines d’application sont nombreux, de même que les supports.
Real-Time Web : informations et interactions sociales en quasi temps réel
Autre phénomène majeur de ces derniers mois, l’avènement du web temps réel avec notamment les outils de microblogging comme Twitter. L’idée derrière cette notion est que les outils mis à la disposition de la foule (accessibles au travers d’un ordinateur ou de terminaux mobiles) permettent l’émergence d’une conscience collective qui réagit en quasi temps réel aux événements extérieurs. Le facteur le plus important dans ce web en temps réel est la remontée d’informations ultra- fraiches directement sur le terrain, comme par exemple lors des dernières manifestations en Iran.
Cela fonctionne aussi bien pour les news que pour les événements (tweets lors de conférences, concerts ou défilé du 14 juillet), pour le marketing (avec des outils de monitoring de la statusphère), pour les interactions sociales avec des solutions de syndication en temps réel comme Echo (cf. Vers des commentaires distribués pour les blogs ?).
Bref, l’échelle de temps est de plus en plus courte et cela s’applique d’autant mieux sur des plateformes sociales à grande échelle. Il y a à ce sujet une théorie très intéressante autour du Synaptic Web (en référence aux synapses qui relient les neurones entre eux) qui décrit les plateformes sociales de type Facebook ou Twitter comme des cerveaux “sociaux” où les membres (les neurones) interagissent en très grand nombre et avec des temps de réaction toujours plus courts (RT, commentaires, notes…). Bref, c’est de l’intelligence collective en quasi temps réel, le tout étant de trouver les bons outils de surveillance / interprétation des ces échanges (pour faire le tri entre bruit et signaux).
Data Ecosystems : des bases de connaissances structurées, ouvertes et universelles
Dernière grosse notion du Web² : les écosystèmes de données qui permettent de relier entre elles des bases de connaissances qui étaient auparavant cloisonnées. Pour comprendre le fonctionnement de ces Data Ecosystems, il me faut d’abord vous expliquer deux notions sous-jacentes : les Linked Data et les Data Sets.
Le terme Linked Data est utilisé pour décrire une méthode de partage et de connexion de données entre elles. Jusqu’à présent, pour relier deux données entre elles il fallait faire un lien depuis une donnée A vers une donnée B avec une URL (ex : Un clic sur ce lien ‘Fred Cavazza‘ mène à mon profil sur LinkedIn). Cette forme de connexion présente de nombreuses contraintes car elle est trop formelle et surtout limitée (un lien ne permet de relier entre elles que 2 données). C’est à la fois très puissant pour les utilisateurs (qui sautent de pages en pages) mais très pauvre pour les machines et agents intelligents (qui doivent parcourir le web dans tous les sens pour lier un grand nombre de données entre elles). L’idée derrière les Linked Data est de proposer un mécanisme plus souple et surtout plus puissant qui repose sur 4 principes :
- Utiliser des URIs et non des URLs (un identifiant unique bien qui autorise de la granularité) ;
- Utiliser des adresses http pour un accès universel (aussi bien pour les utilisateurs que pour les machines) ;
- Structurer les informations sur la ressource à l’aide de métalangage comme RDF ;
- Lier ces informations à d’autres données (via des URIs).
Dans les faits : vous avez un article qui parle de Berlin, vous pouvez soit mettre un lien URL sur le mot Berlin qui pointe vers la page Wikipedia (utile pour les utilisateurs mais par pour les machines car ce sont des informations non-structurées), soit mettre un lien URI qui pointe vers les Linked Data de Berlin (avec des données structurées très utiles pour les machines mais bien trop dures à lire pour les utilisateurs).
Ne vous y trompez pas : les Linked Data ne sont pas l’avenir du web semantique, c’est “simplement” une façon de sémantiser le web. Mais je ne voudrais pas m’enliser dans des explications complexes sur les subtilités entre Linked Data et Semantic Web.
Les Data Sets sont des groupes de données qui sont connectées entre eux (les groupes). Pour faire simple : IMDB est une gigantesque base de données sur l’industrie du cinéma, par contre elle n’est pas nécessairement ouverte à l’extérieure (il faut avoir un compte premium il me semble). Les Data Sets sont des bases de données qui sont liées entre elles grâce aux Linked Data, chaque donnée enrichit les autres et multiplie ainsi la valeur du tout. Fabrice Epelboin donne une très belle métaphore dans son article : « Les données étaient autrefois enfermées, comme des fleurs dans des serres. Ce que l’on propose ici, c’est de les faire pousser en plein air, de façon à ce qu’une multitude d’abeilles non seulement se chargent de la polénisation pour le compte des fleuristes, mais qu’on puisse créer du miel et la profession d’apiculteur ».
Bien évidemment cela représente un chantier titanesque mais les travaux progressent à grand pas, notamment sous l’impulsion de Sir Tim Berners Lee dont vous pouvez voir ici une présentation parlant des Linked Data au TED :
http://video.ted.com/assets/player/swf/EmbedPlayer.swf
L’objectif des Data Ecosystems est donc de créer de gigantesques bases de bases de données, ou plutôt une méta base de données qui les regroupe toutes :
L’idée étant que l’on puisse créer de la valeur en liant des données de différents horizons (médicales, culturelles…). Signalons ainsi des initiatives remarquables comme :
- Le projet Gutenberg, une bibliothèque universelle (sorte de Google Books mais en open source) ;
- dbPedia, une communauté qui se charge de structurer les informations de Wikipedia en données “compatibles” avec Linked Data (regardez donc le cadre à droite de certaines fiches, les infobox, ce sont des données tructurées) ;
- Jamendo, une plateforme musicale entièrement en Creative Commons qui a publié son catalogue sous forme de Data Sets / Linked Data (exploitables avec dbTunes).
Ce ne sont que quelques exemples mais ils témoignent de l’ampleur de la tâche et de l’engagement des membres.
Vous l’aurez donc compris, le web sémantisé n’est pas pour tout de suite mais les différents grands acteurs se mettent en rang pour terminer cette conversion au plus vite. Linked Data et Data Sets ne sont qu’un exemple d’initiatives concourant à la création de Data Ecosystems mais il en existe d’autres comme par exemple le format CommonTag qui vise à standardiser l’utilisation des tags (cf. Common Tag apporte un standard aux métadonnées).
Pourquoi parler du Web Squared ?
Tout simplement parce qu’il est inimaginable de penser évangéliser le marché avec des termes jargonnant comme Information Shadow, Linked Data, Implied Metadata… il faut employer un terme simple qui puisse aider le commun des mortels à comprendre que nous sommes en train de vivre une nouvelle bascule (tout comme cela a été le cas avec le Web 2.0).
Je suis persuadé que nous sommes pratiquement arrivé au bout de ce que le web peut nous offrir en terme de partage de documents / contenus de même que pour les interactions sociales. Il existe encore de nombreux services et domaines d’application à trouver dans ces deux domaines mais nous avons déjà fait le plus gros. Nous sommes déjà en train de vivre la prochaine grosse itération du web : le web en temps réel, la réalité augmentée, les objets communicants, les écosystèmes de données sont des innovations en cours de maturation qui vont complètement bouleverser notre façon de communiquer, consommer, travailler, nous divertir… Bref, un nouveau paradigme des usages du web.
Pour marquer cette itération, nous avons besoin d’éduquer le marché (utilisateurs, annonceurs, opérateurs, pouvoirs publics…) et pour cela il faut pouvoir capitaliser sur un terme simple : le Web² (Web Squared).
Et maintenant ?
Maintenant tout reste à faire ! Ou plus précisément le travail d’évangélisation ne fait que commencer. Je vous engage ainsi à vous familiariser avec ces différentes notions et de prendre le temps d’en tester les applications pour bien appréhender la (r)évolution qui approche.
Du coup on va mesurer la taille du web en net-carrés ?
Excellent article, très complet sur un sujet passionnant…
Je travaille moi même dans le domaine du web et j’avoue que cette définition me fait un peu peur, pas professionnellement, mais en tant qu’individu.
Autant je pense que cela nous apportera énormément, autant je me demande comment traiter ce flot de données qui grandit de façon exponentielle.
Il est déjà difficile de gérer son identité numérique ou ses documents mais il faudra bientôt faire confiance au réseau pour gérer tout cela.
La masse d’informations étant tellement importante et disséminée que nous ne gérerons bientôt plus cette identité propre à chacun, elle fera partie de l’identité collective et risque de ne plus nous appartenir…
“un terme simple : le Web² (Web Squared)”
C’est ironique je suppose ?
J’adore ce genre de billet… merci Fred c’est vraiment excellent et très instructif !
La question de la gouvernance reste entière !
C’est même l’étape qui devra suivre immédiatement l’éllaboration du système. C’est mon humble souhait. Une gouvernance ouverte et “démocratique”.
Quel bonheur, en tous cas, d’ouvrir autant de portes, autant de perspectives. C’est beau.
Mais cette évolution engendrera-t-elle une Révolution d’usages ?
Web 1 => Web 2 = Transformation, Web 2 => Web² = Evolution.
Je peux comprendre que le Web² ne sera qu’une évolution technologique, mais l’usage, lui, sera révolutionné, non?
Exemple la réalité augmenté : révolutionnaire, n’est ce pas?
Merci pour cet article qui prend le temps de décrire un concept dense.
Un billet n’y aurait pas suffit ;>
Amicalement
Hello!
En substance, un article qui traduit une grosse tendance de ces derniers mois mais qu’il était effectivement difficile à exprimer par un terme générique! Web² it is! Merci pour la formalisation et les approfondissements proposés de toutes ces notions : informations shadows, internet des objets, méta données et écos systems, réalité augmentée, social engineering ! Les années à venir risquent d’être réellement passionnantes !
Il n’y a plus qu’à évangéliser en vue de la (r)évolution qui s’annonce!
superbe papier (mais pour ce qui est de la terminologie par contre, avoue que Madame Michu va avoir du mal.. http://www.nuesblog.com/2009/07/24/du-web-20-au-web-30-en-passant-par-les-medias-sociaux-et-lintagable-web-squared/ /-)
Il me semble qu’en langage populaire, “square” se disait des gens “dans l’ordre des choses”, i.e. qui n’avaient pas succombé à la philosophie hippie, notamment le psychédélisme. Ne dites pas “vieux con”, mais “thin man” ;-)
Elvis Presley le chantait même longtemps avant : “(You’re So Square) Baby I Don’t Care”… car même si elle ne comprenais rien au rock’n’roll et à ce qui se passait… personne ne lui faisait l’amour comme ça (you don’t know any dance step that i knew / but no one else could love me like you do”).
Le gars Tim, quand il s’accoquine avec Battelle a toujours une boutanche au frais. La preuve, à chaque fois ils nous sortent un concept marketing… qui devient réalité. Pas si square qu’il n’y paraît, isn’t it ?
@ Le Crosnier : tout s’explique donc. merci :-)
Le meilleur reste à venir !
Monsieur Le Crosnier, voila pourquoi une moindre connaissance de l’anglais ne fait qu’aider dans le monde d’aujourd’hui, on veut quand meme pas passer pour des ignorants. Dans le contexte, ‘square’ veut dire ‘a la puissance 2’, par exemple “3 squared” serait egale a 9.
Pour ce qu’il est de l’article, c’est une bonne vulgarisation du domaine. J’aurais aime avoir plus de details sur la plupart des sujets abordes, mais j’imagine qu l’intention du billet n’etait que d’etre un survol des nouveaux developpement, il reste a nous de nous informer sur chaque point.
(Veuillez m’excuser le manque d’accents).
Merci pour ce billet très intéressant, même si j’avoue être un peu sceptique. La qualité et le succès du web 2.0 étaient de placer l’utilisateur au coeur de web. Le Web² me parait refaire du web un truc de spécialistes, en grande partie éloigné des préoccupations (et des intérêts) de Mme Michu comme dirait Nicolas !
Ouch ! Voilà qui va forcer les webmarketeux à se replonger dans les fondamentaux du web. Ce n’est donc pas gagné et cela m’étonnerait que le web square fasse l’unanimité dans les agences de pub.
On en reparle dans 3 ans quand ils auront réussi à monétiser tout ça…
Superbe article clair et structuré sur un sujet complexe et extrêmement peu abordé. Franchement impressionnant, ça parait évident comme évolution mais il reste juste une inconnue. A quand un internet vraiment populaire?
Ce billet est une belle démonstration de ce que nous apporte comme bonheur la reconversion des vendeurs de lessive à l’ère du web.
Votre graphisme dans la section “Web² = Web 2.0 + World” est véritablement édifiant ! Comment pouvez-vous vraiment lire ça sans être mort de rire ?
Bientôt on nous expliquera que le “web 1” c’était uniquement à base de signaux de fumé, à moins que ça soit le web squared, je sais plus trop.
Monsieur Reilly, votre web au carré, je vous laisse really vous le mettre à l’arrêt…
Quelque soit le terme qu’on choisira, c’est intéressant de voir comment le web évolue et mûrit :)
@ chob > Oui c’est sûr, autant le web 2.0 était immédiatement perceptible par les internautes (qui voyaient leurs commentaires et photos publiées), autant le bénéfice derrière les implied metadata ou les data ecosystems sont beaucoup moins sexy pour les internautes de base (et donc les annonceurs).
@ Auscour > C’est étrange mais votre commentaire me laisse comme une impression de déjà vu (cf. les très vives critiues à l’époque où je commencais à parler du web 2.0).
@ Valent1 > L’internet vraiment populaire existe déjà, c’est celui des blogs et des plateformes sociales, non ?
/Fred
@ Frédéric > Les critiques rappelles peut-être toujours les critiques, mais je n’ai rien à voir avec les premières.
D’ailleurs, je ne suis pas contre trouver des terminologies amusantes pouvant nous expliquer les transformations progressive du web, en revanche même si votre article s’enrichit de jours en jour (il me semble) je n’y vois toujours aucun réel esprit critique.
Dans votre conclusion : “Nous sommes déjà en train de vivre la prochaine grosse itération du web : le web en temps réel […]” nous étions donc en mode tour par tour ? (ça c’est pour la vente de lessive)
Ensuite, vous citez Fabrice Epelboin, et j’avoue que c’est très joli toutes ces fleurs et ces abeilles, c’est presque de l’éco-web-bio ! Mais pourquoi ne pas en donner une traduction concrète, économique, sociétale, culturelle ? Personnellement cela me rappelle un grand “maitre des pensées” ; Le Lay, mais lui a quitté la campagne depuis un p’tit moment déjà !
Vous présentez “pour faire simple” IMDB, là encore un minimum de réflexion, et pas loin je vous assure, Wikipédia suffira. A qui appartient cette base, qui y contribue, qui en sera toujours le bénéficiaire en cas de giga-ouverture-green-bio-web-au-carre ?
Les quelques rares interviews de Thierry Ehrmann sont assez intéressantes sur le sujet.