Ce billet a été initialement publié sur le blog de Clever Age dans Microformats : republier et donner du sens aux contenus

Le Web sémantique.
Cette expression est sur toutes les lèvres de ceux qui préparent l’Internet de demain. Moteurs de recherche, services de pointe, secteur marchand … après avoir indexé du contenu, ils aimeraient désormais le comprendre. Comprendre pour mieux cibler, mieux profiler et mieux servir.
Malgré cet aspect futuriste teinté de recherche et de développement, le concept de Web sémantique est pourtant vieux comme … le Web. Tim Berners-Lee y pensait déjà lorsqu’il accouchait d’Internet sur ses petites tablettes.
Si les hommes arrivent à comprendre les hommes, les ordinateurs ne comprennent que ce pourquoi ils ont été programmés. Le Web sémantique a été imaginé pour palier à ce problème, pour expliquer le sens du contenu, pour lier les contenus entre eux tout en décrivant ces relations.
En ce sens, les formats RDF et OWL figurent comme les étendards du concept. RDF décrit les ressources tandis qu’OWL établit des liens entre eux en leur donnant un sens. Ces relations sont nommées ontologies et permettent donc de transformer un Web de données anonymes en un Web sémantique. Un Web où humains et ordinateurs comprennent et échangent.
Les microformats sont nés du constat de complexité de mise en Å“uvre du couple RDF/OWL et d’un besoin de simplicité.
Les microformats
Tantek Çelik et Adam Rifkin dévoilent le concept des microformats en 2004 après 2 années d’expérimentation. Ils ne s’en cachaient pas : ils souhaitaient démocratiser et implanter la sémantique au cÅ“ur du Web en s’affranchissant au maximum de contraintes techniques.
C’est ainsi qu’au lieu de créer un énième format de fichier les microformats se greffent sous la forme d’attributs (X)HTML pour tenter de donner du sens au contenu.
Il existe plusieurs spécifications de microformats :
- hAtom (syndication de contenus, basé sur Atom) ;
- hCalendar (dates et évènements, basé sur iCal) ;
- hCard (représentation d’entité, basé sur vCard) ;
- hResume (CV, mélangeant hCard et hCalendar notamment) ;
- geo (emplacement géographique) ;
- XFN (relations entre individus) ;
- XOXO (description de contenus) ;
- et de nombreux motifs de conception rel-* (tags, nofollow, license, home etc.).
Intérêts et utilité des microformats
La force des microformats réside dans sa souplesse d’utilisation, leur approche métier et surtout, la réutilisation de formats existants.
Les microformats se basent sur deux attributs [HTML :
rel: pour décrire la relation du lien avec sa cible ;class: pour décrire le sens de contenu.
Les balises (X)HTML indiquent la nature de leur contenu :
<p>pour un paragraphe de texte ;<h1>pour un titre important ;<strong>pour une forte emphase ;<img>pour une image ;<li>pour un élément de liste ;<a>pour lier une autre ressource via son URI.
Les microformats s’ajoutent par le biais des attributs cités ci-dessus (rel et class) pour affiner leur sens :
<a rel="nofollow">indique aux robots d’indexation des moteurs de recherche de ne pas suivre ce lien ;<span class="tel">indique que cette balise neutre contient un numéro de téléphone ;<div class="entry">indique que cette balise neutre contient un article (billet de blog par exemple).
Rassurez-vous, le choix des classes n’est pas arbitraire et le wiki officiel est un bon guide. Il reprend les spécifications des formats cités précédemment tout en les agrémentant d’exemples.
Enfin, et pour achever d’attiser votre curiosité, voici un résumé des microformats en 7 points :
- ils s’adaptent au code et non l’inverse ;
- ils s’appliquent aussi bien sur des pages statiques que dynamiques ;
- ils aident à structurer la page ;
- ils n’ont quasiment aucun coût de mise en place ;
- ils aident et aideront à la bonne indexation du contenu dans les moteurs de recherche ;
- ils offrent des perspectives d’interaction et de navigation intelligente pour les visiteurs d’une page microformatée ;
- ils sont un socle pour réutiliser le contenu (cf. « Outils agrégeant les microformats »).
Cas pratique : offrir une carte de visite en visitant une page Web
Prenons par exemple le cas des fichiers vCard. Nos carnets d’adresses en raffolent car ils contiennent des informations de contact : nom, prénom, adresse, numéro de téléphone, email etc.
Il n’est pas rare de recevoir des emails contenant une vCard en pièce-jointe. Un clic dessus et les informations de l’expéditeur se retrouvent dans notre carnet d’adresses.
Les microformats proposent la même chose mais au format Web avec le microformat hCard. Outre la ressemblance de nom, on retrouve dans sa spécification tous les éléments de vCard (nom, prénom, adresse etc.).
La seule différence se trouve dans la représentation. Nous n’avons plus affaire à un fichier séparé (comme ça aurait été le cas avec RDF et OWL)
mais bel et bien à du texte présent sur une page Web.
Si ce code était placé sur une page Web accessible au public, n’importe quel outil gérant les microformats serait capable d’en extraire les données et pourquoi pas, de lancer une recherche sur
Google Maps pour obtenir les coordonnées GPS de l’adresse.
<div class="vcard">
<a class="fn org url" href="http://www.clever-age.com/">Clever Age</a>
<div class="adr">
<div class="street-address">37, boulevard des Capucines</div>
<span class="postal-code">75002</span>
<span class="locality">Paris</span>
<div class="country-name">France</div>
</div>
<div class="tel">
<span class="type">Téléphone</span> +33 1 53 34 66 10
</div>
<div class="tel">
<span class="type">Fax</span> +33 1 53 34 65 20
</div>
<div>Email: <span class="email">commercial@clever-age.com</span></div>
</div>
Outils proposant des microformats
Les industriels et les leaders du Web contribuent à diffuser les microformats en les adoptant progressivement. Cette adoption apporte une valeur ajoutée à leurs services et facilite la vie des utilisateurs.
Concrètement, ils microformatent leur contenu pour enrichir leur présentation et faciliter les interactions avec d’autres services.
Voici une liste non-exhaustive de services proposant des contenus microformatés :
- Blogs (Wordpress) ;
- Cartographie (Google Maps, Yahoo ! Local) ;
- Emploi JobiJoba) ;
- Outils sociaux (Flickr, Del.icio.us, Ma.gnolia) ;
- Réseaux sociaux (LinkedIn, Ziki).
Outils agrégeant les microformats

L’utilisation la plus intéressante des microformats reste indéniablement l’agrégation. Vous pourrez ainsi construire un flux RSS à partir d’une page statique ou explorer
des photos en rapport avec la page visitée.
Technorati porte l’étendard des microformats. Ses différents services, utilisables en appelant une simple URI, permettent d’agréger des cartes de visites (vCard) ou encore des calendriers (iCal) pour générer des fichiers réutilisables dans votre carnet d’adresse ou votre gestionnaire de temps.
Jobster propose une utilisation intéressante des microformats. Ce site de recherche d’emploi vous évite l’écueil de l’énième ressaisie de CV. En lui fournissant l’URL de votre profil public LinkedIn, il en extrait toutes les données pour en générer un CV en ligne.
Les navigateurs Web jouent également le jeu. Firefox 2 (avec son extension Operator) ou encore Firefox 3 et le futur Internet Explorer 8 proposent des outils intégrés.
Sur chaque page visitée, ils en extraient tous les contenus microformatés possibles et proposent différentes interactions possibles.
D’autres outils plus confidentiels s’efforcent de défricher le terrain, notamment les agrégateurs de flux RSS/Atom et autres transformateurs XHTML/microformats :
- hatom2rss ;
- hAtom2Atom ;
- atom2rss ;
- X2V.
Conclusion
Il est de plus en plus facile de microformater les contenus, d’interagir avec et de les republier. Leur faible coût d’intégration et la rapidité
d’apprentissage sont d’autres atouts pour intéresser vos intégrateurs HTML, vos programmeurs ou même vos décisionnels.
La publication de microformats de LinkedIn et leur utilisation par Jobster pour préremplir automatiquement le CV sans ressaisie est le cas de figure idéal.
Ces pratiques ont pour vocation d’être généralisées, de quoi nous faciliter la vie.
Nous verrons dans une prochaine partie des bonnes pratiques d’intégration des microformats à des contenus déjà existants. Ce sera d’ailleurs l’occasion
de remarquer que sémantique, respect des standards et accessibilité génèrent une incroyable synergie.
Pour en savoir plus
- Présentation des microformats en mars 2006 au SXSW Interactive ;
- En route vers le Web sémantique ;
- Les 10 prochaines tendances du Web.
- [1] Il en existe en réalité 3 mais l’attribut
revn’est employé qu’une fois. Difficile d’en déduire une généralité.


















Commentaires
Bonjour,
Je voulais savoir si au niveau des robots de spam il n’y avait pas de pb pour les adresses mails. Car ca revient a leur faciliter le travail aussi… non ?
Microformats ou pas, quand une adresse mail est affichée en clair sur une page Web, tu peux être certain(e) qu’elle est récupérée.
Personnellement c’est un des rares éléments que je ne place pas dans un microformat accessible publiquement, sauf si derrière il y a un gestionnaire de mails de type Gmail.
Gnignigni, on s’embête à trouver un code xhtml qui tienne la route et toi tu balances la version avec des span et des div à gogo xD
(sinon j’ai bien aimé ton article qui est très clair :))
Merci Thomas, très bon article … je me suis régalé. Merci encore !
Si j’ai bien compris ton article, je les utilise sans le savoir ?
@Alexandre L’exemple n’est pas génial sur le balisage c’est certain. Cependant c’est complètement sorti du contexte donc à part remplacer certains
divpar desp, je ne sais pas trop ce que j’aurais pu proposer.@oli tu aimeras la suite alors
j’ai choisi une approche didactique complétant la compréhension de cet article.
@popolatortue Ton blog en propose (les tags et XFN pour ta blogroll) mais je ne pense pas que dans ton utilisation du Web ça soit le cas.
[...] avions dressé un panorama des microformats dans un précédent article intitulé « microformats : republier et donner du sens aux contenus ». Nous avions notamment conclu que leur intégration était rapide, peu coûteuse et surtout [...]
[...] [...]
Répondre