Web sémantique

Un article de Wikipédia, l'encyclopédie libre.

Le Web sémantique désigne un ensemble de technologies visant à rendre le contenu des ressources du World Wide Web accessible et utilisable par les programmes et agents logiciels, grâce à un système de métadonnées formelles, utilisant notamment la famille de langages développés par le W3C[1].

Sommaire

[modifier] Historique

La notion de métadonnées utilisables par les machines fut proposée assez tôt dans l'histoire du Web, dès 1994 par son inventeur Tim Berners-Lee[2], lors de la conférence WWW 94 où fut annoncée la création du W3C. Ces métadonnées formelles sont alors présentées comme une nécessaire représentation utilisable par les machines de l'information contenue dans les documents, par exemple le fait qu'une personne X est employée par une organisation Y.

Le développement de cette idée aboutira à la publication en 1999 de la première version de RDF (Resource Description Framework)[3], langage qui définit un cadre général pour la standardisation des métadonnées des ressources Web. Sur la base de RDF vont ensuite se développer des vocabulaires spécifiques destinés à des applications particulières, comme par exemple FOAF destiné à décrire les relations entre personnes, puis des langages destinés à structurer ces vocabulaires, comme RDFS et le langage d'ontologie OWL, publiés dans leur forme finale en février 2004.

Au cours de cette évolution, la notion de ressource s'étend de son sens original de « document publié sur le Web » à des sens plus généraux et plus abstraits. Dans les langages d'ontologie ou le langage SKOS, en cours de développement, les ressources décrites sont des concepts comme des classes, des propriétés, ou des concepts utilisés pour l'indexation. À ce titre les langages et technologies du Web sémantique sont parfois présentés comme des outils de représentation des connaissances adaptés à l'environnement Web, permettant de transformer automatiquement les données en information, et les informations en savoir[4].

[modifier] Principe général

Le Web sémantique est entièrement fondé sur le Web et ne remet pas en cause ce dernier. Le Web sémantique se base donc sur la fonction basique du Web « classique » : un moyen de publier et consulter des documents. Mais les documents traités par le Web sémantique contiennent non pas des textes en langage naturel (français, espagnol, chinois, etc.) mais des informations formalisées pour être traitées automatiquement. Ces documents sont générés, traités, échangés par des logiciels. Ces logiciels permettent souvent, sans connaissance informatique, de :

  • générer des données sémantiques à partir de la saisie d'information par les utilisateurs ;
  • agréger des données sémantiques afin d'être publiées ou traitées ;
  • publier des données sémantiques avec une mise en forme personnalisée ou spécialisée ;
  • échanger automatiquement des données en fonction de leurs relations sémantiques ;
  • générer des données sémantiques automatiquement, sans saisie humaine, à partir de règles d'inférences.

[modifier] Cadre de référence

Le Web sémantique est fondé sur les protocoles et langages standards du Web :

  • Le protocole HTTP.
  • Les URI (Uniform Resource Identifiers).
  • Le langage XML (dans le cas, majoritaire, où RDF est sérialisé en XML).

À ces standards s'ajoutent ceux qui sont propres au Web sémantique :

  • RDF : modèle conceptuel permettant de décrire toute donnée.
  • RDF Schema : langage permettant de créer des vocabulaires, ensembles de termes utilisés pour décrire des choses.
  • OWL : langage permettant de créer des ontologies, vocabulaires plus complexes servant de support aux traitements logiques (inférences, classification automatique …).
  • SPARQL : langage de requêtes pour obtenir des informations à partir de graphes RDF.

Ces quatre standards sont ouverts et issus du W3C. Ils forment l'ossature du Web sémantique.

[modifier] Critiques

L'architecture, les outils et les concepts même du Web sémantique ont été souvent critiqués. Certains analystes pensent que les principes d'organisation sur lesquels ils reposent sont applicables à l'échelle d'un système d'information fermé, comme une entreprise ou une bibliothèque, mais ne fonctionneront pas ou mal à l'échelle plus grande du Web, pour des raisons autant techniques que sociales[5],[6]. D'autres critiques ont reproché au W3C de consacrer trop de moyens au développement du Web sémantique, au détriment d'autres technologies comme les services Web[7].

[modifier] Applications pratiques

Ces nouveaux protocoles de communication et langages standards permettent le développement de nouveaux usages qui rendent concrète la notion d'intelligence collective. C'est notamment le cas du « social bookmarking », de la recherche sociale (voir par exemple Lycos IQ [1]).

Les wiki sémantiques permettent de créer des contenus en précisant leur sens et en caractérisant leurs relations via une syntaxe de type wiki.

[modifier] Avancement en Europe

L'avancement du Web sémantique dans le monde est suivi par le W3C dans le cadre d'un projet Semantic Web Advanced Deployment (SWAD). Le projet SWAD-Europe s'est déroulé de mai 2002 à octobre 2004.

Voir : SWAD-Europe

L'organisme européen hôte des projets W3C et qui suit l'avancement du Web sémantique est ERCIM (European Research Consortium for Informatics and Mathematics).

Voir : Site officiel de l'ERCIM

C'est l'INRIA qui représente la France dans ERCIM.

[modifier] Liens externes

[modifier] Références

  1. W3C Semantic Web Activity
  2. Notes de Tim Berners-Lee pour la conférence WWWF94, Genève
  3. RDF Model and Syntax Specification W3C Recommendation - Février 1999
  4. Introduction to Data, Information, Knowledge - Semanticweb.org (en)
  5. "L'ontologie est surfaite", par Clay Shirky
  6. Sept Illusions de la Méta Utopie
  7. "L'éclosion des services web coince sur les standards" (ZDNet, mars 2002)