F.A.Q.

 
 

Qu'est ce que XML ?

XML (EXtensible Markup Language, ou Langage Extensible de Balisage) est le langage qui va succéder à HTML sur le Web. Comme HTML c'est un langage de balisage (markup), c'est-à-dire un langage qui présente de l'information encadrée par des balises.

Avant l'apparition de XML, existaient :

Il convenait donc de définir un langage qui ait la facilité de mise en oeuvre de HTML tout en offrant la richesse sémantique de SGML. C'est la raison d'être de XML.

XML est un sous-ensemble au sens strict de SGML, dont il ne retient pas les aspects trop ciblés sur certains besoins. En cela il représente un profil d'application de la norme SGML.

Exemple de HTML : une portion de notre page Bibliographie telle (à peu près) qu'elle apparaît "en natif" (avant que votre butineur ne l'ait interprétée) :

<H2>En français</H2> 
<UL> 
    <LI> 
    Alain Michard, <I>XML, Langage et Applications</I>, 
    Paris, Eyrolles, 1998 
    </LI> 
</UL>
Ici les balises fournissent des indications qui vont permettre au butineur de mettre en page (ou en écran) le texte qu'elles encadrent : <H2> et </H2>signalent un titre de niveau 2, <UL> et </UL> une liste non numérotée , <LI> et </LI> un élément de la liste, <I> et </I> du texte en italique.

Toutes ces balises sont relatives à la position hiérarchique d'un élément par rapport aux autres (titre de niveau 1, 2, etc.) ou à la présentation associée. HTML propose uniquement des balises de ce type, sans que rien  permette à une machine de connaître le sens (si on est pédant on parle de la sémantique) du texte -- autrement dit de savoir que Alain Michard est l'auteur d'un livre intitulé XML, Langage et Applications, qui est paru en 1998, dont l'éditeur, Eyrolles, est situé à Paris.

Exemple de XML : la même portion de bibliographie

<BIBLIO subject="XML"> 
    <BOOK xml:lang="fr"> 
      <AUTHOR> 
        <FIRSTNAME>Alain</FIRSTNAME> 
        <LASTNAME>Michard</LASTNAME> 
      </AUTHOR> 
      <TITLE>XML, Langage et Applications</TITLE> 
      <PUBLISHER> 
        <NAME>Eyrolles</NAME> 
        <PLACE>Paris</PLACE>
      </PUBLISHER> 
      <DATEPUB>1998</DATEPUB> 
    </BOOK> 
    ... 
</BIBLIO>
Aucune des balises ne décrit la mise en forme. On retrouve là le concept de séparation du contenu et de la structure d'un document qui est à la base de SGML et de la notion de documentation structurée.

On remarque, en revanche, que maintenant les balises ont un sens, c'est à dire que leur contenu est déterminé. Par exemple, l'élément "author" doit comprendre le prénom (balise "firstname") et le nom (balise "lastname") de l'auteur. On doit aussi indiquer le titre et l'éditeur à l'intérieur des balises prévues à cet effet. On parle donc de balisage sémantique.

NB : le contenu des balises peut être obligatoire ou optionnel, ce qui permet d'imposer éventuellement certaines obligations au rédacteur concernant le contenu de son document.

Dans le cas de notre exemple, les robots qui parcourent le Web vont comprendre qu'il s'agit ici de bibliographie et non de recettes de cuisine. Essayez aujourd'hui de demander à votre moteur de recherche favori la liste des livres en Français sur XML, ou celle des livres écrits par Alain Michard, et vous comprendrez ce que va apporter XML.

On voit bien que dans le cas d'un balisage XML, l'information est traitée comme une donnée, c'est à dire qu'elle peut être gérée comme dans une base de données. Il est d'ailleurs tout à fait possible d'alimenter une documentation créée avec XML à partir d'une base de données et vice-versa.

 

En construction !


N'hésitez pas à nous envoyer vos questions et/ou réponses -- et à corriger nos éventuelles erreurs !

Retour à la page d'accueil.