Cours DocBook accelere

1.4. Balisage fondé sur le contenu

Comment baliser vos documents de façon optimale pour que l'information puisse en être extraite et indexée ? L'approche de DocBook est de fournir un ensemble très riche de balises de délimitation qui toutes sont en relation avec la structure et la nature du contenu du document.

Pour vous donner des exemples de balises qui peuvent vous aider à générer des index automatiques : <attribution> et <command>. Si vous avez un grosse documentation (par exemple, tout les logiciels et matériels Sun sont documentés avec DocBook) vous pouvez faire une recherche facilement dans les documents qui traitent d'une commande appelée mount ou une citation attribuée à Ken Thompson. Avec une recherche structurée vous pourriez seulement trouver les occurrences de mount quand c'est un nom de commande et de Thompson quand il est l'auteur de la citation.

Maintenant imaginez ce qui se passerait si le Web tout entier utilisait un langage de balisage basé sur le contenu au lieu du HTML : un moteur de recherche vous donnerait l'information dont vous avez besoin sans toutes les références supplémentaires nécessaires pour utiliser ces termes. Une recherche sur mount sur le Web ne trouvera pas dans la plupart des cas les références à la commande UNIX mount.

Un riche langage de balises comme DocBook est une excellente idée à divers points de vue, mais il peut aussi être difficile à utiliser. DocBook possède des centaines de balises (à l'opposé de quelques unes pour le HTML), ainsi l'apprentissage est plus dur. C'est vrai et le seul moyen pour y remédier est d'écrire une documentation sur l'utilisation de DocBook !

D'un autre côté, si vous êtes familier avec DocBook ça ne vous prendra pas trop de temps de taper les balises. Gardez à l'esprit que la plupart du temps une personne n'écrit pas mais se concentre sur la mise en forme de son document. Si vous utilisez DocBook vous passerez plus de temps à l'écriture et moins à la mise en forme.