HTML, le langage des pages web

Ce n’est certes pas le seul utilisé. Mais HTML et ses dérivés est le langage utilisé pour présenter les pages des sites sur Internet.

Que signifie HTML ?

HTML signifie Hypertext Markup Language. En bon français, ça signifie Langage Hypertexte à balises. C’est donc un langage non compilé, que l’on peut écrire avec un simple bloc-notes ou un éditeur de texte très léger. Grosso modo, chaque page est un fichier avec généralement une extension .htm ou .html. Chaque fichier est stocké sur un serveur, et envoyé aux navigateurs qui en font la requête. Et c’est votre navigateur, votre logiciel de surf, qui interprète le code de ces fichiers pour afficher clairement la page.

HTML est donc un langage qui permet de positionner des éléments, de les colorer, de les agencer, et de gérer la chose la plus importante pour une site… les liens hypertextes.

Hypertexte

Terme central de la typologie Internet, un lien hypertexte est un élément cliquable permettant de télécharger – ou d’afficher, mais techniquement, c’est la même chose – un autre élément, page, fichier, etc. En ordonnant correctement ses liens hypertextes, on peut créer une arborescence de site. Chaque page permet alors d’aller sur n’importe quelle autre page du site en quelques clics.

Balise

Une balise est un code qui sera interprété d’une certaine façon par le navigateur, mais pas visible tel quel par l’internaute. Le navigateur se sert donc des balises pour composer la page telle qu’elle sera vue au final par l’internaute.

Le langage HTML a beaucoup évolué depuis son origine. Il est apparu grosso modo à la fin des années 80, et a subi l’influence de nombreux partis. Très vite, et afin de gérer les standards sans cesse en évolution, un organisme a tenté de gérer ce langage et ses dérivés. Le W3C – pour WorldWide Web Consortium – a réuni les différentes versions et a proposé, avec plus ou moins de succès, son standard.

Les pères fondateurs

Très vite, deux acteurs se sont révélés majeurs : Netscape et Internet Explorer. Dans les années 90, c’étaient les deux navigateurs les plus utilisées. De plus, ils proposaient une technologie très pratique et complémentaire du HTML : le Javascript. Le Javascript, en gros, est un langage de programmation exécuté au niveau du navigateur. Ce langage permet donc de donner des effets et des fonctionnalités que le HTML tout seul ne permet pas. Par exemple, les effets de survol des images, ou encore les fenêtres de popup.

Malheureusement, les versions de HTML et Javascript proposés par les deux grands navigateurs n’étaient pas exactement les mêmes. Elles ne respectaient jamais complètement les standards préconisés par la W3C. En fait, chacun essayait d’innover, de dépasser les standards, et d’imposer sa vision des choses.

Autant dire que pour les développeurs, c’était un véritable cauchemar. Coder un site qui devait pouvoir être vu sur les deux navigateurs ? On est arrivé même à certaines absurdités, les sites étant obligés d’annoncer sur leur page d’accueil qu’ils fonctionnait mieux avec tel ou tel navigateur. Ou même qu’ils ne fonctionnerait pas du tout si on les visitait avec le mauvais !

CSS

CSS est l’acronyme de Cascading Style Sheet, feuilles de styles en cascade. Un énorme pas en avant dans la façon de coder ses pages. Avec les CSS, on peut ajouter des propriétés de présentation très fines à chaque élément qui constituent une page. Ces éléments peuvent être généraux comme le corps de toute la page, spécifiques comme un bloc particulier, ou génériques et répétitifs comme tous les liens de la page. De plus, en nommant certains élément ou en leur attribuant des classes, sortes d’adjectifs, on peut jouer sur la présentation des éléments désignés par ces adjectifs.

Les CSS peuvent jouer sur les polices de caractères, la taille, la couleur, la bordure, le fond, les images de texture de fond, le positionnement… Du coup, en combinant astucieusement un code HTML propre et clair et une CSS déterminée, on peut alors composer des pages très propres, rapides à charger, et définir facilement la charte graphique de tout un site. En effet, un même fichier CSS peut être appelé par toutes les pages d’un site, ce qui permet une unité dans la présentation.

Le DHTML

Terme inventé pour le maketing, DHTML signifie Dynamic Hypertext Markup Language. En fait, ce n’est rien d’autre qu’une combinaison de HTML, de CSS, et de Javascript. Le HTML est utilisé pour coder le corps de de la page, la CSS pour les couleurs et placement des différents éléments de la page, et le Javascript sert alors pour créer des effets relativement inédits. En effet, on peut alors déplacer certains blocs de la page, faire des effets de survols sur une grande partie de la page… bref, donner l’impression que la page vit, qu’elle est dynamique.

Le terme dynamique n’a rien à voir avec le sens qu’on lui donne à présent, qui se rapporte plus au dynamisme apporté par les bases de données. Si les fonctions utilisées par le DHTML existent encore plus ou moins, le terme est passé de mode, donc.

Le XHTML

Le XHTML est la dernière version (au moment de l’écriture de cet article), du HTML. C’est un rapprochement du HTML et du XML, le X signifiant eXtended, étendu.

Pour parler correctement du XHTML, il faut donc d’abord parler du XML. Le XML est un langage qui sert au transfert des informations. Chaque information est encapsulé dans un code à balises, une balise ouverte devant nécessairement être fermée. Et en en-tête du document XML, on doit trouver les références nécessaires à la compréhension des balises utilisées. En XML, on peut donc inventer ses propres balises.

XHTML = HTML+XML

Le XHTML est donc une façon de réécrire le HTML qui se rapproche le plus possible du XML. Les règles de bases sont les mêmes, concernant les balises et les informations d’en-tête. La différence est qu’on n’est pas censé inventer les balises qu’on veut : on utilise les balises HTML.

Le XHTML a été défini de façon très précise par le W3C, dans le but de reprendre autant que possible la main sur l’établissement des standards. Ces standards, s’ils ne sont pas forcément respectés par certains éditeurs de logiciels – eh oui, encore Microsoft… – le sont beaucoup plus par la communauté des logiciels libres, comme la fondation Mozilla, qui édite l’excellent Firefox.

L’avenir du HTML

Clairement annoncé par le XHTML, la présentation de contenu sur Internet se profile nettement vers l’utilisation du XML. Mais avec le nombre grandissant de sites dynamiques, cela n’est pas un problème. En effet, les langages serveurs sont capables de prendre les données venant d’une base de données, et en les passant dans une moulinette, de les transformer soit en fichier XHTML, soit en données XML, soit en autre chose. Tout dépend de la moulinette, finalement. Ces moulinettes, appelées parser, sont fournies en standard avec les CMS comme SPIP, par exemple.

CMS, facilité et efficacité

Du coup, si vous avez choisi une solution basée sur un CMS, vous êtes assuré que vos données pourront traverser le temps avec un minimum de dommage. La pérennité de votre site est assurée.

Une réflexion, tout de même : un site Internet est nécessairement vu au travers d’un logiciel, le navigateur Internet. Les navigateurs possèdent une certaines façon d’interpréter les codes qui leur sont envoyés. Mais ils comprennent tous le HTML, avec plus ou moins de bonheur. Ils ont, de plus, intérêt à être capable d’interpréter autant les nouveaux codes fraîchement inventés que ceux qui datent des grands-parents des sites Internet. Le HTML a donc encore de belles années devant lui.