HTML, acronimo di HyperText Markup Language, non è un linguaggio di programmazione, ma un codice di markup basato a sua volta su un altro linguaggio avente scopi più generici, l'SGML (Standard Generalized Markup Language).
Il W3C ha rilasciato diverse versioni di HTML, che differiscono per lo più per l'introduzione di nuovi attributi e nuovi tag. Successivamente a tale data il W3C ha introdotto XHTML, di cui parleremo in seguito.
L' HTML permette di indicare come disporre gli elementi all'interno di una pagina: le indicazioni vengono date attraverso degli appositi marcatori, chiamati "tag", i quali hanno differenti nomi a seconda della loro funzione.
Per un esaustiva trattazione di HTML rimando alle numerose risorse online, in questa sede è importante sottolineare che:
Un documento HTML è sempre composto da 2 sezioni:
l' intestazione <head> e il corpo <body>. La prima generalmente contiene, i meta tag, il link verso il foglio di stile, l'attributo <title> del documento ed eventuali altre informazioni sul tipo di documento; la seconda contiene invece il contenuto vero e proprio del documento.
La struttura dei tag può essere generalmente descritta come:
<TAG attributo_x ="valoreAttributo_x" attributo_y ="valoreAttributo_y">contenuto</TAG>
anche se ci sono dei tag che non rispettano questa struttura non prevedendo un contenuto (è il caso ad esempio del tag <IMG>). Inoltre spesso è necessario annidare i tag uno dentro l'altro per poter ottere l'effetto desiderato, ad esempio
<div><h2 class="sottotitolo">esempio di annidamento</h2></div>