Data la sua importanza, l'usabilità di un sito Web necessita di metodologie di valutazione il più obbiettive possibile. In tal merito, si possono eseguire valutazioni dell'usabilità sia considerando l'architettura dell'informazione, sia l'interfaccia del sito internet. Entrambe le componenti possono essere sottoposte a test di valutazione di tipo quantitativo o qualitativo; sempre, comunque, è fondamentale il coinvolgimento di utenti reali per poter progettare dei prodotti effettivamente centrati sui loro bisogni, aspettative, e limiti cognitivi.
Una conveniente modalità di valutazione dell'usabilità ha sviluppo iterativo, con test eseguiti a vari stadi di sviluppo del sistema (sviluppo-test-sviluppo). Rubin 1994 identifica quattro tipi di test dell'usabilità che differiscono sia per l'enfasi data a misure quantitative o qualitative, sia per il loro momento di applicazione all'interno del ciclo progettuale del sistema:
1.Test di esplorazione: vengono condotti abbastanza precocemente all'interno del ciclo di sviluppo, quando il prodotto è ancora nelle fasi preliminari della progettazione. Sfruttano il modello dell'utente, l'analisi dettagliata dei compiti (task analysis) e gli obiettivi di usabilità; anche questi, benché definiti sin dall'inizio, possono essere raffinati e/o modificati successivamente.
Lo scopo principale dei test di esplorazione è valutare l'efficacia dei concetti di progettazione preliminari, i quali comprendono anche i modelli mentali dell'utente circa il prodotto. Ciò che viene testata è una rappresentazione molto generale del sistema basata su prototipi, anche in formato cartaceo, che ne riproducono solo le funzioni basilari, senza andare troppo nello specifico. Un esempio di prototipo potrebbe essere un layout della home page con i link e un menù principale di navigazione, che però non si sviluppa ancora in profondità. Per tali motivi, il test di esplorazione ha natura sostanzialmente informale; inoltre, utente e facilitatore/sperimentatore interagiscono molto in modo da far emergere i processi cognitivi dell'utente. A tal fine, una delle metodologie più utilizzate è il thinking aloud (protocolli verbali): gli utenti vengono invitati a verbalizzare ad alta voce le loro idee/impressioni su problemi e difetti del sistema, mentre usano lo stesso. Si possono rivolgere domande più specifiche; ad esempio, se l'utente comprende il tema del sito; dove ciccherebbe per trovare una determinata informazione e così via.
In queste fasi preliminari i dati che vengono raccolti sono essenzialmente di tipo qualitativo, e l'attenzione è rivolta soprattutto al modo con cui l'utente svolge (o svolgerebbe, nel caso di prototipi cartacei o layout non sviluppati in profondità) il compito.
2.Test di valutazione: sono test che vengono condotti sia all'inizio che negli stadi intermedi del ciclo di produzione di un sistema, ma generalmente dopo i test di esplorazione. Il loro obiettivo è di espandere i risultati dei test di esplorazione, valutando l'usabilità in modo più complesso ed in relazione ad una "versione" più realistica del sistema, dotata di maggiori funzionalità, o funzionamento simile/identico al sistema finale. A differenza dei test di esplorazione, in quelli di valutazione l'interazione tra utente e facilitatore/sperimentatore è ridotta. Ciò è motivato da una minore necessità di fare emergere ipotesi relative ai processi cognitivi dell'utente, rispetto al bisogno di testare ipotesi in merito emerse durante le fasi esplorative.
I dati raccolti da questo tipo di analisi sono per lo più di tipo quantitativo, con una notevole enfasi sui comportamenti dell'utente e sulla correlazione tra questi ultimi e le prestazioni effettive. A questo scopo è di particolare importanza disporre dei "log" (registrazioni) più o meno completi dell'attività dell'utente con il sistema: numero di click, loro localizzazione, tempo di permanenza in una pagina e così via. In base a questi dati si possono ricavare informazioni sulla bontà dell'interazione, in termini di tempi di permanenza in una pagina, uso del tasto "back", tempo utilizzato per raggiungere un'informazione, ecc.
3.Test di validazione: sono condotti negli stadi finali del ciclo di sviluppo del prodotto e hanno lo scopo di certificarne l'usabilità. L'obiettivo principale è di verificare se il prodotto risulta essere in linea con le caratteristiche di usabilità definite negli stadi preliminari del ciclo di sviluppo, e, nel caso non lo sia, indagarne i motivi. In una tipica situazione di validazione, all'utente viene richiesto di svolgere un compito rilevante, senza alcuna interazione con il facilitatore. Le prestazioni dei soggetti vengono poi comparate con uno standard definito in relazione al tipo di compito (ad esempio velocità e accuratezza) e agli obiettivi di usabilità. I dati di maggiore interesse sono di tipo quantitativo e questa ultima fase di test richiede una maggiore enfasi sul rigore scientifico e consistenza dei risultati, in quanto vengono formulati importanti giudizi di tipo quantitativo sul sistema, talvolta decisivi per l'immissione dello stesso sul mercato e/o in produzione (o in rete, nel caso di un sito internet). Il ciclo di test e sviluppo, tuttavia, può continuare anche una volta che il prodotto finito è presente sul mercato.
4.Test di comparazione: sono test non associati ad una fase del ciclo di sviluppo in particolare. Se usati negli stadi iniziali, possono essere usati per confrontare, ad esempio, delle interfacce con stili diversi per cercare di capire quella potenzialmente più adatta al gruppo di utenti finali di riferimento. Se condotti nella parte centrale del processo di sviluppo, possono servire per confrontare elementi singoli che compongono l'interfaccia, come ad esempio pulsanti a icona e pulsanti testuali, per decidere in quale modalità gli utenti hanno prestazioni migliori. Se impiegati alla fine del ciclo di sviluppo, possono servire per confrontare il prodotto finale con prodotti analoghi concorrenti. Da questo tipo di test si possono ricavare dati sia in formato quantitativo che qualitativo, a seconda che l'indagine sia più o meno formale (possieda quindi le caratteristiche di un test di esplorazione o di validazione), ciò dipende sempre dallo scopo della ricerca.
Altre metodologie non direttamente legate ad un particolare stadio di sviluppo del prodotto, sono:
questionari, i quali possono essere presentati in formato elettronico in precedenza o a seguito dell'interazione, e a diversi stadi del ciclo di sviluppo del sistema, secondo lo scopo della ricerca.
test autogestiti, nei quali i partecipanti ricevono istruzioni sui compiti da svolgere e comunicano i risultati ai ricercatori. Ad esempio potrebbe essere loro richiesto di trovare delle informazioni specifiche e comunicare se le hanno trovate e il tempo necessario a tale operazione, oppure i partecipanti possono compilare dei questionari elettronici riguardanti la chiarezza visuale e qualità di navigazione, quantificando ad esempio tali elementi su una scala di valori in ordine crescente.