Secondo Fu, Salvendy e Turley (2002) valutazioni non empiriche e valutazioni empiriche affrontano differenti tipologie di errori e possono migliorare la performance degli utenti nei diversi livelli.
Da un loro esperimento si evince che le valutazioni degli esperti sono più efficaci nell'identificare gli errori di design dell'usabilità a livello skill-based e soprattutto rule-based, mentre il test con utenti è molto più efficace nell'evidenziare errori di tipo knowledge-based.
Knowledge-based level e modello dell'utente
Secondo Fu, Salvendy e Turley la valutazione non empirica è meno adatta a diagnosticare gli errori knowledge-based: è difficile "simulare" la conoscenza degli utenti, che possono essere completamente naive, e dunque non conoscere nulla del dominio, oppure estremamente esperti, e dunque conoscere molto più del valutatore.
In secondo luogo gli errori knowledge-based sono estremamente legati allo specifico contesto. Questo rende meno utile l'expertise dell'esperto, in quanto ciò che è buono in un particolare contesto non lo è in un altro.
Livelli skill e rule-based: aspecificità di dominio
I livelli skill e rule-based, al contrario, sono molto meno specifici: molte azioni o schemi di interazione valgono a prescindere dal dominio specifico. In questo caso gli esperti possono applicare in maniera appropriata delle conoscenze acquisite in altri dominii.
Quale metodo?
Alla luce della precedente riflessione, possiamo affermare che, idealmente, la valutazione dell'usabilità di un artefatto dovrebbe includere sia strumenti non empririci che strumenti empririci (testing di soggetti).