Riflettendo sulle folksonomy, ho affrontato alcuni aspetti legati alla semantica dei tag (Folksonomy: questione di semantica) e descritto un approccio che ne agevoli la normalizzazione (Normalizzazione dei tag).
In questi giorni, il clima non ci permette di oziare in spiaggia e le cellule grigie si sono rimesse in moto avanzando una suggestiva ipotesi di lavoro. La domanda a cui sto cercando di dare una risposta è: data una collezione di tag, quali operazione è possibile compiere per rendere il loro uso più efficace?
Immaginiamo che un certo numero di utenti assegni delle parole chiave o delle frasi chiave a una serie di testi. Tutti i termini utilizzati, di fatto, fanno parte di un thesaurus, che è più o meno specialistico in funzione del dominio cui appartengono i testi. La semplice operazione di “prendere nota” delle parole chiave assegnate dagli utenti è oggi condotta da molti siti e, tra questi, i più famosi sono probabilmente Technorati e Delicious. Consultando una qualsiasi tag cloud è abbastanza facile notare che si tratta di un sistema che produce molto “rumore”. Ad esempio, tra i termini più usati è facile trovare weblog, blog o blogs: è evidente che si tratta di grafie diverse per indicare la stessa cosa. Come si può risolvere questo problema?
Una prima risposta potrebbe essere: lasciamo che l’utente se la sbrighi da solo e offriamogli la possibilità di utilizzare degli operatori booleani. Dal mio punto di vista si tratta di una risposta poco produttiva almeno per due ordini di motivi:
- la maggior parte degli utenti non ha familiarità con questo tipo di strumenti e non è probabilmente interessata ad acquisire una competenza in merito. Google ci ha insegnato che, anche nelle ricerche, la strada da seguire è la semplicità (less is more);
- ammesso che gli utenti del nostro sito fossero tutti disposti ad apprendere l’uso degli operatori booleani, ci sarebbe il problema di sapere quali sono i sinonimi, le grafie alternative di un determinato termine o altri modi per esprimere lo stesso concetto. Ad esempio, in occasione di un mio viaggio a Palo Alto nel 2003, ho conosciuto B.J. Fogg e partecipato ad alcune sessioni estive del Persuasive Technology Lab della Stanford University. Una delle ricerche di cui si discuteva riguardava la credibilità (o meglio la web credibility): l’argomento veniva trattato come un nuovo campo di indagine e, in effetti, facendo una ricerca sul web si trovava assai poco sul tema. La cosa cambiò decisamente quando, invece di usare la parola credibilità, optai per reputazione. Sembra banale, ma impiegai un po’ di tempo per fare questo passaggio e arrivare alla conclusione che la web credibility era solo un’etichetta di comodo.
Una risposta probabilmente più produttiva potrebbe essere: cerchiamo di individuare le relazioni tra i tag. In questo ambito, mi sembra molto interessante il meccanismo utilizzato dal Visual Thesaurus.
Il software di Think Map permette di esplorare un dizionario utilizzando dei grafi. Come mostra l’immagine tratta dal manuale, i termini sono collegati tra loro tramite il significato: quindi tutte le parole connesse a un pallino con una linea continua sono sinonimi. Se invece la linea fosse tratteggiata, saremmo di fronte a dei contrari. Infine, i significati possono essere collegati ad altri significati, come illustra la figura seguente:
Nel nostro contesto, questo schema potrebbe essere ampliato includendo altri tipi di relazione e altri “vocaboli”: per il nostro scopo, infatti, un vocabolario è troppo limitato e sarebbe utile un approccio più enciclopedico.