Legacy Blog

Thesauri e rintracciabilità delle informazioni

Ritengo che la presenza di un thesaurus possa migliorare in modo sensibile l’usabilità dei tag e delle folksonomy come sistema di classificazione delle informazioni. Occorre però essere consapevoli che non è possibile limitarsi all’uso di un vocabolario dei sinonimi e dei contrari. Almeno per i seguenti motivi:

  • in genere i vocabolari si limitano a indicare i significati delle parole prendendo in considerazione solo un numero limitato di domini. In questo contesto, troveremo “lancia” nel senso di arma, ma non nel senso di casa automobilistica;
  • i vocabolari non si occupano di frasi e queste ultime sono invece preziose (spesso necessarie) per indicare il contenuto di un testo;
  • nei thesauri che raccolgono definizioni, sinonimi e contrari, sono considerate solo alcune tipologie di relazioni legate alla semantica. Se estendiamo il thesaurus a domini specifici, le relazioni tra due entità possono essere invece di natura assai differente.

Immaginiamo di voler creare un thesaurus per catalogare informazioni relative al mondo dell’industria automobilistica. Oltre ad alcuni termini provenienti dal vocabolario (es. produzione, cruscotto, sedile…) e dall’enciclopedia (es. “Henry Ford”), dovremmo prevedere i nomi delle case automobilistiche (es. Fiat, Alfa Romeo, Lancia) e dei loro prodotti (es. Punto, Chroma, 147…). E così di seguito. Le relazioni tra i termini e le frasi inseriti nel thesaurus sarebbero assai varie. Ad esempio, si potrebbe immaginare:

Punto [è un prodotto di] Fiat
Punto [è un tipo di] utilitaria

Indicando qual è la relazione tra due termini sarebbe possibile navigare tra tag seguendo dei percorsi che permettano di esplorare un dominio lungo le diverse tipologie di relazioni:

Fiat -> Punto -> utilitaria -> C3 -> Citroen -> Francia -> [lista dei produttori francesi]

Un thesaurus di questo genere non può che essere spontaneo e lasciato integralmente alla libera iniziativa degli utenti. Sarebbe interessante metterlo in campo per verificare se può contribuire a migliorare la rintracciabilità di un’informazione o meno.

Mentre scrivo questo post, ricevo la newsletter di Jacob Nielsen: nel suo ultimo alert box definisce quali parole è opportuno utilizzare per agevolare la rintracciabilità delle informazioni. Tra le altre cose, Nielsen suggerisce di evitare le frasi politicamente corrette:

Quando parlate di accessibilità, usate i termini “cieco” e “ipovedente” invece di “utente con difficoltà di visione”. Nessuno cercherà mai una frase così artificiosa e i termini cieco ed ipovedente sono più precisi in quanto individuano due gruppi di persone che usano tecnologie diverse e hanno quindi esigenze di usabilità differenti.

Ebbene, disponendo di un thesaurus, l’utente potrebbe facilmente trovare le relazioni tra cieco, ipovedente e “utente con difficoltà di visione”. Si tratta di termini collegati da relazioni diverse dalla sinonimia e dall’antinomia e i loro rapporti potrebbero essere esplorati con l’aiuto di grafi come accade con Visual Thesaurus.