Legacy Blog

Monitorare Twitter: un’ipotesi di lavoro

Qualche tempo fa, insieme con Davide Bennato, che aveva appena scritto un post sulle reazioni dei social media alla morte di Michel Jackson, stavamo facendo un’ipotesi per il monitoraggio dei messaggi su Twitter e io, come al solito, ho cercato di sintetizzare il discorso alla lavagna. Ci siamo concentrati su una piattaforma particolare, perché entrambi abbiamo concordato sul fatto che le generalizzazioni non sono desiderabili e che non ha molto senso effettuare con lo stesso sistema il monitoraggio di Twitter, Friendfeed o degli stati di Facebook (che da ieri sono diventati pubblici e ricercabili!). Ogni sistema, infatti, genera comportamenti diversi e aggrega persone con caratteristiche peculiari.

tweet_monitor

Il funzionamento non è molto differente da quello di un qualsiasi sistema di monitoraggio ed è articolato in tre step: raccolta, aggiunta di meta dati e rappresentazione sintetica.

Raccolta
Raccogliere i dati è – tutto sommato – la cosa più semplice: è sufficiente lanciare delle ricerche e recuperare i risultati memorizzandoli in un data base. Questa attività è ulteriormente semplificata dalla possibilità di accedere a Twitter via Api. Indipendentemente dagli aspetti tecnici, alla fine abbiamo un bidone di dati che deve essere trasformato in informazioni.

Meta informazioni
La trasformazioni di dati in informazioni passa attraverso l’aggiunta di meta dati strutturati. Nel caso di Twitter, è possibile ricavare alcune informazioni automaticamente grazie alle pratiche sociali che si sono affermate nell’uso dello strumento: in questo senso, si possono isolare gli hashtag, i destinatari di una risposta, oppure i re-tweet. Ovviamente, abbiamo a disposizione l’autore del tweet e il timestamp.
Dopo aver isolato i dati che possiamo trovare facilmente nei tweet, è opportuno (necessario?) aggiungere altri meta-dati e lo si può fare automaticamente oppure a mano. Con il primo metodo, per esempio, si possono ricercare ulteriori parole chiave utilizzando una lista di riferimento; in teoria si potrebbe utilizzare un motore semantico, ma ho idea che sia difficile che riesca a produrre risultati accettabili con stringhe di soli 140 caratteri. Di fatto, molte informazioni devono essere aggiunte a mano. Con l’intervento di una persona, infatti, è possibile introdurre tag che non compaiono già nei testi dei cinguettii e che, per esempio, esprimono concetti più generali. Allo stesso tempo, è relativamente facile qualificare il sentiment del tweet e così di seguito.

Rappresentazione sintetica
L’ultimo passaggio è l’uso dei meta dati per ricavare una rappresentazione sintetica, utile soprattutto per analizzare un grande volume di tweet oppure l’andamento delle conversazioni nel tempo (anche se non sono sicuro che nel caso di Twitter si possa parlare propriamente di conversazioni). E’ facile la costruzione delle tag cloud e degli steamgraph: le prime danno un’idea degli argomenti trattati dai tweet che abbiamo raccolto; i secondi, invece, permettono di apprezzare l’andamento nel volume dei messaggi. Le rappresentazioni che si possono usare sono molte e vanno da banali grafici a barra e torte, a visualizzazioni più raffinate come le treemap. Senza, ovviamente, considerare le tante fantasiose infografiche emerse attorno a Twitter.

Social network analysis
Un ulteriore strumento che può essere utilizzato (ma di cui non abbiamo parlato nel corso della nostra chiacchierata con Davide) è la social network analysis, un metodo di indagine che consente di analizzare la struttura sociale di un gruppo. Nel nostro caso, torna utile per capire se esiste un gruppo sociale dietro i tweet che abbiamo raccolto e quali sono le sue caratteristiche: la trama delle relazioni legati ai rapporto di amicizia; quella – più significativa – che nasce dalle risposte e dai re-tweet; gli utenti che hanno un ruolo più centrale e quindi sono in grado di distribuire meglio un messaggio; e via dicendo.

A questo punto, la domanda è: c’è qualcuno che avrebbe voglia di mettere in piedi un progetto collaborativo per approfondire e strutturare il discorso ed, eventualmente, mettere in piedi il sistemino? Lasciate un commento dopo il bip 😉