"Tag cloud": la "nuvola della parole" di Radioprotezione.org

La "nuvola delle parole" (tag cloud) è una rappresentazione visuale ponderata della frequenza di presentazione delle parole in un testo, libro o Sito Internet.

Proviamo ad immaginare di "scannerizzare" il contenuto di un intero libro, che è composto di una sequenza (lunga, ma non infinita, di parole), e di contare il numero di volte in cui una certa parola si presenta nel testo: ovviamente la lista comprenderà, con la massima frequenza di ripetizione, alcune parole ricorrenti (preposizioni, articoli, etc.), e poi diverse altre parole che costituiscono i "mattoni" (atomi?) con cui è "costruito" il libro, la sua ricchezza lessicale e la varietà linguistica. Per un certo genere  di analisi strutturale del testo, questo tipo di classificazione consente di comprendere anche l'ampiezza del contenuto e della competenza linguistica dell'autore.

Applicata ad un Sito Internet, questa tecnica è assai interessante perché indica la varietà degli argomenti trattati e la sistematicità con qui questi si ripresentano nell'insieme delle diverse pagine internet. Un blog di politica potrà, per esempio, contenere alcune parole che lo caratterizzano (premier, schieramento, votazioni, maggioranza, etc.)  ma che non sono invece rappresentative di un blog di attualità sociale, in cui predominano termini relativi alla vita pubblica (marito, madre, stilista, moda, pubblico, etc.).

Aggiungendo anche la variabile "tempo" a questo genere di analisi dei Siti internet, si può studiare come il contenuto del testo si orienti nel tempo verso una serie di argomenti che polarizzano l'interesse degli Utenti o degli Autori in diversi periodi, ad esempio un evento sociale che ha marcato l'opinione pubblica oppure, nello specifico, il sottoinsieme costituito dagli Utenti del blog.

Da qualche anno, una rappresentazione visuale dell'istogramma delle frequenze della parole si è affermato come uno stumento di analisi visiva potente del contenuto dei Siti Internet: anziché indicare con il numero la frequenza di accadimento di una parola, la parola stessa è riprodotta con una dimensione di carattere che è proporzionale alla frequenza stessa. Spesso, la collocazione delle parole è casuale, con una struttura visiva che ricorda i quadri delle avanguardie degli anni '70. 

Questa rappresentazione è chiamata "tag cloud", e cioè la "nuvola delle etichette", la "nuvola delle parole".

Si guardi ad esempio al tag cloud delle ricerche effettuate su Wikipedia:

wikimedia

è chiaro immediatamente la varietà delle parole che descrivono l'interesse degli Utenti, ma è altresì chiaro che vi è una sorta di "clusterizzazione" attorno ad alcuni termini specifici: i Beatles, Stati Uniti, India, Australia, Canada, United Kingdom, Adolf Hitler, Sex...

Anche Radioprotezione.org ha la sua piccola tag cloud: si trova in prima pagina, subito sotto gli aggiornamenti di articoli ed eventi. E' una lista cliccabile, nel senso che ciascuno dei termini è un hyperlink che può essere cliccato e conduce automaticamente alla pagina di ricerca di quel termine in tutto il Sito.

La tag cloud può essere utilizzata, oltre che per apprezzare l'evoluzione nel tempo delle tematiche trattate nel Sito, come un metodo rapido per accedere a contenuto speficico (due clic in tutto!). 

I termini indicizzati sono tutti quelli appartenenti a ciascuno degli articoli e degli interventi presenti nel Sito, fatta eccezione per i seguenti: del, della, dei, in su per tra, fra, la, le, gli, il, lo, degli, delle, alle, al, agli, delle, nella, nelle, negli, alla, nostro, tutti, questo, questa, dell, come, stati, nell, essere, deve, anche, sulla, prima, dalla, sono, hanno, almeno, solo, ancora, leggere, loro, viene, ogni, oggi, presso, anni, parte, sempre avere, molto, grazie, giorni.

Ecco qui come appare la piccola tag cloud del nostro Sito al giorno 12 Febbraio 2014:

Tag cloud al 12-02-2014

Il numero di articoli presenti sul Sito è ancora piuttosto limitato, alla data attuale: nel futuro, con un incremento del materiale pubblicato sarà possibile apprezzare come quella "nuvola delle parole" di Radioprotezione.org cambia e si trasforma, introducendo anche termini e locuzioni nuove.  

 

*************************************

APPROFONDIMENTI