Data Visualization Project



a Meetup data visual experience








Arrow pointing down.







☍  Overview-Keywords




Meetup è stata creata nel 2002 come piattaforma per mettere in contatto le persone nella vita reale.

Una volta completata la fase di registrazione, gli utenti possono selezionare contenuti riguardanti i propri interessi per mezzo di topic appositi previsti dalla piattaforma, iscriversi a gruppi locali consigliati sulla base degli interessi manifestati e partecipare agli eventi organizzati da questi gruppi.

Il focus centrale dell’intero meccanismo dell’applicazione risulta dunque essere quello del "gruppo" visto come realtà associativa e fautore di momenti di aggregazione durante l’intero anno, molto spesso non guidato da una ristretta cerchia di organizzatori ma, anzi, promotore di iniziative da parte dei suoi stessi membri.

La varietà di gruppi, a seconda dei topic trattati, spazia tra:










Arrow pointing down.



☍   Heatmap aka Distribuzione temporale degli eventi


Attingendo alle informazioni temporali degli eventi, presenti nei messaggi, ed applicando un’opportuna manipolazione per convertire l’originale formato timestamp in un formato umanamente più leggibile, si è stati in grado di rispondere ad una delle nostre domande di ricerca: stimare i momenti migliori per organizzare un meetup.

Dopo aver infatti adattato i metadati temporali alle time zone così da avere una panoramica coerente sugli eventi Meetup tenutisi nel mondo, indipendentemente dal fuso orario, si è provveduto a realizzare una tabella di Pivot, tenente conto della numerosità di partecipanti agli eventi discriminati per giorno della settimana e per fascia oraria della giornata. Una volta realizzata la tabella è stato quindi possibile procedere alla costruzione della heatmap di seguito riportata per rappresentare al meglio queste informazioni.

Appare infatti chiaro dalla visualizzazione come i momenti migliori della settimana per organizzare un evento risultino essere il Martedì, il Mercoledì ed il Giovedì nella fascia oraria 18.00/20.00 ed il Sabato mattina tra le 10.00 e le 12.00. Ciò si conforma bene all’intuizione che la maggior parte dell’utenza di Meetup sembrerebbe essere rappresentata da lavoratori, professionisti, che sono quindi più propensi a partecipare ad eventi in orario successivo alla fine della giornata lavorativa o durante giorni non lavorativi, ma in questo caso prevalentemente la mattina.

View the full code

Click the viz to display in full screen


Arrow pointing down.



☍   Visualizing Meetups


Questa visualizzazione, nello specifico, si compone di due sezioni:

  1. Una prima parte in cui sono rappresentati i topic principali trattati dagli eventi tenutisi nei diversi Paesi europei:

    in questa visualizzazione è possibile esplorare la mappa europea osservando la rappresentazione della numerosità degli eventi che hanno trattato un determinato topic. I topic sono gli argomenti trattati durante gli eventi e possono essere molto vari: da Business fino a Tech, da LGBT ad Education.

    Ci siamo premurati di scalare i dati in nostro possesso rispetto alla popolazione residente in macroaree così che le gradazioni di colore assunte dal coropleto non siano direttamente proporzionali alla popolazione in quella zona ma rispecchino effettivamente la proporzione di trattamento di quel topic.

    View the full code and the viz demo



  2. Arrow pointing down.



  3. Una seconda mappa in cui vengono presentati gli eventi per ogni Paese europeo:

    in questa seconda visualizzazione è possibile esplorare la mappa europea osservando, per ogni paese, gli eventi che si sono tenuti nella capitale (fatta eccezione per l'Italia, per cui oltre a Roma è disponibile anche Milano).

    Sarà così possibile per l'utente visualizzare a colpo d'occhio la numerosità degli eventi da noi rilevati in uno streaming della durata di appena due settimane. Gli eventi in nostro possesso, per quanto riguarda il territorio europeo, si aggirano su una cifra che supera le 50 mila unità. Putroppo però per limiti computazionali dovuti alla potenza "free" offerta da mybinder.org (scelta obbligata per evitare che gli utenti della visualizzazione siano costretti ad eseguire personalmente il notebook) e per poter rendere l'esplorazione il più fluida possibile, abbiamo deciso di limitare la visualizzazione solamente a quegli eventi che avessero raggiunto, durante lo streaming, un certo quantitativo di partecipanti.

    View the full code and the viz demo





Arrow pointing down.



☍   Euristiche


Durante la prima fase di valutazione delle euristiche, gli utenti sottoposti all'utilizzo delle visualizzazioni hanno fatto presente alcuni aspetti che sono stati poi corretti per ottenere la versione finale qui mostrata.
Tra queste osservazioni rientrano:

  1. Per la heatmap:
    • Utilizzare una palette di colori più delicata rispetto all'originale "magma";
    • Implementare all'interno delle celle i numeri a cui la sfumatura di colore fa riferimento, così da rendere più diretta la comunicazione dell'informazione.

  2. Per la mappa interattiva:
    • Utilizzare dei puntatori personalizzati per distinguere tra Eventi e Informazioni riassuntive per Paese;
    • Normalizzare i dati rappresentati nella heatmap interattiva così da ottenere "macchie di calore" più significative e non proxy della densità di popolazione.

Inoltre, per entrambe le mappe interattive ci è stato suggerito di snellire il tempo di caricamento, inizialmente ancor più elevato dato che le mappe presentavano un numero decisamente maggiore di eventi. Anche per questo motivo abbiamo deciso di limitare le risorse mostrate, alleggerendo il carico computazionale e velocizzando il caricamento. Abbiamo aggiunto inoltre delle frasi "disclaimers" per invitare gli utenti a non scoraggiarsi per l'attesa.



Un miglioramento della visualizzazione in questo senso potrebbe avvenire in futuro seguendo due diverse strade:

  1. un aumento delle risorse computazionali (usando un normale pc, anzichè il servizio di free-hosting di myBinder, il caricamento con un numero maggiore di eventi risulta decisamente più tollerabile);

  2. alternativamente, una riscrittura completa del codice in Java, eliminando l'intermediazione dell'API di folium e l'interfaccia con i widget di IPython (essendo questi il principale motivo di necessità di calcolo online).








Arrow pointing down.





☍   Questionari psicometrici


Con lo scopo di valutare l'efficacia delle visualizzazioni abbiamo sottoposto a circa 50 persone, per quanto riguarda la prima visualizzazione, e 25 per la seconda, il questionario psicometrico Cabitza-Locoro.

I risultati di queste valutazioni sono riassunti mediante ulteriori visualizzazioni qui riportate.

I correlogrammi qui di seguito rappresentano la correlazione tra le risposte degli utenti al test psicometrico, a partire da sinistra, rispettivamente della prima visualizzazione statica, ovvero la Heatmap, e della visualizzazione dinamica, ovvero la Mappa interattiva. Le celle del correlogramma che non proiettano il punto colorato rappresentano delle correlazioni non supportate da significatività (controllata mediante test p-value).


View the full code here


Sempre in merito al questionario psicometrico, di seguito sono riportati alcuni Stacked-bar chart rappresentanti, per ogni domanda, la proporzione di punteggi positivi e negativi, sempre per entrambe le visualizzazioni (a sinistra la visualizzazione statica mentre, a destra, la mappa interattiva). Come si può vedere all'interno dei chart sono rappresentati gli intervalli di confidenza al 95% per determinare l'affidabilità delle stime.



View the full code here

In ultimo, sono stati realizzati degli snake-diagram per rappresentare il posizionamento di media e mediana dei voti per le diverse domande poste. L'ordine delle visualizzazioni proposte qui sotto segue coerententemente quello delle visualizzazioni precedenti.



View the full code here


Arrow pointing down.




☍   User test


La fase finale di valutazione delle visualizzazioni è consistita in un piccolo user test, composto da due domande, una per ogni visualizzazione, e sottoposto a circa 20 persone.

Le domande sottoposte agli utenti sono state:

  1. Osservando la heatmap, in quale Paese europeo il topic "Single" sembrerebbe essere più presente rispetto agli altri?
  2. Confrontando Finlandia e Spagna nella mappa interattiva si notano differenze di fascia oraria nella quale vengono organizzati gli eventi?


View the full code here

Come si può vedere il numero di risposte errate per la prima domanda è minore rispetto alla seconda, poichè in quest'ultima si è richiesto di interagire con la mappa interattiva aumentando così la difficoltà del task. Per lo stesso motivo si dilatano anche i tempi di risposta e la loro variabilità, come indicato dai notch all'interno dei violin plot, rappresentanti gli intervalli di confidenza al 95%.

Arrow pointing down.


☍   About us


⊜   Dario Bertazioli

  • Cosa studio : Studente Magistrale di Data Science presso l'Università degli Studi di Milano-Bicocca;
  • Studi precedenti : Laurea triennale in Fisica presso l'Università degli Studi di Milano.


⊜   Fabrizio D'Intinosante

  • Cosa studio : Studente Magistrale di Data Science presso l'Università degli Studi di Milano-Bicocca;
  • Studi precedenti : Laurea triennale in Economia e Statistica per le organizzazioni presso l'Università degli Studi di Torino.


⊜   Massimiliano Perletti

  • Cosa studio : Studente Magistrale di Data Science presso l'Università degli Studi di Milano-Bicocca;
  • Studi precendenti : Laurea triennale in Ingegneria dei materiali e delle nano-tecnologie presso il Politecnico di Milano.