Data journalism, il futuro della professione?

E’ la convinzione di Paul Bradshaw, esperto di giornalismo online, che in questo articolo su Poynter analizza le prospettive di un incontro ravvicinato fra il lavoro giornalistico e i ricchi giacimenti di dati disseminati nella Rete ‘’leggibili’’ da programmi informatici – Affiancare il potere dell’elaborazione computerizzata al nostro arsenale giornalistico ci consente di fare di più, più velocemente, più accuratamente, ed in condivisione con gli altri – I due movimenti culturali che si sono incrociati aggiungendo una dimensione politica alla diffusione dei dati: quello degli open data e quello dei linked data; i giornalisti dovrebbero avere familiarità con entrambi i movimenti – Il caso del lancio degli archivi governativi in Uk e gli esempi del data mashup ChicagoCrime.org e della open source Everyblock – La sovrabbondanza di dati pubblici resi disponibili costituisce un ricco serbatoio di materiale grezzo. La scarsità invece riguarda le professionalità in grado di collocare e dare senso a tutto quel materiale, una programmazione capace di scavarlo a fondo e raffrontarlo con altre fonti, le competenze statistiche per spacchettarlo e quelle grafiche per disegnare un layout per la visualizzazione – Dovrà quindi cambiare la formazione dei giornalisti: la nostra professione ha una storia di grandi letterati ma inesperti nel campo dei numeri, e tutto questo non può più andare avanti

(Nella tabella: un esempio di data journalism, con i dati sulle spese dei vari dipartimenti del governo britannico)

—–

PAUL BRADSHAW: DATA AND JOURNALISM FORM A POWERFUL COMBINATION

(Poynter)

(a cura di Andrea Fama)

Negli ultimi due secoli noi giornalisti ci siamo occupati di valuta giornalistica, trasformando : abbiamo trasformato metalli vili in oro narrativo. Ma l’informazione sta cambiando.

Inizialmente, i metalli vili erano le testimonianze dirette e le interviste. In seguito, abbiamo appreso a fondere rapporti ufficiali, studi di ricerca e bilanci. Più di recente, le leghe a cui abbiamo lavorato sono state diluite con dichiarazioni ufficiali e comunicati stampa. Ma oggi i giornalisti si trovano a trattare una nuova tipologia di informazioni: i Dati. Un giacimento estremamente ricco.

Statistiche e numeri in genere non rappresentano una novità per i giornalisti. Quando parlo di dati, tuttavia, intendo informazioni che possono essere elaborate da un computer.

Si tratta di una distinzione fondamentale: un conto è che un giornalista abbia tra le mani un bilancio, su carta; tutt’altra cosa è l’essere in grado di scavare tra quelle cifre attraverso un foglio di calcolo elettronico, o lo scrivere un codice di programmazione che analizzi tali dati e li raffronti ad altre fonti di informazione. Un computer, inoltre, è in grado di analizzare più facilmente nuove tipologie di dati, come ad esempio live data, testi molto corposi, modelli comportamentali degli utenti e reti di connessione.

Tutto ciò ha un proprio potenziale trasformativo. Affiancare il potere dell’elaborazione computerizzata al nostro arsenale giornalistico ci consente di fare di più, più velocemente, più accuratamente, ed in condivisione con gli altri. Tale scenario spalanca nuove opportunità e nuovi pericoli. Le cose stanno per cambiare.

Come l’elaborazione digitale dei dati si è affermata nel giornalismo

Sono 40 anni che vediamo delinearsi lo scenario attuale. La crescita dei fogli di calcolo elettronici e dei data base a partire dagli anni ’60 del secolo scorso ha dato il via ad un più semplice processo di digitalizzazione delle informazioni, per diverse tipologie di organizzazioni (tra cui i governi) e su una varietà di tematiche.

Negli anni ’90, l’invenzione del World Wide Web ha accelerato i dati a disposizione dei giornalisti fornendo loro una piattaforma che ospitasse sia i fogli di calcolo che i data base, pubblicabili ed accessibili sia dall’uomo che dai programmi informatici – ed un network per distribuire il tutto.

E adesso due movimenti culturali si sono incrociati aggiungendo una dimensione politica alla diffusione dei dati: il movimento open data ed il movimento linked data. I giornalisti dovrebbero avere familiarità con questi due movimenti: le argomentazioni che hanno sviluppato nell’esporre le responsabilità dei potenti costituiscono una lezione su come trattare con interessi intricati, mentre le loro sperimentazioni sulle possibilità del data journalism indicano il percorso da seguire.

Il movimento open data conduce una campagna perché le informazioni di rilievo – la spesa del governo, informazioni scientifiche, mappe – siano rese pubbliche e disponibili per la crescita democratica ed economica della società. Il movimento linked data (sostenuto dall’inventore del Web, Sir Tim Berners-Lee) si batte perché tali dati siano disponibili in modo da poter essere linkati ad altre serie di dati.

Questo potrebbe significare, ad esempio, che un computer è in grado di stabilire che il direttore di una società menzionata in un particolare contratto governativo è la stessa persona pagata come consulente dal governo in un’ altra occasione.

Negli Stati Uniti e nel Regno Unito già si vedono risultati concreti da parte di entrambi i movimenti, innanzitutto con il lancio degli archivi governativi Data.gov e data.gov.uk, avvenuto rispettivamente nel 2009 e nel 2010, ma anche con sperimentazioni meno pubblicizzate quale “Where Does My Money Go?” (dove vanno a finire i miei soldi?) – che utilizza i dati per mostrare la distribuzione della spesa pubblica – e “Mapumen-tal”, che incrocia i dati di viaggio, i prezzi degli immobili e le valutazioni del pubblico in modo da consentire una rapida panoramica delle zone di una città più adatte alle singole esigenze di vita dei cittadini.

Ma vi sono decine, se non centinaia, di esempi simili in settori che vanno dalla sanità alle scienze, dalla cultura allo sport. Stiamo assistendo ad una diffusione di dati senza precedenti – qualcuno l’ha chiamata Big Data – eppure i media si sono rilevati prevalentemente lenti a reagire allo stimolo.

Tutto ciò sta per cambiare.

L’ avvento del data journalism

Nel corso di quest’ultimo anno sempre più realtà editoriali si sono emancipate dalle proprie linee di produzione incentrate sulle storie, e hanno iniziato a scorgere il valore dei dati. Nel Regno Unito, la vicenda delle spese dei parlamentari ha fatto scuola: quando un giornale detta l’agenda per sei settimane, il resto della stampa presta attenzione e al centro dell’intera vicenda vi era un milione di dati salvati su un dischetto. Da allora, ogni altra testata ha ampliato le proprie attività nel settore.

Il Guardian ha creato una speciale interfaccia on-line che ospita oltre 400.000 pagine di documenti e (a partire da agosto 2010) ha arruolato oltre 23.000 lettori per esaminarne e classificarne oltre 221.000.

Negli Stati Uniti, il giornalista programmatore Adrian Holovaty (membro del Poynter’s National Advisory Board) è stato un pioniere in materia lanciando il data mashup ChicagoCrime.org e la novità open source Everyblock, mentre Aron Pilhofer dell’unità interattiva del New York Times è stato un innovatore, e nuovi soggetti – da Talking Points Memo a ProPublica – hanno utilizzato i dati come spunto per interrogare l’operato del governo.

In realtà, siamo soltanto all’inizio.

Il data journalism abbraccia un enorme ventaglio di discipline, dal giornalismo computazionale (Computer Assisted Reporting – CAR) alla programmazione assistita, dalla visualizzazione alle statistiche.

Mentre per anni i media hanno fatto un business del proprio essere intermediari nell’elaborazione di contenuti tra le attività economiche ed i consumatori, tra governo e cittadini, Internet ha reso quel modello di business obsoleto. Non è più sufficiente per un giornalista essere bravo a scrivere o a rielaborare. Vi sono milioni di persone lì fuori in grado di scrivere meglio – molti dei quali lavorano nelle Relazioni Pubbliche, nel marketing o nel governo. Mentre avremo sempre bisogno dei cantastorie, molti giornalisti sono semplicemente operai parcellizzati.

Pertanto, a livello commerciale, se non altro, l’editoria è chiamata ad individuare il valore in questo nuovo ambiente, nonché le nuove pratiche in grado di rendere il giornalismo profittevole, di cui il data journalism è un esempio.

La sovrabbondanza di dati pubblici resi disponibili costituisce un ricco serbatoio di materiale grezzo. La scarsità riguarda le professionalità in grado di collocare e dare senso a tutto quel materiale, una programmazione capace di scavarlo a fondo e raffrontarlo con altre fonti, le competenze statistiche per spacchettarlo e quelle grafiche per disegnare un layout per la visualizzazione.

L’opportunità tecnologica è di grande impatto. Mentre la potenza elaborativa continua a crescere, la capacità di interrogare, incrociare e presentare i dati è sempre maggiore. Lo sviluppo di una realtà aumentata costituisce un’opportunità particolarmente attrattiva per l’editoria. Immaginiamo la possibilità di accedere via mobile ad articoli prodotti attraverso database locali, o di aggiungere dati al disegno complessivo attraverso la propria attività individuale. Le sperimentazioni degli ultimi cinque anni sembreranno sterili in confronto.

Un futuro collaborativo

Sono scettico in merito alla capacità dell’editoria di adattarsi ad un tale futuro ma, che vi riescano o meno, le innovative start-up del mondo digitale non si faranno trovare impreparate. E la formazione giornalistica dovrà cambiare.

La nostra professione ha una storia di esimi esponenti quali uomini di lettere, ma non di numeri. Si tratta di un aspetto che è all’origine dell’attuale imbarazzo del mondo giornalistico, provocato da blogger esperti nel loro campo che hanno evidenziato errori di fondo nelle modalità con cui i giornalisti trattano la scienza, la salute e l’economia. Tutto ciò non può andare avanti.

Ci sarà bisogno di più giornalisti in grado di scrivere una Freedom of Information request (ovvero una richiesta di accesso ad informazioni non ordinarie, NdT); più ricercatori che conoscano gli angoli più remoti del Web, dove si trovano i database del “Web invisibile”. Ci sarà bisogno di giornalisti programmatori capaci di scrivere uno screen scraper per acquisire, organizzare, filtrare, archiviare, incrociare e raffrontare le informazioni con altre fonti. Ci sarà bisogno di web designer che visualizzino tali dati nel modo più chiaro possibile, non solo per ragioni editoriali ma anche distributive. L’infografica è una fonte sempre più rilevante del traffico sui siti di informazione.

Vi è il rischio di incappare nel cosiddetto “data churnalism”, ovvero prendere le statistiche pubbliche e visualizzarle in maniera spettacolare, ma senza approfondimento o contestualizzazione. I redattori dovranno munirsi di adeguate competenze statistiche per scongiurare tale possibilità, o saranno scoperti.

Ma l’innovazione non sarà necessaria solo in campo editoriale. Il settore pubblicitario dovrà registrare la stessa rivoluzione che vivono i giornalisti, apprendendo il linguaggio della metrica Web, la pubblicità comportamentale, e vendendone poi i benefici agli inserzionisti.

E poi vi è l’aspetto commerciale. Molti editori, dopotutto, sono in affari non per vendere contenuti, bensì pubblicità. E anche in questo ambito i dati hanno acquisito sempre maggiore importanza. Il mercato di massa è stato un abbaglio. Come si dice, “sapevamo che solo metà della pubblicità funzionava; il problema è che non sapevamo quale”.

Ma Google e altri sono ricorsi alla misurabilità del Web per ridurre i margini di errore, e gli editori faranno presto altrettanto. I dati giocano un ruolo centrale in questo contesto. Mentre gli utenti si immergono nei dati sulla sicurezza automobilistica, ad esempio, l’offerta pubblicitaria prevede la possibilità di visualizzare inserzioni pubblicitarie diverse in base alle informazioni cercate, o di indirizzare l’utente stesso verso un rivenditore locale in base alla localizzazione dell’utenza.

Tutto il mondo giornalistico dovrà adottare la filosofia dei movimenti open data e linked data, beneficiando dei vantaggi scaturiti da queste nuove esperienze. Il New York Times ed il Guardian hanno entrambi pubblicato diversi API (Interfacce di Programmazione di un’ Applicazione) che consentono a soggetti terzi di realizzare servizi Web con i propri contenuti.

In cambio, hanno accesso a professionalità tecniche, matematiche e grafiche altrimenti insostenibili, e beneficiano di nuovi prodotti e nuove utenze, visto che (nel caso del Guardian) la pubblicità è venduta insieme al servizio. Nel momento in cui tali benefici saranno maggiormente riconosciuti, altri editori seguiranno l’esempio.

Spero che tutto ciò porti ad una forma di giornalismo più collaborativa. La più grande risorsa di una testata editoriale è il proprio pubblico. Finora gli editori hanno semplicemente impacchettato e consegnato tale risorsa agli inserzionisti. Ma ora che gli utenti hanno accesso alle stesse informazioni ed agli stessi strumenti dei giornalisti, interagiscono con gli editori e tra loro stessi, il loro valore si fa più ricco di sfaccettature.

Nello stesso tempo, il valore delle redazioni è diminuito: le dimensioni si sono ridotte, così come il vantaggio competitivo, e nessun giornalista ha insieme tutte le competenze richieste dal data journalism per gestire statistiche, giornalismo computazionale, programmazione e grafica.

Un nuovo media ed un nuovo mercato richiedono nuove regole. È probabile che la forma più interconnessa ed interattiva di giornalismo che abbiamo visto emergere online diventi ancor più diffusa nel momento in cui gli editori passeranno da un modello che pone le storie quali unità di produzione, ad un modello che parte invece dai dati.