Entro cinque anni il Pulitzer a un robot-giornalista

PulitzerLo assicura provocatoriamente Kris Hammond, uno dei fondatori di Narrative Science, l’ azienda Usa che ha sviluppato un programma in grado di raccogliere dati – statistiche sportive o rapporti finanziari – per trasformarli in notizie, in testi giornalistici – Il passo avanti rispetto ad altri programmi, secondo il New York Times, è nella capacità di questo software di fare collegamenti e deduzioni e di presentare i diversi punti di vista – L’ azienda ha raccolto finora una ventina di clienti, fra cui alcune catene di quotidiani Usa che per ora pensano di utilizzarlo per realizzare delle sintesi automatizzate che consentano di ampliare la copertura dello sport giovanile locale e per produrre articoli sui risultati finanziari trimestrali delle aziende della zona – Tra l’ altro anche i prezzi sono competitivi, meno di 10 euro per un articolo di 500 parole,  e sono probabilmente destinati a scendere –  Ma anche 10 dollari, osserva Steve Lohr sul New York Times,  sono un prezzo più conveniente della media dei costi ad articolo a Patch. Com (il grande network di siti locali che fa capo ad AOL), per esempio,  o a Demand Media

—–

Entro cinque anni un programma di scrittura giornalistica automatica vincerà un Premio Pulitzer. Ne è convinto Kris Hammond, uno dei fondatori di Narrative Science l’ azienda dell’ Illinois che ha sviluppato un programma in grado di raccogliere dati – statistiche sportive o rapporti finanziari – per trasformarli in notizie, in testi giornalistici.

‘’Trasformiamo i dati in articoli’’, annuncia spavaldamente la home page della start-up di Chicago.

La grande differenza fra ‘’Narrative Science’’ e gli altri tentativi di produrre notizie con i sistemi di intelligenza artificiale (vedi anche ‘‘La scimmia che vinse il Pulitzer. Personaggi, avventure e (buone) notizie dal futuro dell’ informazione”, il libro di Nicola Bruno e Raffaele Mastrolonardo ) starebbe  nella capacità del software di fare collegamenti e deduzioni e di presentare i vari punti di vista della vicenda, come racconta il New York Times. “La costruzione dei fatti è un concetto chiave – sottolinea Hammond -, non si tratta solo di prendere dei dati e di sparpagliarli in un testo’’.

NarrativeBig Ten Network (BTN), una catena televisiva specializzata nel settore dello sport nei College universitari, sta usando questo programma dalla primavera del 2010 per produrre delle sintesi degli avvenimenti sportivi, football e basket soprattutto. Un articolo pubblicato su Popsci rileva che questa applicazione ha contribuito ad aumentare il traffico nella sezione del football Usa del BTN di un 40%.

E poi c’ è l’ aspetto economico: ogni articolo di 500 parole costa 7 euro e viene scritto in 60 secondi: un minuto!

* * * * *

Per anni i programmatori hanno compiuto esperimenti con software di scrittura di articoli, soprattutto nel settore sportivo – osservava qualche giorno fa sul New York Times Steve Lohr -, ma questi sforzi producevano dei risultati stereotipati, e leggendoli si sentiva che li aveva scritti una macchina.

Narrative Science nasce dopo più di un decennio di ricerche ed è coordinato da due dei fondatori dell’ azienda, Kris Hammond e Larry Birnbaum, con-direttori dell’ Intelligent Information Laboratory alla Northwestern University, che possiede una quota della società. E gli articoli prodotti da Narrative Science sono diversi.

“Una magia”, dice Roger Lee, di Battery Ventures, che ha investito 6 milioni di dollari nell’ azienda all’ inizio di quest’ anno. ‘’E’ come se l’ avesse scritto un umano’’.

E anche gli esperti di intelligenza e linguaggio artificiale sono rimasti impressionati. Oren Etzioni, professore di Computer Science all’ Università di Washington, osserva: “La qualità della narrazione prodotta è ottima’’, come se fosse stata scritta da un umano, e per giunta da un professionista.

Il lavoro innovativo realizzato da Narrative Science – commenta Lohr – solleva una questione più ampia: se tali applicazioni di intelligenza artificiale si limiteranno ad assistere l’ uomo o lo sostituiranno. La tecnologia sta già minando la base economica del giornalismo tradizionale. La pubblicità on-line, pur essendo in crescita, non riesce ancora a compensare il calo della pubblicità su carta. Ma i giornalisti-robot sostituiranno nelle redazioni i redattori in carne ed ossa?

I dirigenti di Narrative Science sottolineano che la loro tecnologia dovrebbe essere per le varie pubblicazioni prima di tutto uno strumento a basso costo per ampliare e arricchire la copertura giornalistica quando i budget editoriali sono sotto pressione. La società, fondata lo scorso anno, ha raccolto finora 20 clienti finora, molti dei quali stanno ancora sperimentando il sistema. Stuart Frankel, direttore generale dell’ azienda, preferisce non  rivelarne i nomi. Fra di essi ci sono anche delle catene di quotidiani che pensano di offrire delle sintesi automatizzate per ampliare la copertura dello sport giovanile locale e produrre articoli sui risultati finanziari trimestrali delle aziende della zona.

‘’Ma soprattutto – osserva Frankel – stiamo facendo delle cose che nessun altro fa’’.

* * * * *

Il  Big Ten Network, uno dei clienti di Narrative Science che hanno accettato di parlare, ha cominciato a usare la nuova tecnologia nella primavera del 2010 per le sintesi di incontri di baseball e softball. E poi ha cominciato a utilizzarla anche per basket e fotto ball riuscendo ad ottenere un 40% di visitatori in più sul network rispetto al 2009.

Hanley Wood, un editore commerciale nel campo dell’ industria edilizia, ha cominciato invece ad usare il programma in agosto per realizzare dei Rapporti mensili su oltre 350 mercati immobiliari che vengono via via pubblicati sul suo sito, builderonline.com. L’ azienda ha sempre raccolto grandi quantità di dati ma assumere delle persone per analizzare e descrivere le tendenze del mercato sarebbe costato troppo, racconta Andrew Reid, presidente dell’ unità operativa dell’ azienda che si occupa di media digitali e analisi del mercato.

Il manager ha raccontato che Hanley Wood ha lavorato per Narrative Science per diversi mesi per affinare il software e adattarlo al campo dell’ edilizia. Aggiungendo che un ex dirigente dell’ agenzia Ruters era rimasto colpito dall’ alta qualità degli articoli: ‘’Sono riusciti a superare dei grossi ostacoli linguistici’’.

E tra l’ altro il dirigente è stato colpito anche dai costi. Hanley Wood paga a Narrative Science meno di 10 euro per un articolo di 500 parole – e il prezzo probabilmente è destinato a scendere. Ma anche 10 dollari sono un prezzo più conveniente della media dei compensi ad articolo che vengono pagati, ad esempio, da Patch. Com (il grande network di siti locali che fa capo ad AOL) o da Demand Media.

* * * * *

Il software di Narrative Science – spiega il giornalista del New York Times – può fare delle inferenze, dei collegamenti logici basati sui dati che a mano a mano raccoglie e sulle sequenze e i risultati dei dati precedenti. Per determinare il ‘’punto di vista’’ dell’ articolo – sostiene Hammond, uno dei fondatori -, il software impara concetti come ‘’sforzo individuale’’, ‘’sforzo della squadra’’, oltre ad espressioni tecniche come “come from behind,” “back and forth,” “season high,” “player’s streak” and “rankings for team.”  Il software quindi decide quale elemento è il più importante per quella gara e così imposta l’ attacco del pezzo. Naturalmente anche i dati determinano la selezione dei termini.

Insomma, dice Hammond, ‘’il concetto chiave è la costruzione. Non si tratta di raccogliere solo dei dati e di rovesciarli in un testo’’.

Le  ambizioni di Narrative Science – continua il NYT – puntano a crescere ulteriormente nella scala della qualità. Sia Birnbaum che Hammond, tra l’ altro, sono docenti di giornalismo oltre che di informatica. E l’ azienda stessa è frutto di una stretta collaborazione fra le due scuole.

“Questo tipo di tecnologia può rafforzare in profondità il giornalismo – sostiene John Lavine, preside della Medill School of Journalism della Northwestern University.

Hammond ritiene che gli sviluppi paralleli nel programma di scrittura e nella ricerca dei dati possono aprire dei nuovi orizzonti per il ‘computer journalism’, esplorando ‘’delle correlazioni che uno non si aspetterebbe’’ – analoghe concettualmente alla sfera di ‘’Freakonomics”.

Hammond cita una previsione di un esperto di media secondo cui un programma digitale potrebbe vincere un  Premio Pulitzer per il giornalismo entro 20 anni — e si permette di non essere d’ accordo.

“In cinque anni – corregge – un programma di scrittura automatica vincerà il Pulitzer, e mi gioco tutto, ma sono sicuro che sarà la nostra tecnologia’’.

Può essere, – conclude Steve Lohr -, ma anche se accadrà, il Pulitzer, naturalmente, non lo vincerà un codice astratto, ma l’ umano che lo ha creato.