Predire il 'successo' di una notizia: un esperimento algoritmico nel mondo reale

L'esperto di giornalismo finlandese Atte Jääskeläinen racconta di come l’editore Alma Media abbia “addestrato” un’intelligenza artificiale per supportare la redazione nella scelta delle notizie.

Redazione ANSA Roma

di Atte Jäääskeläinen*

A un certo punto, tutte le redazioni tradizionali che sperimentano con l’Intelligenza Artificiale e l’analisi dei dati sembrano incontrare lo stesso ostacolo: la redazione non produce il contenuto che l'algoritmo dice che il pubblico vorrebbe leggere.

Possiamo definirlo un problema commerciale: se la redazione si guadagna da vivere sul mercato, allora è importante saper servire le esigenze del pubblico, che ciò piaccia o meno. Ma la questione è importante anche da un punto di vista sociale: nel Regno Unito, solo un terzo circa del pubblico pensa che i media scelgano gli argomenti appropriati e solo la metà circa pensa che i media li aiutino a capire le notizie. In occasione delle elezioni generali del 2019, solo un terzo della popolazione pensava che i media stessero facendo un buon lavoro. Per fortuna, nelle altre nazioni oltre la metà del pubblico ritiene che i media li tenga aggiornati.(1)

Date queste informazioni, dobbiamo concludere che l'intuizione professionale in redazione è tutt'altro che perfetta. E se una macchina potesse aiutare? Questa domanda è ancora un tabù in molte redazioni. La risposta immediata è spesso che nessuna macchina può prendere in considerazione tutti gli aspetti e i contesti delle notizie; che il pubblico vuole che i giornalisti siano responsabili della scelta di cosa scrivere, e come, e di quali pezzi promuovere.

A causa di queste preoccupazioni, abbiamo pensato che valesse la pena di sperimentare l'analisi predittiva basata su machine learning per capire come potrebbe essere utilizzata al fine di migliorare il processo con cui vengono fatte le scelte editoriali nelle redazioni. La nostra proposta è stata in parte finanziata dalla Media Industry Research Foundation of Finland e il nostro partner industriale è stato il secondo editore di giornali in Finlandia, Alma Media

Il problema
Nella nostra ricerca abbiamo adottato un approccio "costruttivo": l'obiettivo era quello di trovare una soluzione pertinente a un problema pratico. Prima Abbiamo indagato il campo dell'analisi predittiva per scoprire cosa era già stato fatto, nei media e altrove. Tra i 12 intervistati c'erano persone come Tom Betts, Chief Data Officer del Financial Times, e Magda Piatkowska, Chief of Data Science di BBC News.

Abbiamo anche intervistato 16 persone chiave di Alma Media, per definire il nesso di causalità tra le azioni in redazione e il "successo", chiedendo cosa significasse quella parola per ogni intervistato. Abbiamo studiato un modello per il processo cognitivo della redazione utilizzando dei diagrammi "stock and flow" dinamici mutuati dalle scienze ingegneristiche. I risultati sono stati sorprendenti: i professionisti delle news hanno detto che si è trattato di un esperimento positivo e che ha generato "una discussione che troppo raramente avviene nelle newsroom, ma che sicuramente è necessaria".

Partendo da questo, abbiamo individuato un totale di 15 possibili casi d'uso per ottimizzare il processo decisionale con l'aiuto dei sistemi predittivi basati su machine learning. Dopo un'attenta valutazione delle priorità con i responsabili di progetto delle aziende media coinvolte, il caso selezionato per la sperimentazione è stato questo: È possibile prevedere quanto una singola notizia contribuirà nel convincere un utente a diventare abbonato, o a rimanere abbonato, prima che la notizia stessa venga pubblicata?

Il valore della previsione è ovvio: se si ottiene un feedback prima della pubblicazione, si ha ancora tempo per intervenire sulla storia, creare una trama o un titolo migliori, oppure riconsiderare se valga del tutto la pena pubblicarla. A riguardo, la mia esperienza - condivisa da molti dei miei ex colleghi - di monitoraggio dei dati di fruizione delle notizie è stata spesso spiacevole: più della metà delle storie prodotte non ha avuto un numero rilevante di lettori digitali.

A causa dei limiti di tempo e di budget, la verifica teorica doveva basarsi su alcuni presupposti e semplificazioni, ma il lusso del nostro progetto di ricerca è stato che abbiamo utilizzato dati reali, così come lo erano le storie e, naturalmente, il pubblico.

Costruire un modello
Dopo circa due mesi di sperimentazione da parte degli esperti di machine learning del nostro gruppo di ricerca di Fourkind Oy insieme con gli specialisti dell'audience insight di Alma Media, abbiamo costruito un modello basato su reti neurali ricorrenti che analizzavano l'intero contenuto del testo. Esso era basato sull'analisi linguistica in comparazione con i dati relativi allo storico dei comportamenti del pubblico, e prevedeva chi avrebbe letto una notizia e quanti abbonamenti sarebbero stati generati dopo la sua lettura.

All'inizio abbiamo insegnato al modello la lingua finlandese utilizzando l'intero contenuto della Wikipedia finlandese, poi gli abbiamo insegnato quale fosse il formato corretto delle notizie utilizzando l'archivio completo di Alma Media. Abbiamo anche utilizzato l’approccio Universal Language-Model Fine-tuning, che permette di utilizzare efficacemente il modello linguistico in altri contesti. In ultimo, per le previsioni sono stati utilizzati tre diversi modelli di regressione.

Infine, il processo ha dovuto essere messo a punto e il modello di previsione modificato affinché funzionassero nel contesto quotidiano di una sala stampa. All’inizio, le previsioni sono state presentate come semplici numeri, e ciò ha fatto sì che gli utenti si concentrassero sulle differenze tra i numeri previsti e quelli reali. Quando il modello è stato modificato per prevedere cinque categorie, in linea con gli obiettivi delle redazioni, il sistema ha iniziato a funzionare bene e "le aspettative sono state superate", come ha riferito il responsabile Alma Media del progetto.

In produzione
Il sistema è stato messo in produzione e ulteriormente sviluppato. In fasi successive, al modello sono stati aggiunti diversi tipi di metadati. Il sistema è stato presentato da Alma Media in un recente articolo su una rivista di settore come esempio di utilizzo delle reti neurali quale strumento pratico per corroborare la valutazione editoriale.(2) In termini di "approccio costruttivo": la soluzione ha superato un "test di mercato debole".

Alcuni leader dell'informazione tradizionale e accademici, dopo aver sentito quello che abbiamo fatto, hanno detto che abbiamo creato una macchina "infernale". La mia risposta è la seguente: voi utilizzate già strumenti di analytics per scoprire come vengono fruiti i vostri contenuti. Utilizzate già queste informazioni come guida per sapere quali notizie coprire, come e cosa promuovere. A volte lasciate persino che siano le macchine a fare la promozione(3): perché allora non verificare in anticipo cosa faranno le macchine e come reagirà il pubblico? Queste informazioni sono così pericolose che preferireste non saperle?

Detto questo, la redazione ideale non è quella in cui questo tipo di sistema è sempre in grado di prevedere cosa avrà successo e cosa no. Le notizie dovrebbero essere sorprendenti. L'analisi predittiva si basa su dati storici, ma quando la storia non si ripete, allora la interpretano meglio gli esseri umani.

O no?

===


*Questo articolo è stato scritto da Atte Jäääskeläinen e fa parte di una serie in cui JournalismAI - progetto dedicato allo studio dell’impatto che l’IA sta avendo sul giornalismo gestito da POLIS (think-tank della London School of Economics and Political Science) e partner di ANSA - invita gli esperti del settore a condividere i casi di studio delle redazioni che sperimentano la tecnologia AI.

Atte Jäääskeläinen è Senior Visiting Fellow presso la LSE e Professor of Practice presso l'Università LUT, Finlandia. È stato Direttore of News per la Finnish Broadcasting Company (2007-2017) e CEO della Finnish News Agency (2004-2006). È stato co-autore dell’EBU News Report 2019: “The Next Newsroom. The Next Newsroom. Unlocking the value of AI for Public Service Journalism” ed è stato co-direttore del progetto di ricerca LSE “The Future of National News Agencies in Europe”.

Potete contattare Atte all’indirizzo e-mail atte.jaaskelainen@lut.fi

Link al documento pubblicato in ACM Digital Library (accesso aperto): https://dl.acm.org/doi/pdf/10.1145/3377290.3377299

===
Note:
1) In 38 paesi studiati, il 62% del pubblico ritiene che i media siano bravi a tenere aggiornate le persone e il 51% ritiene che i media siano bravi ad aiutarle a capire le notizie. Newman, N., Fletcher, R., Kalogeropoulos, A., & Nielsen, R. K. (2019, 12 giugno). Reuters Institute Digital News Report 2019. http://www.digitalnewsreport.org/survey/2019/overview-key-findings-2019/.
Durante le elezioni generali del Regno Unito nel 2019, il 30-40 % degli intervistati ha dichiarato di ritenere che i media nel loro complesso abbiano fatto un buon lavoro. Fletcher, R., Newman, N., & Schulz, A. (n.d.). A Mile Wide, an Inch Deep: Notizie online e utilizzo dei media nelle elezioni generali del 2019 nel Regno Unito. Digital News Report. http://www.digitalnewsreport.org/publications/2020/mile-wide-inch-deep-online-news-media-use-2019-uk-general-election/

2) Autio, N. (2020, 29 gennaio). Tekoäly ennakoi, onko juttu hitti vai huti. Suomen Lehdistö. https://suomenlehdisto.fi/tekoaly-ennakoi-onko-juttu-hitti-vai-huti/

3) Cherubini, F., & Nielsen, R. K. (2016). Editorial Analytics: come i media di informazione stanno sviluppando e utilizzando i dati del pubblico e le metriche. Reuters Institute for the Study of Journalism.
Blanchett Neheli, N. (2018). News by Numbers. Digital Journalism, 6(8), 1041-1051;
Nelson, J. L. (2018). The Elusive Engagement Metric. Digital Journalism, 6(4), 528-544.
Nelson, J. L., & Tandoc, E. C., Jr. (2019). Doing ‘well’ or doing ‘good’: What audience analytics reveal about journalism’s competing goals. Journalism Studies, 20(13), 1960-1976.

 

 

 

RIPRODUZIONE RISERVATA © Copyright ANSA