Perché gli open data del governo sul Pnrr non hanno dignità di pubblicazione La nostra analisi

A ottobre avevamo evidenziato alcune criticità sui dati pubblicati dal governo sul Pnrr. Oggi registriamo addirittura un ulteriore passo indietro. Per questo chiediamo che venga sospesa la pubblicazione della sezione open data del portale “Italia domani”.

|

In un nostro approfondimento di ottobre avevamo segnalato come sul piano nazionale di ripresa e resilienza (Pnrr) il governo non fosse partito con il piede giusto per quanto riguarda la messa a disposizione di dati riutilizzabili a fini di analisi. Su questo fronte però oggi registriamo addirittura dei passi indietro. Come avevamo già raccontato infatti sul portale creato dal governo erano presenti 2 file. Tali documenti presentavano significative carenze ma permettevano di estrapolare una quantità rilevante di informazioni.

Nei primi giorni di novembre tuttavia uno dei due file è stato sostituito, senza nessun avviso o spiegazione da parte delle istituzioni. In questo nuovo documento le informazioni presenti sono molte meno rispetto al precedente. Il risultato di tutti questi movimenti è che, a 4 mesi dall’approvazione del Pnrr da parte del consiglio europeo e con la fase di attuazione ormai entrata nel vivo, ancora non esiste – e non è possibile crearla – un’anagrafica che consenta di individuare in maniera univoca e senza possibilità di errore le misure previste dal piano. L’incongruità di questi dati peraltro si evidenzia anche in atti ufficiali delle amministrazioni i quali, con riferimento alle misure, citano codici identificativi di cui non si trova traccia nei file disponibili.

-54% la riduzione di dati relativi a milestone e target.

I dati rilasciati sul portale “Italia domani”, che rappresentano comunque una pubblicazione ufficiale del governo, devono essere necessariamente corretti e affidabili. Ad oggi invece rileviamo che non è così. Tali dati risultano non solo inutilizzabili ma perfino dannosi per chiunque vi faccia riferimento per cercare di comprendere cosa sta accadendo. Per questo invitiamo l’esecutivo a prendere atto della situazione e a sospendere la sezione open data, almeno fin quando non ci sarà la sicurezza di poter mettere a disposizione di cittadini e analisti dati affidabili.

Cosa non va nei dati pubblicati

Le misure contenute nel Pnrr possono essere suddivise in investimenti da un lato e riforme dall’altro. Ognuna di queste misure poi prevede dei traguardi (milestone) e obiettivi (target) da raggiungere. Target e milestone hanno una precisa data di scadenza che deve tassativamente essere rispettata. In caso contrario il nostro paese rischia di non ricevere le prossime tranches di fondi europei (la prima è già stata erogata).

Come detto, nel portale Italia domani erano stati caricati 2 file. Uno con l’elenco delle misure che prevedono un finanziamento (non sono presenti quindi quelle riforme che non comportano flussi finanziari) aggiornato al 30 settembre. L’altro invece con le scadenze (traguardi e obiettivi) e risalente al 12 luglio. Già nel precedente approfondimento avevamo evidenziato come questi file, oltre a non rispettare le più comuni pratiche in tema di open data, presentassero degli evidenti errori di compilazione. Ad esempio, sia la descrizione testuale delle singole misure che i relativi codici identificativi non coincidevano.

Tali errori peraltro sono finiti anche in alcuni atti ufficiali. Come ad esempio un decreto del presidente del consiglio dei ministri pubblicato recentemente. In questo Dpcm si cita infatti l’investimento “I2.2.1”. Tuttavia nel file con l’elenco delle scadenze non esiste questo codice identificativo.

Nei primi giorni di novembre però uno dei due file, quello relativo alle scadenze, è stato caricato con un nuovo documento aggiornato al 10 ottobre. L’operazione però è avvenuta in modo maldestro. Infatti nella pagina del portale non è stato creato un nuovo file ma si è semplicemente sostituito il precedente. Senza peraltro modificare la data di creazione che rimane il 12 luglio 2021.

Anche in questo nuovo documento tuttavia si ravvisano delle importanti criticità. Il vecchio file infatti (presente sul portale fino al 7 novembre scorso) comprendeva complessivamente 1.148 voci. Di queste 527 erano relative alle scadenze che il nostro paese si è impegnato a rispettare nei confronti dell’Unione europea e da cui dipende l’erogazione delle prossime tranches di fondi.

Da “Italia domani” sono sparite le sub-scadenze individuate dal governo.

Altre 621 voci invece costituivano obiettivi e traguardi che il governo aveva individuato per meglio gestire la progressione dei lavori. Ad esempio se ipoteticamente una “milestone europea” prevedeva l’erogazione di risorse per la realizzazione di opere pubbliche, poteva essere inserito un “sub-traguardo italiano” che indicava una scadenza intermedia come la pubblicazione del bando di gara. Da questo punto di vista si deve sottolineare che seppure queste voci non fossero oggetto del monitoraggio delle istituzioni europee, erano comunque dati ufficiali.

Tali sub-traguardi però non sono presenti nel nuovo file. Rimangono solo le 527 scadenze “europee”. La motivazione che ha portato a questa scelta ad oggi non è nota. Così come non sappiamo da chi sia stata autorizzata questa operazione e sia stata concordata con le istituzioni europee.

La informazioni rimosse

La rimozione di milestone e target “italiani” tuttavia non è la sola differenza tra i due file. Infatti anche il tracciato record (cioè l’insieme delle informazioni disponibili per ogni singola voce) delle misure risulta modificato. Come possiamo vedere anche nell’immagine, non sono più presenti alcuni campi significativi (quelli evidenziati in grassetto). Tra cui anche la fonte dei dati che sarà utilizzata per la verifica degli obiettivi.

Tra i campi eliminati vi è quello denominato “misura” il quale conteneva un codice identificativo che permetteva di associare tale voce alla relativa scadenza. Stesso discorso per quanto riguarda la voce “sub-misura”, relativa alle sottomisure. Questa categorizzazione non era chiarissima ma permetteva quantomeno di capire con certezza la struttura gerarchica delle fonti. Adesso tale operazione risulta impossibile.

Un altro campo rimosso rispetto al vecchio file è quello definito “Codice identificativo”. In tale campo, come si può capire dal nome, era presente un codice alfanumerico che permetteva di individuare missione, componente, misura e sub-misura. Tale voce, pur non risultando indispensabile, poteva rappresentare una buona base identificativa per associare le misure alle relative scadenze. Il problema però è che questo codice è presente solo in questo file e non nell’altro.

Di conseguenza l’unico modo possibile per associare misure e scadenze al momento è quello di esaminare il campo “Misura correlata (riforma o investimento)”. Tale campo tuttavia non è costituito da un codice ma da un testo inserito manualmente. Questa purtroppo è una cattiva pratica abbastanza diffusa che però può portare a errori di compilazione. Errori che, puntualmente, abbiamo riscontrato.

Non si possono più individuare le amministrazioni responsabili di reporting e implementazione.

Altri campi rimossi e che avevano però una grande importanza erano quelli identificati come “Fonte dei dati/Metodologia” e “Responsabilità per il reporting e l’implementazione”. Tali campi fornivano informazioni importanti. Ovvero su quali basi metodologiche si fondavano i dati e le valutazioni riportate nel primo caso e chi era l’amministrazione responsabile dell’implementazione nel secondo.

Un appello al rispetto delle norme sulla pubblicazione di dati aperti

Nel nostro precedente approfondimento avevamo ipotizzato che i file caricati sul portale Italia domani avessero essenzialmente un fine “divulgativo” e che perciò fossero inutilizzabili a fini di analisi e monitoraggio. L’impressione dunque era che il governo e le altre istituzioni coinvolte lavorassero su altri database più attendibili e circostanziati a cui però cittadini e analisti non hanno accesso. Impressione che trova ulteriore conferma.

La pubblicazione di open data incongruenti crea solo confusione.

Nonostante il nostro appello al governo per un maggiore impegno oggi registriamo invece un passo indietro sul fronte della trasparenza. Tra i diversi problemi segnalati desta particolare perplessità il fatto che ancora oggi non sia possibile associare l’anagrafica delle misure con le relative scadenze attraverso una specifica fonte a ciò dedicata. Le continue modifiche ai dati, fatte senza annunci e senza giustificazioni, portano peraltro le stesse amministrazioni a commettere degli errori e a citare in documenti ufficiali misure con codici identificativi che in realtà non esistono. Questa situazione rende estremamente difficoltoso qualsiasi tentativo di comprendere quanto sta accadendo.

In conclusione, evidenziamo che i file presenti contraddicono in maniera palese le norme in materia di pubblicazione di dati aperti. A questo punto la richiesta che rivolgiamo al governo è quella di evitare di contribuire a creare confusione su un tema così complesso. Per questo chiediamo di sospendere la sezione open data fin quando non vi saranno le condizioni per pubblicare informazioni verificate, affidabili e conformi alle norme. Ciò non solo nel rispetto degli addetti ai lavori ma anche dei cittadini che vogliono provare a capire come le istituzioni stanno gestendo una delle più importanti partite del nostro paese dal dopoguerra a oggi.

Il nostro osservatorio sul Pnrr

Scarica i dati in formato Csv o interroga le API

Questo articolo rientra nel progetto di monitoraggio civico “openpnrr” realizzato nell’ambito delle attività di analisi sul piano nazionale di ripresa e resilienza (Pnrr). Ogni lunedì pubblichiamo un nuovo approfondimento sulle misure previste dal piano e sullo stato di avanzamento dei lavori (vedi tutti gli articoli). Nei prossimi mesi pubblicheremo anche un’apposita piattaforma in cui sarà possibile consultare tutte le informazioni disponibili. I dati dei nostri open data possono essere riutilizzati liberamente per analisi, iniziative di data journalism o anche per semplice consultazione

Photo credits: palazzo Chigilicenza

PROSSIMO POST