DATI GEOGRAFICI PUBBLICI NELLA

PUBBLICA AMMINISTRAZIONE

 

Preambolo

Il giorno 13 Aprile 2011 l'associazione GFOSS.it ha organizzato a Bologna presso la sede della Regione Emilia Romagna una Giornata di Studio sul tema dei dati aperti in ambito geografico: l'incontro di Bologna ha visto la partecipazione diretta di GFOSS.it, Regione Emilia Romagna e CSI Piemonte.

Il presente documento rappresenta la sintesi di quanto emerso a Bologna: evidentemente limitarsi a vaghe enunciazioni di principio ha poco senso nel contesto attuale, ed quindi il documento ha un carattere spiccatamente operativo e ben calato all'interno dei processi realmente in atto e delle tecnologie disponibili allo stato dell'arte.

Poiché si tratta di un insieme di linee guida sicuramente utili come riferimento per tutti i soggetti interessati alla pubblicazione dei dati aperti in ambito geografico, il documento è comunque permanentemente aperto alla partecipazione di tutti gli Enti ed Associazioni che riterranno di aderire anche in tempi successivi.  

 

I sottoscritti enti ed associazioni:

si impegnano a promuovere la diffusione di dati pubblici1 come dati aperti quali definiti nella Open Definition della Open Knowledge Foundation che, nella sua formulazione sintetica2, recita:

A piece of content or data is open if anyone is free to use, reuse, and redistribute it — subject only, at most, to the requirement to attribute and share-alike

 

ovvero:

Un contenuto o un dato è aperto se chiunque ha la possibilità di usarlo, riutilizzarlo e ridistribuirlo liberamente – con l'eventuale vincolo di citare la fonte e/o ridistribuire allo stesso modo

(http://www.opendefinition.org i termini della suddetta definizione vanno intesi nel modo in cui sono definiti nella open knowledge definition).

 

 

Finalità
La diffusione dei dati e il loro riutilizzo favorisce la creazione di nuova conoscenza e lo sviluppo dell'economia immateriale. La facilità di riproduzione dei dati digitali e la semplicità di accesso offerta dalla rete grazie agli standard di interoperabilità permettono in poco tempo una diffusione globale del dato. Ciò rende impensabile l'eventualità che alcuni soggetti possano lucrare sulla vendita di dati pubblici ottenuti gratuitamente: si aprono invece le porte alla creazione di servizi a valore aggiunto che utilizzano e integrano i dati pubblici accessibili e diffusi3.

 

Licenze

Si ritengono utilizzabili licenze che prevedono esclusivamente vincoli di attribuzione ed eventuale condivisione secondo i termini della stessa licenza; qualunque restrizione al riutilizzo commerciale dei dati deve essere assente.

Riteniamo importante l'uso di licenze riconosciute a livello internazionale: viceversa l'uso di  licenze realizzate  ad-hoc è fortemente deprecabile. Una volta che i dati sono disponibili lo devono essere per chiunque, e quindi l'uso di standard di riferimento riconosciuti ed apprezzati a livello internazionale non può che garantire una corretta diffusione.

Si considerano pertanto adatte le licenze elencate nell'Allegato "A"

 

Pricing

I dati pubblici devono essere disponibili al costo marginale di distribuzione ovvero ad un costo di riproduzione ragionevole, preferibilmente tramite il download gratuito via Internet4.

 

Formato aperto

I dati pubblici devono essere disponibili in formato aperto5.
Con riferimento specifico ai dati geografici / dati territoriali6 i principali formati aperti sono elencati nell'Allegato "B"

 

 

Dato grezzo e servizi di consultazione WEB

E' auspicabile la messa a disposizione del pubblico di dati tramite servizi web basati su protocolli aperti7 (in particolare, per i dati geografici / dati territoriali, mediante protocolli conformi agli standard OGC8). Tali servizi web possono affiancare ma mai sostituire la messa a disposizione in forma ulteriormente rielaborabile dei dati grezzi (raw data)9 corrispondenti.

Le linee guida specifiche per la pubblicazioni di servizi web conformi agli standard OGC sono elencate nell'Allegato "C"

 

 

 

 

 

ALLEGATO "A" - LICENZE

 

Considerato che la situazione delle licenze è in continua evoluzione, definire la lista delle licenze consigliate in un allegato separato facilita e semplifica la manutenzione futura del documento.

 

Alla data attuale [Maggio 2011] la situazione può essere sintetizzata come segue:

 

Licenze senza vincoli (dominio pubblico)

Creative Commons CC0A1
Open Data Commons Public Domain Dedication and License (ODC PDDLA2)

 

Licenze che richiedono attribuzione

Open Data Commons Attribution License (ODC ByA3)
Creative Commons Attribution (BYA4)

 

Licenze che richiedono attribuzione e la stessa modalità di condivisione (share alike)

Open Data Commons Open Database License (ODC ODbLA5)
Creative Commons Attribution Share Alike (BY-SAA6)
Italian Open Data License (IODL versione 1.0A7)

 

Preferenza di massima

Tutte le licenze sopra elencate sono perfettamente valide ed adeguate. Scegliere l'una o l'altra evidentemente dipende da condizioni particolari che verranno valutate per ciascun singolo caso concreto di applicazione.

Tuttavia si consiglia l'uso della licenza CC0 - pubblico dominio come opzione di base più adeguata per la maggior parte dei casi: questo modello favorisce maggiormente la circolazione dei dati, crea meno problematiche di costi verso la Pubblica Amministrazione ed incentiva l'effettivo il ri-uso.

 

 

Modalità di pubblicazione della licenza

Le informazioni sulla licenza devono essere presenti e facilmente identificabili sul sito WEB di distribuzione dei dati in forma breve con collegamento ai relativi dettagli.

Si consiglia comunque di allegare direttamente il testo della licenza ai files dati (p.es. all'interno del file .zip offerto in download etc).

 

ALLEGATO "B" – FORMATI DATI

 

Considerato che anche la situazione dei formati dei dati è soggetta ad evoluzione tecnologica, definire la lista dei formati dei dati consigliati in un allegato separato facilita e semplifica la manutenzione futura del documento.

 

Alla data attuale [Maggio 2011] la situazione può essere sintetizzata come segue:

 

Dati vettoriali (geometrie: eventualmente con attributi informativi associati)

ESRI ShapefileB1

GML (Geography Markup Language, qualsiasi versione)

altri formati vettoriali pubblicamente documentati (GeoJSON etc)B2

 

Dati raster (immagini e matrici numeriche georeferenziate)

 

1 - Dati raster (immagini: foto satellitari, ortofoto, mappe scannerizzate etc)

GeoTIFF (monochrome, palette, grayscale, RGB)

GIF, PNG e/o JPEG con WorldFileB3 allegato

 

2 - Dati raster (matrici numeriche: GRID, DEM, DTM, DSM etc)

GeoTIFFB4 (int16, int32, float, double)

Ascii Grid

altri formati binari pubblicamente documentati (.hgt, .bin, .flt etc)

 

Linee guida per la pubblicazione / download dei dati grezzi (= raw data):

I dati geografici tipicamente sono di rilevanti dimensioni. Pare quindi opportuno frammentare i dati in porzioni di dimensioni ragionevoli e di pratico utilizzo (fogli sezionali etc).

 

In ogni caso è opportuno pubblicare contestualmente i relativi quadri di unione, in modo tale da facilitare l'identificazione delle sezioni di effettivo interesse.

 

L'uso di interfacce interattive per la navigazione ed il download è sicuramente utile ed opportuno, ma possibilmente dovrebbe comunque essere supportato anche l'utilizzo di strumenti automatici e/o semiautomatici per il download (wget, ftp etc).

 

 

ALLEGATO "C" – SERVIZI WEB OGC

 

Considerato che anche la situazione dei servizi WEB OGC è soggetta ad evoluzione tecnologica, definire le pratiche di pubblicazione consigliate in un allegato separato facilita e semplifica la manutenzione futura del documento.

 

Alla data attuale [Maggio 2011] la situazione può essere sintetizzata come segue:

 

Consultazione contro veicolazione

I servizi WEB OGC possono essere tecnologicamente utilizzati in due contesti ben diversi:

Dato che si tratta di un'area tecnologica generalmente sottovalutata e/o mal compresa, risulta quindi particolarmente opportuno disciplinare esplicitamente i termini d'uso ammessi per tutti i servizi WEB OGC pubblicati.

Qualsiasi eventuale restrizione d'uso del servizio deve quindi essere specificata in modo chiaro e facilmente identificabile, evitando qualsiasi ambiguità.

 

Uso dei servizi WEB OGC come strumenti di distribuzione

Come già visto al punto precedente, i servizi di pubblicazione WEB OGC si prestano tecnologicamente ad essere utilizzati anche come strumenti per la distribuzione dei dati grezzi (raw data).

Di fatto un servizio WMS veicola immagini raster georeferenziate, un servizio WFS veicola contenuti vettoriali GML etc.

Resta il fatto che utilizzando i servizi WEB OGC risulta abbastanza difficoltoso scaricare coperture cartografiche complesse e/o di vasta estensione.

Pertanto il supporto di tradizionali sistemi di download basati su fogli sezionali e relativi quadri di unione risulta in ogni caso un'opzione di gran lunga preferibile dal punto di vista operativo.

Tra l'altro la soluzione di offrire direttamente in download i raw data consente di alleggerire il carico di lavoro del servizio WEB OGC, che quindi potrà essere effettivamente utilizzato per i fini specifici per cui è stato creato con la massima efficienza e senza fattori di disturbo.

Modalità cascading

Per loro stessa natura i servizi OGC possono essere utilizzati in modalità cascading: cioè un server di terze parti può ulteriormente propagare i servizi erogati dal server primario di pubblicazione, eventualmente modificandoli e/o integrandoli (appunto: meccanismo di pubblicazione a cascata).

Dato che il cascading ha sicuramente un forte impatto prestazionale sia sul server che sulle linee di comunicazione, mentre viceversa non è strettamente indispensabile ai fini della libera consultazione dei dati, risulta estremamente opportuno disciplinare esplicitamente le specifiche modalità di cascading ammesse (oppure proibite) per ciascun servizio OGC pubblicato, evitando qualsiasi ambiguità.

1Sono dati pubblici ai sensi dell'art. 1 lett. n del D. Lgs. 82/05 (Codice dell'Amministrazione Digitale) “i dati conoscibili da chiunque”.

2La definizione estesa è disponibile all'URI http://www.opendefinition.org/okd/italiano/

3http://www.datagov.it/il-manifesto/trattare-linformazione-come-infrastruttura/

http://www.datagov.it/il-manifesto/open-data-per-lo-sviluppo-economico-del-terzo-millennio/  

4http://www.epsiplus.net/content/download/3241/35000/file/Italian_l_34520031231it00900096.pdf cfr paragrafo 5 della Direttiva 2003/98/CE del Parlamento Europe e del Consiglio (direttiva PSI): "Più ampie possibilità di riutilizzo delle informazioni del settore pubblico dovrebbero, tra l'altro, consentire alle imprese europee di sfruttarne il potenziale e contribuire alla crescita economica e alla creazione di posti di lavoro."

5Sono formati di tipo aperto ai sensi dell'art. 68, 3 del D. Lgs. 82/05, i formati resi pubblici e documentati esaustivamente. La documentazione deve essere disponibile gratuitamente oppure ad un costo puramente nominale e gli eventuali diritti che ne possano limitare l'uso (brevetti od altri diritti di privativa) devono essere licenziati gratuitamente ed irrevocabilmente

6Quali definiti all'art. 59 comma 1 del D. Lgs. 82/05.

7Il protocollo aperto è disponibile al pubblico, esaustivamente documentato ed il cui documento è disponibile gratuitamente oppure ad un costo puramente nominale e per il quale gli eventuali diritti che ne possano limitare l'uso (brevetti od altri diritti di privativa) sono licenziati gratuitamente ed irrevocabilmente.

8Open Geospatial Consortium http://www.opengeospatial.org

9Si intende per "dato grezzo" l'accesso ai dati secondo un formato aperto

A1http://creativecommons.org/publicdomain/zero/1.0/

A2http://www.opendatacommons.org/licenses/pddl/1-0/

A3http://www.opendatacommons.org/category/odc-by/

A4 http://creativecommons.org/licenses/by/3.0/deed.it

A5http://www.opendatacommons.org/licenses/odbl/

A6http://creativecommons.org/licenses/by-sa/3.0/deed.it

A7http://www.formez.it/iodl/

B1anche se questo formato appartiene formalmente ad ESRI, tuttavia è pubblicamente documento, ed è inoltre supportato dalla quasi totalità del SW GIS disponibile, sia di tipo proprietario che libero. Per consentire l'effettivo riutilizzo dei dati occorrerà tuttavia specificare esplicitamente il sistema di riferimento spaziale (SRID) nonchè il charset encoding utilizzati, dato che l'informazione non è supportata direttamente dal formato.

B2 la preferenza va comunque ai primi due, dato che sono quelli maggiormente utilizzati e più facilmente utilizzabili.

B3anche in questo caso occorrerà specificare esplicitamente il sistema di riferimento spaziale (SRID) utilizzato, dato che l'informazione non è supportata direttamente dal formato.

B4in questo caso occorrerà specificare esplicitamente il valore NODATA utilizzato, dato che l'informazione non è supportata direttamente dal formato.