Tutorial QGIS 2: i formati dell’informazione geografica openoikos
Questo post è il secondo tutorial QGIS della serie.
Nel precedente tutorial abbiamo visto come le piattaforme GIS nascono dall’integrazione di diversi tipi di software per cui gestiscono informazione geografica di diversi formati.
Queste informazioni geografiche sono gestite dal GIS in modo sistematico e possono essere di due tipi:
1) informazioni spaziali;
2) informazioni non spaziali.
Le informazioni spaziali a loro volta possono essere suddivise in base a due modelli:
1.1) modello vettoriale (punti, linee, poligoni);
1.2) modello raster (griglia di celle).
Qualsiasi utente di computer grafica conosce già la distinzione tra formato vettoriale e formato immagine (raster) e tra software che gestiscono il vettoriale (Adobe Illustrator, Inkscape, tutti i CAD) e software che gestiscono immagini raster (Adobe Photoshop, Gimp, ecc.).
I file che contengono informazioni spaziali hanno assunto diversi formati e l’evoluzione del GIS, come per tutti i software, è stata condizionata da alcuni formati proprietari adottati dai produttori di software che hanno avuto maggiore successo.
I formati vettoriali proposti da ESRI (shapefile, coverage, personal geodatabase) sono quelli che più di tutti hanno caratterizzato il software GIS.
Lo shapefile in particolare è ancora fondamentale, anche per la notevole quantità di dati geografici che hanno assunto questo formato. Soffermiamoci su esso.
Che cos’è uno shapefile?
Un formato di archiviazione di dati vettoriali capace di registrare localizzazione, forma ed attributi di entità spaziali.
Uno shapefile è composto da più file relazionati e contiene una sola classe di oggetti, cioè punti, linee o poligoni.
Tutti i file che compongono lo shapefile devono avere lo stesso nome e ciò che li differenzia è l’estensione (i caratteri dopo il punto). I file devono essere almeno tre:
nomefile.shp: è il file che contiene le informazioni geometriche;
nomefile.dbf: è il file che contiene l’informazione tabellare (dati attributo);
nomefile.shx: è il file indice, che permette di raccordare geometria e informazione tabellare.
Il set può inoltre contenere altri file:
nomefile.prj: registra il Sistema di Riferimento geografico;
nomefile.sbn (o anche fbn, fbx): registrano indici spaziali;
nomefile.ain (o aih): registrano indici di attributo;
nomefile.xml: registra i metadati.
Quando si lavora con gli shapefile se si vuole spostare/copiare un dataset da una cartella a un’altra occorre ricordarsi di selezionare tutti i file, così come per rinominarli o qualsiasi altra operazione.
Con la versione 2.0 (e successive) di QGIS è stato introdotto QGIS Browser (simile ad ArcExplorer di ArcGis) per facilitare la gestione dei file.
Sugli altri formati vettoriali ESRI torneremo in seguito ed una elencazione dettagliata di altri formati vettoriali (TAB MapInfo, formati CAD, ecc.) non è il caso di farla, almeno per ora.
Più recentemente attraverso l’uso del linguaggio XML, già usato per l’informazione sui metadati (dati sui dati), sono nati altri formati come GML e KML (formato Google) che hanno inserito nuove possibilità di implementazione.
Una cosa importante da dire è che QGIS supporta tutti i formati della libreria GDAL/OGR che coprono un ampio spettro di formati raster e vettoriali.
Tra i formati immagine (raster) i più usati sono TIF e JPG, che possono essere da soli o come parte di un dataset.
Un dataset TIF ad esempio può essere composto dai seguenti file:
nomefile.tif: file immagine
nomefile.tfw: file di georeferenziazione
nomefile.aux (o .rrd): informazioni che velocizzano la rappresentazione (pyramids)
nomefile.xml: metadati
Ci sono poi altri formati raster come Geotiff, JPG2000 e ECW che incorporano all’interno di un unico file anche le informazioni necessarie per la georeferenziazione.
Altri formati raster degni di nota sono i GRID che nel caso degli ASCII GRID incorporano in un unico file .grd informazioni grafiche e di georeferenziazione.
Gli ESRI GRID invece sono dei dataset piuttosto complessi organizzati in due directory:
– una directory con lo stesso nome della GRID contenente un numero variabile di file con estensione .adf (Arc Data File);
– la directory INFO, che è condivisa con le altre GRID o coverage che sono collocate allo stesso livello della struttura delle directory.
Le informazioni non spaziali invece sono quelle che registrano semplici attributi, senza geometria né in termini di forma né di localizzazione. Sono file riconducibili ai formati tipici di database, fogli di calcolo e testi.
Ad esempio i dati rilevati e pubblicati dall’ISTAT, che possono essere messi in relazione agli ambiti geografici a cui si riferiscono solo attraverso un’unione ad altri file contenenti informazioni spaziali.
Una questione di grande importanza e attualità su cui c’è un fervente dibattito è quella della disponibilità delle informazioni geografiche all’interno della più ampia problematica degli open data unitamente ai problemi di standardizzazione e di interoperabilità su cui ci sono direttive di organismi internazionali ancora non pienamente applicate.
Sono temi interessanti ma di una certa complessità su cui torneremo in seguito con altri tutorial.
Altre letture consigliate:
Tutorial QGIS 2: i formati dell’informazione geografica openoikos