Algoritma dan Struktur Data - Struktur DataKuliahKita
Dokumen ini membahas tentang struktur data dan algoritma. Struktur data adalah cara mengorganisasikan data di program agar dapat disimpan dan diakses secara efisien. Ada beberapa bentuk struktur data seperti kumpulan elemen data yang dibungkus dalam tipe, stack, queue, array, list, tree dan lainnya. Contoh struktur data adalah definisi jam yang memiliki atribut Hour, Minute, Second.
Deep learning is a machine learning technique that uses artificial neural networks with multiple hidden layers to learn representations of data by increasing the level of abstraction from lower to higher layers. It has proven effective for multimedia data mining tasks like image tagging and caption generation. Deep neural networks can extract meaningful patterns from high-dimensional input using convolutional and recurrent layers, whereas shallow networks are limited. While deep learning has achieved good results, supervised approaches require large labeled datasets.
This document provides an overview of different data models, including object-based models like the entity-relationship model and object-oriented model, and record-based models like the relational, network, and hierarchical models. It describes the key features of each model, such as how data and relationships are represented, and highlights some of their advantages and disadvantages. The presentation aims to guide students in understanding different approaches to database design and modeling.
The Relational Data Model and Relational Database Constraints Ch5 (Navathe 4t...Raj vardhan
The Relational Data Model and Relational Database Constraints
Ch5 (Navathe 4th edition)/ Ch7 (Navathe 3rd edition)
Example of STUDENT Relation(figure 5.1)
1.1 Data Modelling - Part I (Understand Data Model).pdfRakeshKumar145431
Data modeling is the process of creating a data model for data stored in a database. It ensures consistency in naming conventions, default values, semantics, and security while also ensuring data quality. There are three main types of data models: conceptual, logical, and physical. The conceptual model establishes entities, attributes, and their relationships. The logical model defines data element structure and relationships. The physical model describes database-specific implementation. The primary goal is accurately representing required data objects. Drawbacks include requiring application modifications for even small structure changes and lacking a standard data manipulation language.
This document summarizes a seminar on temporal databases. It discusses the key topics covered in the seminar including an introduction to temporal databases and their features like valid time and transaction time. It also covers the problems of schema versioning that temporal databases address. The advantages include support for declarative queries and solving problems in temporal data models. Applications mentioned include financial, medical, and scheduling systems. Current research is focused on improving spatiotemporal database management systems. The conclusion is that temporal databases are an emerging concept for storing data in a time-sensitive manner and further efforts are needed to generalize databases as structures change over time.
This document discusses data reduction strategies for reducing large datasets. It describes data cube aggregation, which aggregates data into a simpler form by combining and summarizing data tables. Attribute subset selection is also covered, which reduces a large number of attributes by eliminating irrelevant attributes. The document provides an example of attribute subset selection using forward selection, backward elimination, and decision tree induction to select the most important attributes of age and gender from a dataset containing name, age, gender, address, and phone number attributes. Data reduction maintains data integrity while reducing volume and improving data mining efficiency on large datasets.
This document discusses different types of data models, including object based models like entity relationship and object oriented models, physical models that describe how data is stored, and record based logical models. It specifically mentions hierarchical, network, and relational models as examples of record based logical data models. The purpose of data models is to represent and make data understandable by specifying rules for database construction, allowed data operations, and integrity.
Dokumen ini membahas tiga teknik kartografi dan geovisualisasi yaitu Parallel Coordinate Plot (PCP), Space-Time Cubes (STC), dan Self-Organizing Map (SOM). PCP digunakan untuk visualisasi dan analisis data berdimensi tinggi, STC merepresentasikan pergerakan objek dalam ruang dan waktu, sedangkan SOM melakukan pemetaan data berdimensi tinggi menjadi bentuk dua dimensi untuk mempermudah pemahaman. Ketiga teknik ini telah diterap
Praktikum Sistem Basis Data menggunakan PostgresSQLMega Yasma Adha
Laporan praktikum ini membahas pengenalan dan pembuatan basis data menggunakan PostgreSQL. Tujuannya adalah memahami PostgreSQL, membuat tabel, dan mengkonfigurasi basis data. Mahasiswa belajar cara membuat dan mengisi tabel serta menambahkan data menggunakan antarmuka dan bahasa SQL. Berbagai tipe data dan konsep seperti primary key dan foreign key diperkenalkan.
Dokumen tersebut membahas tentang kalibrasi kamera untuk pemetaan kawasan melalui fotogrametri. Terdapat tiga metode utama kalibrasi kamera yaitu in-situ calibration yang melibatkan kalibrasi kamera besar di lapangan, precision multi-collimator instruments yang memanfaatkan peralatan khusus di laboratorium, dan self calibration yang secara otomatis menentukan parameter kalibrasi berdasarkan informasi gambar hasil foto.
This document discusses different types of data models, including hierarchical, network, relational, and object-oriented models. It focuses on explaining the relational model. The relational model organizes data into tables with rows and columns and handles relationships using keys. It allows for simple and symmetric data retrieval and integrity through mechanisms like normalization. The relational model is well-suited for the database assignment scenario because it supports linking data across multiple tables using primary and foreign keys, and provides query capabilities through SQL.
Dokumen tersebut membahas tentang sistem informasi geografis dan analisis spasial, termasuk definisi SIG, jenis-jenis analisis spasial seperti jarak, luas, keliling, dan hubungan antar unsur spasial, serta contoh aplikasi analisis spasial seperti buffer dan overlay.
This document discusses spatial data mining. It defines spatial data as data pertaining to the geographic location of features and boundaries on Earth. Spatial data mining involves discovering patterns from large spatial datasets and can be used for applications like GIS, geomarketing, and natural disaster prediction. Some key techniques of spatial data mining include spatial classification, clustering, and detecting trends and autocorrelation. The document also discusses spatial data structures like grids, R-trees, and z-ordering which are used to store and index spatial data.
Materi yang ada pada slide ini berisi :
Penjelasan Umum Relasi Kelas
Penjelasan Derajat Relasi Kelas
Konsep dan Simulasi Relasi Kelas Dependency
Konsep dan Simulasi Relasi Kelas Association
Konsep dan Simulasi Relasi Kelas Aggregation
Konsep dan Simulasi Relasi Kelas Composition
Konsep Relasi Kelas Generalisasi (Inheritance)
Penjelasan Konsep MVC
----------------------------------------------------------------------
Keep in touch with me in :
Email : rizkiadamunikom@gmail.com
The document discusses several data models: hierarchical, network, relational, object-oriented, object-relational, deductive, and ER models. It provides descriptions of each model, including their key features, advantages, and disadvantages. The relational model is highlighted as the most popular currently due to its structural independence, conceptual simplicity, and powerful query capabilities using SQL. The ER model is also discussed as defining the conceptual view of databases through modeling real-world entities and relationships.
Progettazione concettuale per le basi di dati - Introduzione e il modello ERMarco Brambilla
Ulteriori esempi e spiegazioni su:
Braga Brambilla Campi - Eserciziario di basi di dati - Edizioni Esculapio, Progetto Leonardo.Euro 12,00.
http://www.editrice-esculapio.it/shop/product/129/Braga-Brambilla-Campi-Eserciziario-di-basi-di-dati.asp
Semplice introduzione ai DBMS e al linguaggio SQL (con attenzione verso pgsql). Ispirato da Appunti di Informatica Libera - http://informaticalibera.net/
La gestione dei database secondo il GDPR – SQL ServerDatamaze
La nuova privacy europea e come adeguarsi entro la scadenza normativa per la gestione dei database Microsoft SQL Server e infrastruttura informative aziendali.
L'avvento del GDPR nel Maggio del 2018 ci consente di fare una serie di riflessioni riguardo ai nostri database e ai dati in essi contenuti. Come dobbiamo prepararci?
Come funzionano i Retrieval-Augmented Generators (RAG) e quanto i database vettoriali sono fondamentali per poter memorizzare e utilizzare le sorgenti dati aziendali e personali?
Dispense del corso IN530 "Sistemi per l'elaborazione delle informazioni" presso il Corso di Laurea in Matematica dell'Università degli Studi Roma Tre.
[http://www.mat.uniroma3.it/users/liverani/IN530/]
Slide che Filippo d'angelo dell'inps ha utilizzato per tenere il seminario online sui dati perti dell'INPS per Dati.gov.it
qui maggiori info: http://www.dati.gov.it/content/terzo-ciclo-di-seminari-online-sui-dati-aperti
La gestione dei dati della ricerca e il ruolo delle biblioteche: quali sfide ...libriedocumenti
Conferenza tenuta presso la ex SSAB da Paola Gargiulo (CINECA) il 19-04-2013 nell'ambito del 7. ciclo "Biblioteche libri documenti: dall'informazione alla conoscenza", a.a. 2012-2013, Prof.ssa M.T. Biagetti
Business Intelligence e Business Analytics sono termini che ricorrono ormai quotidianemente. Cosa significano? Che valore portano in una azienda? Come si crea una soluzione di Business Intelligece e di Business Analytics? Che strumenti mette a disposizione la piattaforma Microsoft? In questa sessione andremo ad introdurre tutti gli attori, gli strumenti e le tecnologie che concorrono a realizzare tali soluzioni, vendendone alcune "dal vivo" per capire come si usano ed il grande valore aggiunto che, in una società sempre più affamata di informazioni, ma ricca solo di dati, possono portare.
La gestione logica dei dati come chiave del successo per Data Scientist e Bus...Denodo
Watch full webinar here: https://buff.ly/3Fmc74I
Affinché i progetti di data science abbiano successo, i Data Scientist e i Business Analysts hanno bisogno di accedere a una molteplicità di dati. Tuttavia, consentire l'accesso a tutti i dati tramite un repository centrale integrato è un compito spesso arduo, che può richiedere fino all'80% del tempo del progetto in attività di acquisizione, esplorazione, comprensione e preparazione dei dati.
La Gestione Logica dei dati può aiutare i Data Scientist e i Business Analyst ad accelerare alcune delle attività più tediose e onerose, consentendo loro di concentrarsi sui loro obiettivi e su come i dati consentono di raggiungerli. Poiché la piattaforma di Gestione Logica dei dati dei dati si integra agilmente nell'ecosistema aziendale, i Data scientist o i Business Analyst possono continuare a utilizzare gli strumenti che conoscono, senza dover acquisire nuove competenze per sfruttare compiutamente i dati disponibili.
In questa sessione on-demand, scopriremo insieme come la Gestione Logica dei dati permetta di:
- fornire tutti i dati aziendali, in tempo reale e senza repliche;
- creare e condividere più modelli logici con un semplici operazioni di drag and drop;
- disporre di un catalogo attraverso il quale comprendere facilmente il significato dei dati, le loro relazioni reciproche e la loro origine.
Strumenti digitali professionisti - Gestione del datoFabio Tonini
Gestire correttamente i dati, organizzazione dei files, valutazione della sicurezza e protezione, analisi dei dati, valorizzazione economica del dato, sicurezza informatica e molti altri aspetti tecnici e formativi necessari in azienda e per i professionisti per creare valore dall'enorme mole di dati che oggi ognuno di noi è
Il seminario presenta le nuove soluzioni di archiviazione e gestione dei dati disponibili oggi sul mercato, basate su database denominati “noSQL”. Dopo una breve introduzione sui concetti fondamentali dei database relazionali (RDBMS), sarà effettuato un confronto con database basati sui documenti (MongoDB) e Key Value Storage (Redis)
1. Basi di Dati Spaziali
Daniela Poggioli
IREA - CNR
DIIAR - Politecnico di Milano
2. Indice
1. Introduzione alle basi di dati
• Definizioni e caratteristiche principali
2. Progettazione di una base dati
• Esterna, concettuale, logica, interna o fisica
3. Modellizzazione concettuale di dati
• Diagramma entità - relazione
• Diagramma UML
4. Modellizzazione logica: il modello relazionale
5. Modellizzazione di dati geografici
• Il dato geografico
• Aspetto spaziale
- Dati raster e vettoriali
- Geometria e topologia
• Aspetto semantico
- Accessibilità dei contenuti
- Ontologie
• Aspetto di qualità
- Metadati
6. Cenni ai GIS
7. Il problema dell’interoperabilità
• Infrastrutture di dati spaziali (SDI): definizione
• L’iniziativa europea Inspire
3. 1. Introduzione alle basi si dati:
Definizioni e caratteristiche principali
Rappresentare e gestire l’informazione
Sistemi informativi, informazioni e dati
Basi di dati e sistemi di gestione di basi di
dati
Linguaggi per le basi di dati
Vantaggi e svantaggi dei DBMS
4. Rappresentare e gestire l’ informazione
Ogni organizzazione ha bisogno di memorizzare e
mantenere informazioni specifiche. Ad esempio:
Utenze telefoniche
Studenti iscritti ad un corso di laurea
Quotazione azioni nei mercati telematici
Proprietà catastali
Necessitano di strumenti per la rappresentazione
dell’informazione e della sua gestione.
5. Rappresentare e gestire l’ informazione
Informazione: é parte di qualsiasi attività umana
Rappresentazione: il problema di astrarre i concetti
importanti da quelli trascurabili per poter modellare la
realtà di interesse: ci serve studiare metodi di
rappresentazione appropriati
Gestione: uso e trasformazione dell’informazione in
maniera funzionale agli obiettivi
6. Sistemi informativi, informazioni e dati
I sistemi informativi organizzano e gestiscono le informazioni
necessarie allo svolgimento di ogni attività di una organizzazione:
Sistema
Informativo
(Attività di organizzazione
e gestione)
DATI Informazioni
Il concetto di sistema informativo è indipendente dalla sua gestione automatica
(es. archivi bancari, servizi anagrafici, …)
Se è gestito in modo automatizzato => basi di dati
Dati = elementi di informazione, che di per sé non hanno interpretazione
Informazione = dati interpretati e correlati opportunamente
Dati “stabili”: poiché sono una risorsa da mantenere, devono essere indipendenti
dalle procedure e applicazioni che operano su di essi
2377540
2377540 Numero
matricola
7. Sistemi informativi
Un sistema informativo è un insieme di:
risorse umane,
strumenti di elaborazione, scambio, acquisizione di
informazioni,
regole e procedure per il loro trattamento.
L’obiettivo è quello di memorizzare grandi quantità di
informazioni, rendendone disponibili anche le
operazioni di modifica e di reperimento
L’evoluzione dei sistemi informativi da settoriali a
integrati per garantire l’interoperabilità dei dati
8. Gestione dei sistemi informativi
Le informazioni differiscono dal tipo di
applicazioni e dal loro uso, ma devono avere
in comune un sistema di gestione che
preveda:
Input e verifica dei dati
Gestione e memorizzazione dei dati
Presentazione e output dei dati
Trasformazione dei dati
Interazione con l’utente
9. Basi di dati e
sistemi di gestione di basi di dati
Una base di dati è una collezione di dati utilizzati per
rappresentare le informazioni di interesse per un sistema
informativo.
Un sistema di gestione di basi di dati (DBMS) è un sistema
software in grado di gestire collezioni di dati grandi, condivise
e persistenti, assicurando la loro affidabilità e privatezza.
Come ogni prodotto informatico un DBMS deve essere
efficiente ed efficace.
10. Caratteristiche delle basi di dati
Grandi: anche migliaia di miliardi di byte (necessità di prevedere
gestione dati in memoria secondaria)
Condivise: applicazioni e utenti diversi devono poter accedere,
secondo opportune modalità, a dati comuni.
In questo modo si riduce la ridondanza dei dati e la possibilità di
inconsistenze cioè copie non uguali dello stesso dato.
Persistenti: i dati devono essere mantenuti, la loro esistenza non è
limitata al periodo delle singole esecuzioni dei programmi che le
utilizzano.
11. Caratteristiche dei
sistemi di gestione di basi di dati
Affidabilità: Capacità del sistema di conservare intatto il contenuto della
base di dati (funzionalità di salvataggio e ripristino dei dati)
Privatezza: Definizione di meccanismi per le limitazioni dell’accesso
(autorizzazioni)
Efficienza: Capacità di svolgere le operazioni utilizzando un insieme di
risorse (tempo di esecuzione e spazio di memoria) accettabile per gli utenti
Efficacia: Capacità di rendere produttive le attività dell’utente
12. DBMS: struttura semplificata
Utenti
Dati Metadati
Software per l’accesso
Software per i programmi
e le richieste
DBMS
Applicazioni
Database
System
Noi ci
occuperemo
della
progettazione
una base di
dati
13. Linguaggi per le basi di dati
Data Definition Language (DDL) = definisce livelli fisici, logici,
esterni del DB (tratta anche le autorizzazioni di accesso)
Data Manipulation Language (DML) = per formulare
interrogazioni e aggiornamenti delle istanze del DB
Alcuni linguaggi (ad es. SQL) presentano in forma integrata le funzionalità
di entrambe le catagorie.
L’accesso ai dati può avvenire mediante:
1. Linguaggi testuali interattivi (es. SQL)
2. Comandi speciali integrati in un linguaggio di programmazione
(Pascal, C, Cobol, ...)
3. Interfacce user-friendly che permettono di sintetizzare
interrogazioni senza usare un linguaggio testuale
14. Vantaggi e svantaggi dei DBMS
VANTAGGI
Permettono di considerare i dati come una risorsa
comune, e le basi di dati come modello della realtà
Controllo centralizzato dei dati con possibilità di
standardizzazione
La condivisione porta alla riduzione di ridondanze e
inconsistenze
Indipendenza dei dati favorisce lo sviluppo e la
manutenzione di applicazioni flessibili e modificabili
SVANTAGGI
Complessi, costosi, hanno specifici requisiti in termini
di SW e HW
Servizi forniti dai DBMS, in forma integrata
15. 2. Progettazione di base di dati
Il ciclo di vita dei sistemi informativi
Metodologie di progettazione
Fasi di progettazione di basi di dati
Modelli dei dati: esterno, concettuale, logico, interno
16. Il ciclo di vita dei sistemi informativi
Il progetto di una base di dati si inserisce nel ciclo di vita del sistema
informativo che comprende le seguenti attività:
Studio di fattibilità
Raccolta ed analisi
dei requisiti
Progettazione
Implementazione
Validazione e
collaudo
Funzionamento e
manutenzione
La progettazione dei
dati che individua
l’organizzazione e la
struttura della base di
dati
La progettazione
delle applicazioni
(funzioni), che
schematizza le
operazioni sui dati e
progetta il software
applicativo
17. Metodologie di progettazione
Una metodologia di progettazione consiste in:
Decomposizione dell’intera attività di progetto in
passi successivi indipendenti fra loro (ad es. separare
le decisioni relative a “cosa” rappresentare e “come”
farlo)
Insieme di strategie e criteri di scelta da seguire nei
vari passi
Modelli di riferimento per la descrizione dei dati
18. Metodologie di progettazione:
proprietà
Le proprietà che una metodologia di
progettazione deve garantire sono:
La generalità rispetto alle applicazioni (possibilità di
utilizzo indipendentemente dal caso di studio e dagli
strumenti)
La qualità del prodotto in termini di correttezza,
completezza ed efficienza in relazione alle risorse
impiegate
La facilità d’uso sia delle strategie che dei modelli di
riferimento
19. Le fasi della progettazione
2. Progettazione
Concettuale: Esprime i requisiti di un sistema in una
descrizione adatta all’analisi dal punto di vista
informatico
Logica: Evidenzia l’organizzazione dei dati dal punto
di vista del loro contenuto informativo, descrivendo la
struttura di ciascun record e i collegamenti tra record
diversi.
Fisica: A questo livello la base di dati è vista come un
insieme di blocchi fisici su disco. Qui viene decisa
l’allocazione dei dati e le modalità di memorizzazione
dei dati.
1. Analisi dei requisiti
Individuare e studiare le funzionalità
che il sistema dovrà fornire
3. Implementazione e validazione
Realizzazione del sistema informativo e verifica
del corretto funzionamento
Progettazione
concettuale
Progettazione
fisica
Progettazione
logica
20. Le fasi della progettazione
Come procedo? Dovrò:
1. Modellare dati e relazioni (il mondo reale va
descritto)
2. Trovare le strutture appropriate per i dati
Ogni fase della progettazione avrà come prodotto uno
SCHEMA che fa riferimento ad un MODELLO di dati.
21. Modelli dei dati, schemi e istanze
Modello dei dati: è un
insieme di concetti che
possono essere utilizzati per
rappresentare la realtà, per
organizzare i dati di interesse
e descriverne la struttura.
Schema dei dati:
rappresentazione di una
specifica parte della realtà,
che usa un modello dei dati.
Istanza: collezione di valori
dei dati che rispetta la
struttura dello schema.
22. Modellazione esterna dei dati
Si devono individuare e studiare le
funzionalità che il sistema dovrà fornire.
Comporta l’interazione con gli utenti del
sistema e gli esperti di dominio e si conclude
in una descrizione informale dei requisiti.
Uso il linguaggio naturale che però è
soggetto ad ambiguità
23. Modellazione concettuale dei dati
Ha lo scopo di rappresentare la realtà di interesse in
termini di una descrizione precisa e completa ma
indipendente dai criteri di rappresentazione usati dal
sistema informatico scelto per gestire la base di dati
(rappresentazione astratta)
Uso un linguaggio formale
Esempi: Entità-relazione,
UML
24. Modellazione logica dei dati
Lo schema concettuale definito nella fase
precedente viene tradotto nello schema
logico che fa riferimento ad un modello
logico.
Ogni modello logico ha lo scopo di
rappresentare la realtà di interesse in
termini di una descrizione ancora
indipendente dai dettagli fisici ma concreta,
in quanto presente nei sistemi di gestioni
delle basi di dati.
Uso un linguaggio comprensibile al computer (mappatura)
Esempi: relazionale, reticolare, gerarchico, a oggetti.
25. Modellazione interna dei dati
Lo schema logico viene mappato nella struttura dei
parametri fisici di memorizzazione dei dati
(organizzazione dei file e degli indici).
Si definisce lo schema fisico dei dati che dipende dal
sistema di gestione di basi di dati scelto.
IMPLEMENTAZIONE
26. 3. Modellizzazione concettuale di dati
Il modello Entità-Relazioni:
definizione, associazioni, identificatori,
gerarchie e loro proprietà
Il modello UML:
il diagramma delle classi e le relazioni
27. Diagramma entità relazioni
Gli schemi del vari modello esterno descritti nel
linguaggio naturale che derivano dall’analisi dei
requisiti, vanno rappresentati con un modello
concettuale utilizzando un linguaggio formale.
Un metodo tra i più utilizzati è
l'approccio entità - relazione:
linguaggio formale basato sui
concetti fondamentali di
entità, relazioni, attributi,
domini.
28. Entità
Sono insiemi di oggetti concettualmente appartenenti ad
una stessa classe, aventi proprietà comuni ed esistenza
autonoma rispetto agli elementi di altre entità.
Ogni entità ha un nome che la identifica univocamente.
Es. Città, Dipartimento, Impiegato, Acquisto e
Vendita (nel contesto di un’applicazione aziendale)
Una occorrenza di una entità è un oggetto della
classe che l’entità rappresenta
Impiegato Dipartimento
Città
29. Relazione
E' un legame concettuale tra due o più entità;
Ad esempio:
Residenza: tra le entità Città e Impiegato
Esame: tra le entità Studente e Corso
Un occorrenza di relazione è una n-upla costituita da
occorrenze di entità. Ad esempio:
Residenza: Bologna, Rossi; oppure Firenze, Verdi
Ogni relazione ha un nome che la identifica univocamente
Graficamente:
Studente CorsoEsame
30. Relazione
Possono esistere relazioni diverse che
coinvolgono le stesse entità. Ad esempio:
È possibile avere relazione tra
una entità e se stessa.
Impiegato CittàResidenza
Sede di
lavoro
Collega
31. Attributi
Descrivono le proprietà elementari di entità e relazioni che
sono di interesse ai fini dell’applicazione. Ad es:
Cognome, Stipendio e Età sono possibili attributi dell’entità
Impiegato
Data e Voto sono possibili attributi della relazione Esame tra
Studente e Corso
Un attributo associa a ciascuna occorrenza di entità o di
relazione un valore appartenente al dominio dell’ attributo
Dominio: range di valori ammissibili per l’attributo
Studente CorsoEsame
Anno di
iscrizione
Matricola
Voto Data esame
Crediti
Nome
Docente
32. Attributi
Attributi composti:
Può risultare comodo raggruppare attributi che
presentano affinità nel loro significato e uso
L’insieme di attributi che si ottiene in questo
modo viene detto attributo composto
Persona
Via
Età
Nome
Sesso
Indirizzo
CAP
Numero civico
Attributi semplici
Attributi composti
33. Cardinalità delle relazioni
Per ogni entità che partecipa alla relazione viene indicata la
cardinalità, cioè il numero minimo e massimo di legami che
un elemento di quell’entità può formare con le occorrenze
delle altre entità coinvolte.
La cardinalità rappresenta il numero di volte che una data
istanza di entità deve o può partecipare alla relazione, ad es.
Libro PersonaPrestito
(0,1) (0,5)
Un libro può essere in prestito o meno, una persona
può avere in prestito fino a 5 libri.
34. Cardinalità delle relazioni
Nella maggiore parte dei casi, è sufficiente utilizzare
solo tre valori:
Zero
Uno
Il simbolo N: indica genericamente un intero maggiore di uno
Cardinalità minima:
Zero: la partecipazione dell’entità relativa è opzionale
Uno: la partecipazione dell’entità relativa è obbligatoria
Cardinalità massima:
Uno: la partecipazione dell’entità relativa associa a una
occorrenza dell’entità una sola occorrenza (o nessuna) dell’altra
entità che partecipa alla relazione
Molti: c’è una associazione con un numero arbitrario di
occorrenze dell’altra entità
35. Cardinalità delle relazioni
Osservando le cardinalità massime si ottiene la
classificazione seguente:
Cardinalità massima pari
a uno per entrambe le
entità coinvolte: definisce
una corrispondenza uno a
uno tra le occorrenze di
tali entità.
Ordine FatturaVendita
(0,1) (1,1)
Relazione uno a uno
Relazione uno a molti
Persona CittàResidenza
(1,1) (0,N)
Ogni persona è residente
in una sola città. Ogni
città può avere molti
residenti
Relazione molti a molti
Turista ViaggioPrenotazione
(1,N) (0,N)
Cardinalità massima pari a N
per entrambe le entità
coinvolte
36. Cardinalità degli attributi
Possono essere specificate per gli attributi di entità
o relazioni
Descrivono il numero minimo e massimo di valori
dell’attributo associati a ogni occorrenza di entità o
relazione
Nella maggior parte dei casi, la cardinalità di un
attributo è (1,1) e viene omessa
Cardinalità minima
0: l’attributo è opzionale
(l’informazione potrebbe
essere non disponibile)
1: l’attributo è obbligatorio
Persona
Targa automobile
Numero patente
Nome
(0,N)
(0,1)
Cardinalità massima
N: l’attributo è multivalore
38. Identificatori delle entità (chiavi)
Descrivono i concetti (attributi e/o entità) che
permettono di identificare univocamente le
occorrenza delle entità
In molti casi, uno o più attributi di una entità
sono sufficienti a individuare un identificatore
interno (o chiave)
Esempio: non possono esistere due
automobili con la stessa targa
Identificatore interno
Automobile
Targa
Colore
Modello
39. Identificatori delle entità (chiavi)
Es: un identificatore interno per l’entità Persona
può essere Nome, Cognome e Data di nascita
Persona
Data di nascita
Nome
Cognome
Indirizzo
Alcune volte gli attributi di una entità non sono
sufficienti a identificare univocamente le sue
occorrenze, ad es.
40. Identificatori delle entità (chiavi)
Due studenti iscritti a università diverse possono avere lo
stesso numero di matricola
Per identificare univocamente uno studente serve, oltre al
numero di matricola, anche la relativa università
Un identificatore corretto per l’entità studente è costituito
dall’attributo Matricola e dall’entità Università
Questa identificazione è resa possibile dalla relazione uno
a molti tra Università e Studente
Studente UniversitàIscrizione
(1,1) (1,N)
Nome
Indirizzo
Città
Matricola
Cognome
Anno
iscrizione
41. Identificatori delle entità
Identificatore esterno: quando l’identificazione di
una entità è ottenuta utilizzando altre entità.
Una entità E può essere identificata da altre
entità solo se tali entità sono coinvolte in una
relazione cui E partecipa con cardinalità (1,1).
42. Generalizzazioni
Rappresentano legami logici tra una entità E detta
padre e più entità E1 ,E2, ..., En dette entità figlie.
L’entità E è più generale e comprende le entità
figlie. (Struttura gerarchica)
Ogni proprietà dell’entità
padre è anche una proprietà
delle entità figlie (ereditarietà)
Es. Gli studenti hanno un
nome e un indirizzo
Ogni occorrenza di una
entità figlia è anche
occorrenza dell’entità padre.
Es. Gli impiegati sono
persone
43. Generalizzazioni
Una generalizzazione è totale se ogni occorrenza
della classe padre è una occorrenza di almeno una
delle entità figlie, altrimenti è parziale.
Ad esempio la generalizzazione tra Persona e le
entità Uomo e Donna è totale, la generalizzazione tra
Veicolo e le entità Automobile e Bicicletta e parziale
Veicolo
Automobile Bicicletta
44. Generalizzazioni
Una generalizzazione è esclusiva se ogni occorrenza
della classe padre è al più una occorrenza di una delle
entità figlie, altrimenti è sovrapposta
Ad esempio la generalizzazione tra Veicolo e le entità
Automobile e Bicicletta è esclusiva, la generalizzazione
tra persona e le entità Studente e Lavoratore è
sovrapposta
Le generalizzazioni sovrapposte possono essere
trasformate in generalizzazioni esclusive.
Si aggiungono una o più entità figlie, per
rappresentare i concetti che costituiscono le
“intersezioni” delle entità che si sovrappongono, ad es:
aggiungere l’entità StudenteLavoratore
45. Generalizzazioni
Una stessa entità può essere coinvolta in
più generalizzazione diverse
Posso esserci generalizzazioni su più livelli
(una gerarchia)
46. ESEMPIO: modellizzazione di dati
geografici
Il Catasto vuole un
sistema informativo
che permetta di
associare le proprietà
catastali ai rispettivi
proprietari.
Le proprietà catastali sono oggetti o "fenomeni” spaziali
georeferenziabili tramite
indirizzo (posizionamento indiretto)
o coordinate del perimetro (posizionamento diretto)
47. Esempi di possibili applicazioni
Evidenziare tutte le particelle appartenenti al signor Rossi
Dare gli indirizzi e le dimensioni superficiali di tutte le particelle
appartenenti al signor Rossi
Dare indirizzi e proprietari di tutte le particelle con dimensione
maggiore di un certo valore
Trovare tutte le particelle adiacenti alle particelle del signor
Rossi
Verificare se il signor Rossi e il signor Verdi hanno particelle
confinanti
Dare le dimensioni di tutte le particelle che si affacciano sulla
strada "NomeStrada".
Stiamo considerando entità di tipo superficiale dobbiamo
descrivere non solo le posizioni degli oggetti (particelle) ma
anche le loro relazioni con altri oggetti (altre particelle,
strade, proprietari,...)
48. ESEMPIO
Consideriamo la modellazione
solo geometrica dell'aspetto
spaziale della carta; come
primitive geometriche
supponiamo di considerare:
• punti
• segmenti (curve caratterizzate
solo da 2 vertici e dal metodo di
interpolazione del cammino
minimo)
Supponiamo inoltre di avere informazioni relative al nome e tipologia
delle strade; all'identificativo e all'indirizzo delle particelle catastali
e dati anagrafici relativi ai proprietari delle particelle stesse
(Codice Fiscale, Nome, Cognome, Data di Nascita, Luogo di
Nascita, Indirizzo).
52. Il modello UML
Esigenza di avere un linguaggio universale per
modellare gli oggetti che potesse essere utilizzato dalle
aziende produttrici di software.
Linguaggio UML (Unified Modeling Language)
Linguaggio per la modellazione completa (dati,
operazioni, processi e architetture) di applicazioni
software che definisce le caratteristiche e le relazioni
esistenti tra le diverse componenti di un progetto (es.
classi, attributi, procedure, relazioni, moduli, ...).
53. Il modello UML
Il linguaggio UML contiene svariati elementi grafici ed
utilizza delle regole per combinare i componenti del
linguaggio durante la creazione dei diagrammi.
I modelli di diagramma sono rappresentazioni grafiche
delle componenti del progetto.
L’obiettivo dei diagrammi è quello di costruire molteplici
viste di un sistema tutte correlate tra di loro.
Il linguaggio UML consiste di nove diagrammi di base,
ma è possibile costruire e aggiungere diagrammi
differenti dagli standard.
54. Il diagramma delle classi
Cosa è una classe?
Tutti gli oggetti o esseri viventi, spesso, sono riconducibili a
determinate categorie che hanno attributi e comportamenti simili.
Queste categorie individuano delle classi.
La rappresentazione grafica di una
classe, entità fondamentale del
diagramma delle classi; sono
evidenziate le tre parti: nome,
attributi e operazioni.
55. Il diagramma delle classi
Esempi di classi
Indirizzo
Street: String
City: String
GetStreet(): String
SetStreet(_street:string)
GetCity():String
SetCity(_city:String)
Viene indicato il tipo (string) degli attributi che
specificano un indirizzo ovvero street e city e
quattro metodi.
Due mi permettono di ricavare l’informazione
contenuta negli attributi e gli altri due di
settare un valore degli attributi utilizzando un
parametro.
Punto
X: int
Y: int
Punto(x:int, y:int)
X():int
Y():int
Add(p: punto)
Gli attributi che descrivono la classe punto
sono di tipo intero (le sue coordinate). I
metodi mi permettono di costruire un nuovo
punto e di compiere una somma delle
coordinate x e y di due punti.
56. Le relazioni
Una relazione è una connessione tra elementi UML.
Senza le relazioni, un modello di classi sarebbe soltanto una lista
di entità che rappresentano un "vocabolario" del sistema.
Le relazioni mostrano come i termini del vocabolario si connettono
tra di loro per fornire un quadro della parte di progetto che si sta
modellando.
Esistono diversi tipi di relazioni:
Associazioni (normali, aggregazioni semplici, aggregazioni di
composizione)
Relazioni di dipendenza
Relazioni di generalizzazioni
57. Le relazioni: associazioni
Una associazione dichiara una relazione semantica tra
le classi e rappresenta un insieme di legami tra le
istanze di tali classi. Ogni associazione ha almeno due
estremi, per ognuno dei quali possono essere definiti:
Un nome
Una molteplicità (numero di istanze della classe associato ad un
estremo che possono essere collegate a ciascuna delle istanze della
classe collocato all’altro estremo dell’associazione)
Un indicatore di navigabilità
Cliente Ordine
1 0..*
Utente Password
1 1
Non solo ad ogni utente è
associata una password, ma posso
anche raggiungerla.
58. Le relazioni: associazioni
Aggregazioni semplici
esprimono una relazione tra un insieme e delle parti di tale
insieme (“tutto/parte”), ma non implicano vincoli particolari per
l’esistenza della parte o dell’insieme.
Aggregazioni di composizione
implicano vincoli precisi: ogni istanza della classe “parte” può
essere riferita ad una sola istanza del “tutto”; inoltre il “tutto” è
responsabile per la creazione e la distruzione delle sue parti,
che non possono avere una esistenza autonoma.
PersonaComitato
* *
Ordine RigaOrdine
1 1..*
59. Le relazioni: dipendenza e
generalizzazione
Relazioni di dipendenza
Indica che il funzionamento di un elemento richiede la presenza di uno
o più altri elementi e che se un elemento viene modificato, potrebbe
essere necessario modificare anche ogni elemento che da esso
dipende.
Relazioni di generalizzazione
Collega un elemento più generico ad un elemento più specifico;
(specializzazione). L’elemento più specifico deve essere pienamente
consistente con quello più generico, cioè ne eredita tutte le caratteristiche
(attributi, operazioni e associazioni delle sue superclassi), ma ne può definire
altre.
Dato Fonte
dei dati
Entità
Geografica
Ghiacciaio
60. Esempio: modello di dati geografico
Si vogliono rappresentare le entità geografiche e le
relazioni coinvolte nella descrizione di applicazioni di
monitoraggio glaciologico.
1) Identificare le classi che fanno parte del modello, prendendo in
considerazione tutti gli elementi coinvolti nelle applicazioni di
interesse.
Es. Classi Ghiacciaio, Bacino, Stazione di misura, …
2) Identificare le classi che descrivono i dati derivanti da differenti
fonti ( catasto, cartografia, telerilevamento, …)
Es. Classi Dato, Fonte dei dati, Qualità, Organizzazione
3) Considerare la rappresentazione di fenomeni spazio-temporali
Es. Classi Spazio, Tempo, Evento
4) Creare fra le classi i diversi tipi di relazione
62. 4. Modellizzazione logica: il modello
relazionale
I modelli logici per le basi di dati
Il concetto di relazione
Relazioni con attributi
Relazioni e basi di dati
Vincoli di integrità
Algebra relazionale
63. I modelli logici per le basi di dati
Tradizionalmente, esistono tre modelli logici:
Gerarchico
Reticolare
Relazionale
Negli ultimi 10 anni:
a oggetti
Le strutture utilizzate dai modelli sono astratte, ma
riflettono una particolare organizzazione
Struttura
ad albero
Tabelle
Grafo
64. I modelli logici per le basi di dati
I modelli gerarchico e reticolare sono più vicini alle
strutture fisiche di memorizzazione, mentre il modello
relazionale è più astratto:
nel modello relazionale si rappresentano solo valori.
Anche i riferimenti fra dati in strutture (relazioni) diverse
sono rappresentati per mezzo dei valori stessi;
nei modelli gerarchico e reticolare si utilizzano riferimenti
espliciti (puntatori) fra record.
Il modello a oggetti è un ibrido tra queste due
concezioni, poiché è di livello alto ma fa uso di
riferimenti
65. Il modello relazionale
Proposto da E. F. Codd nel 1970 e reso disponibile
come modello logico in DBMS nel 1981.
Si basa sul concetto matematico di relazione, (teoria
degli insiemi).
Le relazioni hanno una rappresentazione naturale per
mezzo di tabelle.
Tabella: rappresentazione grafica di una relazione,
(concetto intuitivo)
66. Il modello relazionale
Garantisce indipendenza dei dati
Utenti che accedono ai dati e programmatori
che sviluppano applicazioni fanno riferimento
al livello logico dei dati.
Cioè, agli utenti e ai programmatori, non serve
sapere come i dati sono memorizzati
fisicamente.
67. Relazione matematica: secondo la definizione data
nella teoria degli insiemi; da questa derivano le seguenti:
Relazione secondo la definizione del modello
relazionale dei dati.
Relazione come traduzione di relationship costrutto del
modello concettuale Entity-Relationship; che descrive
legami tra entità del mondo reale.
Relazione: tre accezioni
68. Prodotto cartesiano
Prodotto cartesiano di due insiemi A e B
AxB = {(x1,x2) | x1∈A e x2∈B}
dove (x1,x2) sono coppie ordinate di elementi
Per esempio: A = {1,2,4}, B= {a,b}
AxB = {(1,a),(1,b),(2,a),(2,b),(4,a),(4,b)}
69. Relazione matematica
Relazione matematica su insiemi A e B
(domini della relazione) = sottoinsieme di AxB
Per esempio:
AxB = {(1,a),(1,b),(2,a),(2,b),(4,a),(4,b)}
Una relazione matematica su insieme A e B
potrebbe essere:
R={(1,a),(1,b),(4,b)}
Rappresentazione tabellare:
1 a
1 b
2 a
2 b
4 a
4 b
1 a
1 b
4 b
70. Relazione matematica
Dominio: finito o infinito? Per esempio:
{z|z è un numero naturale} è un insieme infinito
{y|y è un numero naturale t.c. 18≤y≤ 30 } è un insieme
finito
In un DB non possono esserci insiemi infiniti
Sistemi di calcolo gestiscono solo insiemi finiti
Ma è utile ammettere domini infiniti per permettere ad
ogni istante di assumere esistenza di un valore non
presente nel DB
Assumiamo che i DB siano costituiti da relazioni finite
su domini eventualmente infiniti
71. Definizione: Dati n>0 insiemi D1, D2, …, Dn si chiama
prodotto cartesiano di D1, D2, …, Dn , indicato con
D1×D2×…×Dn, l’insieme delle n-uple ordinate
(d1 ,d2,…,dn) t. c. di Di , con i=1,…, n
Definizione: Una relazione matematica R sugli insiemi
D1, D2, …, Dn è un sottoinsieme di D1×D2×…×Dn
Definizioni:
D1, D2, …, Dn sono detti domini della relazione R.
n è il grado di R.
Il numero di n-uple è la cardinalità della relazione.
Relazione matematica
∈
72. Relazione matematica
Esempio: relazione di grado n=3
D1={0,1}, D2={a,b}, D3={rosso,blu}
Che cos’è D1xD2xD3?
{(0,a,rosso), (0,a,blu), (0,b,rosso), (0,b,blu), (1,a,rosso),
(1,a,blu), (1,b,rosso), (1,b,blu)}
Una relazione sugli insiemi {0,1}, {a,b}, {rosso,blu}
potrebbe essere
{(0,b,blu), (1,a,rosso), (1,b,rosso), (1,b,blu)}
(Relazione di cardinalità 4)
73. Relazioni e tabelle
Per esempio: risultati partite di calcio
Juventus Lazio 3 2
Lazio Milan 2 0
Juventus Roma 2 1
Roma Milan 1 2
Sequenza di carattere
(stringa)
Numero naturale (intero)
Relazione R t. c.
R Stringa × Stringa × Intero × Intero
74. Relazioni e tabelle
Una relazione è un insieme:
n-uple della relazione devono essere distinte (no righe
ripetute in tabella)
n-uple non sono tra loro ordinate (tabelle con stesse
righe ordinate in modo diverso rappresentano la stessa
relazione)
Insieme: collezione di elementi
Un insieme non contiene duplicati
L’ordine degli elementi non è importante
75. Relazioni e tabelle
n-upla contiene dati tra loro collegati, che verificano
la relazione
L’ordine degli elementi delle n-uple (colonne) è
significativo.
Se nella tabella precedente scambiamo il terzo e il
quarto dominio, cambieremmo il significato della nostra
relazione. Ciascuno dei due domini intero e stringa
compare due volte, e le due occorrenze sono distinte
attraverso la posizione.
Ordinamento dei domini di una relazione impone una
struttura posizionale degli elementi di n-uple
76. Relazioni con attributi
In una relazione, ogni dominio rappresenta
un ruolo
associamo a ciascuna occorrenza di dominio nella
relazione un nome, detto attributo per identificare
le rispettive componenti delle n-uple
In una tabella: attributo → intestazione di colonne
della tabella
Modificando la definizione di relazione con
l’introduzione degli attributi l’ordinamento
delle colonne nella tabella, risulta irrilevante:
la struttura non è posizionale
77. Relazioni con attributi
SquadraDiCasa SquadraOspitata RetiCasa RetiOspitata
Juventus Lazio 3 2
Lazio Milan 2 0
Juventus Roma 2 1
Roma Milan 1 2
L’ordinamento non posizionale permette di far
riferimento alle componenti delle n-uple in modo non
ambiguo.
78. Relazioni con attributi
Dati insieme di attributi X={A1,…,An} e insieme di
domini D={D1,…,Dm}
Stabiliamo corrispondenza tra attributi e domini
mediante funzione DOM: X → D
Cioè, la funzione DOM associa a ciascun attributo A∈X
un dominio DOM(A) ∈ D
X DA3
D7
DOM
79. Relazioni con attributi
Tupla su insieme di attributi X è una funzione t che
associa a ciascun attributo A ∈X un valore del
dominio DOM(A)
Per esempio: t[SquadraDiCasa]=Juventus
Relazione (con attributi) su X è insieme di tuple su X
n-uple: elementi individuati per posizione
Tuple: elementi individuati per attributo
80. Relazioni con attributi: esempio
DOM:{SquadraDiCasa, SquadraOspitata, Reti Casa,
RetiOspitata} → {Stringa, Intero}
Cioè:
Insieme di attributi X = {SquadraDiCasa,
SquadraOspitata, Reti Casa, RetiOspitata}
Insieme di domini D = {Stringa, Intero}
DOM(SquadraDiCasa) = Stringa
DOM(SquadraOspitata) = Stringa
DOM(Reti Casa) = Intero
DOM(RetiOspitata) = Intero
81. Tabelle e relazioni
Una tabella rappresenta una relazione se
i valori di ciascuna colonna sono fra loro omogenei (dallo
stesso dominio)
le righe sono diverse fra loro
le intestazioni delle colonne sono diverse tra loro (perciò i
campi sono distinguibili mediante il loro nome e non la loro
posizione)
Inoltre, in una tabella che rappresenta una relazione:
l’ordinamento tra le righe è irrilevante
l’ordinamento tra le colonne è irrilevante
82. Tabelle e relazioni
Il modello relazionale è basato su valori:
I riferimenti fra dati in relazioni diverse sono
rappresentati per mezzo di valori dei domini che
compaiono nelle tuple.
Altri modelli logici (reticolare e gerarchico) realizzano le
corrispondenze in modo esplicito attraverso puntatori.
(Modelli basati su record e puntatori)
83. Esempio
Stessa base di dati con puntatori al posto dei
riferimenti realizzati tramite valori
Base di dati
relazionale
Base di dati con
puntatori
84. Vantaggi della struttura basata sui valori
Indipendenza dalle strutture fisiche (si potrebbe anche con
puntatori di alto livello) che possono cambiare anche
dinamicamente
Si rappresenta solo ciò che è rilevante dal punto di vista
dell’applicazione (dell’utente); i puntatori sono meno
comprensibili per l’utente finale (senza, l’utente finale vede gli
stessi dati dei programmatori)
I dati sono trasferibili piu' facilmente da un sistema ad un
altro
NOTE:
• i puntatori possono esistere a livello fisico
• nel modello a oggetti esistono i riferimenti, che funzionano da
‘puntatori di alto livello’
85. Relazioni e Basi di Dati
Un DB è solitamente costituito da più relazioni
(tabelle) le cui tuple contengono valori comuni (usati
per stabilire corrispondenza tra tuple)
Per esempio: tabelle che descrivono studenti, esami
e corsi
Matricola Cognome Nome DataNascita
276545 Rossi Maria 25/11/1981
485745 Neri Anna 23/04/1982
200768 Verdi Fabio 12/02/1982
587614 Rossi Luca 10/10/1981
937653 Bruni Mario 01/12/1981
Studenti
86. Relazioni e Basi di Dati
Codice Titolo Docente
01 Analisi Giani
03 Chimica Melli
04 Chimica Belli
Studente Voto Corso
276545 28 01
485745 27 04
200768 25 01
587614 24 04
Esami
Corsi
87. Schemi di relazioni e di DB
Schema di relazione: R(X)
Costituita da simbolo R (nome della relazione) e da
insieme di nomi di attributi X={A1,…,An}
Per esempio:
Esami(Studente,Voto,Corso)
Istanza di relazione su schema R(X)
Insieme r di tuple su X
Studente Voto Corso
276545 28 01
485745 27 04
200768 25 01
587614 24 04
Esami
88. Schemi di relazioni e di DB
Schema di base di dati: R={R1(X1),…,Rn(Xn)}
Insiemi di schemi di relazione con nomi diversi
Per esempio:
Università =
{Studenti(Matricola,Cognome,Nome,DataNascita),
Esami(Studente,Voto,Corso),
Corso(Codice,Titolo,Docente)}
Istanza di base di dati su schema R={R1(X1),…,Rn(Xn)}
Insieme r di relazione r={r1,…,rn} dove ogni ri è una
relazione sullo schema Ri(Xi)
89. Informazione incompleta
ll modello relazionale impone ai dati una struttura rigida:
– le informazioni sono rappresentate per mezzo di tuple
– solo alcuni formati di tuple sono ammessi: quelli che
corrispondono agli schemi di relazione.
I dati disponibili possono non corrispondere esattamente
al formato previsto, per varie ragioni.
ESEMPIO: Tipi di valori nullo
Persone n. telefono
Sonia Morandi
Simone Rossi
Angelo Colombi
Maria Sordi
02 70638847
Valore
sconosciuto
Valore non
esistente
Valore senza
informazione
90. Informazione incompleta: soluzioni
Non conviene utilizzare valori ordinari del dominio (0,
stringa nulla, “99”, etc), per vari motivi:
– potrebbero non esistere valori “non utilizzati”
– valori “non utilizzati” potrebbero diventare significativi
– in fase di utilizzo nei programmi sarebbe necessario ogni volta
tener conto del loro significato
Si utilizza NULL: valore nullo
Viene assegnato agli elementi di tuple inesistenti o
sconosciuti
E’ un valore aggiuntivo rispetto al dominio di un
attributo
91. Informazione incompleta e valori nulli
Non tutti gli attributi di una relazione possono
assumere valore nullo
In definizione di relazione, si può specificare quali
attributi non devono mai essere nulli nelle tuple
Matricola Cognome Nome DataNascita
276545 Rossi Maria NULL
NULL Neri Anna 23/04/1982
NULL Verdi Fabio 12/02/1982
587614 Rossi Luca 10/10/1981
937653 Bruni Mario 01/12/1981
Studenti
92. Informazione incompleta e valori nulli
Non tutti gli attributi di una relazione possono
assumere valore nullo
In definizione di relazione, si può specificare quali
attributi non devono mai essere nulli nelle tuple
Matricola Cognome Nome DataNascita
276545 Rossi Maria NULL
NULL Neri Anna 23/04/1982
NULL Verdi Fabio 12/02/1982
587614 Rossi Luca 10/10/1981
937653 Bruni Mario 01/12/1981
Studenti
No: matricola usata
per correlare
relazione
93. Vincoli di integrità
Oltre a imporre restrizioni sulla presenza di valori nulli
bisogna evitare la creazione di istanze
sintatticamente corrette, ma che non rappresentano
informazioni possibili.
Un vincolo di integrità è una proprietà che deve
essere soddisfatta dalle istanze che
rappresentano informazioni corrette.
Ogni vincolo può essere visto come una funzione
booleana (o un predicato) che associa ad ogni
istanza il valore vero o falso.
94. Vincoli di integrità
Definendo lo schema di un base di dati si associano
vincoli di integrità che si riferiscono a tutte le istanze.
Questi vincoli permettono di considerare corrette le
sole istanze che li verificano tutti
Vincoli intrarelazionali
Vincolo di tupla
Vincolo di dominio
Vincoli su assegnamento di valori ad attributi diversi di
una tupla
Vincolo di chiave
Vincoli interrelazionali
95. Vincoli intrarelazionali
Vincoli interni a una relazione:
Soddisfacimento definito rispetto ad una singola
relazione della base di dati
Vincolo di tupla: esprime condizioni sui valori di
ciascuna tupla indipendentemente dalle altre tuple
Vincolo di dominio (vincolo su valori): restrizione su
dominio di attributo
Vincoli su assegnamento di valori ad attributi diversi di
una tupla
96. Vincoli di tupla
Esprimibili mediante espressioni booleane (AND, OR,
NOT) i cui termini contengono:
Uguaglianze, disuguaglianze, ordinamenti di valori di
attributo
Espressione aritmetiche su valori di attributo
Per esempio:
Vincolo di dominio
(Voto ≥ 18) AND (Voto ≤ 30)
Vincolo su più attributi
Pagamenti(Data, Importo, Ritenute, Netto)
Netto = Importo - Ritenute
97. Vincoli di chiave
Superchiave/chiave:
insieme di attributi che identificano univocamente le
tuple di una relazione
Superchiave: un insieme K di attributi è detto
superchiave di una relazione r se r non contiene due
tuple t1 e t2 con t1[K]=t2[K]
K è una chiave di r se è una superchiave minimale di r
Ogni chiave è una superchiave
98. Vincoli di chiave
{Matricola} è una chiave
è superchiave minimale (contiene un solo attributo)
Matricola Cognome Nome Nascita Corso
4328 Rossi Luigi 29/04/79 Informatica
6328 Rossi Dario 29/04/79 Informatica
4766 Rossi Luca 01/05/81 Fisica
4856 Neri Luca 01/05/81 Economia
5536 Neri Luca 05/03/78 Economia
99. Vincoli di chiave
{Cognome, Nome, Nascita} è una chiave
è superchiave minimale (nessuno dei suoi sottoinsiemi
è superchiave)
Matricola Cognome Nome Nascita Corso
4328 Rossi Luigi 29/04/79 Informatica
6328 Rossi Dario 29/04/79 Informatica
4766 Rossi Luca 01/05/81 Fisica
4856 Neri Luca 01/05/81 Economia
5536 Neri Luca 05/03/78 Economia
100. Vincoli di chiave
{Matricola, Corso} è una superchiave, ma non una
chiave
Matricola Cognome Nome Nascita Corso
4328 Rossi Luigi 29/04/79 Informatica
6328 Rossi Dario 29/04/79 Informatica
4766 Rossi Luca 01/05/81 Fisica
4856 Neri Luca 01/05/81 Economia
5536 Neri Luca 05/03/78 Economia
101. Vincoli di chiave
{Nome, Corso} non è una superchiave
Matricola Cognome Nome Nascita Corso
4328 Rossi Luigi 29/04/79 Informatica
6328 Rossi Dario 29/04/79 Informatica
4766 Rossi Luca 01/05/81 Fisica
4856 Neri Luca 01/05/81 Economia
5536 Neri Luca 05/03/78 Economia
102. Vincoli di chiave
In questo caso {Nome, Corso} è una chiave, ma non
è ben definita
Matricola Cognome Nome Nascita Corso
6328 Rossi Dario 29/04/79 Informatica
4766 Rossi Luca 01/05/81 Fisica
4856 Neri Luca 01/05/81 Economia
5536 Neri Luca 05/03/78 Informatica
103. Vincoli di chiave
Ogni relazione r, con la schema r(X), ha una
chiave
Essendo un insieme, r è costituita da tuple diverse tra
loro → X (insieme degli attributi) è sicuramente
superchiave di r
X potrebbe essere una chiave di r
Se X non è una chiave di r, allora esiste un
sottoinsieme Y di X tale che Y è una chiave
104. Importanza delle chiavi
Il fatto che ogni schema di relazione abbia almeno una
chiave garantisce:
L’accessibilità a ciascun dato della base di dati. Ogni
singolo valore è univocamente accessibile tramite:
nome della relazione
valore della chiave
nome dell’attributo
La possibilità di definire corrispondenze tra dati
contenuti in relazioni diverse
105. Individuazione delle chiavi
Li individuiamo:
considerando le proprietà che i dati soddisfano
nell’applicazione
notando quali insiemi di attributi permettono di identificare
univocamente le tuple;
e individuando i sottoinsiemi minimali di tali insiemi che
conservano la capacità di identificare le tuple.
I vincoli corrispondono a proprietà del mondo reale modellato
dalla base di dati, quindi interessano a livello di schema (con
riferimento cioè a tutte le istanze.
Ad uno schema associamo un insieme di vincoli e consideriamo
corrette (ammissibili) solo le istanze che soddisfano tutti i
vincoli.
106. Esempio
DB Ghiacciai Lombardia
OBIETTIVI
Creare un modello dei dati che consenta di archiviare e ricercare le
informazioni ricavate dall’osservazione protratta nel tempo di ghiacciai
alpini da sorgenti diverse (campagna di misura, elaborazione di immagini,
…)
Grande eterogeneità di dati
Ruolo chiave dell’attributo temporale
Necessità di non duplicare i dati
Necessità di confrontare i dati
Flessibilità nella gestione delle variazioni dei corpi glaciali
Armonizzazione con database internazionali
Collegamento ad un visualizzatore di dati vettoriali
108. Accesso ai dati di un DB:
algebra relazionale
Aggiornamento di DB: funzione che, data istanza di
DB, produce altra istanza di DB, sullo stesso schema
Modifica, aggiunta, rimozione tuple
Interrogazione a DB: funzione che, dato un DB,
produce una relazione su un dato schema (non
necessariamente uno degli schemi definiti nel DB)
Aggiornamento e interrogazione vengono
effettuati usando specifici linguaggi
Ad esempio: algebra relazionale
109. Algebra relazionale
Algebra relazionale: basata su insiemi di
operatori
Definiti su relazioni
Producono relazioni come risultati
Operatori
Insiemistici: unione, intersezione, differenza
Specifici: ridenominazione, selezione, proiezione, join
110. 5. Modellizzazione di dati geografici
Il dato geografico
Definizione di carta
Relazioni spaziali fra entità geografiche
Cartografia numerica
Entità e campi
Aspetto spaziale
Aspetto semantico
Aspetto di qualità: i metadati
111. Il dato geografico
Dato caratterizzato da un riferimento spaziale che ci
aiuta a collocarlo nel mondo
Localizzazione = coordinate x, y (e z)
Sistemi di riferimento
Dato georeferenziato
Ogni documento o evento che si riferisce ad una determinata porzione
della superficie terrestre ed è quindi possibile rappresentarlo anche dal
punto di vista cartografico mediante carte o immagini da aereo/satellitari.
112. Informazione geografica
Informazioni spaziali digitali caratterizzate da:
Grande quantità di dati
Struttura complessa
Differiscono dal dal modo in cui sono ottenute:
Collezioni di dati (primari)
derivano da varie sorgenti di dati: campagne di misura, dati GPS, immagini
telerilevate, foto aeree, …
Problemi: delimitazione oggetti (confini fuzzy) e associazione dei valori degli attributi
tematici agli oggetti spaziali
Dati derivanti da mappe esistenti
mappe create dall’integrazione di diverse sorgenti di dati digitali
Problemi: eterogeneità delle scale e del sistema di coordinate, qualità dei dati
113. Definizione di carta
Una carta è un insieme di punti, linee e aree
definite:
dalla posizione nello spazio
da attributi non spaziali
Generalmente si considerano separate
planimetria e altimetria.
La LEGENDA della carta è la chiave di connessione
degli attributi non spaziali alle entità spaziali.
Gli attributi non spaziali possono essere indicati
visivamente con COLORI, SIMBOLI, SFUMATURE il
cui significato è deducibile dalla legenda.
114. Relazioni spaziali tra entità geografiche
L'analisi di una carta consente di:
dare una conoscenza del territorio sia
puntuale (basata sull'osservazione di ogni
singolo oggetto) che generale (visione
d’insieme);
di sviluppare processi logici di tipo deduttivo e
induttivo in funzione di relazioni di
concomitanza, vicinanza, frequenza,...;
115. Le relazioni spaziali tra entità geografiche
esistenti su una carta possono essere
classificate in vari modi.
Una distinzione è quella tra le relazioni che
sono indipendenti dall’orientamento, dette
RELAZIONI TOPOLOGICHE, e quelle che ne
dipendono, dette RELAZIONI DIREZIONALI.
Relazioni spaziali tra entità geografiche
116. Le relazioni topologiche tra entità geografiche sono del
tipo:
equivalenza (si sovrappone completamente);
equivalenza parziale (si sovrappone parzialmente,
attraversa);
contenimento (è interna);
adiacenza (è connessa o incontra);
separatezza (è disgiunta)
Relazioni spaziali tra entità geografiche
117. Relazioni spaziali tra entità geografiche
Le relazioni direzionali includono le seguenti relazioni tra
entità:
di fronte a
dall’altra parte di
sopra
Sotto
descrizioni metriche di angoli azimutali
a nord
a sud
a est
a ovest
E loro combinazioni
118. Si hanno poi relazioni di vicinanza che descrivono la
distanza tra entità geografiche sia in termini metrici
quantitativi (misura della distanza) che in termini
qualitativi, mediante termini quali
vicino
lontano
in prossimità di
Relazioni spaziali tra entità geografiche
Relazioni topologiche, direzionali e di vicinanza
sono spesso utilizzate combinate tra loro
119. Esempio di relazioni spaziali tra entità
• Topologiche
b è interno a c
a è connesso a c
d è disgiunto da a
f è sovrapposto a e
• Vicinanza
a vicino a b
f lontano da a
• Direzionali
g a est di b
d a nord di g
120. Cartografia numerica
coordinate che descrivono gli schemi spaziali
che rappresentano gli oggetti del territorio o
le entità geografiche (features);
relazioni tra gli elementi di tale
rappresentazione;
attributi che ne individuano la tipologia.
121. Cartografia numerica
La cartografia numerica ha tutti i contenuti e almeno tutte
le stesse funzioni di base della cartografia tradizionale.
La cartografia numerica è in un certo senso un’immagine
speculare della cartografia tradizionale:
• l’elemento base della cartografia tradizionale è un
disegno che contiene in forma implicita le coordinate
dei punti
• nella cartografia numerica l’elemento base è l’insieme
delle coordinate che contiene in forma implicita la sua
visualizzazione sotto forma di disegno.
122. Entità e campi
Astraendo dal loro contenuto, i dati georeferenziati
possono essere ripartiti nelle categorie principali di
campi o di entità.
I campi sono rappresentativi di fenomeni continui quasi
ovunque nel dominio di definizione.
Esempio:
il rumore ambientale,
l’altimetria del territorio.
I campi vengono usualmente discretizzati, e
rappresentati mediante matrici regolari di attributi
(modello matrix o raster georeferenziato)
123. Entità e campi
Alla categoria entità appartengono viceversa gli oggetti
discontinui, delimitati spazialmente da confini ben precisi,
eventualmente, caratterizzati da specifici attributi.
Esempi:
la ripartizione del territorio in aree normative,
il grafo descrittivo di una rete di infrastrutture di
trasporto;
In ambito GIS le entità vengono usualmente
rappresentate mediante modelli vettoriali, eventualmente
topologici, cui vengono associate opportune tabelle di
attributi.
129. Fenomeni geografici modellizabili a entità
Inoltre:
• in molti casi può essere più comodo trattare dati
grigliati (ad esempio si possono usare algoritmi di
algebra matriciale)
• non ci sono più, come nel passato, problemi
legati all'occupazione di memoria di massa.
I FENOMENI GEOGRAFICI POSSONO
ESSERE MODELLIZZATI SECONDO UN
MODELLO IBRIDO
130. I dati appartenenti a una base di dati geografici sono
sostanzialmente caratterizzati da tre componenti:
ASPETTO SPAZIALE
Modellizzazione di dati geografici
ASPETTO SEMANTICO
ASPETTO DI QUALITA’
131. La geometria di un fenomeno, descritta per mezzo di coordinate di punti
e funzioni matematiche, usa come elementi standard di base le
primitive geometriche.
La componente geometrica può essere:
• vettoriale (coordinate dei punti che descrivono la forma geometrica)
• raster (insieme di pixel corrispondenti al particolare oggetto)
La topologia (relazioni topologiche: adiacenza, connessione e
contenimento) è invariante per deformazioni elastiche e continue
(ad esempio trasformazioni di datum o di sistema di coordinate)
ed è descritta a partire da primitive topologiche.
Una volta definito un oggetto come fenomeno singolo
del mondo reale lo schema spaziale fornisce la
descrizione della sua geometria e topologia.
Aspetto spaziale
132. Aspetto semantico e di qualità
ASPETTO SEMANTICO
attributi statistici e/o testuali
ASPETTO DI QUALITA’
La componente semantica è data dall’insieme degli
attributi di vario dominio (numerico, stringa,…) associati
alla parte geometrica del dato.
L'aspetto di qualità è descritto mediante le categorie di
accuratezza, completezza ed aggiornamento.
133. Aspetto spaziale dei dati geografici
Le primitive geometriche descrivono, parzialmente o totalmente, la
rappresentazione spaziale di un oggetto mediante coordinate e
funzioni matematiche: tutte le posizioni che concorrono alla
descrizione di una primitiva devono essere riferite allo stesso
sistema geodetico di riferimento e alla stessa scala di
rappresentazione (la scala definisce il dettaglio e le approssimazioni
rispetto alla "realtà")..
Le entità geometriche utilizzate per la descrizione di
fenomeni spaziali nel dominio bidimensionale sono:
punto
curva
superficie
Entità vettoriali Campi
griglia
pixel
banda raster
voxel
blocco raster
134. Immagini vettoriali e raster
Immagine Vettoriale - E' un sistema di archiviazione di dati grafici
secondo il quale gli oggetti vengono memorizzati in base alle
coordinate cartesiane dei punti e linee che li compongono.
Immagine raster - Qualsiasi immagine può essere pensata come
formata da un insieme di piccole aree uguali (pixel), ordinate
secondo linee e colonne, tali da costituire una matrice. I valori
associati ad ogni cella possono esprimere sia informazioni di tipo
grafico (colore, tono di grigio, …) sia di tipo descrittivo
(temperatura, pendenza, …).
Comprendono immagini digitali ottenute da riprese aeree o satellitari (a colori), ed
immagini digitali ottenute da scansione di mappe cartacee (in bianco e nero
contenenti linee, tessiture, simboli).
Successive elaborazioni possono aggiungere altri attributi ai pixel.
135. Primitive geometriche
Punto: è una primitiva geometrica 0-dimensionale, la
cui posizione spaziale è descritta da coordinate
(posizionamento diretto: insieme ordinato di numeri in
un sistema di riferimento di posizioni).
Curva: è una primitiva geometrica limitata, continua,
monodimensionale e può essere chiusa o aperta.
Una curva è descritta da un metodo di interpolazione
(cammino minimo, arco, B-spline, …) applicato ad una
lista di due o più posizioni dirette.
136. Primitive geometriche
Superficie
possibile
Bordo: è un elemento chiuso monodimensionale non
intrecciato (né esplicitamente, né implicitamente); può
essere composto da una o più curve.
Superficie: è una primitiva geometrica limitata,
continua, bidimensionale, delimitata da un bordo
esterno e da zero o più bordi ( o confini) interni non
annidati e non intrecciati.
Superficie non
possibile
Superficie non
possibile
137. Primitive geometriche
Struttura (frame): è una primitiva basata su una
partizione con areole dello spazio considerato: tali areole
sono l'elemento base della struttura.
La forma e dimensione delle areole lungo ogni asse del
sistema di riferimento scelto per la struttura sono costanti
e caratterizzano la struttura stessa.
Si considerano strutture bi o tridimensionali: nell’ultimo caso la struttura è
una partizione costituita da uno o più piani contigui di righe e colonne
contigue, di unità regolari che riempiono una parte limitata dello spazio.
138. Primitive geometriche
Griglia: è una distribuzione regolare di
punti, derivabile dagli angoli di
tassellatura determinati da una
struttura. Una griglia è definita in
accordo con la specifica struttura che
fornisce la posizione spaziale di ogni
punto della griglia stessa.
Pixel: è una primitiva geometrica
bidimensionale, elemento base
(o unità) di una specifica struttura
bidimensionale. La sua posizione
spaziale è definita dal numero di
riga e di colonna. P(i,j)
139. Topologia
L'aspetto geometrico delle entità geografiche è descritto
da coordinate di punti relativamente ad un sistema
geodetico di riferimento.
Ma la geometria che descrive le entità di un
territorio può variare in funzione di molti fattori, ad
esempio al variare della scala della rappresentazione
digitale.
(Scala nominale: rapporto di scala a cui si può riprodurre una carta digitale in
modo che abbia gli stessi requisiti qualitativi e metrici della relativa carta
tradizionale).
Per garantire quindi la consistenza della rappresentazione
si devono introdurre dei vincoli e delle relazioni di tipo non
metrico.
140. Topologia
La topologia è la disciplina matematica che si occupa di connessione
e adiacenza di punti e linee e che permette quindi di analizzare le
relazioni spaziali tra dati geografici.
Una struttura dati topologica determina esattamente come e dove sono
connessi punti e linee su una carta numerica per mezzo di congiunzioni
topologiche, dette nodi.
La teoria dei grafi è lo strumento utilizzabile per
rendere consistente una carta numerica descritta per
mezzo di primitive geometriche.
Un qualsiasi aggiornamento della carta dovrà rispettare i vincoli
topologici imposti alle varie entità geografiche coinvolte.
141. Primitive topologiche
Le primitive topologiche descrivono gli aspetti topologici delle entità
geografiche stabilendo delle relazioni che le connettono.
Gli aspetti topologici di un oggetto possono essere descritti da una o
più primitive topologiche.
Le entità topologiche per una descrizione nel
dominio bidimensionale sono:
nodo
spigolo
anello
faccia
142. Primitive topologiche
Nodo: è una primitiva topologica 0-dimensionale.
Si può distinguere tra due tipi di nodi.
• Nodo connesso. Si tratta di un nodo connesso ad uno o
più spigoli. In questo caso si può ulteriormente
distinguere tra nodo che è iniziale o finale di uno spigolo,
detto nodo terminale, e nodo che è solo intersezione di
lati, in questo caso si parla di nodo intermedio.
• Nodo isolato: nodo che non è connesso con nessuno
spigolo.
Si può osservare che quello che può essere considerato
nodo intermedio se riferito ad un determinato spigolo
può anche essere terminale rispetto ad un altro spigolo.
143. Primitive topologiche
Spigolo: è una primitiva topologica monodimensionale
che rappresenta una connessione orientata tra due
nodi terminali; i due nodi possono essere coincidenti.
Anello: è un insieme ordinato di spigoli connessi che
formano un elemento monodimensionale non
intersecantesi né implicitamente né esplicitamente. I
punti estremanti di un anello convergono allo stesso
nodo.
Faccia: è una primitiva topologica descritta da un anello
esterno e da zero a molti anelli interni.
144. Questo aspetto diventa fondamentale
quando si parla di interoperabilità e
condivisione dei dati anche sul Web.
Aspetto semantico dei dati geografici
Ricerca dei dati più
adatti al mio scopo
Necessità di associare
ad essi una semantica
strutturata…
145. Problema generale: accessibilità dei
contenuti
Ricerca di
informazione
L’informazione che ci interessa può essere contenuta in più
documenti e siti diversi. Nulla ci permette ad esempio di descrivere
concetti come: prima, dopo, coincidenza, percorso, …
Cooperazione
Ricerca di
documenti
Link
Motori di ricerca
Processo cognitivamente molto ricco, ma può essere
dispendioso in termini di tempo
Richiede poca informazione iniziale, ma l’80% del contenuto del
web è “nascosto” perché non indicizzato o non indicizzabile.
Inoltre la ricerca per parole chiave comporta il fenomeno dei “falsi
positivi” (pagine contenenti le parole cercate, ma con
l’informazione errata) o dei “falsi negativi” (pagine contenenti
sinonimi dei termini cercati)
Integrazione
di
informazione
Non vengono forniti servizi ad altri servizi, ma solo contenitori di
informazioni
146. Ridefinire e ristrutturare i dati su Web in modo che il loro significato sia
accessibile, non solo alle persone, ma anche a programmi che li utilizzano per
manipolarli, integrarli, renderli disponibili per diverse applicazioni e non solo per
mostrarli
Semantic Web
Una soluzione
“Il Semantic Web è un’estensione
dell’attuale Web, nella quale
all’informazione viene dato un significato
ben definito, permettendo così ai
computer e alle persone di lavorare meglio
in cooperazione.”
[Tim Berners-Lee, James Hendler, Ora
Lassila, “The Semantic Web”, Scientific
American, Maggio 2001]
Semantic
Web
World Wide
Web
Aumentare le
potenzialità
del WWW e
eliminarne le
limitazioni
ONTOLOGIE
147. Branca che studia la natura e l‘organizzazione della realtà
“Lo studio dell'essere in quanto essere”, Aristotele (Metafisica)
Ontologia in filosofia
Non ha per oggetto una realtà in particolare, bensì la
realtà in generale, cioè gli aspetti fondamentali e comuni
di tutta al realtà.
Come la matematica studia l'essere come quantità; la
fisica studia l'essere come movimento, solo l’ontologia
studia l'essere in quanto tale, considerando le
caratteristiche universali di ogni essere, ed è dunque il
presupposto indispensabile di ogni ricerca.
Pone le domande:
• Cosa è l‘essere?
• Cosa caratterizza l‘essere?
148. Ontologia (informatica)
• Un‘ ontologia consiste in
– uno specifico vocabolario usato per descrivere un dominio
– un insieme di asserzioni sul significato inteso dal vocabolario
• Un‘ ontologia è una descrizione formale esplicita di un determinato dominio
di interesse
DESCRIZIONE: Una forma di rappresentazione della conoscenza
FORMALE: Simbolica e meccanizzabile
ESPLICITA: Elenchi estesi di frammenti di conoscenza
DOMINIO: ristretta ad un determinato sottoinsieme dello scibile,
affrontato da un certo punto di vista
• “Un’esplicita specificazione di una concettualizzazione”, Gruber (1993)
149. Contenuto di un’ontologia
Un insieme di classi = concetti
Astrazioni del mondo reale a vari livelli di
dettaglio non necessariamente disgiunti e
non necessariamente esaustivi
Un insieme di relazioni (fra concetti)
Le più importanti sono ereditarietà,
generalizzazione, particolarizzazione.
Esempi: sinonimo, opposto fornito_da, …
Un insieme di proprietà
Attributi di ciascuna classe
Un insieme di restrizioni
Impongono il tipo di dato delle proprietà
Istanze
Rappresentano
specifici oggetti
del modo reale
ereditano
attributi e
relazioni dalle
classi
Annotazioni
Relazioni fra
un’istanza di un
oggetto e una classe
dell’ ontologia.
Rappresentabile
mediante la tripla
<oggetto, relazione,
classe>
150. Osservazioni
La realizzazione del Semantic Web potrebbe diventare uno
strumento per supportare la condivisione e l’evoluzione
dell’intera conoscenza umana
• Condivisione della conoscenza
• Comunicazione tra agenti con diverse
“teorie del mondo”
Caratteristica e limite delle ontologie:
si riferiscono ad un particolare
dominio quindi se vogliono
comunicare dovranno avere un
protocollo comune
ALBERO
IT Nautica Botanica
151. Aspetto di qualità dei dati geografici
La qualità del dato geografico riguarda aspetti come:
accuratezza
completezza
aggiornamento
Questi ed altri aspetti sono espressi mediante i metadati.
Dati sui dati: descrizione standardizzata del contenuto,
qualità, codifiche e altre caratteristiche dei dati
Servono a fornire:
• Informazioni sui dati disponibili
• Informazioni necessarie per il trattamento e
l’interpretazione dei dati
152. Metadati: esempi
Sono strumenti che usiamo abitualmente:
Ingredienti, data di scadenza, nome e sede del
produttore o del venditore, modalità di
conservazione e di utilizzo, tabella nutrizionale,
marchi di qualità
Etichette
Documentazione tecnica, istruzioni per l'uso,
definizione della destinazione del prodotto,
garanzia
Libretto istruzioni
Composizione, posologia, effetti collaterali,
avvertenze, indicazioni e controindicazioni
Bugiardino
153. Metadati geografici
Domande a cui dovrebbero rispondere:
1. Cosa descrive il dataset?
2. Chi lo ha prodotto?
3. Quali sono i possibili utilizzi?
4. Come sono stati creati i dati?
5. Perché è stato creato il dataset?
6. C’ è la possibilità di ottenerne una copia?
7. Chi ha scritto i metadati?
154. Metadati geografici
a. Qual è il titolo?
b. Quale area geografica è rappresentata?
c. Quali sono i dati della situazione descritta?
d. Qual è il formato dell’informazione geografica
presentata?
e. Quali sono le parole chiave del dataset?
f. Quali sono i possibili utilizzi?
h. Con che frequenza l’informazione è aggiornata?
1. Cosa descrive il dataset?
File XML
155. Metadati geografici: XML
<title>Catalonia Topographic Base 1:5.000. Version 2</title>
<abstract>Topographic cartography that covers catalan territory.</abstract>
<purpose>Topographic base of Catalonia. Needed for the development of technic activities, management and
territorial planification within DPTOP and other departments of Generalitat of Catalonia. Also is necessary to other
public organisms and private entities. Obtaining of land elevations database of Catalonia.</purpose>
<status>
<MD_ProgressCode value="underdevelopment" />
</status>
<distributorFormat>
<b-name>DGN, DXF, E00</b-name>
</distributorFormat>
<descriptiveKeywords>
<keyword>Spain</keyword>
<keyword>Catalonia</keyword>
<keyword>Topographic cartography</keyword>
<keyword>Cartography</keyword>
<keyword>Topographic database</keyword>
</descriptiveKeywords>
<pointOfContact>
<organisationName>Institut Cartogràfic de Catalunya</organisationName>
<positionName>Responsable de Distribució i Vendes</positionName>
</pointOfContact>
<MD_MaintenanceFrequencyCode value="irregular" />
156. Standard per i metadati:
XML: struttura fisica
XML (eXtensible Markup Language)
• E’ una raccomandazione del W3C
• È pensato per gestire qualsiasi tipo di contenuto che possa
essere descritto in forma di testo
• È orientato alla rappresentazione di documenti fruibili tramite
Internet
• E’ un metalinguaggio: permette tramite la sua sintassi di
descrivere altri linguaggi
• E’ open source e sta diventando lo standard per l’interscambio
dei dati di ogni applicazione
157. 6. GIS (Geographic Information System)
(cenni)
Definizioni
Componenti
Applicazioni e finalità
Strutture di gestione di basi dati nei GIS
158. Definizione
E’ un sistema informativo che tratta dati geografici
Un sistema informativo è un insieme organizzato di
procedure
risorse umane
risorse materiali
Sono utilizzati per
la raccolta
l'archiviazione
l'elaborazione
la comunicazione
di informazioni necessarie ad una organizzazione per
gestire le proprie attività operative e di governo.
159. Informazioni georeferenziate
Informazione georeferenziata: ogni documento o evento
che si riferisce ad una determinata porzione della
superficie terrestre è un esempio di informazione
geografica
I dati spaziali o geografici rappresentano fenomeni del
mondo reale e sono caratterizzati:
dalla posizione nello spazio rispetto ad un sistema di riferimento
e di coordinate
da attributi non spaziali (colore, temperatura, etc…)
dalle reciproche relazioni spaziali (topologiche, direzionali, di
distanza)
160. Dati nei GIS ambientali
Sfondi cartografici
vettoriali e raster
Osservazioni
sul campo
Modelli digitali di superficie
e del terreno
Ortofoto e immagini
telerilevate
Carte tematiche primarie
Carte tematiche
derivate
161. Definizioni di GIS basate sul concetto di
Database
“un database in cui la maggior parte dei dati sono
spazialmente indicizzati e sui quali un insieme di procedure
opera per rispondere a query legate ai loro attributi
spaziali”
Smith T.R., S. Menon, J.L. Starr, and J.E. Estes, 1987.Requirements and principles for the
implementation and construction of large-scale geographic information systems.
International J. of Geographical Information Systems, 1: 13-31.
“ogni insieme di procedure manuali o informatiche usato
per memorizzare e manipolare dati georeferenziati”
Aronoff S., 1989. Geographic Information Systems: A Management Perspective. WDL Publ.,
Ottawa, Canada.
162. Componenti di un Sistema Informativo
geografico
Un GIS non è quindi solo l’insieme dei motori software che si occupano di
acquisire e aggiornare, pretrattare, archiviare, analizzare e rappresentare
in forma grafica con carte e diagrammi un certo fenomeno
georeferenziabile.
STRUTTURE ORGANIZZATIVE
METODI DI LAVORO
COMPONENTI HARDWARE
COMPONENTI SOFTWARE (motori del GIS)
DATI
SISTEMA INFORMATIVO SPAZIALE
=
MODELLO DEL MONDO REALE
163. Obiettivi e metodi di un GIS
La definizione di un GIS prevede contestualmente la
definizione dei suoi obiettivi e metodi:
per obiettivi del GIS si intende l'insieme di risultati
che si vogliono conseguire al momento della
definizione e creazione del GIS stesso
i metodi del GIS sono invece l'insieme di operatori,
codificati in forma astratta, che permettono il
conseguimento di tali obiettivi
164. Schema dei GIS ambientali
Modellizzazione dei dati
nei GIS ambientali
Funzionalità di base
Funzionalità specifiche
165. Applicazioni ambientali/territoriali
dei GIS
Stato ambiente/territorio: analisi e controllo
Pianificazione delle attività antropiche
Azioni per ambiente/territorio
Ricerca in campo ambientale/territoriale
166. Finalità delle applicazioni
ambientali/territoriali
Produzione di archivi
geografici, carte tematiche
ed inventari (locali o
accessibili via Internet)
• Automazione dell’elaborazione del
Bilancio Territoriale Ambientale;
• Automazione della formazione degli
strumenti a supporto della
ecopianificazione e di governo delle attività
attuate sul territorio;
• Selezione delle priorità e adeguamento
delle politiche ambientali per la formazione
di Piani di Azione in campo ambientale.
167. Strutture di gestione di basi dati nei GIS:
Sistemi ibridi
I GIS che implementano un’architettura ibrida sono
caratterizzati da:
parte testuale strutturata utilizzando un modello di dati
relazionale e gestita da un DB relazionale;
parte geometrica gestita da un sistema proprietario
appositamente realizzato per rendere possibile
la memorizzazione della parte spaziale del dato, utilizzando
particolari indicizzazioni
la gestione usando algoritmi implementati in dipendenza del tipo
di dati che il sistema GIS deve gestire
169. Strutture di gestione di basi dati nei GIS:
Sistemi integrati
Il RDBMS deve
avere estensioni
spaziali.
La componente spaziale (i file delle coordinate dei punti
e della topologia degli elementi geometrici) coesiste con
la componente testuale (i file degli attributi) ed è in
relazione con questa, creando una base di dati
geometrico-statistica.
170. 7. Il problema dell’interoperabilità
• Infrastrutture di dati spaziali (SDI): definizione
• L’iniziativa europea Inspire
171. Cosa è una infrastruttura?
• E’ un insieme di elementi interconnessi che
forniscono una rete per il supporto dell’intera
struttura. Esempi: istituzionale, dei trasporti,
urbanistica, economica, militare, …
• Ha il compito di supportare fondamentali
attività, dovrà facilitare il flusso di beni o
persone o servizi
• Sono necessari enti preposti per la
pianificazione dell’infrastruttura e per
l’implementazione
• Comporta un investimento anticipato e a lungo
termine, di costi, impegno e manutenzione
172. Esempio: l‘ infrastruttura stradale
Tecnologie: costruzione
della rete stradale
Politiche: pianificazione e
gestione ad ogni livello
(locale, statale, …)
Standard: indicazioni
stradali, segnaletica,
informazioni sul percorso
ottimizzare le
capacità delle reti
stradali esistenti
garantire
l'efficienza e la
sicurezza
d'esercizio delle
strade
garantire il
migliore accesso
alla rete
autostradale
173. Infrastruttura di dati spaziali: perchè?
• Protezione dell’ ambiente
• Miglioramento della sicurezza e dei trasporti
• Lo sviluppo sociale
• Miglioramento dei servizi per i cittadini
Ruolo fondamentale dell’informazione
geografica: le sfide principali
Cresce la necessità di:
• individuare dove i bisogni sono più pressanti
• indirizzare in modo efficace gli interventi
• monitorare i risultati e valutare gli impatti
L’informazione
geografica deve essere
accessibile,
deve essere facile
identificare chi la
possiede,
si deve poter stimare
quanto essa risolve il
problema da affrontare,
come può essere
ottenuta,
se può essere integrata
con altre informazioni
175. Executive order 12906, April 13, 1994
http://www.fgdc.gov/publications/documents/geninfo/execord.html
Esempio: l’ NSDI americana
Riduzione del deficit federale
Migliore gestione della spesa per l’informazione geografica
Motivazioni iniziali:
Promuovere l’uso e il riuso dei dati spaziali per scopi diversi da parte della
pubblica amministrazione e dei cittadini
Organizzare i servizi necessari per permettere il reperimento e l’accesso
all’informazione geografica da parte della collettività
In seguito:
Leadership affidata al Federal Geographic Data Committee (FGDC)
176. Esempio: l’ NSDI americana
Le componenti
• Geospatial Data
Clearinghouse
Network distribuito di produttori,
gestori, utilizzatori di dati geografici
connessi elettronicamente
2003: geodata.gov
Il portale per un accesso
alle mappe ai dati e ad altri servizi
Dati sui dati: descrizione
standardizzata del contenuto, qualità,
codifiche e altre caratteristiche dei dati
Servono a fornire:
• Informazioni sui dati disponibili
• Informazioni necessarie
per il trattamento e
l’interpretazione dei dati
Dati di base: sia perché molto utilizzati
in contesti diversi sia perché utili per la
costruzione di altri dati geografici
I temi più utilizzati nel 1994:
• Altimetria
• Idrografia
• Unità amministrative
• Ortofoto
• Trasporti
• Catasto
• Rete geodetica
• Metadata
• Framework data
177. Alcuni riferimenti:
– 1986 Avvio di Australian Land Information Council
(ALIC)
– 1990 Avvio della FGDC (US)
– 1993 Creazione di EUROGI
– 1994 Clinton Executive Order
– 1996 Prima conferenza sulle GSDI (Bonn)
– 1996 11 SDI nazionali
– 2000 53 SDI nazionali
• Europa 13
• America 21
• Asia e Australia 13
• Africa 6
– 2003 120 SDI nazionali
Il fenomeno SDI
178. L’Europa diviene sempre più economicamente e socialmente integrata
Coscienza di affrontare a livello europeo molti processi:
Protezione dell’ ambiente
Sicurezza sociale
Trasporti
Tali processi necessitano di una SDI con un minimo set
di dati comune a tutti i paesi della comunità
Contesto europeo
Alcuni di questi hanno avviato il processo di realizzazione
della propria SDI a vari livelli (nazionale, regionale o locale)
179. La commissione europea ha avviato una iniziativa per lo
sviluppo di una Infrastruttura di Dati Spaziali Europea
Sviluppo di aspetti legislativi per la creazione di
una SDI
Coordinamento fra il livello europeo e quello
nazionale/locale
Inspire
INfrastructure for SPatial InfoRmation in Europe
180. Prevede la creazione di servizi integrati di informazione
spaziale basati su un network distribuito di database,
connessi da standard e protocolli comuni che assicurino
la compatibilità e l’ interoperabilità
Inspire
INfrastructure for SPatial InfoRmation in Europe
L’interoperabilità è la possibilità per due
o più autonome entità ( ad es. sistemi, applicazioni,
data sets, …) di comunicare e cooperare
tra loro in modo significativo.
Ciò non deve richiedere particolari sforzi…
181. Sistemi non-interoperabili
MapGuide™
GIS Viewer
ModelServer Imager
CARIS Internet Server
TerraServer
Orthophoto Browser
Mapquest Internet
MapObjects IMS
Spatial Web Broker
OGDI
STAR Next Surf
TIGER Map Server
GLOBE Visualization
GeoMedia™
WebMap
MapXtreme™
ELVIS
NetGIS
PARC Map Viewer
Internet Map Server
EnviroMapper
Web Browser
GIS
DATA
Web Browser
GIS
DATA
Web Browser
GIS
DATA
GIS
DATA
Web Browser Web Browser
GIS
DATA
Web Browser
GIS
DATA
Web Browser
GIS
DATA
Web Browser
GIS
DATA
Web Browser
GIS
DATA
Web Browser
GIS
DATA
Web Browser
GIS
DATA
Web Browser
GIS
DATA
Web Browser
GIS
DATA
GIS
DATA
Web Browser
GIS
DATA
Web Browser
GIS
DATA
Web Browser
GIS
DATA
Web Browser
GIS
DATA
Web Browser
GIS
DATA
Web Browser
GIS
DATA
X X X X X X X X X X X X X X X X X X X
Web Browser
182. Possibili servizi sono:
Inspire
INfrastructure for SPatial InfoRmation in Europe
La visualizzazione delle informazioni
L’overlay di informazioni provenienti da fonti diverse
Analisi spaziali e temporali
Questi servizi devono permettere agli utenti di individuare ed
accedere ai dati spaziali di fonti diverse, dal livello locale al livello
globale, in modo interoperabile, per scopi diversi
183. Principi INSPIRE :
I dati geografici devono diventare facili da capire e interpretare in
maniera user-friendly tramite tools di visualizzazione
I dati vanno raccolti una sola volta e gestiti dove ciò può essere fatto
nel modo più efficace
Deve essere possibile combinare informazioni territoriali provenienti
da diverse fonti in Europa e condividerle tra più utenti e applicazioni
Deve essere possibile che informazioni raccolte ad un livello siano
condivise a diversi livelli, con informazioni dettagliate per le analisi,
generali per scopi strategici
L’informazione geografica necessaria per il buon governo deve
esistere ed essere ampiamente accessibile
Deve essere facile individuare quale informazione geografica è
disponibile, adatta ai propri scopi e le condizioni secondo cui è
possibile acquisirla ed usarla
184. Metadata
Documentazione necessaria ad un utente per scoprire se una
risorsa delle informazioni esiste, chi la possiede, quali sono i
termini per accedere ad essa e se corrisponde agli scopi
dell'utente
Elementi chiave
Coordinamento
Per gestire il grande numero di data sets derivante da
differenti produttori a differenti momenti e per differenti scopi
Core data sets
Identificazione di alcuni dei data sets più importanti che sono
di largo uso fra le diverse comunità di utenti
185. INSPIRE: il modello dell’architettura
Clients
Middleware
ServersFeaturesCoverages
Metadata updateCatalogs
Geo-processing
and catalog Services
Content
Repositories
Other data
e.g., administrative,
statistical, env. reporting
Distributed Geographic reference data
Service
chaining:
search, display,
access, e-
commerce,
….
User applications
Direct
data
access
Access to transformed
data, pictures, maps, reports,
multi-media content
Metadata search and retrieval
for data and services
186. Standard OGC
Nome Funzionalità
Web Map Service
(WMS)
Creazione di mappe da datasets raster e vettoriali. Le
mappe generate possono essere visualizzate da un comune
web browsers
Web Feature Service
(WFS)
Accesso ai dati vettoriali spediti in formato GML (v. 2.1.) al
client che può processare questi dati
Web Coverage Service
(WCS)
Accesso ai dati raster in vari formati (tiff, gif, jpeg, bmp,
bnm) che possono essere ulteriormente elaborati
Web Catalog Service
(WCAS)
Gestione e query dei metadati che descrivono i dati e i geo
servizi. Permettono la ricerca basata su criteri testuali e
spaziali
Web Gazetteer Service
(WFS-G)
Servizio che permette la georeferenziazione delle entità
geografiche basate su identificatori testuali
Web Terrain Service
(WTS)
Creazione di views di dati 3D (es. il DEM) visualizzabili da
qualsiasi web browsers
Web Coordinate
Transformation Service
(WCTS)
Permette la trasformazione di coordinate geografiche da un
sistema di riferimento di coordinate a un altro
187. WMS
Web Map Service
La specifica WMS standardizza il modo in cui i clients richiedono le
mappe.
Un Web Map Service (WMS) produce mappe di dati
georeferenziati.
La specifica definisce tre operazioni WMS :
1. GetCapabilities fornisce metadati a livello del service, che sono
descrizioni sul contenuto delle informazioni del servizio e sui parametri
richiesti accettati;
2. GetMap fornisce una mappa i cui i parametri geospaziali e
dimensionali sono ben definiti;
3. GetFeatureInfo (opzionale) fornisce informazioni circa particolari
features mostrate sulla mappa.
188. La condivisione dei dati territoriali
Pubbliche
amministrazioni
ed enti governativi
Utility & servizi
pubblici
Utenza Comm.
& profess.
Enti di ricerca
Associazioni
no profit
Cittadini
Risorse
Dati
Locali
Dati
Nazionali
Regionali
Dati
Europei
Utenti
Servizi di
Discovery
Integrazione
tecnica
Politiche dati
Accordi di
collaborazione
Specifiche INSPIRE
Richiesta di servizi informativi
Distribuzione di servizi informativi
ISO
189. Dati forniti ma quasi mai accompagnati dalla
documentazione necessaria
Dati non forniti, non perché riservati, ma per
la scarsa qualità, incompletezza e disorganizzazione
Accesso e qualità dei dati
Libro verde sull’informazione del settore pubblico: una risorsa
fondamentale per l’Europa (1999)
Incremento di accesso viene identificato come cruciale
190. Data Data Data
ServerServer Server
Web Client
standards, Interfacce
WebMapping
Testbed (WMT)
• Studio di fattibilità (Ottobre 1999)
sulla connessione di servers e
clients eterogenei
• Un test per la collaborazione fra
varie compagnie e agenzie
• Ricercare i dati in data servers di
varie nazioni, da vari clients
191. OGC Web Mapping Testbed (WMT)
Dati atmosferici
Fornitore A
Dati per
l’evacuazione
Fornitore D
Topografia
Fornitore B
Zone
allagate
Fornitore E
Immagini
Fornitore F
WMT distribuiràWMT distribuirà
I dati attraversoI dati attraverso
map serversmap servers
usando differentiusando differenti
fornitorifornitori
Scenario: evento atmosferico catastroficoScenario: evento atmosferico catastrofico
Dati di
censimento
Fornitore C
193. Server 1
Server 2
Server 3
Interoperable Web
Mapping
Dati
Coverage aree
Mappe vettoriali
Formati
Costi
Dati
Coverage aree
Mappe vettoriali
Formati
Costi
Dati
Coverage aree
Mappe vettoriali
Formati
Costi
Catalog
Service
Source: Digital Earth, NASA
194. Viewer Client: Mappe combinate
Topografia?
Idrografia?
Confini?
Catalog
Service
Interoperable Web Mapping
Server 1
Server 2
Server 3
Server 1: Topografia
Server 2: Idrografia
Server 3: Confini
Source: Digital Earth, NASA
195. Riferimenti
Basi di dati, Atzeni, Ceri, Paraboschi,
Torlone
Appunti del corso di GIS, M. Brovelli
Editor's Notes
Per identificare le classi che fanno parte del modello, si sono presi in considerazione tutti gli elementi coinvolti nelle applicazioni di interesse, cercando di individuare le relazioni esistenti fra questi.
Nella legenda sottostante si ricordano le relazioni fondamentali tra le classi e i colori con i quali si è voluto sottolineare l’esistenza di gerarchia fra le classi e la conseguente ereditarietà fra queste.
Si è deciso di considerare come un’entità primaria l’oggetto degli studi, ovvero la classe Entità Geografica (figura 11). In relazione di generalizzazione con questa vi sono varie sottoclassi; in particolare per la classe Ghiacciaio si sono indicati diversi attributi specificandone il tipo.
Sono presenti anche relazioni di aggregazione semplice; ad esempio le classi Ghiacciaio, Lago e Fiume sono in tale relazione rispetto alla classe Bacino in quanto “per definizione” queste tre entità sono parte di un Bacino (idrografico) e vengono usate per definirlo. Tutte le entità geografiche definite sono in relazione di aggregazione con la classe Regione, anch’essa entità geografica, poiché si può sempre fare riferimento ad una regione di cui possono fare parte.
Bacino e Regione sono state considerate come sottoentità primarie di Entità Geografica poiché sono ad un livello più generale rispetto alle classi con le quali sono in relazione di aggregazione.
Tutte le entità geografiche sono in relazione di associazione fra di loro in quanto potrebbero essere espresse molte caratteristiche comuni.
Altre entità primarie sono Spazio e Tempo per le quali sono previste sottoclassi che potrebbero essere considerate anche come attributi. Queste riguardano il sistema di coordinate e l’unità di misura; per la classe Tempo si sono evidenziate anche le sottoclassi Istante e Intervallo di tempo ovviamente in relazione di associazione fra loro.
La sottoentità primaria Evento vuole esprimere qualcosa che ha un riferimento spaziale e temporale e quindi viene considerata sottoclasse delle classi Tempo e Spazio. Un esempio di evento è dato dalla classe Campagna di misura intesa come acquisizione di dati al suolo contemporanea al passaggio satellitare che quindi risulta essere anche una Fonte di dati.
Sono state definite altre due entità primarie: una riguardante la Qualità che fa riferimento sia alla classe Dato che alla classe Fonte dei Dati (ad esempio posso parlare di qualità del sensore per il telerilevamento che è una fonte di dati); l’altra riguardante l’Organizzazione intesa come insieme di persone che forniscono ed elaborano dati e quindi sono responsabili delle loro fonti.
Si notano nel diagramma molte relazioni di associazione generiche; questo per indicare l’esistenza di un legame fra le istanze delle classi, ma senza specificarne, per ora, la precisa semantica.
Quello che comunque si può notare è che tutte le entità primarie sono fra loro in relazione di associazione: questo per impedire una concezione troppo gerarchica del modello che lascia quindi spazio alle interpretazioni di una classe attraverso diversi punti di vista e legami non diretti.
Vincoli di integrità, motivazioni
• risultano utili al fine di descrivere la realtà di interesse in modo più accurato di quanto le strutture permettano;
• forniscono un contributo verso la “qualità dei dati”
• costituiscono uno strumento di ausilio alla progettazione
• possono essere utilizzati dal sistema nella scelta della strategia di esecuzione delle interrogazioni
• molti di essi si esprimono mediante il linguaggio associato al DBMS prescelto
• purtroppo non tutte le proprietà di interesse sono rappresentabili per mezzo di vincoli esprimibili direttamente nel linguaggio
Vincoli di integrità, motivazioni
• risultano utili al fine di descrivere la realtà di interesse in modo più accurato di quanto le strutture permettano;
• forniscono un contributo verso la “qualità dei dati”
• costituiscono uno strumento di ausilio alla progettazione
• possono essere utilizzati dal sistema nella scelta della strategia di esecuzione delle interrogazioni
• molti di essi si esprimono mediante il linguaggio associato al DBMS prescelto
• purtroppo non tutte le proprietà di interesse sono rappresentabili per mezzo di vincoli esprimibili direttamente nel linguaggio
&lt;number&gt;
Grande divergenza fra:
Significato dei dati e
Attuale immagazzinamento dei dati
&lt;number&gt;
&lt;number&gt;
Metafisica La scienza più alta è per Aristotele la metafisica (che in realtà lui chiamava filosofia prima e, più tardi, verrà anche detta ontologia, cioè studio dell&apos;essere), la quale viene da lui definita in quattro modi: essa è la scienza che studia le cause e i principi primi, studia l&apos;essere in quanto essere; studia la sostanza; studia Dio e la sostanza immobile. Dire che la metafisica studia l&apos;essere in quanto essere significa che essa non ha per oggetto una realtà in particolare, bensì la realtà in generale, cioè gli aspetti fondamentali e comuni di tutta al realtà. In altri termini, la matematica studia l&apos;essere come quantità, la fisica studia l&apos;essere come movimento, solo la metafisica studia l&apos;essere in quanto tale, considerando le caratteristiche universali di ogni essere (ecco perché è chiamata &quot;filosofia prima&quot; mentre la altre scienze sono &quot;filosofie seconde&quot;), ed è dunque il presupposto indispensabile di ogni ricerca.
Se la metafisica è lo studio dell&apos;essere, che cosa è l&apos;essere? Aristotele dice che l&apos;essere ha molteplici aspetti e significati (noi diciamo ad esempio che l&apos;uomo è, la neve è sui monti, Dio è...). Esso viene perciò diviso da Aristotele in quattro gruppi principali: l&apos;essere come categoria; l&apos;essere come potenza e atto; l&apos;essere come accidente; l&apos;essere come vero (e il non essere come falso).
Col termine &quot;categorie&quot; Aristotele intende le caratteristiche fondamentali che ogni essere possiede. Esse sono dieci: sostanza, qualità, quantità, relazione, agire, subire, dove (luogo), quando (tempo), avere e giacere. La prima di esse, la sostanza, è la più importante perché è il riferimento comune alle altre categorie che, in qualche modo, la presuppongono (la qualità ecc. è sempre riferita a qualcosa che esiste di già: l&apos;uomo, ovvero la sostanza, è alto, uno, padre, cammina ecc.). Il che ci porta a concludere che, se l&apos;essere si identifica con le sue categorie e le categorie si riferiscono alla sostanza, la domanda su &quot;che cos&apos;è l&apos;essere ?&quot; si trasforma in &quot;che cos&apos;è la sostanza?&quot;.
&lt;number&gt;
Recentemente (1993) Gruber, nel trasferire l’idea di Ontologia al mondo dei sistemi informativi, ha affermato che “un’ontologia (con la “o” iniziale minuscola) è l’esplicita specificazione di una concettualizzazione”.
Ed è proprio quest’ultima la definizione cui ci si ispira nell’ideazione di strumenti informatici basati su ontologie. Infatti, in questi casi, il compito principale è proprio quello di rappresentare in maniera formale i concetti ascrivibili al dominio applicativo (cioè la porzione di realtà, diverso da dominio di valori) in esame - l’esistente o, meglio, la conoscenza che si ha dell’esistente. Il corpo di tale rappresentazione formale è basata su una concettualizzazione e, cioè, sulla specificazione del significato inteso dei termini coinvolti nella situazione applicativa in esame. Specificare la concettualizzazione vuol dire attribuire un significato non ambiguo ai termini che definiscono la conoscenza in un preciso dominio.
In sintesi, un’ontologia è uno schema di base di conoscenza che include per alcuni domini di valori tassonomie ed eventuali ulteriori correlazioni esistenti (ad esempio similitudine) ed è arricchita dalla descrizione del significato dei termini, cioè delle entità dello schema (classi, generalizzazioni e associazioni) e dei valori di alcuni domini di particolare interesse. In altri termini una ontologia è una coppia costituita da uno schema di base di conoscenza e una base di conoscenza parziale che contiene istanze per alcune entità dello schema che hanno una &quot;durata&quot; (e non quelle volatili che cambiano giorno per giorno) che sono la elicitazione delle conoscenze di esperti del dominio applicativo.
Un ontologia, oltre a definire lo “schema di base di conoscenza” per un dominio applicativo, fornisce un “vocabolario semantico” comune che può essere utilizzato per riutilizzare, condividere e scambiare conoscenza fra utenti e gruppi di utenti ed applicazioni (ad es. Agenti Intelligenti). In definitiva, quindi, un ontologia fornisce un “vocabolario semantico” (basato su concetti) comune per uno specifico dominio (o porzione del mondo) e definisce, con diversi livelli di formalismo, il “significato” dei termini (o meglio dei concetti) del vocabolario e le relazioni intercorrenti fra i termini stessi.
------------------------------------------------------------------------------------------------------------------------------
Secondo Gruber un&apos;ontologia è una quintupla composta di classi, istanze, funzioni,
relazioni, assiomi. Le classi corrispondono alle entità del dominio, le istanze sono gli
oggetti che stanno nel dominio, le funzioni e le relazioni collegano le entità al dominio,
ed in fine gli assiomi che limitano il senso e l&apos;uso delle classi, istanze, funzioni e
relazioni.
&lt;number&gt;
Problema: identificazione delle entità e delle relazioni
Gli strumenti di sviluppo per le ontologie spesso limitano le implementazioni
&lt;number&gt;
L&apos;etichetta nutrizionale si può sempre inserire e diventa obbligatoria quando la presentazione o la pubblicità del prodotto indicano particolari caratteristiche nutrizionali. La tabella nutrizionale deve indicare il valore energetico e la quantità di proteine, carboidrati e grassi. In alternativa si può indicare il valore energetico, la quantità di proteine, carboidrati, zuccheri, grassi, acidi grassi saturi, fibre alimentari e sodio. In alcuni casi si possono indicare le quantità di altri nutrienti, vitamine e alcuni sali minerali.
&lt;number&gt;
&lt;number&gt;
significa la tecnologia, le politiche, gli standards, le risorse umane necessarie per acquisire, memorizzare, distribuire e migliorare l’utilizzo dei dati geografici.
&lt;number&gt;
FGDC: Organismo che comprende agenzie federali, stati governi locali, università e settore privato
&lt;number&gt;
NSDI basata su Internet che permette agli utenti di vedere l’offerta dei dati come un tutt’ uno.
Internet modella anche i rapporti fra providers di dati e NSDI: i providers conservano completa autonomia e la responsabilità
dei propri dati (anche sul fatto di rendere accessibili metadati e dati o solo metadati); l’elemento costitutivo della NSDI è un insieme di standards e di protocolli (riguardanti le modalità di accesso ai dati…), costruito attraverso processi partecipativi.
Geospatial Data Clearinghouse “Piazza virtuale dove domanda e offerta di informazione geografica si incontrano”
Per avere un’ idea attuale della attuale NSDI si può far riferimento al portale geodata.gov
I metadata permettono di individuare se esistono dati adatti ai propri scopi.
&lt;number&gt;
The Australian Prime Minister and heads of Australian State and Territory Governments established the Australian Land Information Council (ALIC) in 1986. The New Zealand government became a full member in 1987 and the organisation was renamed the Australian New Zealand Land Information Council (ANZLIC). ANZLIC is the peak-body on behalf of the Australian and New Zealand Governments for co-ordinating the development of geographic information standards. ANZLIC has closely aligned these processes with international efforts in the same area. The purpose of ANZLIC is to:
co-ordinate the collection and transfer of land related information, and
promote the use of that information in decision making
&lt;number&gt;
E’ necessaria per gestire il grande numero di datasets derivante da differenti produttori a differenti momenti e per differenti scopi. La coordinazione richiede sia una necessaria funzione strategica per sviluppare e mantenere il supporto politico, sia una funzione operativa necessaria nelle iniziative e nei progetti; comprende l&apos;istruzione, la formazione e l’implementazione tecnica.
Si ottengono attraverso l’identificazione di alcuni dei datasets più importanti che sono di largo uso fra le diverse Comunità di utenti.
Sono le “informazioni sulle risorse delle informazioni” , riguardano la documentazione necessaria ad un utente per scoprire se una risorsa delle informazioni esiste, chi la possiede, dove è individuata, quali sono i termini per accedere ad essa e se corrisponde agli scopi dell&apos;utente. I metadati svolgono un ruolo importante in tutti gli sforzi per sviluppare le SDIs e le iniziative di e-government.