BASI DI DATI, ONTOLOGIE E WEB SEMANTICO

Anno accademico 2020/2021 - 2° anno
Docenti Crediti: 12
SSD: INF/01 - INFORMATICA
Modalità di erogazione: Tradizionale
Organizzazione didattica: 300 ore d'impegno totale, 228 di studio individuale, 72 di lezione frontale
Semestre: Insegnamento annuale
ENGLISH VERSION

Obiettivi formativi

  • MODULO A: BASI DI DATI

    Le attività di raccolta, organizzazione e conservazione dei dati costituiscono uno dei principali fabbisogni in qualsiasi progetto di digitalizzazione.

    Il modulo Basi di Dati del corso, fornisce concetti sulle basi di dati, sui linguaggi di interrogazione e di gestione, sulle tecniche, sui metodi di progettazione, e sulle tecnologie e architetture per la gestione dei dati. Comprendere l’utilità del database, i vantaggi di un DBMS, acquisire la conoscenza degli aspetti funzionali e organizzativi di una base di dati, capire le motivazioni alla base della normalizzazione è tra gli obiettivi. Verranno affrontati inoltre concetti di Datawarehouse, Big Data e Sistemi NoSQL (Conoscenza e capacità di comprensione).

    Lo studente riconosce il ruolo della tecnologia delle basi di dati nell'intermediazione tra il mondo delle conoscenze tradizionali e il mondo digitale. Il corso consentirà di mappare le conoscenze a casi di studio che verranno affrontati, comprendendo le diverse sfumature applicative dei concetti appresi (Capacità di applicare conoscenza e comprensione).

    Lo studente analizzerà dati in modo da interpretare le premesse teoriche che sono iscritte negli stessi, integrando conoscenze e gestendone la complessità, sino alla formulazione di giudizi anche con dati incompleti (Autonomia di giudizio).

    Abilità comunicative (communication skills): attività di cooperative learning nell’implementazione di sistemi esemplificativi, permetteranno di sviluppare abilità sociali, interdipendenza positiva, responsabilità individuale.

    Capacità di apprendimento (learning skills): lo studente utilizza l'analisi di un dato problema quale scenario di partenza per l'acquisizione di nuove conoscenze.

  • MODULO B:ONTOLOGIE E WEB SEMANTICO

    Conoscenza e capacità di comprensione (knowledge and understanding): saranno acquisite le conoscenze relative agli strumenti standard indicati dal World Wide Web Consortium (W3C) per la rappresentazione semantica e l'interrogazione della conoscenza presente sul Web.

    Capacità di applicare conoscenza e comprensione (applying knowledge and understanding): saranno acquisite le capacità di costruire modelli logici riguardanti svariati domini di applicazione, anche chiamati ontologie web, utilizzando la tecnologia standard del W3C insieme a dati e informazioni presenti sul Web. Lo studente inoltre, sarà in grado di utilizzare i reasoner automatici attualmente più diffusi per costruire inferenze logiche sulle ontologie web realizzate e quindi deducendo l'informazione implicitamente presente in esse.

    Autonomia di giudizio (making judgements): lo studente sarà in grado di valutare la qualità di un’ontologia e di valutare quale strumento per la rappresentazione e l'interrogazione della conoscenza sia più adeguato nelle diverse situazioni.

    Abilità comunicative (communication skills): saranno acquisite le necessarie abilità comunicative ed un'adeguata appropriatezza espressiva nella comunicazione di problematiche riguardanti la rappresentazione e l'interrogazione della conoscenza presente sul Web, anche ad interlocutori non esperti.

    Capacità di apprendimento (learning skills): lo studente avrà la capacita di adattare le conoscenze acquisite anche a nuovi contesti, nonché di aggiornarsi attraverso la consultazione delle fonti specialistiche del settore del Web semantico.


Modalità di svolgimento dell'insegnamento

  • MODULO A: BASI DI DATI

    L'organizzazione didattica per il modulo prevede 36 ore di lezione in presenza più 114 ore di studio individuale.

    Lezioni frontali – cooperative learning

    Possibilità implementative attraverso l’uso della piattaforma MS Teams tramite “One Note – Collaboration Space” e utilizzo di canali di gruppo.

    Qualora l'insegnamento venisse impartito in modalità mista o a distanza potranno essere introdotte le necessarie variazioni rispetto a quanto dichiarato in precedenza, al fine di rispettare il programma previsto e riportato nel syllabus.

  • MODULO B:ONTOLOGIE E WEB SEMANTICO

    Lezioni frontali in cui, oltre alla spiegazione delle nozioni e degli strumenti base del semantic Web, verranno presentati diversi esempi e casi di studio al fine di stimolare la discussione in classe e facilitare la comprensione degli argomenti.

    Qualora l'insegnamento venisse impartito in modalità mista o a distanza potranno essere introdotte le necessarie variazioni rispetto a quanto dichiarato in precedenza, al fine di rispettare il programma previsto e riportato nel syllabus.


Prerequisiti richiesti

  • MODULO A: BASI DI DATI

    Conoscenze di utilizzo di un personal computer: sistema operativo, software applicativi, navigazione web.

  • MODULO B:ONTOLOGIE E WEB SEMANTICO

    Nessuno.


Frequenza lezioni

  • MODULO A: BASI DI DATI

    Obbligatoria

  • MODULO B:ONTOLOGIE E WEB SEMANTICO

    Obbligatoria.


Contenuti del corso

  • MODULO A: BASI DI DATI
    1. Introduzione alla Basi di Dati e analisi caso di Studio.
    2. Database Relazionali
    3. Datawarehouse e big data
    4. Database NoSQL
  • MODULO B:ONTOLOGIE E WEB SEMANTICO

    - Introduzione al web semantico: motivazioni, esempi, cenni alla modellazione semantica (ontologie), alla logica.

    - Modello di dati RDF (cenni a progetti come Open Graph Protocol di Facebook, Google Graph, DBPedia).

    - Il linguaggio SPARQL per l’interrogazione di grafi RDF e introduzione a importanti endpoint SPARQL.

    - Il linguaggio RDFSchema (cenni ad ontologie fondazionali in RDFS per le Digital Humanities).

    - Il linguaggio OWL 2 (esempi di ontologie fondazionali e non per le Digital Humanities).

    - Introduzione alle logiche descrittive (teorie logiche in grado di rappresentare i linguaggi del semantic web) e a relativi strumenti di inferenza.


Testi di riferimento

  • MODULO A: BASI DI DATI
    • Materiale fornito dal Docente

    Letture consigliate:

    • Basi di Dati

    Di: Paolo Atzeni – Stefano Ceri – Pietro Fraternali – Stefano Paraboschi – Riccardo Torlone

    Casa editrice: Mc-Graw-HIll

     

    Si ricorda che, ai sensi dell’art. 171 della legge 22 aprile 1941, n. 633 e successive disposizioni, fotocopiare libri in commercio, in misura superiore al 15% del volume o del fascicolo di rivista, è reato penale.

    Per ulteriori informazioni sui vincoli e sulle sanzioni all’uso illecito di fotocopie, è possibile consultare le Linee guida sulla gestione dei diritti d’autore nelle università (a cura della Associazione Italiana per i Diritti di Riproduzione delle opere dell’ingegno - AIDRO).

    I testi di riferimento possono essere consultati in Biblioteca.

  • MODULO B:ONTOLOGIE E WEB SEMANTICO
    1. A semantic Web Primer (third edition). Grigoris Antoniou, Paul Groth, Frank van Harmelen, and Rinke Hoekstra, 2012. The MIT Press, Cambrigde, Massachusetts, London, England (pp. 288).
    2. Semantic Web for the Working Ontologist (Second Edition). Dean Allemang and James Hendler, 2011. Elsevier (pp. 384).
    3. Informazione, conoscenza e Web per le scienze umanistiche. Silvana Castano, AlfioFerrara, Stefano Montanelli, 2009. Pearson Addison Wesley (pp. 176).
    4. Informatica umanistica (II edizione). Marco Lazzari 2014. Mc Graw Hill Education (pp. 326).

    I testi non vanno studiati per intero, ma devono essere utilizzati come supporto alle lezioni frontali e alle slide. In particolare dei libri 3 e 4 sono rilevanti solo le parti riguardanti il semantic web.

    Si ricorda che, ai sensi dell’art. 171 della legge 22 aprile 1941, n. 633 e successive disposizioni, fotocopiare libri in commercio, in misura superiore al 15% del volume o del fascicolo di rivista, è reato penale.

    Per ulteriori informazioni sui vincoli e sulle sanzioni all’uso illecito di fotocopie, è possibile consultare le Linee guida sulla gestione dei diritti d’autore nelle università (a cura della Associazione Italiana per i Diritti di Riproduzione delle opere dell’ingegno - AIDRO).

    I testi di riferimento possono essere consultati in Biblioteca.


Programmazione del corso

MODULO A: BASI DI DATI
 ArgomentiRiferimenti testi
1Basi di dati e DBMS – Caso di Studio 
2Progettuale concettuale e logica 
3Modello E-R 
4Dal modello E-R allo schema logico 
5Modello Relazionale 
6Regole di integrità 
7Normalizzazione 
8Operazioni relazionali 
9DBMS (Mysql /Access) 
10Il linguaggio SQL 
11Datawarehouse e Big Data 
12Database NoSQL – MongoDB 
13Biblioteche digitali – Standard di metadati 

Verifica dell'apprendimento

Modalità di verifica dell'apprendimento

  • MODULO A: BASI DI DATI

    Prova orale

    Prova pratica

    Lungo tutta la durata del corso saranno previste delle prove intermedie (facoltative) consistenti in attività settimanali (o bisettimanali) schedulate all’interno della piattaforma MS Teams. Saranno quesiti a risposta multipla e/o aperta, potranno essere svolti in modalità asincrona e avranno tempi di consegna settimanale (o bisettimanale).

    La media finale di tutte le attività asincrone, espresse in trentesimi, farà media con l’elaborato finale.

    L’elaborato consiste in un lavoro individuale da presentare in sede di orale.

    Per la valutazione dell’esame si terrà conto della padronanza dei contenuti e delle competenze acquisite, dell’accuratezza linguistica e proprietà lessicale, nonché della capacità argomentativa dimostrata dal candidato.

    La verifica dell’apprendimento potrà essere effettuata anche per via telematica, qualora le condizioni lo dovessero richiedere.

  • MODULO B:ONTOLOGIE E WEB SEMANTICO

    Progetto software sugli argomenti del corso. Durante la discussione del progetto, in data d'appello d'esame, lo studente verrà sottoposto a delle domande riguardanti la motivazione di alcune scelte nel design dell'ontologia e delle domande teoriche riguardanti costrutti ed operatori utilizzati.

    Il progetto potrà anche essere sviluppato in piccoli gruppi (di tre o quattro persone).

    In quest’ultimo caso il lavoro svolto da ciascun partecipante dovrà essere ben documentato.

    Per la valutazione dell’esame si terrà conto della padronanza dei contenuti e delle competenze acquisite, dell’accuratezza linguistica e proprietà lessicale, nonché della capacità argomentativa dimostrata dal candidato.

    La verifica dell’apprendimento potrà essere effettuata anche per via telematica, qualora le condizioni lo dovessero richiedere.


Esempi di domande e/o esercizi frequenti

  • MODULO A: BASI DI DATI

    Esempio 1 – scelta multipla:

    La modellazione dei dati consiste:

    • Nell’analisi del problema
    • Nella progettazione delle tabelle del database
    • Nell’implementazione del database
    • Nella creazione delle funzioni che accedono ai dati

     

    Esempio2 – scelta multipla:

    Nel modello gerarchico le relazioni possono essere:

    • 1 a 1
    • 1 a molti
    • Molti a 1
    • Molti a molti

    Esempio3 - Progettazione concettuale

    Si desidera automatizzare il sistema di prestiti di una biblioteca.
    Le specifiche del sistema, acquisite attraverso un’intervista con il bibliotecario, sono quelle riportate
    in figura x.x. Analizzare tali specifiche, filtrare le ambiguità presenti e poi raggrupparle in modo
    omogeneo. Prestare particolare attenzione alla differenza esistente tra il concetto di libro e di copia
    di libro. Individuare i collegamenti esistenti tra i vari gruppi di specifiche così ottenuti.

    Esempio4- SQL

    Considerare le relazioni IMPIEGATI (Matricola, Nome, Stipendio,
    Direttore) e DIPARTIMENTI (Codice, Direttore) e le due interrogazioni
    seguenti, specificare se e in quali casi esse possono produrre risultati diversi:

    select avg(Stipendio)
    from Impiegati
    where Direttore in (select Direttore
    from Dipartimenti)

    select avg(Stipendio)
    from Impiegati I, Dipartimenti D
    where I.Direttore = D.Direttore