Il corso si propone di introdurre gli studenti alle tematiche delle Digital Humanities (DH), del Data Management (DM), dell'Open Science (OS) e dei Linked Open Data (LOD).
Durante il corso, si darà particolare attenzione all'utilizzo di strumenti e metodologie informatiche per una corretta gestione dei dati umanistici durante tutto il ciclo di vita di un progetto di DH.
Gli studenti acquisiranno conoscenze teoriche e pratiche sui linguaggi, i modelli, gli strumenti e i principi necessari per ideare, progettare e implementare una risorsa digitale, basata su una gestione dei dati FAIR (Findable, Accessible, Interoperable e Reusable), in grado di valorizzare il patrimonio culturale (testi letterari, documenti d'archivio, materiale bibliografico, oggetti museali, ecc.).
Vai alla pagina ufficiale per la bibliografia completa, sia per frequentanti che per non-frequentanti.
L'esame consiste nella presentazione orale di un progetto di gestione dei dati riguardante le guide turistiche di Roma.
Il progetto deve rispettare i seguenti criteri:
- essere una repository Git pubblicata su GitHub, strutturata almeno con
- una cartella
data
, per i dati - una cartella
docs
, per documentazione varia
- una cartella
- avere una documentazione scritta in Markdown, che include:
- i vari README (uno per cartella)
- un Data Management Plan
- una piccola pagina Web, pubblicata tramite GitHub Pages, che servirà da principale vetrina di comunicazione per il progetto (vi consiglio di usare il README della cartella
docs
).
Dati che possono essere usati, in parte o in tutto: Guide di Roma.
Un esempio (in bozza e incompleto) di possibile progetto è la nostra repo che abbiamo usato come tutorial durante le lezioni pratiche.
Possibili idee di progetto includono:
Activity | Descrizione | Esempio di oggetto di ricerca prodotto e da documentare | Note |
---|---|---|---|
Marcatura in TEI | Marcatura in TEI delle entità presenti nel testo, della sua struttura e dei suoi metadati contestuali. | esempio-tei.xml | Fornire un esempio di documento marcato in TEI e spiegare l'uso dei tag con i relativi attributi, e le scelte fatte. |
Raccolta e strutturazione dati in CSV | Raccolta e strutturazione di dati in una tabella CSV (ad esempio, ogni riga rappresenta una chiesa, e ogni colonna una sua caratteristica). | esempio-tabella.md | Fornire un esempio di tabella in CSV ed eventualmente spiegarne la struttura, le buone pratiche seguite (separatori, schemi di codifica), ed eventuali strumenti usati (come OpenRefine). |
Pulizia manuale e analisi dei termini | Pulizia manuale del testo e analisi qualitativa e quantitativa dei termini utilizzati utilizzando strumenti come Voyant Tools. | Spiegare come è stato corretto il testo, quali stopwords sono state rimosse o aggiunte, cosa è stato scoperto durante l'analisi e fornire immagini delle visualizzazioni generate. | |
Modellazione semantica dei dati in RDF | Modellazione semantica dei dati in RDF creando esempi in Turtle e riutilizzando ontologie esistenti. | esempio-rdf.ttl | Fornire un esempio di modellazione in RDF, spiegando le classi e le proprietà estratte dal testo, quali vocabolari sono stati utilizzati e come sono stati adattati per il caso specifico. |