LiIta: Interlinking Linguistic Resources for Italian via Linked Data
Milano, 2023 - 2025
PNRR per la Missione 4, Componente 2, Investimento 1.1 - Avviso 1409/2022 - Prot. P2022M7KR8 - CUP J53D23017270001 - Finanziato dall'Unione Europea Next Generation EU
L'obiettivo del progetto LiITA – Linking Italian è creare interoperabilità tra le risorse disponibili per l'italiano. Per affrontare questa sfida, il progetto si baserà sugli standard de facto creati dalla comunità scientifica dei Linked Open Data (LOD), grazie ai quali le risorse e gli strumenti sono pubblicati, interconnessi e possono interagire tra loro sul web. Per raggiungere l'interoperabilità, questo progetto svilupperà il componente fondamentale per l'interconnessione delle risorse, ovvero la Lemma Bank, un elenco di forme di citazione per l'italiano pubblicato come LOD. La prima fase del progetto LiITA – Linking Italian si concentrerà sulla costruzione di una Lemma Bank a partire da insiemi di lemmi italiani esistenti, meticolosamente selezionati e confrontati. La Lemma Bank è disponibile come Linked Open Data, aderendo al vocabolario ampiamente accettato delineato nel modello OntoLex-Lemon per la descrizione delle risorse lessicali.
La seconda fase ruota attorno all'integrazione di un insieme di risorse linguistiche italiane liberamente disponibili con la Knowledge Base. Questo include una risorsa lessicale prominente, specificamente un WordNet, e una categoria di risorse testuali, sotto forma di treebank italiani disponibili nel framework Universal Dependencies.
La terza fase del progetto prevede lo sviluppo di uno strumento che consenta ai fornitori di risorse di collegare automaticamente i loro dati alla Lemma Bank. Insieme all'impegno del progetto nell'utilizzare vocabolari consolidati per la rappresentazione della conoscenza come LOD, questo strumento promuove un approccio aperto. Di conseguenza, la Knowledge Base diventa facilmente estensibile e adattabile per futuri arricchimenti ed espansioni.
Working group:
- Eleonora Maria Gabriella Litta Modignani Picozzi - Responsabile scientifico UCSC
- Francesco Mambrini
- Marco Carlo Passarotti
- Paolo Brasolin
Partners:
- Università di Torino
Sede: Milano
Area Scientifica: scienze dell’antichità, filologico-letterarie e storico-artistiche
Responsabile scientifico: Eleonora Maria Gabriella Litta Modignani Picozzi
Periodo di svolgimento della ricerca: 2023 - 2025