La ricerca in Cattolica

LiIta: Interlinking Linguistic Resources for Italian via Linked Data

Milano, 2023 - 2025

PNRR per la Missione 4, Componente 2, Investimento 1.1 - Avviso 1409/2022 - Prot. P2022M7KR8 - CUP J53D23017270001 - Finanziato dall'Unione Europea Next Generation EU

 

L'obiettivo del progetto LiITA – Linking Italian è creare interoperabilità tra le risorse disponibili per l'italiano. Per affrontare questa sfida, il progetto si baserà sugli standard de facto creati dalla comunità scientifica dei Linked Open Data (LOD), grazie ai quali le risorse e gli strumenti sono pubblicati, interconnessi e possono interagire tra loro sul web. Per raggiungere l'interoperabilità, questo progetto svilupperà il componente fondamentale per l'interconnessione delle risorse, ovvero la Lemma Bank, un elenco di forme di citazione per l'italiano pubblicato come LOD. La prima fase del progetto LiITA – Linking Italian si concentrerà sulla costruzione di una Lemma Bank a partire da insiemi di lemmi italiani esistenti, meticolosamente selezionati e confrontati. La Lemma Bank è disponibile come Linked Open Data, aderendo al vocabolario ampiamente accettato delineato nel modello OntoLex-Lemon per la descrizione delle risorse lessicali.

La seconda fase ruota attorno all'integrazione di un insieme di risorse linguistiche italiane liberamente disponibili con la Knowledge Base. Questo include una risorsa lessicale prominente, specificamente un WordNet, e una categoria di risorse testuali, sotto forma di treebank italiani disponibili nel framework Universal Dependencies.

La terza fase del progetto prevede lo sviluppo di uno strumento che consenta ai fornitori di risorse di collegare automaticamente i loro dati alla Lemma Bank. Insieme all'impegno del progetto nell'utilizzare vocabolari consolidati per la rappresentazione della conoscenza come LOD, questo strumento promuove un approccio aperto. Di conseguenza, la Knowledge Base diventa facilmente estensibile e adattabile per futuri arricchimenti ed espansioni.

SCOPRI DI PIÙ


Working group:

Partners:

  • Università di Torino

Sede: Milano

Area Scientifica: scienze dell’antichità, filologico-letterarie e storico-artistiche

Responsabile scientifico: Eleonora Maria Gabriella Litta Modignani Picozzi

Periodo di svolgimento della ricerca: 2023 - 2025