Il Thesaurus INAPP in LOD - Linked Open Data

Chiara Carlucci, Giuseppina Di Iorio       
Inapp  


Il Thesaurus Inapp è un vocabolario controllato di tipo monogerarchico di circa 2600 termini, nato alla fine degli anni Novanta, a partire dallo studio di vocabolari controllati particolarmente autorevoli nell’ambito delle materie di competenza istituzionale (lavoro, formazione, politiche sociali). La manutenzione e l’aggiornamento di questo corpus informativo con un alto livello di specializzazione è curato dalla Biblioteca Inapp utilizzando le funzioni specifiche messe a disposizione dal proprio OPAC.  

Il poster presenta l’esperienza relativa alla pubblicazione del Thesaurus INAPP in modalità LOD. Grazie alla traduzione in SKOS è infatti possibile la consultazione dei termini con i quali INAPP indicizza la propria documentazione scientifica istituzionale nel contesto tecnologico del web dei dati. Dal punto di vista tecnico le finalità descritte sono state raggiunte tramite la definizione di un mapping che ha utilizzato il linguaggio RML (RDF Mapping Language) per la trasposizione dei dati del thesaurus dal formato csv in RDF, avvalendosi del modello e del vocabolario SKOS per rappresentarne la semantica, la struttura e il patrimonio relazionale esistente tra concetti, ricercando inoltre, dove possibile, il collegamento a termini di altre strutture thesaurali disponibili nella linked data cloud. 

È stata predisposta una procedura automatica di generazione dei dati RDF e di aggiornamento dell’endpoint che è eseguibile a richiesta. A supporto della gestione e fruizione dei LOD prodotti è stata definita un’architettura infrastrutturale con la creazione degli ambienti di sviluppo e di installazione delle componenti e la predisposizione di query SPARQL predefinite per l’interrogazione dei dati RDF.    
La dereferenziazione delle URI generate in fase di pubblicazione LOD è stata demandata alle seguenti componenti software: 

  • LodView - Derefenziatore documentale dei dati pubblicati in RDF 
  • LODE - Piattaforma documentale dedicata all’ontologia 
  • LodLive - Navigatore di risorse RDF che interfacciandosi direttamente con l’endpoint sparql dove sono pubblicati i dati RDF è in grado di fornire una rappresentazione visuale degli stessi sottoforma di diagramma 
  • Virtuoso - Triplestore che espone l’endpoint SPARQL. Il triplestore è un database per il salvataggio e il recupero di triple, entità composte da soggetto-predicato-oggetto. È dotato di un suo front end che permette la gestione e il caricamento dei dati. 

Con questo progetto INAPP si pone l’obiettivo di rendere disponibile il patrimonio informativo altamente specializzato, prodotto e conservato dall’Istituto stesso, ampliandone i circuiti e l’utenza di riferimento favorendo contestualmente meccanismi di interoperabilità tecnica e semantica della propria base di conoscenza.  

Tema

2. Open (research) data

poster Carlucci_Di Iorio 05

 


Giornata delle Biblioteche per l'Open Science: sessione poster

Ultimo aggiornamento 24 Ottobre 2024