La ricerca in ascolto, come l’intelligenza artificiale può aiutare l’open access. Un progetto Inapp

Chiara Carlucci e Valeria Cioccolo
INAPP – Istituto nazionale per l’analisi delle politiche pubbliche


La forza della condivisione, in particolare per i prodotti della ricerca finanziata da fondi pubblici, e la sua disponibilità attraverso i principi dell’open access e l’open science è emersa significativamente durante la recente crisi pandemica e si concretizza attraverso ambienti digitali e archivi aperti che ne garantiscono la fruizione da parte di tutti i potenziali beneficiari: stakeholders, cittadini, società civile. L’INAPP (Istituto nazionale per l’analisi delle politiche pubbliche) svolge ricerche e analisi nell’ambito dei temi del lavoro, della formazione, delle politiche sociali e applica da molti anni i principi dell’open access mettendo a disposizione il proprio know-how tecnico-scientifico in un archivio istituzionale denominato Inapp OA.

Per massimizzare la visibilità e la ricercabilità delle proprie risorse, l’INAPP ha avviato un progetto sperimentale nel quale il sistema di ricerca dell’open archive è stato implementato attraverso una rete neurale di intelligenza artificiale (AI) che potesse massimizzare i risultati di ricerche effettuate dagli utenti colmando lo scarto esistente tra i contenuti restituiti dal sistema e quelli potenzialmente disponibili. L’intelligenza artificiale così implementata lavora sia sui metadati sia sui full text disponibili nell’open archive indipendentemente dal loro formato (pdf, jpeg, tiff, png), creando una base dati “raw” formata da stringhe testo e keywords. A questa operazione si affianca il NER (Named-entity recognition) o individuazione delle ‘entità nominate’ per cui ogni parola significativa (persone, luoghi ed altre entità) viene progressivamente taggata e riconosciuta dall’AI che “impara” e quindi restituisce anche questa tipologia di informazioni nei risultati di ricerca. Le simulazioni di ricerca effettuate su un utente 0 con e senza la soluzione di AI per misurarne il funzionamento, hanno mostrato come i risultati cambiassero e si arricchissero in presenza/assenza tale upgrade in AI.

Viene in tal modo sensibilmente migliorata la capacità di risposta del sistema, perché la rete neurale artificiale ‘interpreta’, ‘traduce’ e ‘corregge’ le parole utilizzate superando le limitazioni tipiche delle piattaforme di open archive. Dal lato back-office, inoltre, il sistema di AI coadiuva il lavoro di bibliotecari/documentalisti e professionisti della PA perché aiuta a individuare il panorama significativo dei temi di maggior interesse e delle parole del linguaggio naturale maggiormente utilizzate nelle ricerche, arricchendo così di nuovi metadati la catalogazione sia descrittiva che semantica derivanti dall’aggregazione delle informazioni usate in fase ricerca dagli utenti.

Sebbene questo progetto sia ancora in fase sperimentale, gli elementi di innovatività e di applicazione sono molteplici. Tra i più significativi, la possibilità di diffusione e integrazione con ambienti semantici, competenze e aree di applicazione diversi grazie alla replicabilità e scalabilità delle tecnologie applicate. L’ambizione è mettere la ricerca pubblica in ascolto delle esigenze reali di ricerca dei propri utenti in modo di poter consolidare il rapporto di fiducia tra istituzioni e società civile. L’iniziativa nel 2021 è stata inserita da Open Gov tra le nove finaliste della categoria del Premio Open Gov nell'ambito della sezione dedicata ai progetti delle amministrazioni pubbliche per la categoria 'Trasparenza e Open Data'.

Topic

Le pubblicazioni scientifiche - comunicazione scientifica

Parole chiave:

Comunicazione scientifica; Intelligenza artificiale; Open access

poster_INAPP

Biblioteche per l'Open Science: Sessione Poster

Ultimo aggiornamento 17 Ottobre 2022