▶️I metadati nei documenti

Cosa sono i metadati

La definizione più sintetica di metadati è quella di “dati che descrivono altri dati”.

Il termine deriva dall’inglese metadata che trae origine dalla preposizione greca μετά (meta), ossia “al di sopra” e dal plurale neutro latino data ossia “i dati”. Si tratta, quindi, di informazioni che integrano i dati reali, per permettere maggiori dettagli sul contenuto di un oggetto (per es. un file, un fascicolo, un’immagine, un libro) e per dare anche istruzioni su come gestire quei dati reali. In tal senso, i metadati assumono un ruolo fondamentale sia nel contesto analogico che in quello informatico.

Funzioni dei metadati, da Wikipedia

La funzione principale di un sistema di metadati è quella di consentire il raggiungimento dei seguenti obiettivi:

  • Ricerca, che consiste nell'individuare l'esistenza di un documento;

  • Localizzazione, ovvero rintracciare una particolare occorrenza del documento;

  • Selezione, realizzabile analizzando, valutando e filtrando una serie di documenti;

  • Interoperabilità semantica, che consiste nel permettere la ricerca in ambiti disciplinari diversi grazie a una serie di equivalenze fra descrittori;

  • Gestione risorse, ossia gestire le raccolte di documenti grazie all'intermediazione di banche dati e cataloghi;

  • Disponibilità, ovvero ottenere informazioni sull'effettiva disponibilità del documento.

Nei progetti di digitalizzazione e nelle attività di gestione degli archivi di oggetti digitali, i metadati rivestono un'importanza crescente, tanto da venire considerati parte costituente della definizione di “oggetto digitale”.

Al primo ambito possiamo associare, ad esempio, l’invio di una lettera tramite Raccomandata AR: il testo della lettera costituisce l’insieme dei dati primari, mentre le informazioni distribuite tra busta e moduli di accompagnamento sono i metadati, quali mittente e destinatario e relativi indirizzi, date di spedizione e ritiro o anche i codici a barre; in ambito informatico l’esempio analogo è quello delle PEC.

I metadati, quindi, possono essere utilizzati per fornire il contesto delle informazioni e, pertanto, descrivono il processo che ha condotto alla creazione delle informazioni primarie; oppure per fornire informazioni non semplici da reperire in altro modo, quali la durata di un video o la dimensione di un file; o, ancora, per collegare informazioni di diversa natura e renderle facilmente recuperabili come i dati strutturati di una pagina web.

Nello specifico degli oggetti digitali trattati in un sistema di gestione documentale, file d email, i metadati possono essere di diversa categoria e vengono gestiti dal sistema operativo, da cui possono essere denominati anche come “attributi”. Tra quelli più comuni possiamo individuare:

  • indicazione dell’allocazione dei dati nel file system

  • dati temporali - quando è stato creato, modificato o letto

  • proprietà – singolo ruolo e/o gruppo di utenti

  • permessi - cioè chi può fare cosa, attività in base al ruolo → leggere, leggere e scrivere, modificare, ecc.

A questi si possono aggiungere metadati attribuiti dall’applicazione con cui si è generato un documento, a fini interni di memorizzazione e tracciamento; o, ancora, possono essere inseriti nel corso di attività di catalogazione o archiviazione. Una definizione più specifica, è anche quella di considerare i metadati come le informazioni di cui bisogna dotare il documento informatico per poterlo correttamente formare, gestire e conservare nel tempo.

Stante la diffusione pervasiva e la fondamentale importanza dei documenti digitali si è ritenuto di sistematizzare la materia ed è stata emanata la serie di norme ISO 23081 - Information and documentation - Records management processes – Metadata for records che forniscono un quadro di riferimento per lo sviluppo di un sistema di metadati per la gestione e conservazione dei documenti elettronici.

Sotto l’aspetto dei fini operativi i metadati vengono classificati in:

  • descrittivi

  • amministrativi / gestionali

  • strutturali

I primi riguardano l’identificazione e il recupero dei documenti stessi e sono costituiti da descrizioni normalizzate; i secondi sono dedicati alla loro gestione all’interno dell’archivio e comprendono quindi anche informazioni di natura tecnico-organizzativa (i formati, le procedure di creazione, l’ambiente tecnologico); l’ultima categoria riguarda le informazioni necessarie a descrivere l’articolazione interna e le relazioni fra le parti che compongono gli oggetti digitali.

In relazione agli obiettivi i metadati utilizzati nella gestione documentale possono essere organizzati come nella seguente tabella.

Le Linee Guida sulla formazione, gestione e conservazione dei documenti informatici e l’Allegato 5 “Metadati”

Le Linee Guida sulla formazione, gestione e conservazione dei documenti informatici introducono i metadati in sede di trattazione delle modalità di formazione dei documenti informatici: Al momento della formazione del documento informatico immodificabile, devono essere generati e associati permanentemente ad esso i relativi metadati.

Ne indicano, quindi, una completa esposizione rimandando allo specifico allegato: L’insieme dei metadati del documento informatico è definito nell’allegato 5- Metadati alle presenti linee guida. Potranno essere individuati ulteriori metadati da associare a particolari tipologie di documenti informatici. (vedi par. 2.1.1, Formazione del documento informatico).

Nel paragrafo 2.4 “Il documento amministrativo informatico” le stesse Linee guida introducono e ampliano la gestione dei metadati riguardanti il documento amministrativo informatico: Al documento amministrativo informatico viene associato l’insieme dei metadati previsti per la registrazione di protocollo ai sensi dell’art 53 del TUDA, nonché i metadati relativi alla classificazione, ai sensi dell’articolo 56 del TUDA, e ai tempi di conservazione, in coerenza con il piano di conservazione, e quelli relativi alla relazione con l’aggregazione documentale informatica d'appartenenza.

Al documento amministrativo informatico sono associati ulteriori metadati rilevanti ai fini amministrativi o per finalità gestionali o conservative, definiti, per ogni tipologia di documento, nell’ambito del contesto a cui esso si riferisce, secondo quanto previsto dall’Allegato 5 alle presenti Linee guida.

Sarà cura dell’Amministrazione individuare ulteriori metadati (ad es. metadati relativi al Registro giornaliero di protocollo ecc.) da associare a particolari tipologie di documenti amministrativi informatici. A tal proposito si ricorda che nel manuale di gestione devono essere riportati i metadati definiti per ogni tipologia di documento.

Ne emerge un quadro composito, ma non rigido: le PA, infatti, possono anche aggiungere altri metadati oltre a quelli previsti e riportati in Allegato 5, pur se nel rispetto dei criteri generali indicati.

Nel contesto di un sistema di gestione documentale, anche se non direttamente connessi al documento in quanto tale, altrettanta importanza rivestono i metadati relativi alla registrazione di protocollo che nelle Linee guida, al par. 3.1.4 “Formato della registrazione e della segnatura di protocollo” viene, infatti, definita come l’insieme dei metadati che il registro di protocollo deve memorizzare, per tutti i documenti ricevuti o spediti dalla Pubblica Amministrazione e per tutti i documenti informatici che non rientrano tra le tipologie specificate dall’art. 53, comma 5 del TUDA e che non sono oggetto di registrazione particolare da parte dell’amministrazione, al fine di garantirne l'identificazione univoca e certa.

Altra categoria di metadati è quella relativa alla classificazione del documento e le Linee Guida ne descrivono la fondamentale importanza al par. 3.2 “Classificazione dei documenti informatici” dove si può leggere: Le informazioni relative alla classificazione nei casi dei documenti amministrativi informatici costituiscono parte integrante dei metadati previsti per la formazione dei documenti medesimi.

L’Allegato 5, in introduzione, esplicita la struttura degli schemi di metadati relativi al documento informatico e al documento amministrativo informatico: L’elaborazione degli schemi è stata effettuata tenendo conto anche delle informazioni necessarie in vista della conservazione a lungo termine. Gli schemi sotto riportati sono organizzati in modo da indicare per ogni metadato:

  • Informazione: il nome;

  • Sottocampi: l’eventuale sottostruttura del metadato complesso;

  • Valori ammessi: valori accettati all’interno del campo;

  • Tipo dato: numerici o alfanumerici;

  • Obbligatorietà: l’indicazione di obbligatorietà, eventualmente condizionata;

  • Nuova definizione: metadati nuovi o ridefiniti rispetto all’allegato alla normativa precedente;

  • Definizione: indicazione sulla modalità di utilizzo del metadato.

La configurazione dei metadati indicati in Allegato 5 tiene conto della necessaria flessibilità di utilizzo, come è possibile riscontrare analizzando i singoli schemi contenuti nell’allegato e le possibilità fornite dalla previsione, per ogni metadato, di sottocampi e relativi valori ammessi.

L’Allegato 5 comprende l’elencazione, e i relativi schemi, dei metadati relativi a tre oggetti:

  1. il documento informatico;

  2. il documento amministrativo informatico;

  3. le aggregazioni documentali informatiche.

I metadati del documento amministrativo informatico

Per quanto riguarda l’oggetto “documento amministrativo informatico”, l’Allegato 5 riporta la lista dei metadati obbligatori, tenendo conto del fatto che l’obbligatorietà non è legata specificatamente ai singoli metadati ma, in maniera più granulare, ai sottocampi di ogni singolo metadato e, in alcuni casi sono condizionati da determinati parametri.

Nel caso, ad esempio, del metadato “Chiave descrittiva” possiamo riscontrare due sottocampi, “Oggetto” e “Parole chiave” → il primo è obbligatorio, ma il secondo non lo è.

Nella tabella seguente sono riportati i metadati obbligatori, previsti dall’Allegato 5 e da utilizzare per i documenti amministrativi informatici, limitatamente al nome del metadato e ad una sua definizione sintetica. Per una completa analisi dei valori relativi agli schemi completi, comprensivi anche dei sottocampi, si rinvia alla consultazione diretta dello stesso Allegato 5.

Last updated