Que jouent exactement les métadonnées dans un GED ?

Il est possible de synthétiser un ensemble de données pour faciliter la recherche et l’identification de documents via l’utilisation de métadonnées dans le cadre de la mise en place d’une solution GED.

Qu’est-ce qu’un GED, de toute façon ?

Les documents et leurs données associées sont au centre de GED, une abréviation pour « Electronic Document Management« . Elle se sent appelée à améliorer leur administration et l’utilisation des ressources à leur disposition.

Intégration des métadonnées dans une GED

Le but des métadonnées est de faciliter la lecture des informations et des données afin qu’un document puisse être classé, catégorisé ou recherché dans le système GEDmis. Les articles sont organisés selon leur type, leur contenu, leur date d’acquisition et d’autres métadonnées. Par conséquent, les métadonnées facilitent la gestion globale des documents.

Les différentes formes de métadiorite

Il existe trois grandes catégories de métadonnées, et elles sont les suivantes :

  • Métadonnées descriptives : elles fournissent les informations nécessaires pour localiser un document en fonction de critères tels que son titre ou sa date de création.
  • Les modèles de données structurés permettent l’organisation systématique des sources de données.
  • Les dossiers administratifs permettent d’encadrer une ressource en traitant des données telles que son nom, sa date de création (ou d’achat) et ses droits d’archivage.

Les métadonnées au service de la LAD (Lecture Automatique de Documents)

  • Le système de classification de documents RAD (Automatic Document Recognition) vise à distinguer les documents similaires.
  • Dans son ensemble, LAD (Automated Document Reading) intègre la technologie OCR (Optical Character Recognition) qui peut transformer un document numérisé en texte. Cela fonctionne également pour la reconnaissance d’images, qui est une sorte de données non structurées.
  • Dans la lignée de la reconnaissance optique de caractères (OCR), la reconnaissance intelligente de caractères (ICR) permet la reconnaissance de caractères manuscrits dans des documents structurés ou semi-structurés.

Quelles sont exactement les métadonnées ?

En informatique, une métadonnée est un élément de données qui peut être utilisé pour caractériser et définir d’autres éléments de données. Ils ont été développés avec la technologie du web sémantique. Selon le World Wide Web Consortium (W3C), la technologie du Web sémantique fournit un cadre pour « réutiliser et partager des données entre de nombreuses applications, entreprises et groupes d’utilisateurs » (World Wide Web Consortium).

Les métadonnées sont des éléments qui caractérisent une ressource de manière générale. Il peut s’agir, par exemple, d’un livre, d’une bibliothèque ou d’une grande collection de livres. Il est possible de fournir des éléments de métadonnées pour chacun de ces jeux de données. Un exemple de cela serait de nommer le titre du livre, l’auteur, la date de sortie, etc. Mais à quoi cela sert-il ?

Et supposons que ce livre soit largement diffusé en ligne. Par conséquent, les métadonnées joueront un rôle important, notamment en facilitant la recherche de la ressource et en fournissant des informations utiles aux internautes. D’un point de vue technique, un simple tableau peut décrire adéquatement la ressource. Cependant, la table doit être construite dans un format interopérable comme CSV afin que les métadonnées puissent être facilement exploitées par les machines.

Définition d’une norme de métadonnées

Les normes de métadonnées sont ce que vous avez ici. Il existe de nombreuses normes, dont chacune vise carrément un objectif particulier dans un domaine particulier. Certaines descriptions s’avèrent assez compliquées, devant respecter un certain nombre de contraintes et de normes différentes. Un schéma de base n’est pas le meilleur choix ici. C’est là que les schémas de métadonnées peuvent jouer un rôle.

Schémas de métadonnées

Divers domaines, y compris l’informatique, la philosophie et la rédaction technique, donnent au terme «schéma» des significations variées. Ici, le diagramme doit être considéré comme une collection structurée de données. Un ensemble de métadonnées, ou un « schéma », est une collection liée d’éléments descriptifs.

Par exemple, le schéma fournit une définition pour le titre, l’auteur et la date de publication, qui peuvent tous être trouvés dans leurs emplacements respectifs. le type de contenu attendu, tel que du texte ou des nombres. Il peut être écrit dans un langage de forme libre, une structure prescrite ou conformément à un ensemble de règles. Et enfin, des valeurs attribuables, comme un mot dérivé d’un thésaurus ou un choix parmi un ensemble limité d’options.

Le degré de responsabilité

Ce qui peut et ne peut pas être fait avec les éléments est également spécifié par le diagramme. Il est possible de différencier les fonctionnalités requises, recommandées et facultatives. Le choix d’inclure ou d’exclure certains composants. Enfin, certaines réglementations plus détaillées, telles que « si ce champ est renseigné, alors le champ suivant dans la séquence doit également être renseigné ». Un modèle de données, ou schéma, qui représente graphiquement les interconnexions entre les différentes parties à partir desquelles il est construit.