-191.jpg

MASA réunit actuellement le réseau FRANTIQ, le Réseau des Écoles Françaises à l’Étranger, l’INRAP, le musée d’archéologie nationale (MAN) et 10 laboratoires répartis dans 6 Maisons des Sciences de l’Homme (MSH) :

Des masses de sources archéologiques (cahiers de terrain, relevés, plans, photographies, bases de données, etc.) sont encore aujourd’hui non traitées, non accessibles et non sauvegardées. MASA a pour objectif de rendre plus accessibles les données de la recherche archéologique indispensables aux chercheurs dans le cadre de leurs projets.

Leurs compétences sont mises en commun autour de plusieurs groupes de travail, afin de mettre à disposition de la communauté des archéologues des corpus, des outils et des guides de bonnes pratiques :
groupes de travail :

  • Plan de gestion de données (coordinatrices : E. Bryas , N. Le Tellier Becquart )
  • Bonnes pratiques d’archivage (coordinatrices : L. Bezard, C. Jouys Barbelin, A. Montagne-Bôrras)
  • OpenArchaeo , interopérabilité (coordinateur : O. Marlet, Bruno Baudoin, Bruno Morandière)
  • Publication logiciste (coordinateur : P. Y. Buard)
  • PACTOLS (coordinatrice : B. Nouvel)
  • Opentheso (coordinateur : M. Rousset)
  • ArkeoGIS (coordinateur : L. Bernard)
  • Livre blanc (coordinateur : O. Marlet)
  • Offre de formations MASA (coordinatrice : B. Nouvel)
  • International (coordinateurs : P.-M. blanc, X. Rodier)

Au sein de la MSH Val-de-Loire, le Laboratoire Archéologie et Territoires de l’UMR CITERES est engagé essentiellement dans l’axe Web de données du Consortium MASA.

La mise en ligne de la base ArSol grâce à un contrat financé par la Région Centre (programme SCREVO) permet à la communauté scientifique d’accéder à la documentation archéologique en lien avec le processus d’interprétation mis en œuvre par les archéologues. Depuis septembre 2014, la version web d’ArSol est consultable en ligne (http://arsol.univ-tours.fr). Elle donne accès à l’ensemble des données informatisées mais également aux fichiers numériques : pour le moment les photographies (mobilier, sépultures, structures) mais à terme seront également disponibles les plans, les coupes stratigraphiques, etc. Ce travail constituait un prérequis pour commencer à travailler sur l’interopérabilité d’ArSol et poursuivre la redocumentarisation des corpus qui constituent le fonds d’ArSol.

Les données mises en ligne ne concernent que les fouilles pour lequel l’ensemble des données et de la documentation a pu être vérifié et consolidé. Ainsi, on trouve les données des fouilles du Château de Tours et celles de l’Abbaye de Marmoutier. Le soutien du consortium MASA a permis de traiter trois nouveaux corpus : la Collégiale St-Mexme de Chinon, le Fort St-Georges de Chinon et les fouilles de l’église paroissiale et du cimetière de Rigny. Ces corpus seront prochainement disponibles en ligne.

La mise en ligne permet de mettre en place des projets de publications scientifiques mobilisant directement les données d’ArSol. Par exemple, un projet, en collaboration avec le Laboratoire d’Informatique de l’Université de Tours, de publication électronique des fouilles de Marmoutier permettra d’argumenter les propositions d’interprétation par les preuves (analyse stratigraphique, mobilier, etc.) qui sont accessibles dans la version web d’ArSol. La publication des fouilles de Rigny au format TEI-XML, mobilisant également les données d’ArSol dans son argumentaire, est actuellement en cours de développement à la MRSH de Caen. Au-delà de la publication des résultats des fouilles du Laboratoire Archéologie et Territoires, l’objectif est de proposer à la communauté des archéologues un modèle de publication électronique connecté directement à la base de données scientifique afin d’apporter au lecteur la preuve de chaque proposition avancée dans l’argumentaire.

pm3ok.jpg

Comment rendre une base de données propriétaire interopérable ? Il existe autant de bases de données en archéologie qu’il existe d’équipes d’archéologues, voire plus ! Les logiciels et les structurations sont extrêmement hétérogènes et uniformiser les outils et la façon de structurer l’information reste un objectif inaccessible qui ne résoudrait pas le problème des bases déjà existantes car, outre les réticences des chercheurs pour homogénéiser un jeu de données, les moyens manqueraient pour venir à bout de l’énorme chantier que représenterait la migration des bases de données d’un système fermé à un autre plus interopérable.

La solution envisagée au sein du Consortium MASA est de permettre d’utiliser un système commun qui puisse venir en surcouche sur les bases de données existantes. L’objectif est de permettre l’interrogation dynamique des bases existantes sans avoir à procéder à des exports. Le Consortium MASA a permis de mettre en place les bases d’une interopérabilité d’ArSol via l’ontologie du CIDOC-CRM (norme ISO 21127:2006) en utilisant les vocabulaires des thésaurus PACTOLS, norme ISO 25964-1 (2011). L’ontologie du CIDOC-CRM permettant de modéliser précisément tout objet ou concept patrimonial, le principe est donc d’établir des ponts entre la structure d’une base de données archéologique existante et cette ontologie. Cette phase de mise en correspondance, appelée « mapping », est primordiale et nécessite d’être effectuée avec soin. Le prérequis est bien sûr que la base puisse être interrogée de l’extérieur (c’est le cas des bases construites avec Access, 4D, mySQL, Oracle ou Filemaker, pour ne citer que les outils les plus utilisés en archéologie). Pour le mapping, la Laboratoire Archéologie et Territoires a bénéficié de l’aide précieuse de Patrick Lebœuf (BNF) et d’Anne-Violaine Szabados (ArScAn, MAE, Nanterre), tous deux spécialistes du CIDOC-CRM. Le rapport réalisé constitue ainsi la base d’un guide de bonne pratique pour la mise en correspondance d’une base de données d’archives de fouilles avec l’ontologie CIDOC-CRM.

Même si d’une base de données à l’autre, le mapping est différent, le fait de rattacher chaque champ de la structure d’une base à une entité ou une propriété de l’ontologie permet de se référer à une structure commune avec un vocabulaire unique, en anglais donc indépendant de la langue d’origine.

L’intérêt est de permettre à un utilisateur d’interroger n’importe quelle base de données quelque soit le logiciel et la structure qui accueillent ces données : l’interrogation se fait via l’ontologie, puis un moteur retranscrit la requête pour la base de données cible en utilisant le fichier de mapping, enfin les résultats sont renvoyés à l’utilisateur en respectant la structure de l’ontologie. Avec ce procédé, il est donc techniquement possible d’interroger plusieurs bases en même temps, même si leur format natif diffère complètement. C’est l’interopérabilité attendue.

-192.jpg

Outre la mise en place de tout un écosystème numérique pour accompagner les archéologues à porter leurs données sur le Web sémantique, le résultat de ces travaux se trouve être la mise en place d’un triplestore accueillant l’ensemble des corpus archéologiques mis en ligne dans le cadre du consortium MASA par ses différents acteurs et surtout l’exploitation de ce triplestore par la plateforme OpenArchaeo qui permet à la fois une interrogation traditionnelle du Web sémantique (mais spécialisée) en SPARQL mais également une interface d’interrogation intuitive grâce à des icônes (système SPARNATURAL).

>> Découvrir OpenArchaeo

logohumanum-web-grand-rvb-pt.png