Indexer les corpus numeriques – atelier #1

Labo IHRIM /

Littérature /

01/02/2019

25images/shs
Projets
Indexer les corpus numeriques – atelier #1

Le laboratoire IHRIM (CNRS UMR5317) organise le 1er février 2019 à Saint-Étienne, la première séance du séminaire Indexer les corpus numériques.

La constitution d’index est un véritable enjeu scientifique et technique, pour lequel il existe encore peu de documentation. Les index relèvent, avec l’annotation, de l’exploitation scientifique des textes édités : ils sont des outils de navigation dans le corpus et participent à sa compréhension en identifiant les personnes, les lieux et les œuvres mentionnés, ainsi que les matières traitées. L’exploitation de ces données aide par exemple à visualiser des réseaux de relations. Les référentiels et les notices d’autorités permettent d’uniformiser et de consolider les index grâce à l’emploi d’un vocabulaire contrôlé et de formes normalisées. Ils apportent des solutions au traitement des variantes des patronymes, des toponymes et des titres d’ouvrages. Dans la perspective du Linked Open Data, l’alignement sur des référentiels aide à enrichir les données d’un projet en les complétant avec d’autres ressources et bases de données (data.bnf.fr, IdREF, VIAF, ISNI).

L’atelier, fondé sur le partage d’expériences d’ingénieurs et de chercheurs impliqués dans l’édition de corpus numériques, vise à définir les bonnes pratiques utiles à l’établissement d’index, pour identifier et documenter de manière univoque une notion ou une entité nommée.

> Programme du 1er février 2019

Introduction

Accueil et introduction du séminaire l'atelier #1 "Des référentiels à la publication numérique" par Emmanuelle Perrin (UJM Saint-Étienne, IHRIM) et Fabienne Vial-Bonacci (CNRS, IHRIM)

Play Video

Durée: 11 minutes

IdRef

François Mistral, ABES, responsable d’IdRef-Autorités
IdRef : une offre de services à destination de la recherche pour enrichir les données et accroître leur interopérabilité.

Play Video

Durée: 45 minutes

Encodage sémantique de textes historiques et référentiels publics

Francesco Beretta CNRS, LARHRA UMR 5190
Encodage sémantique de textes historiques et référentiels publics : retours d’expériences et perspectives

Play Video

Durée: 47 minutes

Retrouver, annoter, cartographier et analyser les entités spatiales

Thierry Joliveau UJM Saint-Étienne, EVS UMR 5600
Retrouver, annoter, cartographier et analyser les entités spatiales nommées dans un corpus de romans parisiens