Indexer les corpus numeriques – atelier #1
Labo /
01/02/2019
Le laboratoire IHRIM (CNRS UMR5317) organise le 1er février 2019 à Saint-Étienne, la première séance du séminaire Indexer les corpus numériques.
La constitution d’index est un véritable enjeu scientifique et technique, pour lequel il existe encore peu de documentation. Les index relèvent, avec l’annotation, de l’exploitation scientifique des textes édités : ils sont des outils de navigation dans le corpus et participent à sa compréhension en identifiant les personnes, les lieux et les œuvres mentionnés, ainsi que les matières traitées. L’exploitation de ces données aide par exemple à visualiser des réseaux de relations. Les référentiels et les notices d’autorités permettent d’uniformiser et de consolider les index grâce à l’emploi d’un vocabulaire contrôlé et de formes normalisées. Ils apportent des solutions au traitement des variantes des patronymes, des toponymes et des titres d’ouvrages. Dans la perspective du Linked Open Data, l’alignement sur des référentiels aide à enrichir les données d’un projet en les complétant avec d’autres ressources et bases de données (data.bnf.fr, IdREF, VIAF, ISNI).
L’atelier, fondé sur le partage d’expériences d’ingénieurs et de chercheurs impliqués dans l’édition de corpus numériques, vise à définir les bonnes pratiques utiles à l’établissement d’index, pour identifier et documenter de manière univoque une notion ou une entité nommée.

Introduction

Durée: 11 minutes

Accueil et introduction du séminaire l'atelier #1 "Des référentiels à la publication numérique" par Emmanuelle Perrin (UJM Saint-Étienne, IHRIM) et Fabienne Vial-Bonacci (CNRS, IHRIM)

Play Video

IdRef

Durée: 45 minutes
François Mistral, ABES, responsable d’IdRef-Autorités
IdRef : une offre de services à destination de la recherche pour enrichir les données et accroître leur interopérabilité.
Play Video

Encodage sémantique de textes historiques et référentiels publics

Durée: 47 minutes

Francesco Beretta CNRS, LARHRA UMR 5190
Encodage sémantique de textes historiques et référentiels publics : retours d’expériences et perspectives

Play Video

Retrouver, annoter, cartographier et analyser les entités spatiales

Durée: 56 minutes

Thierry Joliveau UJM Saint-Étienne, EVS UMR 5600
Retrouver, annoter, cartographier et analyser les entités spatiales nommées dans un corpus de romans parisiens

Play Video

ISIDORE

Durée: 55 minutes

Laurent Capelli CNRS, Huma-Num
Collectes, enrichissements et normalisations sur ISIDORE, la plateforme d’accès aux données numériques des SHS.

Play Video