Indexer les corpus numeriques – atelier #2
Labo /
29/03/2019
L’édition critique est l’un des axes structurants de l’Institut d’Histoire des Représentations et des Idées dans les Modernités (IHRIM UMR 5317). Le laboratoire mène en particulier de nombreux projets d’éditions numériques, pour lesquels il jouit d’une véritable reconnaissance. Dans ce domaine en pleine expansion des Humanités numériques, le partage des compétences et la diffusion des bonnes pratiques se révèlent essentiels.
Pour l’édition numérique de corpus, la constitution d’index est un véritable enjeu scientifique et technique, pour lequel il existe encore peu de documentation. Les index relèvent, avec l’annotation, de l’exploitation scientifique des textes édités : ils sont des outils de navigation dans le corpus et participent à sa compréhension en identifiant les personnes, les lieux et les œuvres mentionnés, ainsi que les matières traitées. L’exploitation de ces données aide par exemple à visualiser des réseaux de relations.
Les référentiels et les notices d’autorités permettent d’uniformiser et de consolider les index grâce à l’emploi d’un vocabulaire contrôlé et de formes normalisées. Ils apportent des solutions au traitement des variantes des patronymes, des toponymes et des titres d’ouvrages. Dans la perspective du Linked Open Data, l’alignement sur des référentiels aide à enrichir les données d’un projet en les complétant avec d’autres ressources et bases de données (data.bnf.fr, IdREF, VIAF, ISNI).
L’atelier, fondé sur le partage d’expériences d’ingénieurs et de chercheurs impliqués dans l’édition de corpus numériques, vise à définir les bonnes pratiques utiles à l’établissement d’index, pour identifier et documenter de manière univoque une notion ou une entité nommée : quels sont les référentiels à utiliser ? Comment valoriser au mieux son corpus ? Comment structurer ces données ? Quelles sont les solutions techniques ?
Le programme de cet atelier propose des présentations générales, des échanges autour de projets en cours et une table-ronde technique, animée par des ingénieurs. Les participants sont invités à suivre les deux journées pour faire part de leurs questions lors de la table-ronde.

Introduction

Durée: 7 minutes

Introduction du séminaire l'atelier #2 par Sabine Loudcher, Université Lumière Lyon 2, ERIC et ICOM

Play Video

TEI pour l’indexation

Durée: 52 minutes

Lou Burnard, Université d'Oxford, co-fondateur de la Text Encoding Initiative
Propositions de la TEI pour l'indexation : encodage de texte ou encodage de données ?

Play Video

Indexer les personnages, annoter les caractères

Durée: 40 minutes

Ioana Galleron (Université Sorbonne Nouvelle - Paris 3, Lattice) et Cécile Meynard (Université d'Angers, CIRPaLL)
Excusée : Fatiha IDMHAND (Université de Poitiers, CRLA-Archivos)

Indexer les personnages, annoter les caractères : expérimentations sur quelques nouvelles.

Play Video

Histoire sociale de l’institution

Durée: 46 minutes

Thierry Pecout (UJM Saint-Etienne, LEM-CERCOR)
Pour une histoire sociale de l'institution (l'Europe angevine, XIIIe-XIVe s.) : construire un outil d'analyse prosopographique.

 

Play Video

Saint-Simonisme

Durée: 38 minutes

Michel Bellet (UJM Saint-Etienne, Centre Max Weber)
Saint Simonisme, une utopie innovante à revisiter

Play Video

Indexer Solr et Drupal

Durée: 40 minutes

Gérald Chatagnon (UJM Saint-Etienne, DSI) et Ahmad Fliti (CNRS, LEM-CERCOR)
Indexer les corpus avec Solr et Drupal

Play Video

Synthèse du séminaire

Durée: 17 minutes

Christelle Bahier-Porte / UJM Saint-Etienne, IHRIM

Synthèse du séminaire

Play Video