Semaine Data SHS 2021
Dans le cadre de sa plateforme universitaire de données (PUD) PANELS, la MSH Lyon St-Etienne organise du 6 au 10 décembre 2021 une semaine « Data SHS », qui aura pour thématique générale « Traiter et analyser des données en sciences humaines et sociales ». Cette semaine, inscrite dans le plan national de formations de PROGEDO, propose une série de présentations et d’ateliers pratiques autour des méthodes de traitement et d’analyse de données en sciences humaines et sociales. Ces présentations seront aussi l’occasion d’aborder les principes et outils utiles à la sciences ouverte et à la gestion de données « FAIR » en SHS.
Ces conférences et ateliers ont un double objectif : présenter en détails les fondements théoriques des méthodes d’analyse et de représentation de données SHS et expliciter les moyens de leur mise en œuvre pratique. Le but est de permettre aux participants d’adapter ces méthodes à leurs propres travaux, de façon la plus autonome possible.
Public : ce programme s’adresse aux chercheurs, enseignants-chercheurs, ingénieurs et techniciens, ainsi qu’aux doctorants, des laboratoires SHS du site Lyon St-Etienne.
Visioconférences filmées du 9 décembre 2021
Le web sémantique : introduction, travaux pratiques et exemples
Voir les éditions précédentes 2019 et 2020

Introduction au web sémantique

Durée: 96 minutes

Introduction au web sémantique, l’exemple de data.idref.frIntervenant : Jean-Baptiste Pressac (Univ. Brest, CRBC - UMS 3554)
 Dans son plan national pour la science ouverte du 4 juillet 2018, la France s’est engagée à développer l’accès ouvert aux données de la recherche (science ouverte). Le modèle RDF correspond au plus haut niveau de qualité de diffusion des données ouvertes (open data) car il garantit l’interopérabilité syntaxique et sémantique des données. Il permet également l’interrogation fédérée de plusieurs sources de données. Le SPARQL, recommandation depuis 2012 du W3C, l’organisme de standardisation du web, est le langage de facto pour interroger les données en RDF. Cet atelier d’introduction vous propose de découvrir ces concepts avec l’exemple de data.idref.fr, la version sémantique des notices d’autorité IdRef.

Play Video

Apports des technologies sémantiques pour des données de nature documentaire

Durée: 76 minutes

Illustration des apports des technologies sémantiques pour des données de nature documentaire : l’exemple d’IdRef, autorités et référentiels pour l’ESR
Intervenant : François Mistral, responsable IdRef-Autorités (ABES)Les données d’autorité, initialement produites dans les coulisses des catalogues de bibliothèques pour décrire les Personnes, les Collectivités, les Sujets, les Oeuvres et les Lieux impliqués dans les documents signalés, ont subi et suivi les évolutions d’Internet depuis le web de documents au web sémantique, comme autant de métamorphoses. Il s’agira de retracer ce parcours et d’en exposer les points saillants (impacts, prérequis, espoirs et limites) du point de vue des données et de leurs exploitations.

Play Video

L’interopérabilité sémantique au service de la réutilisation des données SHS

Durée: 103 minutes

L’interopérabilité sémantique au service de la réutilisation des données SHS : OntoME et le projet SDHSS
Intervenant : Vincent Alamercery, ingénieur d’études (ENS de Lyon, LARHRA - UMR 5190) et Francesco Beretta, chargé de recherche en histoire (CNRS, LARHRA - UMR 5190)
 Nous avons tous des vieux fichiers au fond d’un disque dur comportant des données plus ou moins structurées de l’époque héroïque où les chercheurs en sciences humaines utilisaient vaillamment des logiciels créés pour un usage tout autre : comptabilité, gestion financière, gestion de fichier client... Si les fichiers ont vieilli, les informations qu’ils contiennent sous forme de données numérique sont souvent toujours utiles. Comment faire alors pour les réutiliser, les croiser et les enrichir avec d’autres données disponibles ?La clé est la sémantisation des données :1. Produire des données sémantiquement claires permet à d’autres de les comprendre et de les réutiliser.2. Comprendre les données existantes permet de les réutiliser.Lors de cette intervention, nous présenterons la méthode et les outils développés par l’Axe de recherche en histoire numérique du LARHRA pour promouvoir la production de données FAIR dans le web sémantique : SDHSS, une extension du CIDOC CRM pour la recherche en SHS, et OntoME, une application de gestion d’ontologies et de profils applicatifs connectée au web sémantique.

Play Video

Glitter makes SPARQL

Durée: 72 minutes

Glitter makes SPARQL : glitter, un package R pour explorer et collecter des données du web sémantique

Intervenant : Lise Vaudor, ingénieur de recherche en analyses statistiques (CNRS, EVS - UMR 5600, plateforme ISIG)
 La collecte de données du web sémantique, qui sont formalisées selon le modèle RDF, nécessite l’élaboration de requêtes dans le langage dédié SPARQL. Ce langage, qui est aux données du web sémantique ce que SQL est aux bases de données relationnelles, a ainsi un objectif très spécifique et demeure assez méconnu des utilisateurs de données. Au contraire, R est un langage de programmation assez généraliste puisqu’il permet de gérer de nombreux aspects de la chaîne de traitements de données, depuis leur recueil jusqu’à leur valorisation (par des modèles, graphiques, cartes, rapports, applications, etc.).Le package glitter permet aux utilisateurs de R sans connaissance préalable de SPARQL (analystes de données, chercheurs, étudiants) d’explorer et collecter les données du web sémantique. Par des commandes R, l’utilisateur peut générer des requêtes SPARQL, les envoyer aux points d’accès de son choix, et recueillir les données correspondantes. Ces étapes sont ainsi intégrées à l’environnement R dans lequel l’utilisateur peut également réaliser les étapes d’analyse et de valorisation des données, dans une chaîne de traitement reproductible.Lors de cette présentation, Lise Vaudor montrera les principales fonctionnalités du package glitter à partir d’exemples. Le package est toujours en développement mais il est fonctionnel, documenté et peut être installé par les participants qui souhaitent le tester en suivant les instructions décrites sur cette page.

Play Video