Glitter makes SPARQL : glitter, un package R pour explorer et collecter des données du web sémantique
Intervenant : Lise Vaudor, ingénieur de recherche en analyses statistiques (CNRS, EVS – UMR 5600, plateforme ISIG)
La collecte de données du web sémantique, qui sont formalisées selon le modèle RDF, nécessite l’élaboration de requêtes dans le langage dédié SPARQL. Ce langage, qui est aux données du web sémantique ce que SQL est aux bases de données relationnelles, a ainsi un objectif très spécifique et demeure assez méconnu des utilisateurs de données. Au contraire, R est un langage de programmation assez généraliste puisqu’il permet de gérer de nombreux aspects de la chaîne de traitements de données, depuis leur recueil jusqu’à leur valorisation (par des modèles, graphiques, cartes, rapports, applications, etc.).Le package glitter permet aux utilisateurs de R sans connaissance préalable de SPARQL (analystes de données, chercheurs, étudiants) d’explorer et collecter les données du web sémantique. Par des commandes R, l’utilisateur peut générer des requêtes SPARQL, les envoyer aux points d’accès de son choix, et recueillir les données correspondantes. Ces étapes sont ainsi intégrées à l’environnement R dans lequel l’utilisateur peut également réaliser les étapes d’analyse et de valorisation des données, dans une chaîne de traitement reproductible.Lors de cette présentation, Lise Vaudor montrera les principales fonctionnalités du package glitter à partir d’exemples. Le package est toujours en développement mais il est fonctionnel, documenté et peut être installé par les participants qui souhaitent le tester en suivant les instructions décrites sur cette page.