Big Data Mining and Visualization – Focus sur les Humanités Numériques dans le Big Data
Labo , /
18/06/2015

Les groupes de travail de l’association EGC – « Fouille de Données Complexes » (GT-FDC), « Fouille de Grands Graphes » (GT-FGG) et « Visualisation d’informations, interaction et fouille de données » (GT-VIF, commun avec l’AFIHM) – organisent chaque année depuis trois ans des journées thématiques visant d’une part à poursuivre les activités des groupes et d’autre part à développer des axes communs autour de la complexité liée à la fouille et la visualisation des données massives (big data). Cette année, le nouveau groupe de travail «  Gestion et Analyse de données Spatiales et Temporelles » (GT-GAST) ainsi que le groupe de travail « Data Mining et Apprentissage » (DMA) de la SFdS rejoignent l’organisation de ces journées : la 4ème édition des Journées Big Data Mining & Visualization – Focus sur les Humanités Numériques dans le Big Data. L’Institut des Sciences de l’Homme de Lyon (ISH) accueille cette édition.

Les problématiques abordées lors de ces deux journées peuvent concerner les processus (acquisition, structuration, extraction d’information et de connaissances et la visualisation) ou les données elles-mêmes. L’objectif de ces journées est, d’une part, de rassembler l’ensemble des acteurs de la communauté scientifique intéressés par ces nouvelles approches de fouille de données massives pour susciter des interactions entre chercheurs et, d’autre part, d’animer et de dynamiser cette communauté. Pour ce faire, un appel à communications a donc été lancé, et des personnes spécialistes de ces questions ont également été invitées à présenter leurs travaux.

Pour cette nouvelle édition, un focus est donc fait sur les Humanités Numériques à l’ère du big data, mettant à l’honneur un champ pluridisciplinaire grâce à une articulation de l’informatique avec les Arts, Lettres, Sciences Humaines et Sciences Sociales et leurs productions scientifiques. Le numérique impacte très fortement toutes les recherches scientifiques. Les Arts, Lettres, Sciences Humaines et Sciences Sociales y trouvent un double intérêt. Le premier est d’ouvrir de nouveaux espaces de recherche impactant considérablement la manière d’effectuer ces recherches. Le second est de fournir à ces disciplines les moyens de participer aux innovations technologiques et scientifiques, de produire des biens et des services à forte valeur socio-économique et, par-delà à accroître leur apport dans la chaîne de création de valeur socio-économique et culturelle. L’édition numérique des sources ouvre des possibilités qui permettent de fixer des objectifs scientifiques qui vont au-delà de la diffusion, et invite les chercheurs et enseignants à s’emparer de nouvelles problématiques dans de multiples domaines. Elles rassemblent des informaticiens, des représentants des Sciences et Technologies de l’Information et de la Communication, et bien sûr des chercheurs du domaine des Arts, Lettres, Sciences Humaines et Sciences Sociales.

Ainsi, l’objectif de ces journées était de créer un espace de rencontres et d’échanges sur les problématiques d’analyse et de visualisation de données massives, en particulier dans le contexte des humanités numériques, et ce dans leur définition non restrictive, recouvrant les Arts, les Lettres, les Sciences Humaines et les Sciences Sociales.

Comité d’organisation

– Julia Bonaccorsi (ELICO, Université Lyon 2)
– Cécile Favre (ERIC, Université Lyon 2)
– Sonia Guerin-Hamdi (ISH, CNRS)
– Sabine Loudcher (ERIC, Université Lyon 2)
– Branislav Meszaros (ISH, Université Lyon 2)
– Adrian Tanasescu (ISH, Université Lyon 2)
– Djamel A. Zighed (ISH/ERIC, Université Lyon 2)

Comité de coordination

Correspondant EGC avec les Groupes de Travail (GT) :
– Mustapha Lebbah (LIPN, Université Paris 13)

GT-FDC (Fouille de Données Complexes):
– Cécile Favre (ERIC, Université Lyon 2)
– Germain Forestier (MIPS, Université de Haute Alsace)
– Camille Kurtz (LIPADE, Université Paris Descartes)

GT-GGB (Grands Graphes et Bioinformatique) (ex GT-FGG):– Etienne Birmelé (MAP5, Université Paris Descartes)
– Lydia Boudjeloud-Assala (LITA, Université de Lorraine)
– Mohamed Elati (ISSB, Université d’Evry)
– Blaise Hanczar (LIPADE, Université Paris Descartes)

GT-GAST (Gestion et Analyse de données Spatiales et Temporelles):
– Thomas Guyet (IRISA, Agrocampus Ouest)
– Eric Kergosien (GERIICO, Université Lille 3)
– Cyril de Runz (CReSTIC, Université de Reims Champagne-Ardenne)

GT-VIF (Visualisation d’informations, Interactions et Fouille de données):
– Hanene Azzag (LIPN, Université Paris 13)
– David Bihanic (CALHISTE, Université de Valenciennes et du Hainaut-Cambrésis)
– Pierrick Bruneau (LIST, Luxembourg)
– Monique Noirhomme (FUNDP, Namur, Belgique)
– Fabien Picarougne (LINA, Université de Nantes)

Personnel de l’ISH en support
– Valérie Bernardo (Accueil)
– Emma Bessieres (Secrétariat général)
– Jennifer Chanteloup (Assistante projets)
– Christian Dury (Réalisation audio-visuelle)
– Jean-Pierre Françon (Maintenance)
– Amélie Hugot (Communication)
– Didier Leblanc (Informatique)

Avec le soutien de l’ISH, de l’association EGC, du laboratoire ERIC et de l’Université Lyon 2

Introduction

Durée: 13 minutes

Introduction aux journées par Djamel Zighed (directeur de l’ISH), Fabrice Guillet (président d’EGC) et Cécile Favre (coordinatrice de l’organisation des journées).

Play Video

Djamel Zighed

Durée: 51 minutes

Conférencier invité  Djamel A. Zighed (ISH) : « Les humanités numériques à l’ère du big et de l’open data » (Présidence de session : Julia Bonaccorsi).

Play Video

Adrien Guille

Durée: 20 minutes

Adrien Guille, Michael Gauthier and Ciprian-Octavian Truică. How CATS can help researchers collect and analyze a corpus of tweets.

Play Video

Dario Compagno

Durée: 18 minutes

Dario Compagno. Comprendre le partage des contenus journalistiques sur les réseaux socionumériques : enjeux, défis, compétences

Play Video

Adrian Tanasescu

Durée: 13 minutes

Adrian Tanasescu. Analyse de l’interdisciplinarité dans la recherche scientifique.

Play Video

Guillaume Cabanac

Durée: 78 minutes

 Conférencier invité  Guillaume Cabanac (IRIT, Université de Toulouse) : « Excursion en scientométrie : études quantitatives de la science à la croisée entre informatique, psychologie et sociologie » (Présidence de session : Cécile Favre).

Play Video

Aurélien Faravelon

Durée: 19 minutes

Aurélien Faravelon, Stephane Grumbach and Billel Lasledj. Voir dans le miroir des données

Play Video

Mohammed Ghesmoune

Durée: 19 minutes

Mohammed Ghesmoune, Mustapha Lebbah and Hanane Azzag. Clustering over Data Streams based on Growing Neural Gas

Play Video

Sanaa Ait-Daoud

Durée: 28 minutes

Sanaa Ait-Daoud and Hélène Tanghe. Enjeux éthiques et juridiques du Big Data Le cas de la Privacy By Design (PbD) : Limites et pistes de réflexion.

Play Video

Rafiqul Haque

Durée: 30 minutes

Rafiqul Haque. On the road to searching facts about Big Data Technologies.

Play Video

Linda Atif

Durée: 25 minutes

Linda Atif. Big Data : Dans quelle mesure leur recours peut-il améliorer la prise de décision RH ?

Play Video

Giovanni Fusco

Durée: 27 minutes

Giovanni Fusco and Cristina Cao. Représenter un clustering incertain de la spécialisation sociale. Le cas de l’aire métropolitaine azuréenne.

Play Video

Sarah Zenasni

Durée: 15 minutes

Sarah Zenasni, Eric Kergosien, Mathieu Roche and Maguelonne Teisseire. Une approche de fouille de textes pour l’identification automatique de relations spatiales.

Play Video

Asma Gharbi

Durée: 15 minutes

Asma Gharbi, Cyril De Runz, Sami Faiz and Herman Akdag. Une approche à base de règles d’association pour la prédiction des évolutions de fonction de l’occupation du sol.

Play Video

Francesco Beretta

Durée: 26 minutes

Francesco Beretta. Exploration d’un corpus de notices biographiques : identification d’entités nommées, extraction de connaissances historiques et visualisation (SIG et réseaux) avec la méthode du projet symogih.org.

Play Video

Christophe Cruz

Durée: 55 minutes

Conférencier invité Christophe Cruz (Le2i, Université de Bourgogne) : « Approche sémantique pour la recommandation de documents textuels dans un contexte Big Data appliquée à la veille économique » (Présidence de session : Eric Kergosien).

Play Video

Pierrick Bruneau

Durée: 26 minutes

Pierrick Bruneau, Mickaël Stefas and Thomas Tamisier. Visualisation interactive pour l’annotation automatique de locuteurs.

Play Video

Frédéric Rayar

Durée: 26 minutes

Frédéric Rayar, Sabine Barrat, Fatma Bouali and Gilles Venturini. Construction d’un graphe de proximité pour l’exploration de larges collections d’images.

Play Video

Eric Masson

Durée: 26 minutes

Eric Masson, Shamshod Akmalov, Olivier Blanpain, Jean-Baptiste Litot, Hélène Melin, Antonio Dos Santos, Cyril Durant, Alain Leprêtre, Céline Pernin, Coralie Burrow, Francis Douay and Julie Leclercq. Environnements numériques de l’image – Images numériques de l’environnement

Play Video

Conclusion

Durée: 4 minutes

Clôture des journées apr Cécile Favre.

Play Video

Réalisation

Christian Dury

Responsables scientifiques

Cécile Favre

Intervenants

Djamel Abdelkader Zighed, Adrien Guille, Dario Compagno, Adrian Tanasescu, Aurélien Faravelon

Autres projets