Romuald Thion est Maître de Conférences en informatique depuis 2010 à l’Université Claude-Bernard Lyon 1 et au laboratoire LIRIS. Ses travaux de recherche scientifique portent sur la gestion de données au sens large avec des intérêts particulier pour la sécurité, la protection de la vie privée, les modèles de graphe (RDF, RDFS, SPARQL), la provenance et l’intégration de données. Il est en délégation à l’Université de la Nouvelle-Calédonie et à l’ISEA depuis février 2021.
titre : Les bases de données graphes : une application au partitionnement des disciplines scientifiques des archives ouvertes en lignes (HAL).
lieu / horaire / langue : amphi 80 / 13h00 (entrée libre) / francais
mots-clé : databases, graph databases, RDF, SPARQL, linked data, LOD, inference, clustering, data mining, ontology, HAL, data science
résumé : Plusieurs paradigmes de bases de données existent, différents selon la structure de ce que l’on stocke : des données tabulaires, arborescentes ou encore sous forme de graphes. Le modèle de graphes « RDF » a été proposé pour organiser les informations du web (semantic web) mais ce paradigme est plus généralement pertinent pour organiser des données complexes que l’on souhaite rendre ouvertes et interopérables (linked open data). Certains domaines ont largement fait le pas de l’intégration par les données sous formes de graphes (e.g., gestion documentaire, la BNF publie tout son catalogue au format RDF). Dans ce séminaire, nous illustrerons ce type de bases de données sur l’archive ouverte pluridisciplinaire HAL. Nous en extrairons plusieurs jeux de données sur lesquels nous essaierons d’extraire de la connaissance avec des méthodes de clustering. Nous montrerons notamment que les données ontologiques des bases RDF permettent de guider le clustering pour caractériser des groupes de disciplines « intéressants ». Nous conclurons sur les possibilités d’applications à des jeux de données scientifiques, pour lesquels il existe de nombreuses bases au format RDF.
bio : Maître de conférences en informatique depuis 2010 à l’Université Claude-Bernard Lyon 1 et au laboratoire LIRIS, mes travaux de recherche scientifique portent sur la gestion de données au sens large avec des intérêts particulier pour la sécurité, la protection de la vie privée, les modèles de graphe (RDF, RDFS, SPARQL), la provenance et l’intégration de données. Je suis en délégation à l’Université de la Nouvelle-Calédonie et à l’ISEA depuis février 2021.