Home » Évènement

Soutenance de thèse de Benjamin MOREAU (équipe GDD)

Benjamin Moreau, doctorant au sein de l’équipe GDD, soutiendra sa thèse intitulée « Faciliter la Réutilisation sur le Web des Données » / « Facilitating Reuse on the Web of Data »

vendredi 6 novembre 2020

Jury :
– Directeur thèse : Patricia Serrano Alvarado
– Co-encadrant : Emmanuel Desmontils
– Rapporteurs : Serena Villata (I3S), Olivier Cure (LIGM)
– Autres membres : Philippe Pucheral (U Versailles), Pascal Molli, Serge Garlatti (IMT-A Brest), Bernd Amann (LIP6)
– Invités : David Thoumas (Opendatasoft)

Résumé : Le Web des données est un ensemble de données liées qui peuvent être interrogées et réutilisées à l’aide de moteurs de requêtes fédérées. Pour protéger les jeux de données, les licences renseignent leurs conditions d’utilisation. Cependant, choisir une licence conforme n’est pas toujours aisé. En effet, pour protéger la réutilisation de plusieurs jeux de données, il est nécessaire de prendre en considération la compatibilité entre leurs licences. Pour faciliter la réutilisation, les moteurs de requêtes fédérées devraient respecter les licences. Dans ce contexte, nous nous intéressons à deux problèmes (1) comment calculer la relation de compatibilité entre des licences, et (2) comment respecter les licences pendant le traitement de requêtes fédérées. Pour le premier problème, nous proposons CaLi, un modèle capable d’ordonner partiellement n’importe quel ensemble de licences selon leur compatibilité. Pour le second problème, nous proposons FLiQue, un moteur de requête fédéré respectant les licences. FLiQue utilise CaLi pour détecter les conflits de compatibilité entre licences et assure que le résultat d’une requête fédérée respecte les licences. Dans le cadre de cette thèse, nous proposons également trois approches ODMTP, EvaMap et le SemanticBot ayant pour objectif de faciliter l’intégration de données au Web des Données.

Mots-clés : Web des données, données liées, RDF, SPARQL, licences, contrôle d’usage, traitement des requêtes fédérées, relâchement de requête, intégration de données, mappings RDF

——————–

Abstract: The Web of Data is a web of interlinked datasets that can be queried and reused through federated query engines. To protect
their datasets, data producers use licenses to specify their condition of reuse. But, choosing a compliant license is not easy. Licensing reuse of several licensed datasets must consider compatibility among licenses. To facilitate reuse, federated query engines should preserve license compliance. To do so, we focus on two problems (1) how to compute compatibility relations among licenses, and (2) how to ensure license compliance during federated query processing. To the first problem, we propose CaLi, a model that partially orders any set of licenses in terms of compatibility. To the second problem, we propose FLiQue, a license-aware federated query processing strategy. FLiQue uses CaLi to detect license compatibility conflicts and ensures that the result of a federated query preserves license compliance. Within the scope of this thesis, we also propose three approaches ODMTP, EvaMap, and the SemanticBot that aim to facilitate the integration of datasets to the Web of Data.

Keywords: Web of Data, Linked Data, RDF, SPARQL, licenses, usage control, federated query processing, query relaxation, data integration, RDF mappings

Soutenance d’HDR de Patricia SERRANO ALVARADO (équipe GDD)

Patricia Serrano, maître de conférences au sein de l’équipe GDD, soutiendra son Habilitation à Diriger des Recherches (HDR) intitulée « Protecting user data in distributed systems » / « De la protection des données des utilisateurs dans les systèmes répartis »

mardi 16 juin 2020 à 14h en visio.

Jury :
Présidente : Mme Pascale KUNTZ COSPEREC, Professeure, Université de Nantes
Rapporteurs : – M. Luc BOUGANIM, Directeur de Recherches, Inria Saclay-Île de France
                           – M. Sébastien GAMBS, Professeur, Université du Québec
                           – M. Daniel LE METAYER, Directeur de Recherches, Inria Alpes
Examinateurs : – Mme Catherine FARON ZUCKER, Maître de Conférences HDR, Université de Nice Sophia Antipolis
                              – Mme Marie-Christine ROUSSET, Professeure, Université Joseph Fourier

Manuscrit (pdf).

Résumé : Protéger les données des utilisateurs dans les systèmes distribués est aujourd’hui très difficile.Dans cette thèse, nous nous concentrons sur diverses questions liées à la protection des données utilisateur sur des systèmes de gestion de données distribuées, dont les architectures vont des architectures client-serveur aux fédérations de serveurs ou aux énormes organisations pair-à-pair. Notre première contribution concerne la confiance dans unsystème. Nous proposons un métamodèle basé sur la logique du premier ordre, qui permet de modéliser un système en considérant des entités des mondes sociaux et numériques et leurs relations. Nous présentons ensuite deux approches permettant aux utilisateurs d’évaluer la confiance envers les systèmes. Dans le contexte des systèmes pair-à-pair, nous proposons un modèle de confidentialité de données et son implémentation basée sur DHT,ainsi qu’un canevas permettant de mesurer et d’améliorer la satisfaction des utilisateurs. Dans le contexte du Web sémantique, en particulier des données liées, nous présentons deux approches pour déduire des BGP de requêtes SPARQL. Enfin, nous présentons un modèle basé sur treillis qui permet de positionner des licences en termes de compatibilité et de conformité.

Mots-clés : Confidentialité des données, licences, confiance, systèmes pair-à-pair, Web des données, traitement des requêtes fédérées, contrôle d’usage

———-

Abstract: Protecting user data in distributed systems nowadays is very difficult. In this thesis, we focus on various issues related to the protection of user data on distributed data management systems, whose architectures range from client-server architectures to federations of servers or huge peer-to-peer organizations. Our first contributionis about trust in a system. We propose a metamodel based on first order logic, that allowsto model a system considering entities of the social and digital worlds and their relations. Then we present two approaches that allow users to evaluate trust in systems. In the context of peer-to-peer systems, we propose a data privacy model, and its DHT-based implementation, as well as a framework to measure and improve users’ satisfaction. In the context of the semantic web, in particular the Linked Data, we present two approaches for deducing BGPs of SPARQL queries. Finally, we present a lattice-based model that allows to position licenses in terms of compatibility and compliance.

Keywords: Data privacy, licenses, trust, peer-to-peer systems, Linked Data, federated query processing, usage control

Appel à communications AlgoTel 2020

AlgoTel, 22ème Édition des Rencontres Francophones pour les Aspects Algorithmiques des Télécommunications, co-localisée avec CoRes 2020 aura lieu à Lyon, du 11 au 15 mai 2020.

Site web : https://cores-algotel-2020.imag.fr/

Ces rencontres sont l’occasion de réunir chaque année toute la communauté universitaire et industrielle souhaitant partager ses compétences et ses résultats récents en algorithmique et optimisation appliquée aux problèmes des télécommunications.
Nous attendons vos nombreuses soumissions pour cette 22ème édition d’AlgoTel. Comme les années précédentes, AlgoTel sera organisée conjointement avec la conférence CoRes.

OBJECTIFS ET THEMATIQUES:
L’objectif d’AlgoTel est de permettre la diffusion de travaux novateurs traitant de la résolution de problèmes fondamentaux provenant du monde des réseaux, des télécommunications et des données distribuées au moyen de techniques algorithmiques sophistiquées.
Les principaux domaines d’intérêt incluent les sujets suivants:
Green networking, Systèmes éco-énergétiques
Configuration et routage dans les réseaux à grande échelle
Évaluation de performances, dimensionnement et modélisation
Gestion et fouille de données massives distribuées
Graphes et réseaux dynamiques
Métrologie de graphes et réseaux
Modèles de géométrie stochastique pour les réseaux
Ordonnancement, recherche opérationnelle et optimisation
Planification, dimensionnement de réseaux, allocation de ressources
Réseaux ad hoc, réseaux de capteurs, réseaux corporels sans fils
Réseaux cellulaires et réseaux de satellites
Réseaux d’interactions
Réseaux complexes
Réseaux opportunistes
Réseaux orientés contenu (CCN)
Réseaux Pair-à -Pair
Réseaux sociaux
Réseaux VANETs, optiques, réseaux de robots
Programmation des réseaux : SDN, NFV
Sécurité et vie privée dans les réseaux de communication
Tolérance aux pannes
Blockchains
Auto-stabilisation, auto-organisation et systèmes autonomes
Cloud Computing
Concurrence, synchronisation et mémoire transactionnelle
Internet of Things
Théorie des jeux et apprentissage collaboratif

INSTRUCTIONS AUX AUTEURS
Les auteurs sont invités à soumettre un texte de quatre pages maximum (tout inclus), et dont au moins le titre et le résumé sont en français, le reste pouvant être en anglais.
Les papiers doivent être soumis au format pdf uniquement, et doivent respecter les modèles Latex ou Word. (cf. Site web Algotel 2020).
Le but d’AlgoTel de diffuser un aperçu des meilleurs travaux récemment réalisés dans la communauté – Il est donc possible de présenter les résultats d’un article déjà publié dans une conférence ou une revue internationale -. Nous encourageons particulièrement les soumissions présentant les travaux innovants de jeunes chercheurs doctorants.
Le processus de soumission est géré par Easychair. Le lien pour soumettre à la conférence est le suivant (vous devez disposer d’un compte Easychair avant de pouvoir soumettre) : https://easychair.org/conferences/?conf=algotel2020

La soumission se fait en deux temps :
1/ Les méta-données (auteurs, titre, résumé notamment) sont à soumettre au plus tard le 31 janvier 2020
2/ L’article complet correspondant doit être soumis au plus tard le 7 février 2020.

COMITE D’ORGANISATION :
Hervé Rivano, INSA de Lyon (Président)
Karine Altisen, Grenoble-INP
Pierre Corbineau, PolyTech’Grenoble
Stéphane Devismes, Université Grenoble Alpes
Franck Rousseau, Grenoble-INP

COMITE DE PROGRAMME :

Bernardetta Addis, LORIA, Université de Lorraine
Karine Altisen, VERIMAG / Grenoble INP
Emmanuelle Anceaume, IRISA
Leila Blin, LIP6, Univ. Evry
Marthe Bonami, LaBRI, CNRS
Janna Burman, LRI / UPSud
Aline Carneiro Viana, Inria Saclay
Benoit Darties, LIRMM, Université Montpellier 2 (co-président)
Antonella Del Pozzo, CEA Paris
Eric, Gourdin, Orange
Sahar Hoteit, L2S, U. Paris Sud-Centrale Supelec
Nicolas Huin, Huawey
Damien Imbs, LIS, Marseille
Katia Jaffres-Runser, IRIT, INPT-ENSEEIHT
Colette Johnen, LaBRI, Université de Bordeaux
Hicham Khalife, Thalès
Pascal Lafourcade, LIMOS, Université Clermont Auvergne
Clémence Magnien, LIP6,CNRS
Nader Mbarek, Université Bourgogne
Alessia Milani, LaBRI, CNRS (co-présidente)
Nicolas Nisse, Inria et Université Nice Sophia Antipolis, CNRS, I3S
Ludovic Noirie, LINCS, Nokia Bell Labs
Anne-Cécile Orgerie, Irisa, CNRS
Matthieu Perrin, LS2N, Université de Nantes
Arnaud Sangnier, IRIF / Univ. Paris-Diderot
Thomas Silverston, NICT
Géraldine Texier, IMT Atlantique
Fabrice Theoleyre, Icube, CNRS
Sébastien Tixeuil, LIP6, UPMC

La société Easybroadcast a reçu le prix européen EIT Digital

La société Easybroadcast a récemment été récompensée par le EIT Digital Challenge, la plaçant ainsi parmi les 10 licornes européennes.

Créée en 2016 par Soufiane Rouibia, la scaleup deep-tech édite un logiciel en mode Saas qui permet d’optimiser la bande passante consommée par les diffuseurs de contenus audio et vidéo en streaming (VOD, SVOD et services internet utilisant la vidéo). Ce produit émane d’un projet collaboratif LINA (Patricia Serrano Alvarado) et IRCCyN (Benoît Parrein) intitulé « P2PWeb« .

EasyBroadcast propose une solution brevetée de streaming hybride de contenus audio et vidéo combinant un modèle client-serveur standard et un modèle de diffusion d’internaute à internaute (peer-to-peer). Chaque internaute peut ainsi agir comme un micro-serveur dès qu’il reçoit des segments de contenu vidéo ou audio. Les internautes sont sélectionnés intelligemment via des algorithmes de géolocalisation et de correspondance de qualité de service. De ce fait, un large public ne constitue plus un risque de saturation des serveurs du diffuseur de contenus mais plutôt un atout. Les coûts de bande passante peuvent ainsi être réduits jusqu’à 75% pour les contenus vidéo et jusqu’à 90% pour les contenus audios avec une meilleure qualité de service.

Plus de détails : https://www.atlanpole.fr/portraits/soufiane-rouibia/

Séminaire UFR Sciences : Et si on parlait de la thèse ?

Vous vous posez des questions sur une poursuite d’études en thèse ? Ou vous aimeriez en savoir plus sur le quotidien d’un doctorant ?

Rendez-vous en Amphi B mardi 5 mars 2019 à partir de 17h !

Avec le témoignage de Thomas Minier, doctorant en 2ème année au sein de l’équipe GDD.

Plus d’infos

Séminaire de Maxime Folschette au Data Institute de l’Université Grenoble Alpes

Maxime Folschette , ingénieur de recherche contractuel au sein des équipes COMBI et GDD, est invité par le Data Institute le 25 janvier 2019 pour un exposé sur « Computational methods for system biology« .

The quickly growing amount of available biological data raises many problems related to efficiently using them: How to take advantage of the available signaling databases in order to extract new knowledge? What methods can be used to study a large dynamical model? Starting from dynamical behavior data of a biological system, how to perform model inference or completion?

During this seminar, I will present my works related to these topics, applied to several biological systems, among them:
* the Hepatocellular Carcinoma, which is the most widespread and lethal form of liver cancer: we want to understand the causes of its proliferation;
* the Circadian cycle, or “cellular clock”: we want to reproduce its day-night cycle behavior in a model;
* other models such as the Epithelial Growth Factor Receptor: we can study its dynamics using computational approximations despite its large size.

Best demo award à la conférence ESWC 2018 pour l’équipe GDD !

Thomas Minier, doctorant au sein de l’équipe GDD, a présenté le projet Ulysses à la conférence Extended Semantic Web Conference (ESWC) à Héraklion le 6 juin 2018.

Cette conférence de rang A a récompensé « Ulysses: an Intelligent client for replicated Triple Pattern Fragments » par un best demo award !

Retrouvez le papier (pdf) le diaporama, ainsi que la démo enligne.

Soutenance HDR de Hala SKAF-MOLLI

Hala Skaf (équipe GDD) présentera ses travaux de recherche en vue de l’obtention de l’Habilitation à Diriger des Recherches intitulée
« Gestion décentralisée de données du web sémantique »
vendredi 6 octobre à 14h dans l’amphithéâtre du bâtiment 34 (FST).

Jury :
– Bernd Amann, Professeur à l’Université de Pierre et Marie Curie (Paris 6), Rapporteur
– Fabien Gandon, Directeur de recherche INRIA Sophia-Antipolis Mediterranée, Rapporteur
– Philippe Lamarre, Professeur à l’INSA Lyon, Rapporteur
– Maria Esther-Vidal, Professeur à Université de Simon Bolivar Venezuela et Fraunhofer IAIS, Germany, Examinatrice
– Pascale Kuntz, Professeur à l’Université de Nantes, Examinatrice
– Abdelkader Hameurlain, Professor à l’Université de Paul Sabatier, Toulouse, Examinateur
– François Charoy, Professor à TELECOM Nancy – Université de Lorraine, Examinateur

Résumé :
Le web sémantique est une extension du web où l’information a une signification précise.
Aujourd’hui, des milliers de jeux de données sont accessibles simplement sur le web. Ces jeux de données respectent des standards du web sémantique permettant leur interrogations à travers le langage de requêtes SPARQL. Cependant, des problèmes importants liés à la production et la consommation des données liées restent ouverts : la qualité des données, l’accès au web profond et la disponibilité des données. Pour assurer la qualité de données, nous proposons de transformer le web de données vers un web de données en lecture/écriture. Ainsi, un consommateur de données est à même de corriger une erreur. Autoriser les écritures sur le web sémantique pose le problème de cohérence de données. Cette transformation nécessite la définition des algorithmes de synchronisation adaptés au modèle de données RDF et au langage SPARQL 1.1 Update.
Pour assurer l’accès au web profond, nous proposons une approche médiateur permettant de combiner données sémantique et données du web profond. Le problème est alors d’améliorer les performances des requêtes en présence de nombreuses sources de données. Enfin, pour assurer la disponibilité des données, nous proposons un modèle de réplication pour le web de données. Le problème est alors d’optimiser l’exécution des requêtes fédérées en présence de réplicas découverts au moment de l’exécution des requêtes.

Abstract:
The semantic web is an extension of the web where information has a precise meaning.
Today, thousands of datasets are available on the web. These datasets respect semantic web standards, therefore, they can queried allowing through the SPARQL query language. However, important problems related to the production and consumption of linked data remain open: data quality, deep web access, and data availability. To ensure the quality of data, we propose to transform the web of data into a read/write web of data. Consequently, a data consumer is able to correct an error. Allowing consumers to write the semantic data poses the problem of data consistency. This transformation requires the definition of synchronization algorithms adapted to the RDF data model and to SPARQL 1.1 Update language.To ensure access to the deep web, we propose a mediator approach allowing to combine semantic data and deep web data. The problem is then to improve the performance of queries in the presence of a large number of data sources. Finally, to ensure the availability of data, we propose a replication model for the web of data. The problem is to optimize the execution of federated SPARQL queries in the presence of replicas discovered at queries execution time.

Copyright : LS2N 2017 - Mentions Légales - 
 -