Home » Posts tagged "Pôle SDD"

Rétrospective journée pôle SDD du 7 avril 2023

La journée dédiée au pôle thématique Sciences des Données et de la Décision (SDD) a été un succès avec la participation de 45 personnes. Les six équipes du pôle, COMBI, DUKe, GDD, MéForBio, modelis et TASC, ont été représentées avec une forte participation des doctorants.

La thématique de la journée était « Le cycle de vie de la donnée ». Nous avons eu le plaisir d’accueillir Stéphane Pesant, chercheur à l’EMBL-EB au Royaume Uni, qui a partagé son expertise sur le cycle de vie de la donnée dans les projets du monde marin. En tant que gestionnaire de données pour les missions de Tara Oceans, il a présenté l’ensemble du processus, de la collecte à la publication.

La matinée s’est poursuivie avec une présentation courte de chaque équipe, permettant aux doctorants de présenter leurs travaux.

Marinna Gaudin, de l’équipe COMBI, a exposé la question centrale de sa thèse : « Dans quelle mesure la biogéographie des interactions planctoniques peut-elle fournir des informations sur la réponse des communautés planctoniques au changement climatique ? »
Guillaume Raschia, de l’équipe DUKe, a présenté les travaux de thèse d’Aurélie Suzanne, qui a trouvé une solution efficace pour traiter les flux d’événements temporels en temps réel.
Quatre doctorants de l’équipe GDD ont mis en avant leur travail sur comment rendre de données hautement accessibles sur le web. Ils ont discuté de la transformation des données en graphes de connaissances, de l’augmentation des données grâce au web et de l’accès efficace et flexible du web des données.
Honglu Sun, de l’équipe MéForBio, a exposé les problématiques de son travail de thèse, qui consiste à identifier les paramètres de la modélisation hybride (modèles continus et discrets) de réseaux de régulation génique à partir de données de séries temporelles.
Après une courte introduction d’Olivier Peton, responsable de l’équipe modelis, David Tremblet a présenté son sujet de thèse, qui s’inscrit dans le cadre du projet européen ASSISTANT. Il a expliqué comment il travaillait à la planification de la production basée sur les données avec des économies de coûts importantes, tout en prenant en compte l’incertitude dans la prédiction de la consommation de ressources.
Enfin, après une courte introduction de Samir Loudni, responsable de l’équipe TASC, trois doctorants de l’équipe TASC ont introduit de manière ludique leurs problématiques de recherche : les modèles discrets d’ordonnancement dans un contexte d’optimisation combinatoire, l’utilisation de solveurs de contraintes pour échantillonner des problèmes combinatoires de manière générique et l’apprentissage pour classer des règles d’association à l’aide de l’intégrale de Choquet de façon itérative en prenant en compte les retours de l’utilisateur.

L’après-midi, trois tables rondes ont eu lieu en parallèle. Chacune d’entre elles a duré une heure, suivie d’un bref compte-rendu adressé à l’ensemble des participants.

  1. La modélisation des données et les nouveaux enjeux, comment les affronter (éthique, qualité des jeux de données utilisés, qualité des résultats, respect de la vie privée, respect de la RGPD, etc.).
  2. La place de l’IA dans nos préoccupations (est-elle le sujet central de nos recherches, ou un outil à un stade de solution que nous proposons).
  3. Les bonnes pratiques à suivre pour produire des protocoles expérimentaux sérieux (quelle taille des données à générer ? quels benchmarks ? quels indices de qualité ? etc.).

Galerie photos

Séminaire inter-établissements en Science des données – Frédéric Chazal

Frédéric Chazal animera le prochain séminaire inter-établissements en Science des données jeudi 19 décembre à 14h, dans l’amphi du bâtiment 34 sur le site de la FST.

Il aura pour thème : « Les données ont elles une forme ? Une petite introduction à l’Analyse Topologique des Données« .

Résumé : L’Analyse Topologique des Données (TDA) est un domaine récent, à la croisée des mathématiques, de l’algorithmique et de la statistique, qui connait un succès croissant depuis quelques années. Il vise à comprendre, analyser et exploiter la structure topologique et géométrique de données complexes. Avec l’émergence de la théorie de la persistance topologique, la géométrie et la topologie algorithmique ont fourni des outils nouveaux et efficaces pour aborder ces questions. Dans cet exposé, qui ne nécessite pas de prérequis en topologie, nous mettrons en lumière quelques problématiques qui se posent lorsque on cherche à estimer des propriétés topologiques ou géométriques à partir de données et nous présenterons quelques approches et techniques fondamentales permettant de s’y attaquer. Nous illustrerons aussi, sur quelques exemples concret, l’intérêt des approches topologiques pour l’analyse des données et l’apprentissage statistique.

Plus d’infos.

Séminaire d’équipe – Invitée : Linda VAN DER GAAG (Université d’Utrecht, Pays-Bas)

L’équipe DUKe a la chance d’accueillir Linda van der Gaag, Professeur à l’Universiteit Utrecht (Pays-Bas), avec le soutien de la Région et du programme « Attractivité » du RFI Atlanstic 2020.

Dans le cadre de cette visite, Linda van der Gaag fera une présentation intitulée « From the Reverend Bayes to Bayesian Networks »

lundi 29 avril, à partir de 11h15, en salle D118 du bâtiment IRESTE sur le site de Polytech.

Résumé : When the English Reverend Bayes was thinking about probabilities and likelihoods, he could not foresee that Bayes’ rule would be a key concept in probability theory more than two centuries later and that Bayesian statistics would then still be controversial. In this talk, we trace some of the history of Bayes’ legacy to current times, and argue that Bayesian networks as graphical models of probability perfectly fit into this legacy. 

Séminaire du Pôle SDD – Invité : Dr. Christopher Quince (University of Warwick, UK)

Le pôle SDD recevra Dr Christopher Quince (University of Warwick, UK) au LS2N 
jeudi 25 avril à 11h
dans l’amphi du bâtiment 34, sur le site FST (arrêt tram Michelet Science).

Ce dernier donnera un séminaire intitulé : “ Resolving de novo strain variation from metagenomes for high resolution analysis of microbiomes « .

Résumé :
The importance of strain level variation in the human microbiome is well established. Short read metagenomics has the resolution to resolve strains but most current approaches require reference genomes. Methods for de novo resolving strains are still an area of active development. Strains cannot be simply assembled from metagenomes due to the complexity of the assembly graph when multiple closely related genomes are present. This results in fragmented assemblies of potentially millions of contigs. It is possible to cluster or bin contigs into metagenome assembled genomes (MAGs) using composition and co-occurrence across multiple samples. I will introduce our binning algorithm CONCOCT and illustrate its application to both environmental and human-associated microbial communities. However, the MAGs that result from metagenome binning are still composites of multiple strains. I will also demonstrate how co-occurrence across samples can also be used to resolve sub populations within MAGs, using our DESMAN (De novo extraction of strains from metagenomes) pipeline. This leads to a higher resolution picture of microbial community changes.

 

Un café d’accueil sera offert à partir de 10h30 dans le hall du bâtiment 34.

Emission du Labo des Savoirs avec Pascale Kuntz et Florent Laroche

Pascale Kuntz (équipe DUKe) et Florent Laroche (équipe IS3P) interviendront mercredi 14 novembre 2018  à 19h dans l’émission de la radio associative Le Labo des savoirs intitulée « Dataquid comment faire parler les données ? »

Pitch :
Elles sont tout autour de nous, elles sont de nature très diverses et elles sont produites à l’heure actuelle en des quantités industrielles sans cesse croissantes. Elles, ce sont “les données”. Cela peut être des suppositions, constatations, probabilités, qui, étant indiscutables ou indiscutées, servent de base à une recherche, à un examen quelconque.
Pour tirer des informations de nos données, on entraîne des algorithmes à en digérer de grandes quantités. Mais on peut aussi chercher des moyens de représentation. Comment ces outils de visualisation permettent-ils aux chercheurs et chercheuses de travailler ? Comment sont-ils conçus ? Comment les améliorer ?

A écouter en direct sur la radio Prun’ 92 FM !

Soutenance de thèse de Emma BEN ABDALLAH (équipe MéForBio)

Emna Ben Abdallah soutiendra sa thèse intitulée « Etude de la dynamique des réseaux biologiques : apprentissage des modèles, intégration des données temporelles et analyse formelle des propriétés dynamiques » / Study of the dynamics of biological networks: learning models, time data integration and model checking analysis.

jeudi 7 décembre à 10h dans l’amphi du bât. S, sur le site de Centrale Nantes.

Jury : Olivier Roux (directeur de thèse), Morgan Magnin (co directeur), Hanna Klaudel (rapporteur, IBISC), Sylvain Sené (rapporteur, LIF), Laurent Trilling (TIMC IMAG), Franck Delaunay (iBV)

Résumé :
Au cours des dernières décennies, l’émergence d’une large gamme de nouvelles technologies a permis de produire une quantité massive de données biologiques (génomique, protéomique…). Ainsi, une grande quantité de données de séries temporelles est maintenant élaborée tous les jours. Nouvellement produites, ces données peuvent nous fournir des nouvelles interprétations sur le comportement des Systèmes Biologiques (SB). Cela conduit alors à des développements considérables dans le domaine de la bioinformatique qui peuvent tirer profit de ces données. Ceci justifie notre motivation pour le développement de méthodes efficaces qui exploitent ces données pour l’apprentissage des Réseaux de Régulation Biologique (RRB) modélisant les SB. Nous introduisons alors, dans cette thèse, une nouvelle approche qui infère des RRB à partir des données de séries temporelles. Les RRB appris sont présentés avec un nouveau formalisme, introduit dans cette thèse, appelé  » réseau d’automates avec le temps » (T-AN). Ce dernier assure le raffinement de la dynamique des RRB, modélisés avec le formalisme des réseaux d’automates (AN), grâce à l’intégration d’un paramètre temporel (délai) dans les transitions locales des automates. Cet enrichissement permet de paramétrer les transitions entre les états locaux des automates et aussi entre les états globaux du réseau.
À posteriori de l’apprentissage des RRB, et dans le but d’avoir une meilleure compréhension de la nature du fonctionnement des SB, nous procédons à l’analyse formelle de la dynamique des RRB. Nous introduisons alors des méthodes logiques originales (développées en Answer Set Programming) pour déchiffrer l’énorme complexité de la dynamique des SB. Les propriétés dynamiques étudiées sont : l’identification des attracteurs (ensemble d’états globaux terminaux dont le réseau ne peut plus s’échapper) et la vérification de la propriété d’atteignabilité d’un objectif (un ensemble de composants) à partir d’un état global initial du réseau.

Mots clés : réseaux de régulation biologique, systèmes complexes, réseaux d’automates, réseaux d’automates avec le temps, apprentissage des modèles, analyse formelle, atteignabilité, attracteurs, Answer Set Programming

*********

Abstract: Over the last few decades, the emergence of a wide range of new technologies has produced a massive amount of biological data (genomics, proteomics…). Thus, a very large amount of time series data is now produced every day. The newly produced data can give us new ideas about the behaviour of biological systems. This leads to considerable developments in the field of bioinformatics that could benefit from these enormous data. This justifies the motivation to develop efficient methods for learning Biological Regulatory Networks (BRN) modelling a biological system from its time series data. Then, in order to understand the nature of system functions, we study, in this thesis, the dynamics of their BRN models. Indeed, we focus on developing original and scalable logical methods (implemented in Answer Set Programming) to deciphering the emerging complexity of dynamics of biological systems. The main contributions of this thesis are enumerated in the following. (i) Refining the dynamics of the BRN, modelling with the automata Network (AN) formalism, by integrating a temporal parameter (delay) in the local transitions of the automata. We call the extended formalism a Timed Automata Network (T-AN). This integration allows the parametrization of the transitions between each automata local states as well as between the network global states. (ii) Learning BRNs modelling biological systems from their time series data. (iii) Model checking of discrete dynamical properties of BRN (modelling with AN and T-AN) by dynamical formal analysis: attractors identification (minimal trap domains from which the network cannot escape) and reachability verification of an objective from a network global initial state.

Key words: Biological Regulatory Networks, Dynamical analysis, Learning models, Automata Networks, Inference and Revision of Delayed Biological Systems, Answer Set Programming.

Soutenance d’HDR de Charlotte TRUCHET (équipe TASC)

Charlotte Truchet soutiendra son Habilitation à Diriger des Recherches, intitulée « Vers une programmation par contraintes moins contrainte, outils venant de l’Interprétation Abstraite et de l’Analyse en Moyenne pour définir des solveurs plus expressifs et faciles à utiliser »

jeudi 30 novembre 2017 à 10h, sur le site de la FST.

Jury : Nadia Creignou (Aix-Marseille Université – rapporteure), Christian Schulte (KTH, Suède – rapporteur), Pascal Van Hentenryck (University of Michigan, USA – rapporteur), Gérard Assayag (IRCAM), Frédéric Benhamou (Université de Nantes), Eric Goubault (Ecole Polytechnique), Thomas Jensen (INRIA), Brigitte Vallée (CNRS).

Le manuscrit est disponible en ligne (lien pdf).

4ème École d’Hiver é-EGC « Social Networks » : formation et conférence

La quatrième École d’Hiver é-EGC, sur le thème « Social Networks », est un évènement organisé par l’Association Extraction et Gestion de Connaissances (EGC).
Cet événement s’organise autour de deux activités principales :
• deux jours de formation : les 22 et 23 janvier 2018
• participation à la conférence EGC2018 : les 24, 25 et 26 janvier 2018

THÈMES DE L’ÉCOLE : LES RÉSEAUX SOCIAUX
Les réseaux sociaux en ligne sont des plates-formes très largement utilisées pour permettre des interactions sociales et professionnelles entre des millions d’utilisateurs à travers le monde. Il n’est pas surprenant qu’à partir de janvier 2016, les sites de réseaux sociaux tels que Facebook, Twitter, Linkedin et Weibo figurent parmi les 20 sites les plus visités sur le Web, d’après Alexa. Les réseaux sociaux en ligne sont une source d’informations précieuse sur les individus, qui attirent de plus en plus l’attention des spécialistes dans différents domaines tels que l’informatique, la politique, l’économie et les sciences sociales. Dans ces différents domaines, on s’intéresse notamment à la détection de communautés dans les graphes d’individus, à la recherche d’experts/leaders dans les groupes sociaux, à la réconciliation de profils mais aussi à la fouille d’opinions.

OBJECTIFS DE L’ÉCOLE
Les deux jours de formation ont pour but principal d’offrir aux participants des tutoriaux d’initiation dans le domaine des réseaux sociaux: notions principales et techniques d’analyses, mais également des tutoriaux plus spécifiques présentant les récentes avancées proposant des solutions et des techniques nouvelles pour les différentes problématiques ayant émergées dans ce domaine, telles que la détection de communautés, la sécurité et la vie privée des utilisateurs, et les réseaux centrés sur l’égo. Les exposés, de 1h30 ou 2h30, couvriront une large gamme des problématiques et des solutions existantes autour de la gestion et de l’analyse de graphes de données sociales. Ces exposés seront associés à des séances plus pratiques afin de permettre aux participants de manipuler les différents outils existants.
La participation à la conférence permettra aux participants de prendre part à un des événements majeurs de la communauté francophone de l’extraction et la gestion de connaissances. Elle leur permettra d’assister à des présentations de nouvelles avancées et approches développées dans la communauté, ceci pouvant ainsi inspirer leurs parcours scientifiques futurs.
Enfin, cette École souhaite offrir aux jeunes chercheurs (doctorants, post-doctorants et ingénieurs) et aux chercheurs confirmés du domaine la possibilité de se rencontrer et d’échanger des idées autour des problématiques et défis abordées dans l’école é-EGC 2018, ce qui devrait également permettre aux jeunes chercheurs d’accroître leur réseau.

PROGRAMME DE L’ÉCOLE
Lundi22/01/2018
08h30 – 09h00 : Bienvenue / Welcome !
09h00 – 10h30 : Arnaud Martin (Université de Rennes 1, IRISA) : “An introduction to social network challenges”
10h00 – 10h30 : Pause café
10h30 – 13h00 : Ernesto Estrada (University of Strathclyde Glasgow) : “Network Analytics: traditional vs modern methods”
13h00 – 14h00 : Déjeuner
14h00 – 15h30 : Oana Goga (LIG, Grenoble) – “Security and privacy aspects of social media systems”
15h30 – 16h00 : Pause café
16h00 – 18h30 : Mauro Sozio (Télécom ParisTech) – “Finding dense subgraphs and communities in real-world graph”

Mardi 23/01/2018
08h30 – 10h00 : Florence Sèdes (Université de Toulouse, IRIT) – “Social networks: all goes to the ego”
10h00 – 10h30 : Pause café
10h30 – 12h00 : Michalis Vazirgiannis (École Polytechnique, LIX) – “Graph degeneracy and applications in social networks”
12h00 – 13h30 : Déjeuner
13h30 – 15h00 : Christine Largeron (Université Jean Monnet, Saint-Etienne, LHC) – “Community detection on attributed network”
15h00 – 15h30 : Pause café
15h30 – 18h00 : Rémy Cazabet (Université de Lyon, LIRIS) – “Community detection in dynamic networks, theoretical and practical aspects”

PUBLIC CONCERNÉ
L’École d’Hiver é-EGC « Social Networks » vise la formation par la recherche et la promotion des recherches dans le domaine des réseaux sociaux.
Elle s’adresse particulièrement aux doctorants et étudiants, de manière générale, désirant approfondir leurs connaissances dans le domaine des réseaux sociaux– et plus particulièrement aux techniques d’analyse des réseaux sociaux, à la détection de communautés, aux problématiques liées à la sécurité et la vie privée, et aux réseaux sociaux centrés utilisateur.

COMITÉ SCIENTIFIQUE ET ORGANISATION
Claudia Marinica (LS2N et ETIS – ENSEA / UCP / CNRS 8051)
• Fatiha Saïs (LRI – Université Paris Sud, CNRS 8623, Université Paris Saclay)
• Christine Largeron (Laboratoire Hubert Curien – Université Jean Monnet de Saint-Etienne, CNRS 5516)
Fabrice Guillet (LS2N – Polytech’Nantes, CNRS 6241)
• Hanene Azzag (LIPN – Université Paris Nord, CNRS 7030)
• Mustapha Lebbah (LIPN – Université Paris Nord, CNRS 7030)
• Dimitris Kotzinos (ETIS – ENSEA / UCP / CNRS 8051)

DATES IMPORTANTES
• Date limite pré-inscriptions (CV à fournir) : 15/11/2017
• Inscription effective (École (formation + conférence EGC), sur le site de la conférence) : 07/12/2016

L’INSCRIPTION SE REALISE EN DEUX ÉTAPES
1/ Les participants doivent manifester leur intérêt, avant le 15/11/2017, pour participer à l’École en s’inscrivant avec ce formulaire.
Pour que la pré-inscription soit prise en compte, elle doit être accompagnée d’un CV récent du participant.
2/ Après la confirmation de la pré-inscription par le comité d’organisation, et avant le 07/12/2017, les participants doivent s’inscrire via la page d’inscription de la conférence EGC-2018 (attention de bien choisir le tarif comprenant l’École).

INSCRIPTIONS
Le nombre total de participants est limité à 30 personnes.
 L’inscription s’élève pour les étudiants à 390€ et elle comprend :
– la participation à l’École d’Hiver (22 et 23 janvier) ;
– la participation à la conférence (24-26 janvier) ;
– les déjeuners et le repas de gala.

Journée d’étude sur l’analyse des savoirs humains dans les environnements numériques

Jeudi 7 décembre, Marc Jahjah (équipe DUKe) organise à la MSH Ange-Guépin une journée d’étude sur l’analyse des savoirs humains dans les environnements numériques.
Des chercheurs/chercheuses en communication, sociologie, anthropologie, linguistique sont attendus pour faire part de leurs terrains et leur méthodologie.

Dans cette journée d’étude, nous nous proposons d’interroger la notion d’ environnement numérique en l’articulant aux enjeux de l’analyse des savoirs humains, dans une approche ouverte, pluridisciplinaire et fraternelle. Plus précisément, nous aimerions comprendre :
1. Quelles opérations matérielles, techniques, corporelles, langagières et affectives les acteurs mobilisent pour donner du sens à/agir sur leurs environnements numériques ;
2. Ce qu’est un « environnement ». Comment prend-il forme, s’organise-t-il matériellement et quelles ressources offrent-ils à l’action des individus appareillés ?
3. Comment les différentes disciplines en SHS enquêtent sur les relations entre les acteurs humains et les « environnements numériques ». Comment les corpus sont-ils constitués
et traités ? Quels outils théoriques sont convoqués ? Y’a-t-il une dimension interdisciplinaire (socio-sémiotique, techno-langagière etc.) ? Comment les concepts d’une discipline sont travaillés, transformés, appropriés par d’autres disciplines ?

Programme de la journée « Analyser les savoirs dans les environnements numériques : approche pluridisciplinaire »

10h-10h15 : Accueil
10h15-11h00 : Marc Jahjah (Maître de conférences en Sciences de l’Information et de la Communication) – Mot de bienvenue, présentation de la journée : « Environnement, milieu, écosystème, cadre…un “air de famille” »
11h00-12h00 : Nadia Elmrabet (consultante en stratégie de communication, Jule21) : « Littératies numériques dans les programmes pédagogiques au Panama »
12h-14h : pause déjeuner
14h-15h : Marion Coville (post-doctorante en sociologie, Télécom ParisTech) – « Les usages des jeux vidéo dans un cadre muséal : articuler les approches socio-techniques et
communicationnelles »
15h-16h00 : Julien Pierre (chercheur en Sciences de l’Information et de la Communication, Audencia) – « Le web affectif »
16h-17h00 : Yosra Ghliss (doctorante en Sciences du langage, Université de Montpellier) – « “Habiter” WhatsApp ? Perspectives et verrous analytiques d’une écologie discursive »
17h-17h30 : Discussions et conclusion de la journée

Copyright : LS2N 2017 - Mentions Légales - 
 -