Home » Posts tagged "thèse"

PhD Thesis position(CNRS funding) + NII Japan collaboration

We are seeking for candidates to a PhD fellowship in Computer science, in collaboration between LS2N (France) and NII (Japan), in the topics of: Ontology Learning, Graph Embeddings and GNN, Semi Supervised Learning, and Knowledge Graphs 

Application is available here and open from May 2023 until a candidate is selected.

Combining Knowledge graph embedding and prior knowledge based semi-supervised learning for ontology learning from large scale data.

  • Keywords: Ontology learning, Knowledge Graph Completion, Prior Knowledge, Clustering, Relation Prediction, Knowledge Graph Embedding, Graph Neural Network.
  • Laboratory: DUKe, LS2N (Laboratory of Digital Sciences of Nantes, France) and a collaboration with NII & AIST (Tokyo, Japan)
  • Supervisors: Mounira Harzallah  and Fabrice Guillet
  • CNRS financial support: 2135 € (gross salary)/month and a NII financial support for the Japan internship.
  • Start date: 1st of October 2023
  • Duration: 3 years
  • Requirements:
  • Education Level: MSc
  • Field: Computer Science, Data Science, Web Science, Computational Linguistics, Artificial Intelligence
  • Candidate Profile: Knowledge on Data mining/Machine Learning, Knowledge on Semantic Web and NLP will be strongly appreciated but not mandatory, Knowledge in programing languages mainly Python.
  • Language: English 
  • The application evaluation will be continuous until the position is filled. Interested candidates should submit : CV, cover letter, transcripts of records of the tree last years and names and addresses of two references. Applications should be submitted  to mounira.harzallah@univ-nantes.fr and fabrice.guillet@univ-nantes.fr

PhD Description

Background. The popularity of ontologies and the easy access to a large number of textual resources have strongly motivated the automatic construction of ontologies using artificial intelligence techniques. Three types of construction approaches are distinguished: distributional approaches, knowledge graph-based approaches and pattern-based approaches [Xu et al., 2019, Chen et al. 2020]. In this thesis, we will focus on distributional approaches and more specifically on clustering and graph-based approaches. Generally, clustering allows to consider a large amount of data. However, it faces two main difficulties: the cluster labelling and the formation of semantically consistent clusters relevant to the ontology domain. In our previous work, we have developed a prior knowledge-driven LDA to tackle these two difficulties [Huang et al. 2021, Xu et al 2020]. However, clustering based approaches suffer also from the sparsity of the term representation space [Shwartz et al., 2016]. Graph-based approaches extract triples from texts (subject, predicate, object), then align and link them to form knowledge graphs (e.g. Yago, DBpedia). They allow to process a large number of texts and build very large graphs, but they suffer from the issue of data heterogeneity, because the same concept can be denoted by different terms in distinct triples and the same term can have several semantics [Nguyen and Ichise, 2012], [Kertkeidkachorn and  Ichise, 2018].

PhD purpose. The purpose of this thesis is to develop a new approach for automatic ontology construction combining semi-supervised clustering methods driven by prior knowledge (seed knowledge, local knowledge, domain knowledge, DBpedia,..) [Jagarlamudi et al. 2012, Xu et al. 2019, Huang et al, 2021] and knowledge graph embedding [Ebisu and Ichise, 2018]. This new approach will solve the scientific locks of data heterogeneity and data sparsity. By defining cluster terms by subgraphs and their vector embeddings, the problem of text sparsity can be addressed and the quality of clusters can be improved. In recent years, graph embedding has gained rapid growth [Zhang et al. 2020]. It aims to automatically learn a low-dimensional feature representation for each node in a graph. Graph embedding is used in the construction of machine learning models for various tasks, and our goal is to exploit them to improve ontology learning. The approach to be developed in this thesis will also infer hypernym relationships between terms within each cluster. The objective of this task is threefold: 1) to evaluate the quality of the clusters, 2) to refine their description space in an iterative clustering/extraction of hypernym relations/clustering approach, and 3) to evaluate and improve the quality of the exploited knowledge graphs from which term subgraphs are extracted.

The positioning and significance of this research. Since Ontology is crucial for AI applications, many research studies are working on ontology learning. However, they investigate the sparsity and the heterogeneous problem separately. The first originality of our research is to combine knowledge graph representation and prior-knowledge-driven clustering to solve simultaneously the sparsity and the heterogeneous problems. Knowledge graph and graph embedding deal with sparsity problem and prior knowledge-driven clustering deals with heterogenous problem.The second originality of our research is to enrich semantically the graph embedding by integrating prior knowledge from the core ontology in the process of embedding. Focusing on improving the embedding process itself, Sun et al [2020] show that embedding based approaches perform well when training is performed on the text corpus from which the graph is constructed. However, in the case where this corpus is unavailable or of small size, the graph embedding will be based exclusively on its structure, which weakens the performance of these approaches. In this case, in order to semantically enrich the graph embedding input, considering the semantics of certain entities or properties of the graphs could be relevant. This enrichment could be done using a domain ontology or its core ontology.

Therefore, we would like to develop an original approach benefiting on the one hand from the power of graph embedding techniques for the clustering of entities, and on the other hand from the semantic quality of ontology in order to drive and refine the learning. A core ontology will be used as a seed knowledge model to improve the quality of graph embedding as well as for clustering.

Equipe Commande : recherche de participants pour une expérience sur simulateur de conduite

Yishen Zhao, doctorant au sein des équipes Commande et PACCE, recherche des participants pour mener une expérience sur le simulateur de conduite du laboratoire.

L’objectif est d’essayer de conduire dans le brouillard sur un simulateur de conduite, sans ou avec un nouveau type d’assistance de conduite au suivi de voie (Lane Keeping Support). Cette assistance, conçue en tenant compte du comportement de l’humain, est considérée comme une étape intermédiaire vers la conduite autonome.

Description du simulateur de conduite : https://www.ls2n.fr/plateformels2nfiche/6/

Conditions à remplir : Avoir le permis de conduire depuis au moins 3 ans;

Lieu : Bâtiment S de l’Ecole Centrale de Nantes.

Quand : L’expérience dure approximativement entre 1h et 1h30.

Collations offertes.

Si vous êtes intéressé(e) ou vous avez des questions, contacter Yishen soit par mail yishen.zhao@imt-atlantique.fr soit directement à son bureau (salle C119, IMT Atlantique Nantes).

Soutenance de thèse de Misbah RAZZAQ (équipe COMBI)

Misbah Razzaq, doctorante au sein de l’équipe COMBI, soutiendra sa thèse intitulée “Integrating Phosphoproteomic Time Series Data into Prior Knowledge Networks” / “Intégration de données de séries temporelles phosphoprotéomiques dans des réseaux de connaissances antérieurs”

mercredi 5 décembre 2018 à 14h dans l’amphi du bâtiment S sur le site de Centrale Nantes.

Jury : Jérémie Bourdon (directeur de thèse), Carito Guziolowski (co encadrante), Thomas Sauter (rapporteur, Université du Luxembourg), Céline Rouveirol (rapporteur, Institut Galilée), Frédéric Saubion (LERIA), Sara-June Dunn (Microsoft Research, Cambridge), Sabine Peres (Université Paris Sud)

Abstract: Traditional canonical signaling pathways help to understand overall signaling processes inside the cell. Large scale phosphoproteomic data provide insight into alterations among different proteins under different experimental settings. Our goal is to combine the traditional signaling networks with complex phosphoproteomic time-series data in order to unravel cell specific signaling networks. On the application side, we apply and improve a caspo time series method conceived to integrate time series phosphoproteomic data into protein signaling networks. We use a large-scale real case study from the HPN-DREAM Breast Cancer challenge.
We infer a family of Boolean models from multiple perturbation time series data of four breast cancer cell lines given a prior protein signaling network. The obtained results are comparable to the top performing teams of the HPN-DREAM challenge. We also discovered that the similar models are clustered together in the solutions space. On the computational side, we improved the method to discover diverse solutions and improve the computational time.

Keywords: signaling networks, logic programming, model checking, cell lines


Résumé : Les voies de signalisation canoniques traditionnelles aident à comprendre l’ensemble des processus de signalisation à l’intérieur de la cellule. Les données phosphoprotéomiques à grande échelle donnent un aperçu des altérations entre différentes protéines dans différents contextes expérimentaux. Notre objectif est de combiner les réseaux de signalisation traditionnels avec des données de séries temporelles phosphoprotéomiques complexes afin de démêler les réseaux de signalisation spécifiques aux cellules. Côté application, nous appliquons et améliorons une méthode de séries temporelles caspo conçue pour intégrer des données phosphoprotéomiques de séries temporelles dans des réseaux de signalisation de protéines. Nous utilisons une étude de cas réel à grande échelle tirée du défi HPN-DREAM Breast Cancer.
Nous déduisons une famille de modèles booléens à partir de données de séries temporelles de perturbations multiples de quatre lignées cellulaires de cancer du sein, compte tenu d’un réseau de signalisation protéique antérieur. Les résultats obtenus sont comparables aux équipes les plus performantes du challenge HPN-DREAM. Nous avons découvert que les modèles similaires sont regroupés dans l’espace de solutions. Du côté informatique, nous avons amélioré la méthode pour découvrir diverses solutions et améliorer le temps de calcul.


Thesis defences : Ekaterina ARAFAILOVA

Ekaterina Arafailova, doctorante au sein de l’équipe TASC, soutiendra sa thèse intitulée “Functional Description of Sequence Constraints and Synthesis of Combinatorial Objects

mardi 25 septembre 2018 à 15h à l’IMT Atlantique.

Jury : Nicolas Beldiceanu (directeur), Rémi Douence (co encadrant), Michela Milano (Rapporteur, U. Bologne), Stanislav Zivny (Rapporteur, U. Oxford), John Hooker (Carnegie Mellon University), Claude Jard

Soutenance de thèse d’Adel HASSAN (équipe AeLoS)

Adel Hassan, doctorant au sein de l’équipe AeLoS, soutiendra sa thèse intitulée “Styles et méta-styles: Une autre façon de réutiliser l’évolution d’architectures logicielles“.

lundi 24 septembre 2018 à 10h30, dans l’amphi du bâtiment 34 sur le site de la FST.

Jury : Mourad Oussalah (directeur), Kamel BARKAOUI (rapporteur, CNAM), Henri BASSON (rapporteur, Université du Littoral), Isabelle BORNE (Université de Bretagne Sud), Christian Attiogbé, Djamel SERIAI (LIRMM)

Résumé : Au cours des dernières années, la taille et la complexité des systèmes logiciels ont considérablement augmenté, rendant le processus d’évolution plus complexe et consommant ainsi beaucoup de ressources. C’est pourquoi, l’architecture logicielle est devenue l’un des éléments les plus importants dans la planification et la mise en oeuvre du
processus d’évolution. Cette abstraction permet une meilleure compréhension des décisions de conception prises précédemment et un bon moyen d’explorer, d’analyser et de comparer des scenarii alternatifs de l’évolution. Fort de constat, nous avons introduit une approche de styles d’évolution afin de capitaliser les pratiques d’évolution récurrentes dans un domaine particulier et de favoriser leur réutilisation. Dans cette thèse, nous préconisons en spécifiant un cadre de modélisation standard conforme à différents styles
d’évolution et pouvant satisfaire les préoccupations de différentes équipes impliquées dans un processus d’évolution. Afin de relever les défis de la réutilisation de l’évolution de l’architecture logicielle, nous nous fixons comme objectif: D’abord, d’introduire un style de méta-évolution qui spécifie les éléments conceptuels de base nécessaires à la modélisation de l’évolution; ensuite, de décrire une nouvelle méthodologie pour développer un style d’évolution selon plusieurs vues et plusieurs abstractions. Cette approche multi-vues/multi-abstractions permet de réduire la complexité du modèle de processus d’évolution en décomposant un style d’évolution en plusieurs vues et abstractions
pertinentes. Enfin, pour la validité et la faisabilité de notre approche, nous avons développé un prototype basé sur la plateforme de méta-modélisation ADOxx.

Mots-clés : Style d’évolution, Réutilisation de l’évolution, Architecture Logicielle.


Title: Style and Meta-Style: Another Way to Reuse Software Architecture Evolution

Abstract: Over the last years, the size and complexity of software systems has been dramatically increased, making the evolution process more complex and consuming a great deal of resources. Consequently, software architecture is becoming an important artifact in planning and carrying out the evolution process. It can provide an overall structural view of the system without undue focus on low-level details. This view can provide a deep understanding of previous design decisions and a means of analysing and comparing alternative evolution scenarios. Therefore, software architecture evolution has gained significant importance in developing methods, techniques and tools that can help architects to plan evolution. To this end, an evolution styles approach has been introduced with the aim of capitalising on the recurrent evolution practices and of fostering their reuse.
In this thesis, we endeavour to tackle the challenges in software architecture evolution reuse by specifying a standard modeling framework that can conform to different evolution styles and satisfy the concerns of the different stakeholder groups. The primary contribution of this thesis is twofold. First, it introduces a meta-evolution style which
specifies the core conceptual elements for software architecture evolution modeling. Second, it introduces a new methodology to develop a multi-view & multi-abstraction evolution style in order to reduce the complexity of the evolution model by breaking down an evolution style into several views, each of which covers a relevant set of aspects. The central ideas are embodied in a prototype tool in order to validate the applicability and feasibility of the proposed approaches.

Keywords: Evolution style, Evolution reuse, Software architecture.

Soutenance de thèse de Marija TOMIC (équipe ReV) | Thesis defence of Marija Tomic

Marija Tomic, doctorante au sein de l’équipe ReV, soutiendra sa thèse intitulée “Manipulation Robotique à deux mains inspirée des aptitudes humaines

mercredi 4 juillet 2018 à 16h, à la Faculté de génie électrique de l’Université de Belgrade (Serbie).

Jury : Christine Chevallereau (directrice de thèse), Kosta Jovanovic (co-directeur, Université de Belgrade), Philippe Fraisse (rapporteur, LIRMM), Zeljko Durovic (rapporteur, Université de Belgrade), Yannick Aoustin, Aleksandar Rodic (Institut Mihailo Pupin, Belgrade)

Copyright : LS2N 2017 - Legal notices -