Home » Posts tagged "équipe TALN" (Page 2)

L’équipe nantaise lauréate du Hackathon F’AI’R Education (AI for the Common Good)

Félicitations à l’équipe nantaise composée d’Aniss Bentebib, Camille-Amaury Juge et Vincent Kowalski qui vient de remporter le « AI for the Common Good: F’AI’R Education Hackathon » qui s’est disput à Paris fin février. L’événement était organisé par l’Ambassade du Royaume-Uni en France et a réuni 10 équipes de 4 pays européens, après avoir eu des rounds de qualification auxquels ont participé plus de 250 étudiants de Londres, Osnabrück, Ljubljana et Londres.

Belle performance également de l’équipe composée de Mohamed Reda Marzouk , Sofiane Elguendouze et Timothee Poulain, tous stagiaires au LS2N qui prend la 3ème place ainsi que le prix « Wow » !

A souligner le fantastique travail des coachs, préparateurs et co-organisateurs Walid Ben Romdhane et Victor Connes, du LS2N.

L’objectif du hackathon était de proposer des applications IA liées aux objectifs de développement durable définis par les Nations-Unies. Nos vainqueurs ont proposé un enseignant virtuel capable de répondre aux questions des étudiants, de leur proposer des ressources éducatives libres mais aussi d’intégrer des communautés d’apprenants dans plus d’une centaine de langues.

Prix Inria « Appui à la recherche et à l’innovation » 2019 décerné au projet Class’Code

Inria a décerné son Prix « Appui à la recherche et à l’innovation » au projet de médiation Class’Code. Lancé en 2015, Class’code a déjà permis de former 80 000 personnes à la pensée informatique. Il est porté en local par Colin de la Higuera (équipe TALN).

Plus d’infos sur le site d’Inria.

Soutenance de thèse de Jingshu LIU (équipe TALN)

Jingshu Liu, doctorant au sein de l’équipe TALN, soutiendra sa thèse intitulée « Apprentissage de représentations cross-lingue d’expressions de longueur variable » / « Unsupervised cross-lingual representation modeling for variable length phrases »

mercredi 29 janvier 2020 à 14h, dans l’amphi du bât 34 sur le site de la FST.

Jury :
– Directeur thèse : Emmanuel Morin
– Co-encadrant : Sebastian Pena Saldarriaga
– Rapporteurs : Pierre Zweigenbaum (CNRS Univ Saclay), Laurent Besacier (U Grenoble Alpes),
– Autres membres : Olivier Ferret (Ingénieur Chercheur CEA LIST)

Resumé : L’étude de l’extraction de lexiques bilingues à partir de corpus comparables a été souvent circonscrite aux mots simples. Les méthodes classiques ne peuvent gérer les expressions complexes que si elles sont de longueur identique, tandis que les méthodes de plongements de mots modélisent les expressions comme une seule unité. Ces dernières nécessitent beaucoup de données, et ne peuvent pas gérer les expressions hors vocabulaire. Dans cette thèse, nous nous intéressons à la modélisation d’expressions de
longueur variable par co-occurrences et par les méthodes neuronales état de l’art. Nous étudions aussi l’apprentissage de représentation d’expressions supervisé et non-supervisé. Nous proposons deux contributions majeures. Premièrement, une nouvelle architecture appelée tree-free recursive neural network (TFRNN) pour la modélisation d’expressions indépendamment de leur longueur. En apprenant à prédire le contexte de l’expression à partir de son vecteur encodé, nous surpassons les systèmes état de l’art de synonymie monolingue en utilisant seulement le texte brut pour l’entraînement. Deuxièmement, pour la modélisation cross-lingue, nous incorporons une architecture dérivée de TF-RNN dans un modèle encodeur-décodeur avec un mécanisme de pseudo contre-traduction inspiré de travaux sur la traduction automatique neurale nonsupervisée. Notre système améliore significativement l’alignement bilingue des expressions de longueurs différentes.

Mots-clés : plongement lexical bilingue, alignement d’expressions, apprentissage non-supervisé

******

Abstract: Significant advances have been achieved in bilingual word-level alignment from comparable corpora, yet the challenge remains for phrase-level alignment. Traditional
methods to phrase alignment can only handle phrase of equal length, while word embedding based approaches learn phrase embeddings as individual vocabulary entries suffer
from the data sparsity and cannot handle out of vocabulary phrases. Since bilingual alignment is a vector comparison task, phrase representation plays a key role. In this thesis, we
study the approaches for unified phrase modeling and cross-lingual phrase alignment, ranging from co-occurrence models to most recent neural state-of-the-art approaches. We review supervised and unsupervised frameworks for modeling cross-lingual phrase representations. Two contributions are proposed in this work. First, a new architecture called tree-free recursive neural network (TF-RNN) for modeling phrases of variable length which, combined with a wrapped context prediction training objective, outperforms the state-of-the-art approaches on monolingual phrase synonymy task with only plain text training data. Second, for cross-lingual modeling, we propose to incorporate an architecture derived from TF-RNN in an encoder-decoder model with a pseudo back translation mechanism inspired by unsupervised neural machine translation. Our proposition improves significantly bilingual alignment of different length phrases.

Keywords: bilingual word embedding, bilingual phrase alignment, unsupervised learning

Projet OnBoard (connecting cities through education)

Le projet OnBoard est un projet Européen dont la ville de Nantes est partenaire et que Colin de la Higuera et Bastien Masse accompagnent à partir de leur expérience dans Class’Code et la Chaire Unesco. L’objectif est de bâtir des projets éducatifs à l’échelle de la ville, incluant de nombreux acteurs : l’école, les entreprises, les associations et l’enseignement supérieur.

La réunion du projet à Albergaria-a-Velha, au Portugal, en septembre 2019 était organisée autour du rôle de l’enseignement supérieur dans ce type de dispositifs. Voir l’interview de Colin sur YouTube.

Pour en savoir plus ou participer à ce type de projets au sein de la Chaire Académique Education Ouverte et Intelligence Artificielle, contactez : cdlh@univ-nantes.fr ou bastien.masse@univ-nantes.fr.

Interventions de Colin de la Higuera (équipe TALN) sur l’IA

Colin de la Higuera animera des débats et présentations sur l’intelligence artificielle dans le cadre de 3 manifestations grand public :

Séminaires du projet exploratoire AILE (Artificial Intelligence for Learning Environment)

Les lundis 7/10/2019  et 4/11/2019 prochains de 17h à 18h, nous organisons un temps de restitution de travaux réalisés dans le cadre du projet exploratoire AILE (Artificial Intelligence for Learning Environment) [1], soutenu par le CominLabs.

Chaque séance accueillera 3 séminaires d’une dizaine de minutes chacun. Ces séminaires sont ouverts et retransmis par visioconférences sur deux sites :
* Site de la FST, Bât 34 salle ABC
* Site Polytech, le 07/10 la salle du conseil (bât IRESTE), le 04/11 la salle B016 (bât IHT)

Le 7/10/2019, nous entendrons
* Maëlle BRASSIER    « Calculs d’indices de difficulté »
* Solène CATELLA  « Définition d’indices de difficulté »
* Axel RAMBAUD « Chapitrage de la transcription du discours de l’enseignant à l’aide de son diaporama »

Et le 4/11/2019* Hugo le Baher    « What’s next »
* Marie HUMBERT–ROPERS    « Modélisation d’utilisateurs »
* Xavier PILLET « Prédiction de succès/échec »

Les personnes souhaitant assister par visioconférence sont invitées à nous contacter.

Olivier Aubert et Nicolas Hernandez

[1] http://aile.comin-ocw.org/

Soutenance de thèse de Basma El Amel BOUSSAHA (équipe TALN)

Basma El Amel Boussaha, doctorante au sein de l’équipe TALN, soutiendra sa thèse intitulée « Recherche de réponses pour les systèmes de dialogue basés sur la recherche de réponse de bout en bout » / « Response selection for end-to-end retrieval-based dialogue systems »

mercredi 23 octobre 2019 à 14h, dans l’amphi du bâtiment 34 sur le site de la FST.

Jury :
– Directeur thèse : Emmanuel MORIN
– Co- encadrants : Nicolas HERNANDEZ, Christine JACQUIN
– Examinateurs : Sophie ROSSET (LIMSI), Frédéric BECHET (LIS), Yannick ESTEVE (LIA)

Résumé : Le besoin croissant en assistance humaine a poussé les chercheurs à développer des systèmes de dialogue automatiques, intelligents et infatigables qui conversent avec les humains dans un langage naturel pour devenir soit leurs assistants virtuels ou leurs compagnons. L’industrie des systèmes de dialogue est devenue populaire cette dernière décennie, ainsi, plusieurs systèmes ont été développés par des industriels comme des académiques. Dans le cadre de cette thèse, nous étudions les systèmes de dialogue orientés vers la tâche comme la réservation de restaurants en cherchant la réponse la plus appropriée à la conversation parmi un ensemble de réponses prédéfini. Le défi majeur de ces systèmes est la compréhension de la conversation et l’identification des éléments qui décrivent le problème et la solution qui sont souvent implicites. La plupart des approches
récentes sont basées sur des techniques d’apprentissage profond qui permettent de capturer des informations implicites. Souvent, ces approches sont complexes ou dépendent fortement du domaine. Nous proposons une approche de recherche de réponse de bout en bout, simple, efficace et indépendante du domaine et qui permet de capturer ces informations implicites. Nous effectuons également des analyses profondes afin de déterminer des pistes d’amélioration.

Mot-clés : Apprentissage profond, systèmes de dialogue orientés tâche, chatbots, systèmes de recherche, réseaux de neurones

**********

Abstract: The increasing need of human assistance pushed researchers to develop automatic, smart and tireless dialogue systems that can converse with humans in natural language to be either their virtual assistant or their chat companion. The industry of dialogue systems has been very popular in the last decade and many systems from industry and academia have been developed. In this thesis, we study task-oriented retrieval-based dialogue systems which aim to fulfill a specific task such as restaurant booking by retrieving the most appropriate response to the conversation among a set of predefined responses. The main challenge of these systems is to understand the conversation and identify the elements that describe the problem and the solution which are usually implicit. Most of the recent approaches are based on deep learning techniques which can automatically capture implicit information. However these approaches are either complex or domain dependent. We propose a simple, end-to-end and efficient retrieval-based dialogue system that first matches the response with the history of the conversation on the sequencelevel and then we extend the system to multiple levels while keeping the architecture simple and domain independent. We perform several deep analyzes to determine possible improvements.

Keywords: Deep learning, goal-oriented dialogue systems, chatbots, retrieval-systems, neural networks

Interview de Béatrice Daille sur le préGDR TAL

Le préGDR Traitement automatique des langues (TAL), créé depuis janvier 2018, est en phase de structuration.

Béatrice Daille (équipe TALN) qui porte ce projet, a rencontré Laure Thiébaud, chargée de communication de l’INS2I, afin de lui exposer les raisons de la création de ce préGDR, ses débuts et ses perspectives.

Retrouvez l’interview complète sur le site de l’INS2I.

Copyright : LS2N 2017 - Mentions Légales - 
 -