Home » évènement

Soutenance de thèse de Ygor GALLINA (équipe TALN)

Ygor GALLINA, doctorant au sein de l’équipe TALN, soutiendra sa thèse, intitulée « Indexation de bout-en-bout dans les bibliothèques scientifiques numériques » / « End-to-end indexation in digital scientific libraries »

Le 28 mars 2022 à 9h30, dans l’amphithéâtre du bâtiment 34.

Jury :

Rapporteurs :  Josiane MOTHE, Professeure, Université de Toulouse ; Patrick PAROUBEK Professeur, Université de Paris-Saclay
Examinateurs : Lorraine GOEURIOT, Maître de conférence, Université Grenoble Alpes ; Richard DUFOUR Professeur, Nantes Université
Directrice : Béatrice DAILLE, Professeure, Nantes Université
Encadrant : Florian BOUDIN, Maître de conférence, Nantes Université
Résumé : Le nombre de documents scientifiques dans les bibliothèques numériques ne cesse d’augmenter. Les mots-clés, permettant d’enrichir l’indexation de ces documents ne peuvent être annotés manuellement étant donné le volume de document à traiter. La production automatique de mots-clés est donc un enjeu important. Le cadre évaluatif le plus utilisé pour cette tâche souffre de nombreuses faiblesses qui rendent l’évaluation des nouvelles méthodes neuronales peu fiables. Notre objectif est d’identifier précisément ces faiblesses et d’y apporter des solutions selon trois axes. Dans un premier temps, nous introduisons KPTimes, un jeu de données du domaine journalistique. Il nous permet d’analyser la capacité de généralisation des méthodes neuronales. De manière surprenante, nos expériences montrent que le modèle le moins performant est celui qui généralise le mieux. Dans un deuxième temps, nous effectuons une comparaison systématique des méthodes états de l’art grâce à un cadre expérimental strict. Cette comparaison indique que les méthodes de référence comme TF×IDF sont toujours compétitives et que la qualité des mots-clés de référence a un impact fort sur la fiabilité de l’évaluation. Enfin, nous présentons un nouveau protocole d’évaluation extrinsèque basé sur la recherche d’information. Il nous permet d’évaluer l’utilité des mots-clés, une question peu abordée jusqu’à présent. Cette évaluation nous permet de mieux identifier les mots-clés importants pour la tâche de production automatique de mots-clés et d’orienter les futurs travaux.
Mot clés : indexation automatique, mots-clés, évaluation extrinsèque, recherche d’information, génération de mots-clés, méthodes de bout en bout

Abstract: More and more scientific documents are being avaible in digital libraries. Efficient indexing is of the utmost importance for ease of access to scientific knowledge. Keywords, that supplements this indexation, can’t be annotated manually given the volume of document to process. Automatic keyword production is then an important issue. The commonly used evaluation protocol has many weaknesses which make the evaluation of the recent neural models less reliable. Our goal is to precisely identify these weaknesses and to provide solutions given three axis. First, we introduce KPTimes, a dataset from the news domain. It will allow us to analyse the generalisation ability of neural models. Suprisingly, the least performant model is the most generalisable one. Then, we perform a systematic comparison of state-of-the-art methods using a strict experimental setup. This comparison shows that baselines such as TF×IDF are still competitive and that reference keywords quality have a strong impact on evaluation reliability. Finally, we introduce a new extrinsic evaluation protocol based on information retrieval. It allow us to evaluate keyphrase usefulness, an issue that has been given very little attention until now. This evaluation will help us better identify important keywords for automatic keyword production and to guide future works.
Keywords: automatic indexing, keywords, extrinsic evaluation, information retrieval, keyword generation, end-to-end method

Béatrice Daille (équipe TALN) est nommée membre d’honneur de la SIF en 2021 !

La Société informatique de France distingue chaque année des personnalités pour leur engagement dans la promotion de la discipline Informatique, que ce soit dans la société, l’enseignement, la recherche ou l’industrie.  Ces personnalités sont «Membres d’honneur » de la SIF.

Cette année 2021, quatre personnalités ont été nommées membres d’honneur dont Béatrice Daille, professeure des Universités et membre de l’équipe TALN. Retrouvez son portrait sur le site de la SIF.

Félicitations à elle pour cette distinction !

La cérémonie de nomination 2021 se déroulera le 2 février 2021, lors du congrès annuel de la SIF qui aura lieu en ligne.

Journée du GDR TAL : « Intelligence artificielle et technologies des langues : l’ordinateur passe la barrière de la langue »

Le GDR TAL organise une journée grand public autour de l’IA et du traitement automatique de la langue, en présentiel au siège du CNRS et online sur https://webcast.in2p3.fr/live/gdr-tal

mardi 12 janvier 2021 de 9h30 à 16h30.

Cette journée propose un tour d’horizon des récentes avancées des technologies des langues pour des applications au cœur de notre société. Nous verrons comment est utilisée l’intelligence artificielle, en particulier les nouvelles approches exploitant les réseaux de neurones profonds, pour aider différents acteurs de la société : formateurs, journalistes, scientifiques, médecins, mais aussi le grand public.

Programme

9h30    Introduction, B. Daille, directrice du GdR TAL

9h45    Fouille de publications scientifiques sur le COVID, B. Favre

10h30    Ironie, sarcasme et sentiments : les algorithmes dans les subtilités de la langue, F. Benamara

11h15    pause

11h30    Mon ordinateur est-il un bon psy ? Le TAL au service du diagnostic médical, M. Amblard

12h15    La traduction automatique à l’heure des réseaux de neurones, F. Yvon

Repas

14h15    Le dialogue virtuel au service de la formation, M. Ochs

15h00    Quand la science-fiction inspire les technologies de la langue, F. Landragin

15h45    Les algorithmes à la chasse aux infox, V. Claveau

16 H 30 Fin

Consulter/télécharger la plaquette de la journée :  Journée grand public GdR TAL 2021

L’Université de Nantes organisera le congrès mondial Open Education Global en 2021. Félicitations à l’équipe de la chaire UNESCO REL pour son implication !

C’est décidé : l’édition 2021 de la conférence mondiale Open Education Global sera organisée par l’Université Nantes, sous la présidence de Carine Bernault et Colin de la Higuera.
Pendant 3 jours, des délégués de plusieurs dizaines de pays viendront discuter d’éducation ouverte.

Plus d’infos sur le blog de la chaire UNESCO REL.

NDW 2020 – Journée « IA et les ODDs »

La chaire UNESCO REL animera une journée sur l’intelligence artificielle et les objectifs de développement durable dans le cadre de la Nantes Digital Week,

mardi 22 septembre 2020 de 10h à 18h.

Les thèmes choisis pour cet événement sont les ODDs :

  • 3 (Santé et bien-être),
  • 8 (Accès à des emplois décents)
  • et 14 (Océans et mers).

Samuel Chaffron (équipe COMBI), Benoit Delahaye (équipe AeLoS), Damien Eveillard (équipe COMBI) et Diana Mateus (équipe SIMS) représenteront le labo au cours des tables rondes.

Programme détaillé sur https://chaireunescorel.ls2n.fr/2020/08/27/conference-en-ligne-ia-et-objectifs-de-developpement-durable/

En raison de la crise sanitaire, la journée se déroulera principalement à distance, grâce à une diffusion des débats en streaming sur le blog de la chaire. Un public d’une quinzaine de personnes participera à cet événement en présentiel.

Pour plus d’informations, le site officiel.

Nantes Machine Learning MeetUp avec les gagnants du F’AI’R Education Hackathon

Lors de la finale du F’AI’R Education Hackathon organisée à Paris par l’Ambassade du Royaume-Uni en France les 25 et 26 février 2020, l’équipe « Next Wave Learning » composée de Mohamed Reda Marzouk, Sofiane Elguendouze et Timothée Poulain, stagiaires au LS2N a remporté la 3ème place ainsi que le prix “Wow”.
Le Hackathon reposait sur des données ouvertes produites dans le cadre du projet européen X5-GON.

Lors du meetup en ligne qui aura lieu lundi 8 juin de 19h à 21h, le challenge sera présenté, ainsi que les solutions (gagnantes) nantaises.

Parmi les speakers, notons la présence de Walid BEN ROMDHANE, ingénieur contractuel au sein des équipes DUKe et TALN)

L’événement aura lieu .

Détails et inscription : https://www.meetup.com/fr-FR/Nantes-Machine-Learning-Meetup/events/269895104/

Brain & Breakfast #4 – Intelligence artificielle : La machine est-elle plus intelligente que l’homme ?

Rendez-vous le vendredi 20 mars 2020 à partir de 9h15 à la Cafet’Sciences, pour le dernier Brain & Breakfast, petit déjeuner scientifique, de l’année universitaire sur le thème de l’intelligence artificielle.

L’intelligence artificielle peut-elle être… intelligente ?

Aujourd’hui, l’intelligence artificielle est annoncée partout : elle permet aux voitures d’être autonomes, aux logiciels de battre les humains à la plupart des jeux, aux médecins de mieux diagnostiquer. Les villes deviennent intelligentes, nos maisons sont connectées, les entreprises discutent avec nous par l’intermédiaire de robots…

Autour de la Chaire Unesco en Ressources Educatives Libres de l’Université de Nantes nous étudions les interactions entre intelligence artificielle et éducation. Celles-ci s’analysent dans les deux sens :

  • Peut-on utiliser l’IA pour améliorer l’éducation ? C’est par exemple ce que nous essayons de faire au sein du projet européen X5-GON qui cherche à analyser automatiquement les ressources éducatives libres du monde entier, quels que soient les thèmes, les supports, les langues, les domaines et les cultures. A partir de cette analyse il est ensuite possible de recommander un cours, d’organiser les cours par difficulté croissante et de proposer des chemins d’apprentissage.
  • Peut-on (et doit-on) se préparer à un monde dans lequel de nombreuses décisions seront prises par l’IA ? Et en premier lieu, comment préparer les enseignants ? Nous avons travaillé au niveau national dans le contexte de Class’Code, pour la formation des enseignants, et au niveau international avec l’Unesco, pour préparer une série de recommandations.

Intervenants :

  • Frédérique Krupa est Professeure à l’Ecole du Design de Nantes, Directrice du Human Machine Design Lab et s’intéresse à nos interactions avec l’IA
  • Victor Connes est Doctorant au LS2N et son travail, dans le cadre du projet européen X5-GON, consiste à construire des modèles à partir desquels il est possible d’inférer de nouvelles connaissances.
  • Bastien Masse est coordinateur de la Chaire Education Ouverte et Intelligence Artificielle et coordinateur national de l’association Class’Code qui vient juste de sortir le MOOC IAI.
  • Colin de la Higuera est titulaire de la Chaire Unesco en REL.

Plus d’infos.

Copyright : LS2N 2017 - Mentions Légales - 
 -