Journées scientifiques de lancement du GDR, Orléans, 28-29 novembre 2019

Site web des journées : https://lift2019.sciencesconf.org/

L’objectif des Journées scientifiques est de favoriser les interactions entre les trois grands domaines que sont la linguistique informatique, la linguistique formelle et la linguistique de terrain, afin de favoriser le développement de recherches en linguistique qui tirent le meilleur parti des nouvelles technologies.

Le format des Journées consiste en

  • quatre séances plénières : communication de conférenciers invités,
  • des séances poster,
  • des tables-rondes thématiques.

Conférenciers invités / Invited speakers

Programme  

Jeudi 28 novembre / Thursday 28 November

9h-9h30 : accueil / Welcome

9h30-10h : Claire Gardent (CNRS/LORIA, Nancy)
Introduction générale à LIFT / Presentation of the LIFT network

10h-11h : Emily Bender (University of Washington)
Computer Assisted (Morpho-)Syntax: Grammar Engineering for Linguistic Hypothesis Testing, Linguistic Typology, and Language Documentation.

11-12h : posters / poster session

Visualisation en arbres pour assister l’étude de la phonologie : application à la transcription de textes oraux nisvais, langue orale parlée dans l’ile de Malekula, au Vanuatu
Aznar Jocelyn (1)
1 – Centre de Recherche et de Documentation sur l’Océanie (France)
Interdisciplinary Approach to the Study of Pragmatic Markers in Everyday Spoken Discourse
Sherstinova Tatiana (1) (2), Natalia Bogdanova-Beglarian (1), Olga Blinova (1)
1 – Saint-Petersburg State University (Russie), 2 – National Research University Higher School of Economics (Russie)
ACCOLÉ : Annotation Collaborative d’erreurs de traduction pour COrpus aLignÉs
Esperança-Rodier Emmanuelle (1), Brunet-Manquat Francis (1)
1 – Laboratoire dÍnformatique de Grenoble (France)
Allegro : une plateforme « couteau suisse » pour l’exploitation des ressources textuelles
Petitjean Étienne (1), Benzitoun Christophe (2), Husson Benjamin (1), Ollinger Sandrine (1)
1 – Analyse et Traitement Informatique de la Langue Française (France), 2 – Analyse et Traitement Informatique de la Langue Française (France)
Pourquoi se tourner vers le SUD : L’importance de choisir un schéma d’annotation en dépendance surface-syntaxique
Gerdes Kim (1) (2), Kahane Sylvain (3), Guillaume Bruno (4), Perrier Guy (5)
1 – Almanach (France), 2 – LPP – Laboratoire de Phonétique et Phonologie – UMR 7018 (France), 3 – Modyco, Université Paris Ouest & CNRS (France), 4 – Université de Lorraine, CNRS, Inria, LORIA, F-54000 Nancy, France (France), 5 – Université de Lorraine, CNRS, Inria, LORIA, F-54000 Nancy, France (France)
Combiner parseur automatique et révision manuelle pour la constitution d’un corpus arboré de parole spontanée : retour d’expérience sur le corpus ODIL-Syntaxe
Wang Ilaine (1) (2), Pelletier Aurore (2), Waszcuk Jakub (2) , Halftermeyer Anaïs (1), Antoine Jean-Yves (2), Abouda Lotfi (3), Schang Emmanuel (3), Savary Agata (2)
1 – Laboratoire d’Informatique Fondamentale d’Orléans (France), 2 – Laboratoire d’Informatique Fondamentale et Appliquée de Tours (France) , 3 – Laboratoire Ligérien de Linguistique
Retours d’expérience concernant le développement de CasEN pour la reconnaissance d’entités nommées
Maurel Denis (1)
1 – Laboratoire d’informatique fondamentale et appliquée de Tours (France)

12h-13h : table ronde « Extraction de généralisations linguistiques par des méthodes informatiques » / Round table ‘Extraction of linguistic generalizations by computer methods’

13h-14h : déjeuner / Lunch

14h-15h : table ronde « Linguistique et évaluation des systèmes de traitement automatique des langues » / Round table ‘Linguistics and evaluation of automatic language processing systems’

15h-16h : posters / Poster session

Developing technologies for low resource Uralic languages : the case of North Saami and Komi-Zyrian
Partanen Niko , Rießler Michael , Poibeau Thierry (1)
1 – Langues, Textes, Traitements Informatiques, Cognition (France)
Un corpus du kriol à l’épreuve du TAL pour l’étude de la variation
Rougé Jean-Louis , Badin Flora (1)
1 – Laboratoire Ligérien de Linguistique (France)
La Collection Pangloss
Guillaume Séverine (1), Michaud Alexis (2), Do Nascimento Balthazar (3)
1 – Langues et civilisations à tradition orale (France), 2 – Langues et civilisations à tradition orale (France), 3 – UMR 7107 LACITO (France)
La Construction d’un Corpus Comparative : Une Méthodologie Pour L’étude Des Langues Parlées en Afrique de l’Ouest
Hantgan Abbie (1), Chanard Christian (1), Aplonova Katya (1)
1 – Langage, LAngues et Cultures d’Afrique Noire (France)
How Does Language Influence Documentation Workflow? Unsupervised Word Discovery Using Translations in Multiple Languages
Zanon Boito Marcely (1), Villavicencio Aline (2) (3), Besacier Laurent (4)
1 – GETALP (LIG Laboratoire d’Informatique de Grenoble) (France), 2 – Department of Computer Sciences [Scheffield] (Royaume-Uni), 3 – Institute of Informatics (UFRGS) (Brésil), 4 – GETALP (France)
Augmentation non Supervisée de Données pour des Langues Peu Dotées non Standardisées
Millour Alice (1), Fort Karën (1)
1 – Sorbonne Université – Equipe STIH (France)

16h-17h : Invited speaker : Sabrina Bendjaballah (Université de Nantes) ‘On descriptive adequacy.’

17h-18h : table ronde : éthique et cadre juridique

18h : Cocktail

Vendredi 29 novembre / Friday 29 November

9h-10h : accueil / Welcome

10h-11h : Invited speaker : Steven Bird (Charles Darwin University & Nawarddeken Academy & University of California Berkeley) ‘Sparse Transcription: Representing and Processing Oral Languages’

11h-12h : table ronde Outils de collecte et d’analyse pour les linguistes / Round table ‘Tools for collecting and analysing languages’

12h-13h : table ronde « Données et défis partagés pour une science ouverte » / Round table ‘Shared Data and Shared Tasks for Open Science’

13h-14h : déjeuner / Lunch

14h-15h : table ronde Linguistique informatique pour les langues peu dotées ou non documentées / Round table ‘Computational linguistics for under-resourced and non-documented languages’

15h-16h : posters / poster session

Advancing the study of endangered languages with computational tools for morphology: The case of Asama verb paradigms
Leveque Dimitri (1), Pellard Thomas (1)
1 – Centre de Recherches Linguistiques sur l’Asie Orientale (France)
GREW, un outil au service de l’annotation de corpus et de l’exploitation de corpus annotés
Perrier Guy (1), Guillaume Bruno (2)
1 – Université de Lorraine, CNRS, Inria, LORIA, F-54000 Nancy, France (France), 2 – Université de Lorraine, CNRS, Inria, LORIA, F-54000 Nancy, France (France)
Data software for written corpora of underresourced languages
Vydrin Valentin (1) (2), Maslinsky Kirill (3)
1 – Langage, Langues et Cultures d’Afrique Noire (France), 2 – Langage, LAngues et Cultures dÁfrique Noire (France), 3 – Higher School of Economics (Russie)
Analyse automatique du chinois utilisant des ressources linguistiques
Cai Zhen (1)
1 – Edition, Littératures, Langages, Informatique, Arts, Didactique, Discours – UFC (EA 4661) (France)
Une métagrammaire TAG pour le créole guadeloupéen
Schang Emmanuel (1)
1 – Laboratoire Ligérien de Linguistique (France)
A bioinformatics solution to inter-rater agreement for forced time-alignment of data from underresourced languages
Delafontaine François (1) (2), Stave (1), Seifart Frank (3), Paschen Ludger (3)
1 – Dynamique Du Langage (France), 2 – Laboratoire Ligérien de Linguistique (France), 3 – Zentrum für Allgemeine Sprachwissenschaft [Berlin] (Allemagne)

16h-17h : Invited speaker : Michel Jacobson (TGR Huma-Num) « Les affaires FAIR ? »

Principaux résultats

  • Proposition d’organiser un hackaton
  • Proposition de centraliser des offres / recherches de stages de Master