Journées scientifiques de lancement du GDR, Orléans, 28-29 novembre 2019

Site web des journées : https://lift2019.sciencesconf.org/

L’objectif des Journées scientifiques est de favoriser les interactions entre les trois grands domaines que sont la linguistique informatique, la linguistique formelle et la linguistique de terrain, afin de favoriser le développement de recherches en linguistique qui tirent le meilleur parti des nouvelles technologies.

Le format des Journées consiste en

quatre séances plénières : communication de conférenciers invités,
des séances poster,
des tables-rondes thématiques.

Conférenciers invités / Invited speakers

Programme

Jeudi 28 novembre / Thursday 28 November

9h-9h30 : accueil / Welcome

9h30-10h : Claire Gardent (CNRS/LORIA, Nancy)
Introduction générale à LIFT / Presentation of the LIFT network

10h-11h : Emily Bender (University of Washington)
Computer Assisted (Morpho-)Syntax: Grammar Engineering for Linguistic Hypothesis Testing, Linguistic Typology, and Language Documentation.

11-12h : posters / poster session

Visualisation en arbres pour assister l’étude de la phonologie : application à la transcription de textes oraux nisvais, langue orale parlée dans l’ile de Malekula, au Vanuatu

Aznar Jocelyn (1)

1 – Centre de Recherche et de Documentation sur l’Océanie (France)

Interdisciplinary Approach to the Study of Pragmatic Markers in Everyday Spoken Discourse

Sherstinova Tatiana (1) (2), Natalia Bogdanova-Beglarian (1), Olga Blinova (1)

1 – Saint-Petersburg State University (Russie), 2 – National Research University Higher School of Economics (Russie)

ACCOLÉ : Annotation Collaborative d’erreurs de traduction pour COrpus aLignÉs

Esperança-Rodier Emmanuelle (1), Brunet-Manquat Francis (1)

1 – Laboratoire dÍnformatique de Grenoble (France)

Allegro : une plateforme « couteau suisse » pour l’exploitation des ressources textuelles

Petitjean Étienne (1), Benzitoun Christophe (2), Husson Benjamin (1), Ollinger Sandrine (1)

1 – Analyse et Traitement Informatique de la Langue Française (France), 2 – Analyse et Traitement Informatique de la Langue Française (France)

Pourquoi se tourner vers le SUD : L’importance de choisir un schéma d’annotation en dépendance surface-syntaxique

Gerdes Kim (1) (2), Kahane Sylvain (3), Guillaume Bruno (4), Perrier Guy (5)

1 – Almanach (France), 2 – LPP – Laboratoire de Phonétique et Phonologie – UMR 7018 (France), 3 – Modyco, Université Paris Ouest & CNRS (France), 4 – Université de Lorraine, CNRS, Inria, LORIA, F-54000 Nancy, France (France), 5 – Université de Lorraine, CNRS, Inria, LORIA, F-54000 Nancy, France (France)

Combiner parseur automatique et révision manuelle pour la constitution d’un corpus arboré de parole spontanée : retour d’expérience sur le corpus ODIL-Syntaxe

Wang Ilaine (1) (2), Pelletier Aurore (2), Waszcuk Jakub (2) , Halftermeyer Anaïs (1), Antoine Jean-Yves (2), Abouda Lotfi (3), Schang Emmanuel (3), Savary Agata (2)

1 – Laboratoire d’Informatique Fondamentale d’Orléans (France), 2 – Laboratoire d’Informatique Fondamentale et Appliquée de Tours (France) , 3 – Laboratoire Ligérien de Linguistique

Retours d’expérience concernant le développement de CasEN pour la reconnaissance d’entités nommées

Maurel Denis (1)

1 – Laboratoire d’informatique fondamentale et appliquée de Tours (France)

12h-13h : table ronde « Extraction de généralisations linguistiques par des méthodes informatiques » / Round table ‘Extraction of linguistic generalizations by computer methods’

13h-14h : déjeuner / Lunch

14h-15h : table ronde « Linguistique et évaluation des systèmes de traitement automatique des langues » / Round table ‘Linguistics and evaluation of automatic language processing systems’

15h-16h : posters / Poster session

Developing technologies for low resource Uralic languages : the case of North Saami and Komi-Zyrian

Partanen Niko , Rießler Michael , Poibeau Thierry (1)

1 – Langues, Textes, Traitements Informatiques, Cognition (France)

Un corpus du kriol à l’épreuve du TAL pour l’étude de la variation

Rougé Jean-Louis , Badin Flora (1)

1 – Laboratoire Ligérien de Linguistique (France)

La Collection Pangloss

Guillaume Séverine (1), Michaud Alexis (2), Do Nascimento Balthazar (3)

1 – Langues et civilisations à tradition orale (France), 2 – Langues et civilisations à tradition orale (France), 3 – UMR 7107 LACITO (France)

La Construction d’un Corpus Comparative : Une Méthodologie Pour L’étude Des Langues Parlées en Afrique de l’Ouest

Hantgan Abbie (1), Chanard Christian (1), Aplonova Katya (1)

1 – Langage, LAngues et Cultures d’Afrique Noire (France)

How Does Language Influence Documentation Workflow? Unsupervised Word Discovery Using Translations in Multiple Languages

Zanon Boito Marcely (1), Villavicencio Aline (2) (3), Besacier Laurent (4)

1 – GETALP (LIG Laboratoire d’Informatique de Grenoble) (France), 2 – Department of Computer Sciences [Scheffield] (Royaume-Uni), 3 – Institute of Informatics (UFRGS) (Brésil), 4 – GETALP (France)

Augmentation non Supervisée de Données pour des Langues Peu Dotées non Standardisées

Millour Alice (1), Fort Karën (1)

1 – Sorbonne Université – Equipe STIH (France)

16h-17h : Invited speaker : Sabrina Bendjaballah (Université de Nantes) ‘On descriptive adequacy.’

17h-18h : table ronde : éthique et cadre juridique

18h : Cocktail

Vendredi 29 novembre / Friday 29 November

9h-10h : accueil / Welcome

10h-11h : Invited speaker : Steven Bird (Charles Darwin University & Nawarddeken Academy & University of California Berkeley) ‘Sparse Transcription: Representing and Processing Oral Languages’

11h-12h : table ronde Outils de collecte et d’analyse pour les linguistes / Round table ‘Tools for collecting and analysing languages’

12h-13h : table ronde « Données et défis partagés pour une science ouverte » / Round table ‘Shared Data and Shared Tasks for Open Science’

13h-14h : déjeuner / Lunch

14h-15h : table ronde Linguistique informatique pour les langues peu dotées ou non documentées / Round table ‘Computational linguistics for under-resourced and non-documented languages’

15h-16h : posters / poster session

Advancing the study of endangered languages with computational tools for morphology: The case of Asama verb paradigms

Leveque Dimitri (1), Pellard Thomas (1)

1 – Centre de Recherches Linguistiques sur l’Asie Orientale (France)

GREW, un outil au service de l’annotation de corpus et de l’exploitation de corpus annotés

Perrier Guy (1), Guillaume Bruno (2)

1 – Université de Lorraine, CNRS, Inria, LORIA, F-54000 Nancy, France (France), 2 – Université de Lorraine, CNRS, Inria, LORIA, F-54000 Nancy, France (France)

Data software for written corpora of underresourced languages

Vydrin Valentin (1) (2), Maslinsky Kirill (3)

1 – Langage, Langues et Cultures d’Afrique Noire (France), 2 – Langage, LAngues et Cultures dÁfrique Noire (France), 3 – Higher School of Economics (Russie)

Analyse automatique du chinois utilisant des ressources linguistiques

Cai Zhen (1)

1 – Edition, Littératures, Langages, Informatique, Arts, Didactique, Discours – UFC (EA 4661) (France)

Une métagrammaire TAG pour le créole guadeloupéen

Schang Emmanuel (1)

1 – Laboratoire Ligérien de Linguistique (France)

A bioinformatics solution to inter-rater agreement for forced time-alignment of data from underresourced languages

Delafontaine François (1) (2), Stave (1), Seifart Frank (3), Paschen Ludger (3)

1 – Dynamique Du Langage (France), 2 – Laboratoire Ligérien de Linguistique (France), 3 – Zentrum für Allgemeine Sprachwissenschaft [Berlin] (Allemagne)

16h-17h : Invited speaker : Michel Jacobson (TGR Huma-Num) « Les affaires FAIR ? »

Principaux résultats

Proposition d’organiser un hackaton
Proposition de centraliser des offres / recherches de stages de Master

Journées scientifiques de lancement du GDR, Orléans, 28-29 novembre 2019

Site web des journées : https://lift2019.sciencesconf.org/

Conférenciers invités / Invited speakers

Programme

Principaux résultats

On en parle