Appel à propositions d’actions 2020

Appel à propositions d’actions en 2020 sur les thématiques du GdR LIFT

Le Gdr LIFT soutiendra en 2020 plusieurs actions favorisant les activités de recherches autour des thématiques du GdR.

Ces actions peuvent viser par exemple (liste non limitative) :
– la création d’un groupe de travail réunissant des chercheurs de plusieurs laboratoires
– l’organisation de journées thématiques
– la création d’un site web permettant de documenter des données, des logiciels et/ou des cas d’usage
– l’organisation d’une campagne d’évaluation
– toute autre action permettant de promouvoir les thématiques du GdR et le rassemblement des trois communautés (linguistes formels, de terrain et informaticiennes).

Les propositions pourront être soumises au fil de l’eau jusqu’à épuisement du budget dédié (4 000 euros) et avant septembre 2020, en utilisant le modèle joint à envoyer à  lift_resp@inria.fr.

Les propositions émanant de jeunes chercheurs (maximum 10 ans après la thèse) auront la priorité.

Le montant attribué par proposition est plafonné à 2 000 euros et devra être dépensé pour une action réalisée avant fin novembre 2020.

Les propositions reçues seront examinées périodiquement par le comité de pilotage du GdR.

Les porteurs seront informés dans la semaine qui suit des décisions du comité de pilotage.

Le calendrier d’examen des propositions est prévu comme suit :
20 avril (examen des propositions reçues avant le 15 avril)
20 mai (examen des propositions reçues avant le 15 mai)
20 juin (examen des propositions reçues avant le 15 juin)
20 septembre (examen des propositions reçues avant le 15 septembre)

Claire Gardent
Coordinatrice du GdR LIFT

Lien vers le formulaire

 

Publié dans appels, Événement | Marqué avec | Commentaires fermés sur Appel à propositions d’actions 2020

Datathon 2021 — Bilan

Le Groupement de recherche « Linguistique Informatique, Formelle et de Terrain (GDR LIFT) et la plateforme Collection de Corpus Oraux Numériques (Cocoon) organisaient à Orléans un atelier « Datathon de la parole » de quatre demi-journées du lundi 8 novembre 2021 au mercredi 10 novembre. L’événement s’inscrivait également dans le cadre des activités soutenues par le consortium CORLI de la Très Grande Infrastructure de Recherche Huma-Num  et par l’nstitut des Langues Rares (ILARA) de l’École Pratique des Hautes Études. L’appel à participation était ouvert à tous les chercheurs, chercheuses et doctorant.e.s qui ont un jeu de données orales et souhaitent en ouvrir l’accès (à diverses fins, y compris sa ré-utilisation à des fins de recherche nouvelles). Ce billet présente un rapide bilan, en forme d’invitation à prendre contact si vous seriez intéressé·e à participer à une réédition de cet événement en 2022.

L’atelier fournissait un cadre dans lequel travailler à la description des ressources et de leur contexte de production, en vue d’une publication électronique des données. Au fil des quatre demi-journées, les travaux pratiques (sur des jeux de données de participant.e.s) ont alterné avec des présentations générales visant à situer les enjeux et stratégies, dans un contexte de Science ouverte : dépôt, archivage et diffusion ; description des données et référencement ; articulation entre données, outils et publications. Les thématiques abordées couvraient les finalités aussi bien que les dimensions spécifiques du plan de gestion de données que sont le plan de classement, le plan de nommage, le formatage et autres étapes qui permettent d’aboutir au dépôt en archive dans les règles de l’art, dépôt qui ouvre les données à de nouvelles utilisations et recherches, dans une logique cumulative.

L’événement était hébergé à l’
Hôtel Dupanloup (qui abrite le Centre international universitaire pour la recherche). Y participaient dix déposants de divers labos (LLL, BCL [Nice], CRLAO, LLACAN, LACITO, FoReLLIS [Poitiers]) et huit organisateurs et formateurs / tuteurs (Huma-Num, BnF, LLL, LACITO, Laboratoire de Phonétique et Phonologie).

Tous les participants sont confirmés dans leur projet de déposer des données de terrain (collectées de première main) sur une plate-forme professionnelle pour archivage et diffusion. Parmi les points appréciés des déposant(e)s :
  • Le contact avec les personnes qui ont monté (et font vivre) la plate-forme Cocoon, et avec une personne du département audiovisuel de la BnF
  • Le choix de travailler sur des exemples précis (mode Travaux pratiques)
  • Le dialogue constant entre déposants et formateurs. Photo : Emmanuel Schang (licence : CC BY-NC-SA 3.0 fr)

Il reste bien sûr, pour certains participants, des incertitudes à lever concernant la publication de certains corpus. Un consentement « non standard » recueilli auprès des locuteurs (ou souvent l’absence de document attestant du consentement) est un frein. Les infos juridiques reçues de sources diverses sont parfois contradictoires, d’où une impression de flou, et une indécision. Des pistes ont été fournies afin de permettre à chacun·e d’avancer sur ce point aussi, notamment en renvoyant au groupe « Questions éthiques et juridiques » du consortium Huma-Num CORLI.

Au-delà du but premier (diffusion du rudiment d’archivistique dont les déposants ont besoin), le Datathon a fourni l’occasion de constater un vif intérêt des déposant·e·s pour la vie des corpus après leur dépôt. Les corpus comme point de rencontre entre linguistes et TAListes, entre linguistes et locuteurs des langues concernées, entre linguistes de diverses spécialités : c’est une perspective qui encourage clairement au dépôt.

Comme indiqué en introduction : n’hésitez pas à prendre contact (en écrivant à flora.badin@univ-orleans.fr et/ou alexis.michaud@cnrs.fr) si vous seriez intéressé·e à participer à une réédition de cet événement en 2022. Les informations souhaitées :

  • langues concernées (on donnera la priorité aux langues peu documentées de tous les continents)
  • description succincte du projet scientifique dans le cadre duquel les données ont été collectées
  • description des données : type de données, format et quantité (des données primaires : les enregistrements audio et/ou vidéo, ainsi que des données secondaires : transcription, annotation, traduction)
  • perspectives d’enrichissement futur

Les organisateurs: Flora Badin, Emmanuel Schang, Séverine Guillaume, Michel Jacobson, Audrey Viault, Alexis Michaud

Laboratoires organisateurs : LLL et LACITO

Publié dans Conférence / Atelier, Événement | Commentaires fermés sur Datathon 2021 — Bilan

Journées Lift 2021 : 6 et 7 décembre à Grenoble

Présentation

Le GdR LIFT (Linguistique Informatique, Formelle et de Terrain) organise deux journées de rencontres autour des thèmes de LIFT. L’objectif de ces journées est de favoriser les interactions entre linguistique informatique, linguistique formelle et linguistique de terrain, afin de favoriser le développement de recherches en linguistique qui tirent le meilleur parti des nouvelles technologies.

En plus d’orateurices invité⋅e⋅s, ces journées incluent des moments d’échanges via la présentation de travaux de recherche en cours. Les personnes souhaitant présenter leurs travaux sont invitées à soumettre un résumé étendu (limité à 2 pages). Les résumés retenus pour présentation seront publiés dans les actes des journées.

https://lift2021.sciencesconf.org/

Dates importantes

  • Soumission des résumés : 1er octobre 2021.
  • Notification aux auteurs : 1er novembre 2021.
  • Soumission des versions finales : 15 novembre 201.
  • Journées scientifiques : 6 et 7 décembre 2021.

Thématiques:

Les communications pourront porter sur tous les thèmes de LIFT, incluant, de façon non limitative:

  • Retours d’expérience concernant l’emploi et/ou le développement d’outils informatiques pour l’analyse linguistique
  • Linguistique informatique et Science ouverte : perspectives ouvertes par le partage des données, des outils et des publications
  • Modélisation informatique et linguistique formelle (théorie des langages formels, grammaires d’unification, théorie de la preuve…)
  • Mise en dialogue des modèles linguistiques et des modèles d’apprentissage automatique (de tous types : approches génératives et discriminantes, approches statistiques neuronales, approches de type encodeurs-décodeurs…)
  • Méthodes non supervisées ou faiblement supervisées pour l’analyse des langues peu dotées, peu écrites ou non documentées.
  • Réflexions au sujet de l’automatisation des processus d’analyse et de validation

Toutes les propositions qui entrent dans les thèmes des journées d’étude sont les bienvenues. La présentation de travaux aboutis mais aussi de travaux en cours est possible. Les journées LIFT visent aussi bien à présenter des résultats qu’à susciter des discussions, notamment autour de travaux en cours pour lesquels les auteur⋅es aimeraient développer des collaborations (par ex., expert en TAL souhaitant appliquer un outil sur des données langagières variées ; linguiste de terrain souhaitant automatiser une tâche d’annotation, etc.).

Format

En pratique, les résumés feront 2 pages maximum. Les soumissions devront être conformes aux lignes directrices officielles qui sont contenues dans les fichiers de style disponibles en ligne à l’adresse https://gdr-lift.loria.fr/wp-content/uploads/2021/06/LIFT_styles_2021.zip et être au format PDF. Les soumissions pourront être en anglais ou en français. Les articles sélectionnés seront présentés sous forme de poster.

Les soumissions devront être déposées sur https://lift2021.sciencesconf.org/

Lieu:

Les 2 journées se dérouleront en présentiel sur le campus de l’Université de Grenoble Alpes (Bâtiment IMAG, 700 Avenue Centrale, 38400 Saint-Martin-d’Hères). En cas de restrictions liées à la pandémie, la conférence se tiendra virtuellement.

Conférencier invité:

  • Laurent Besacier (Naver Labs Europe)
  • Daan van Esch (Google research)
  • tba

Comité d’organisation:

  • Benjamin Lecouteux, LIG/Université Grenoble-Alpes
  • Maximin Coavoux, LIG/CNRS
  • Emmanuelle Esperança-Rodier, LIG/Université Grenoble-Alpes
  • Claire Lemaire, LIG/Université Grenoble-Alpes, LAIRDIL/Université Paul Sabatier (Toulouse 3)
Publié dans Événement | Commentaires fermés sur Journées Lift 2021 : 6 et 7 décembre à Grenoble

Séminaire ILFC

Le séminaire ILFC « Interactions entre linguistiques formelles et computationnelles » organisé le 1er juin 2021 par Timothée Bernard (Laboratoire de Linguistique Formelle, U. Paris) et Grégoire Winterstein (Université du Québec à Montréal) a connu un franc succès.

Avec 143 inscrits, 40 à 50 auditeurs présents à chaque intervention et de nombreux échanges dans Gather.Town, le format virtuel a permis d’ouvrir le séminaire à un large public en provenance de France bien sûr (46 inscrits), mais aussi d’Italie, Allemagne, Argentine, Autriche, Belgique, Bosnie-Herzégovie, Brésil, Canada, Chine, Etats Unis, Egypte, Espagne, Grèce, Hong Kong, Hongrie, Inde, Indonésie, Irelance, Italie, Japon, Jordanie, Mexique, Niger, Pays Bas, Perou, Pologne, Portugal, Royaume Uni, Russie, Singapour, Turquie et USA. De même, les orateurs invités venaient de Suisse (Juan Luis Gastaldi, ETH Zürich), du Japon (Koji Mineshima, Keio University), du Canada (Maud Pironneau, Druide informatique) et des Etats-Unis (Marie-Catherine de Marneffe, Ohio State University, Jacob Andreas, MIT et Olga Zamaraeva, University of Washington).

La journée a couvert des thèmes éminemment actuels pour l’interface entre linguistique et linguistique informatique tels que « Que disent les approches neuronales sur les langues naturelles ? Quelle place pour les grammaires formelles dans la modélisation informatique des langues du monde ? Quelles sont les techniques de Traitement Automatique des Langues réellement utilisées dans des applications telle que l’Antidote de Druide Informatique ? ».

Devant le succès de cette première journée, Grégoire et Timothée envisagent l’organisation d’un séminaire mensuel, toujours en ligne, et toujours sur l’interface entre linguistique et linguistique informatique. A suivre.

Publié dans Conférence / Atelier | Commentaires fermés sur Séminaire ILFC

Datathon

Le GdR LIFT organise le 8-10 novembre 2021 un atelier « datathon de la parole ». L’appel à participation est ouvert à tous les chercheurs, chercheuses et doctorant.e.s qui ont un jeu de données orales et souhaitent en ouvrir l’accès (à diverses fins, y compris sa ré-utilisation à des fins de recherche nouvelles). L’atelier fournira un cadre dans lequel travailler à la description des ressources et de leur contexte de production, en vue d’une publication électronique des données.
Plus d’information : [ici]

Publié dans Conférence / Atelier | Commentaires fermés sur Datathon

Personnes

  • Séminaire ILFC : interactions entre linguistiques formelles et computationnelles.

Timothée Bernard (LLF) et Grégoire Winterstein (LLF)

  • Datathon de la parole, 8-10 novembre 2021 : dépôt, archivage et diffusion de documentation linguistique sur langues rares .

Alexis Michaud (LACITO), Flora Badin (LLL), Emmanuel Schang (LLL), Séverine Guillaume (LACITO), Michel Jacobson (LACITO)

  • Ecole thématique « Annotation, modélisation et partage de données textuelles etsonores pour l’analyse linguistique ».

Berthold Crysmann (LLF), Sylvain Loiseau (LACITO), Karën Fort (Sorbonne Universités) et Guillaume Wisniewski(LLF).

 

Publié dans Non classé | Commentaires fermés sur Personnes

Séminaire ILFC : interactions entre linguistiques formelles et computationnelles, en ligne, 1er juin 2021

Le GdR LIFT organise le 1er juin 2021 une journée de séminaire en ligne sur les interactions entre linguistiques formelles et computationnelles.
Le séminaire se penchera en particulier sur la place des méthodes symboliques dans les systèmes actuels de traitement automatique des langues et sur l’apport des méthodes computationnelles à la linguistique théorique.
Cette journée a pour but de réunir des membres de communautés scientifiques différentes tout autour du monde et de favoriser l’interfécondation des approches.

Plus d’information : [ici]

Publié dans Conférence / Atelier | Commentaires fermés sur Séminaire ILFC : interactions entre linguistiques formelles et computationnelles, en ligne, 1er juin 2021

Journées LIFT 10-11 décembre 2020 (en virtuel)

Programme

Les journées incluent deux sessions sur les thèmes Corpus arborés et syntaxe  et Grammaire et Linguistique de terrain, un tutoriel, onze conférences invitées et onze présentations d’articles.
Programme détaillé et inscriptions ICI
Les paramètres de visio seront envoyés aux participants enregistrés

Thèmes des contributions

  • Corpus arborés et syntaxe
  • Syntaxe  et Linguistique de terrain
  • Bonne pratiques pour la création et l’annotation de Corpus
  • Traitement automatique de données orale
  • Traitement automatique de données écrites
  • Outils et ressources pour la linguistique formelle

Conférences invitées

Katya Aplonova, LLACAN, Villejuif
Cherifa Ben Khelil, Université Orléans
Lionel Clément, LaBRI, Université de Bordeaux
Eric de la Clergerie, INRIA/Almanach, Paris
Annie Foret, Université de Rennes
Kim Gerdes, Université Paris Saclay
Sylvain Loiseau, Université Paris XIII
Aleksandra Miletic, Université Toulouse Jean Jaurès
Simon Petitjean, Heinrich Heine Universität Düsseldorf
Mathilde Regnault, Universität Stuttgart
Emmanuel Schang, Université d’Orléans

 

 

Publié dans Événement, Non classé | Commentaires fermés sur Journées LIFT 10-11 décembre 2020 (en virtuel)

Appel: Prochaines journees du GdR LIFT

Appel à communications

Journées LIFT, 10-11 Décembre
https://gdr-lift.loria.fr/

Le GdR LIFT (Linguistique Informatique, Formelle et de Terrain) organise deux journées de rencontres autour des thèmes de LIFT. Par ailleurs, deux thèmes spécifiques sont proposées pour ces journées : (i) Corpus arborés et syntaxe et (ii) Grammaire et Linguistique de terrain. L’objectif de ces journées est de favoriser les interactions entre linguistique informatique, linguistique formelle et linguistique de terrain, afin de favoriser le développement de recherches en linguistique qui tirent le meilleur parti des nouvelles technologies.

En plus d’orateur.trice.s invité.e.s, ces journées incluent des moments d’échanges via la présentation de travaux de recherche en cours. Les personnes souhaitant présenter leurs travaux sont invitées à soumettre un résumé étendu (limité à 2 pages). Les résumés retenus pour présentation seront publiés dans les actes des journées (et téléversés dans l’archive ouverte HAL). La possibilité de passer certains résumés dans un format long pour publication dans une revue scientifique est à l’étude.

Dates

Soumission des résumés :  15 octobre 2020
Notification aux auteurs :  7 novembre 2020
Soumission des versions finales : 1er décembre 2020
Journées scientifiques : 10-11 décembre 2020

Thématiques

Les communications pourront porter sur tous les thèmes de LIFT ainsi que sur les thèmes des deux sessions spéciales (Corpus arborés et syntaxe; Grammaire et Linguistique de terrain), incluant, de façon non limitative:

– Retours d’expérience concernant l’emploi et/ou le développement d’outils informatiques pour l’analyse linguistique
– Linguistique informatique et Science ouverte : perspectives ouvertes par le partage des données, des outils et des publications
– Modélisation informatique et linguistique formelle (théorie des langages formels, grammaires d’unification, théorie de la preuve…)
– Mise en dialogue des modèles linguistiques et des modèles d’apprentissage automatique (de tous types : approches génératives et discriminantes, approches statistiques neuronales, approches de type encodeurs-décodeurs…)
– Méthodes non supervisées ou faiblement supervisées pour l’analyse des langues peu dotées, peu écrites ou non documentées – Réflexions au sujet de l’automatisation des processus d’analyse et de validation

Toutes les propositions qui entrent dans les thèmes des journées d’étude sont les bienvenues. La présentation de travaux aboutis mais aussi de travaux en cours est possible. Les journées LIFT visent aussi bien à présenter des résultats qu’à susciter des discussions, notamment autour de travaux en cours pour lesquels les auteurs aimeraient développer des collaborations (par ex., expert en TAL souhaitent appliquer un outil sur des données langagières variées ; linguiste de terrain souhaitant automatiser une tâche d’annotation, etc.).

Format

En pratique, les résumés feront 2 pages maximum. Les soumissions devront être conformes aux lignes directrices officielles qui sont contenues dans les fichiers de style disponibles en ligne à l’adresse https://gdr-lift.loria.fr/wp-content/uploads/2020/10/LIFT_styles.zip et être en format PDF.  Les articles sélectionnés seront présentés sous forme de poster.

Les soumissions devront être déposées au moyen du service en ligne easychair, accessible à l’adresse : https://easychair.org/conferences/?conf=lift2020

Lieu

Aux vues de la situation sanitaire et des règles en vigueur, les journées se feront principalement en virtuel (une formule hybride avec des regroupements locaux permettant des rassemblements d’un nombre autorisés de personnes est à l’étude).

Conférencier.e.s invité.e.s (à confirmer)

  • Katja Aplonova
  • Lionel Clément
  • Annie Foret
  • Kim Gerdes
  • Aleksey Koshevoy (tutoriel)
  • Sylvain Loiseau
  • Aleksandra Miletic-Haddad

Comité d’organisation

Yannick Parmentier, LORIA/Université de Lorraine
Thierry Poibeau, LATTICE/CNRS
Emmanuel Schang, LLL/Université d’Orléans

Comité de programme

  • Angélique Amelot LPP/CNRS
  • Laurent Besacier LIG/Université Grenoble Alpes
  • Berthold Crysmann LLF/Université de Paris
  • Karën Fort LORIA/Université Paris Sorbonne
  • Claire Gardent LORIA/CNRS
  • Anaïs Lefeuvre-Halftermeyer LIFO/Université d’Orléans
  • Alexis Michaud LaCITO/INALCO
  • Tatiana Nikitina LLACAN/CNRS
  • Yannick Parmentier LORIA/Université de Lorraine
  • Thierry Poibeau LATTICE/ENS Paris
  • Emmanuel Schang LLL/Université de Lorraine
  • Valentin Vydrine LLACAN/INALCO
  • Guillaume Wisniewski LLF/Université de Paris
Publié dans appels, Événement, Non classé | Commentaires fermés sur Appel: Prochaines journees du GdR LIFT

Lancement de l’action Déméter

Suite à l’appel à actions paru en mars dernier, nous avons le plaisir de vous annoncer que la proposition d’action Déméter (DEs MÉTagrammaires au service de la linguistique de TERrain) portée par Chérifa Ben Khelil (Université d’Orléans), Mathilde Regnault (Université Paris-Sorbonne) et Simon Petitjean (Universität Düsseldorf), a été sélectionnée pour financement.

Cette action bénéficiera ainsi d’une dotation de 2000 EUR du GDR.

Pour plus d’information, une page de présentation de l’action est accessible ici.

Publié dans Événement | Commentaires fermés sur Lancement de l’action Déméter