|
Problématique
Les activités de l’équipe de recherche en Informatique Linguistique (ILPL) se concentrent autour du traitement automatique de la langue française écrite. De manière très
générale, notre approche associe langue et raisonnement, aux niveaux formels
et applicatifs.
Nos travaux sont organisés selon deux axes :
- un travail sur les notions de sens
et de polysémie, concrétisés par le développement de ressources linguistiques liées
aux formes prédicatives (verbes et prépositions), et
- les modèles et applications
en langue et raisonnement pour l’accès intelligent aux bases de données, aux textes
et au Web (systèmes de question-réponses coopératives, résumé automatique, grammaires génératives pour le texte et extraction de connaissances).
Notre activité en sémantique lexicale est une analyse approfondie de la syntaxe et
de la sémantique lexicale des formes prédicatives et leur modélisation dans une dynamique générative du langage.
Ces travaux permettent une extraction de connaissances plus avancée des textes,
prenant en compte les actions (prédicats) et leurs participants (arguments).
La dimension générative modélise l’émergence d’usages non-standards, reflets
de la créativité et de la dynamique du langage, propres à chaque locuteur. Les axes principaux de notre recherche sur les ressources linguistiques s’articulent autour de :
La modélisation de connaissances linguistiques
- En syntaxe et en sémantique lexicale (représentations en structure lexicale conceptuelle, traitement de la compositionalité, sous-détermination).
- L’analyse de la variation du sens, les modèles formels pour la polysémie et les métaphores, le lexique génératif et ses évolutions.
- Le développement de ressources linguistiques pour le traitement du langage naturel :
structures syntaxique et conceptuelle des verbes (projet VOLEM) et des prépositions
(projet PrepNet).
- La programmation logique (contraintes, modélisation,
stratégies d’analyse et
de génération pour le traitement du langage naturel).
Langue et raisonnements pour les applications intelligentes sur le Web
- Extraction de connaissances dans les pages Web, organisée autour des formes
prédicatives. Production dynamique de représentations (frames + logique) à partir
de l’ontologie du domaine aux noeuds de laquelle sont associées des grammaires
locales.
- Dans le cadre d’un accès intelligent au Web, développement de réponses coopératives : analyse de fausses présuppositions, de termes flous, questions par l’exemple,
etc. Dans les questions : développement d’un savoir-faire coopératif incluant
des techniques de réponses relaxées, intentionnelles, conditionnelles et narratives
(projet WebCoop).
- Développement d’autres types de question-réponses, toujours dans un cadre coopératif : les questions en Comment ? appliquées aux textes procéduraux et l’intégration
de données lorsque l’on obtient à partir du Web des réponses avec contradictions.
Travaux en grammaire générative pour les textes procéduraux en vue d’améliorer
l’extraction de réponses.
- Analyse plus formelle des notions d’explicitation des connaissances, d’explication
et d’argumentation dans les réponses coopératives : modèles d’interprétation
(par exemple des implicatures conversationnelles), pragmatique de la coopérativité,
connecteurs et templates associés.
- Résumé automatique de pages Web produit à partir d’une requête sous forme
de mots-clés (projet WebSum). L’objectif est de produire un résumé en langue naturelle organisé selon l’ontologie du domaine au lieu des liens produits par les moteurs
classiques. Nous étudions des modes de résumés allant d’une simple organisation
ontologique des liens à du langage naturel.
- Génération de langue naturelle associée aux projets ci-dessus, avec un accent
particulier sur la lexicalisation, l’agrégation et l’introduction d’hyper-liens comme
mode d’expression du discours.
Les ressources développées en syntaxe et sémantique lexicale sont utilisées de façon
intensive pour les projets en langue et raisonnement. Ce que nous développons se veut
à la fois approfondi sur le plan de la langue et opérationnel dans des applications.
Revenir à la rubrique Equipe ILPL
|