IRIT - UMR 5505

- Version texte -
Accueil Annuaire Intranet English
  Bandeau IRIT
    Accueil > Français > Thèmes de recherche > Thème 4 - Raisonnement et décision > Equipe ILPL > Problématique

 

 Problématique

 

Les activités de l’équipe de recherche en Informatique Linguistique (ILPL) se concentrent autour du traitement automatique de la langue française écrite. De manière très générale, notre approche associe langue et raisonnement, aux niveaux formels et applicatifs.

Nos travaux sont organisés selon deux axes :

  • un travail sur les notions de sens et de polysémie, concrétisés par le développement de ressources linguistiques liées aux formes prédicatives (verbes et prépositions), et
  • les modèles et applications en langue et raisonnement pour l’accès intelligent aux bases de données, aux textes et au Web (systèmes de question-réponses coopératives, résumé automatique, grammaires génératives pour le texte et extraction de connaissances).

Notre activité en sémantique lexicale est une analyse approfondie de la syntaxe et de la sémantique lexicale des formes prédicatives et leur modélisation dans une dynamique générative du langage.

Ces travaux permettent une extraction de connaissances plus avancée des textes, prenant en compte les actions (prédicats) et leurs participants (arguments). La dimension générative modélise l’émergence d’usages non-standards, reflets de la créativité et de la dynamique du langage, propres à chaque locuteur. Les axes principaux de notre recherche sur les ressources linguistiques s’articulent autour de :

 

La modélisation de connaissances linguistiques

  • En syntaxe et en sémantique lexicale (représentations en structure lexicale conceptuelle, traitement de la compositionalité, sous-détermination).
  • L’analyse de la variation du sens, les modèles formels pour la polysémie et les métaphores, le lexique génératif et ses évolutions.
  • Le développement de ressources linguistiques pour le traitement du langage naturel : structures syntaxique et conceptuelle des verbes (projet VOLEM) et des prépositions (projet PrepNet).
  • La programmation logique (contraintes, modélisation, stratégies d’analyse et de génération pour le traitement du langage naturel).

 

Langue et raisonnements pour les applications intelligentes sur le Web

  • Extraction de connaissances dans les pages Web, organisée autour des formes prédicatives. Production dynamique de représentations (frames + logique) à partir de l’ontologie du domaine aux noeuds de laquelle sont associées des grammaires locales.
  • Dans le cadre d’un accès intelligent au Web, développement de réponses coopératives : analyse de fausses présuppositions, de termes flous, questions par l’exemple, etc. Dans les questions : développement d’un savoir-faire coopératif incluant des techniques de réponses relaxées, intentionnelles, conditionnelles et narratives (projet WebCoop).
  • Développement d’autres types de question-réponses, toujours dans un cadre coopératif : les questions en Comment ? appliquées aux textes procéduraux et l’intégration de données lorsque l’on obtient à partir du Web des réponses avec contradictions. Travaux en grammaire générative pour les textes procéduraux en vue d’améliorer l’extraction de réponses.
  • Analyse plus formelle des notions d’explicitation des connaissances, d’explication et d’argumentation dans les réponses coopératives : modèles d’interprétation (par exemple des implicatures conversationnelles), pragmatique de la coopérativité, connecteurs et templates associés.
  • Résumé automatique de pages Web produit à partir d’une requête sous forme de mots-clés (projet WebSum). L’objectif est de produire un résumé en langue naturelle organisé selon l’ontologie du domaine au lieu des liens produits par les moteurs classiques. Nous étudions des modes de résumés allant d’une simple organisation ontologique des liens à du langage naturel.
  • Génération de langue naturelle associée aux projets ci-dessus, avec un accent particulier sur la lexicalisation, l’agrégation et l’introduction d’hyper-liens comme mode d’expression du discours.

Les ressources développées en syntaxe et sémantique lexicale sont utilisées de façon intensive pour les projets en langue et raisonnement. Ce que nous développons se veut à la fois approfondi sur le plan de la langue et opérationnel dans des applications.

 

 

 

 Revenir à la rubrique Equipe ILPL

 

 

CNRS
INPT
UPS
UT1

UTM

  Rechercher

 
Accueil Imprimer Contact mail Plan du site Crédits Fil RSS du site Thème 1 Thème 2 Thème 3 Thème 4 Thème 5 Thème 6 Thème 5 Thème 1 Thème 2 Thème 3 Thème 4 Thème 5 Thème 6 Thème 5