|
Projets en cours
Projets ANR
-
Projet DynamO - ANR-07-TLOG-004 (2008-2010) : Dynamic Ontologies
Responsable : J. Thomas (ACTIA) - Partenaires : ACTIA, ARTAL , LaLIC (Univ. Paris 4), IRIT éq. IC3, SIG-EVI et SMAC, Préhistoire et Technologie (Paris X).
Objectifs : définir une méthode et des outils pour améliorer la recherche d’information et la satisfaction des utilisateurs en prenant en compte l’évolution des collections documentaires consultées. L’objectif est de définir une recherche d’information basée sur une approche sémantique, s’appuyant sur une ontologie, et d’assurer la maintenance de cette ontologie en fonction de l’évolution des connaissances et de la terminologie du domaine, ou des besoins des utilisateurs.
L’équipe IC3 contribue à la définition du processus de maintenance d’ontologie à partir de textes selon deux approches : à l’aide de traitement automatique des langues et à l’aide d’un système mulit-agents, ainsi qu’à la définition d’une représentation de l’ontologie adaptée pour intégrer des termes.
-
Projet Corpus Logicistes - ANR-07-CORP-006 (2008-2010)
Corpus logicistes en arhéologie des techniques
Responsable : V. Roux (« préhistoire et technologies » , MAE Nanterre)
Partenaires : laboratoires « préhistoire et technologies » de Paris X, Editions Epistèmes
Le projet a trois objectifs au service de la cumulativité des connaissances dans les sciences humaines : (1) développer des méthodes et outils permettant la constitution de corpus dits "logicistes", composés de documents structurés en données et règles d’interprétation ; (2) constituer, sur ce modèle, des corpus en tracéologie, un domaine d’excellence en Europe ; (3) développer un outil d’annotation automatique basé sur une ontologie qui permettra d’effectuer sur les corpus logicistes des requêtes tant sur les règles d’interprétation que sur les données.
L’équipe IC3 intervient sur ce dernier point : construire l’ontologie, définir un outil d’annotation sémantique et proposer un système de recherche d’information dans les collections du site Arkeotek.
-
Projet GeoOnto - ANR-07-MDCO-005 (2008 - 2010)
Constitution, alignement, comparaison et exploitation d’ontologies géographiques hétérogènes
Responsable : Chantal Reynaud, LRI - Partenaires : LRI eq. IASI/gemo (Univ. Paris Sud), IRIT eq. IC3 (Toulouse 3), LIUPPA eq. DESI (Univ. de Pau) et CoGIT (IGN).
Ce projet vise l’interopérabilité de données géographiques hétérogènes via deux objectifs applicatifs : (1) l’intégration de bases de données géographiques hétérogènes, par la mise en correspondance de leurs schémas ; (2) l’interrogation d’une collection de documents textuels complémentaires. Le projet consistera donc à (lot 1) construire des ontologies associées à des bases de données par exploitation du texte de leurs spécifications, ou d’un corpus de documents géographiques ; (lot 2) aligner les ontologies obtenues et étudier leurs différences ; (lot 3) utiliser ces ontologies pour apparier les schémas des bases de données, et pour développer un moteur de recherche d’information dans les documents et les données.
L’IRIT intervient lors de la construction de l’ontologie à partir des textes de spécification, pour l’extraction des relations sémantiques en particulier ; lors de la définition du moteur de recherche d’information s’appuyant sur une ontologie et exploitant les bases de données et les textes.
-
Projet DAFOE4App - ANR-06-TLOG-010 (2007-2009)
Differential and formal ontology editor
Responsable : J. Charlet (INSERM) - Partenaires : INSERM UMR_S 872 équipe 20 (Paris 6/Paris 5), ENST/GET (Paris), IRIT (Toulouse 3), LIPN (Paris 13), LISI (Poitier), Mondeca (Paris), Supelec (Saclay), UTC (Compiègne)
L’objectif du projet est de proposer une méthode complète associée à une plateforme technique pour concevoir des ontologies, de la modélisation à partir du domaine à leur évolution en passant par leur formalisation et exploitation. Le projet mettra en valeur les approches partant d’analyse de textes par des outils de traitement automatique des langues.
Notre intervention dans ce projet concerne : la gestion du lot 1 (analyse des besoins), contribution à la spécification du modèle de données pour la représentation d’éléments terminologiques associés à une ontologie, contribution à la spécification des outils relatifs à l’extraction et à la représentation de relations sémantiques.
-
WEBCONTENT - ANR-05-TLOG- (2006-2009)
Plateforme de gestion de contenus pour le Web sémantique
Partenaires : CEA, INRIA-GEMO/LRI, LIG, EADS DS, Thalès Reasearch, Soredab, NewPhenix, INRA, ADRIA, LIP6, Exalead, Prism, INRIA-InSitu, INRIA-Mostrare, INRIA-Exmo, LIMSI, PSY.CO,
L’objectif de WebContent est de produire une plate-forme flexible et générique pour la gestion de contenus et l’intégration des technologies du Web Sémantique dans le but de montrer leur utilité sur des applications réelles à fort impact économique ou sociétal.
La plate-forme vise initiallement un groupe d’applications autour de la veille technologique.
l’équipe IC3 intervient pour définir un système de recherche d’information dans des corpus produits par la veille économique, en s’appuyant sur des ontologies et des annotations sémantiques représentés sous forme de graphes conceptuels.
Autres financements
- Projet CNES - R&T - 2006-2007
Responsable : B. Rothenburger (IC3)
Partenaires : laboratoires CLLE-ERSS et LSP (laboratoire de Statistiques et de Probabilités de l’IMT).
Objectifs : Définir des outils pour anticiper les problèmes liés à l’évolution des connaissances dans le temps et à leur pérennité. Une étude, menée par CLLE-ERSS, porte sur l’identification linguistique d’éléments d’expression du risque dans des documents. L’étude menée par l’IRIT porte sur l’accès, par des communautés scientifiques, des données scientifiques déposées par d’autres communautés scientifiques sur le web. L’application porte sur les données d’astronomie déposées sur des sites web appelés « observatoires virtuels ». L’identification des communautés s’appuie sur deux études statistiques visant à identifier des classes à partir des liens entre sites web et à partir des références bibliographiques. Une ontologie va être utilisée pour vérifier la compréhension des données d’un observatoire virtuel par différentes communautés scientifiques.
-
Projet OntoTextes « Ontologies et textes » - Financement BQR-UPS (2007)
Modélisation de connaissances pour la gestion documentaire.
Partenaires : 3 équipes de l’IRIT / SIG-EVI, SMAC et IC3
Objectifs : faciliter le partage de travaux des 3 équipes matière de construction et de maintenance d’ontologies à partir de textes et de thésaurus, ainsi que de leur utilisation pour l’annotation de documents et la navigation au sein de collections documentaires.
-
Autodiag - Projet MODE (2004 - 2008). Ontologies et annotations sémantiques pour le diagnostic des calculateurs électroniques de voitures.
Partenaires : ACTIA (Toulouse), LAAS (CNRS, Toulouse)
Le projet, mené au sein du laboratoire AUTODIAG, porte sur la mise au point d’un système de diagnostic des calculateurs électroniques de voitures, basé sur une approche multi-modèle et multi-raisonnement.
Notre intervention a consisté à définir et développer un système de recherche d’information qui simplifie la saisie des descriptions de pannes et oriente rapidement l’utilisateur vers une fiche de diagnostic adaptée lorsqu’elle existe, ou si non, vers le mode de résolution le plus pertinent. Ce module d’appuie sur une ontologie du domaine qui permet de représenter les fiches par un index sémantique. Ce travail est réalisé dans le cadre de la thèse CIFRE d’Axel Reymonet, soutenue en septembre 2008.
Les équipes de l’irit dans Autodiag : ici.
- TATCG : Traitement Automatique de Textes pour le Ciblage de Gènes.
Partenaire : INSERM - U563 Purpan.
Le séquençage du génome humain permet aujourd’hui de connaître la localisation précise des gènes sur les chromosomes. Par ailleurs, les études de l’ADN de personnes atteintes de maladies héréditaires ou à prédispositions génétiques visent à déterminer les régions chromosomiques affectées dans ces syndromes (anomalies ou que l’on détecte à l’aide de marqueurs moléculaires). Notre étude a pour objectif de corréler ces deux types d’information. Actuellement, ces observations ne sont décrites que sous une forme textuelle (articles scientifiques publiés sous PubMed), et sont difficilement accessibles. L’outil informatique que nous souhaitons réaliser doit extraire automatiquement les conditions expérimentales et les résultats décrits (en identifiant les concepts et les relations entre concepts) dans ces articles afin de constituer une base d’annotations. Ces annotations alors exploitables, pourront être recoupées avec les informations d’autres bases de données du domaine (NCBI, ENSEMBL, ...), permettant de proposer une liste de gènes candidats localisés dans ces régions.
- IAPA : Infrastructure d’Accès, de Partage et d’Analyse de données biomédicales
Partenaire : Claudius Régaud (INSERM)
Ce projet s’inscrit dans la réflexion des laboratoires IRIT et ICR et de leurs partenaires économiques IBM et CS, dans le cadre du pôle de compétitivité « Cancer-Bio-Santé » du futur Cancéropole de Toulouse. La pratique médicale génère une masse grandissante d’informations diverses (textes, images, vidéo, tableaux), structurées ou non, brutes ou résultantes d’un processus d’analyse, archivées sur des systèmes dédiés ou non. La combinaison de ces informations s’avère cependant très utile dans divers champs d’exercice de la médecine. Le projet se propose de créer une infrastructure d’accès, de partage et d’analyse en corrélation de données bio-médicales.
Notre contribution concernera l’élaboration d’un référentiel pour la description des données, la description et l’annotation sémantique des données, la modélisation de recherche de données
- CORINTHE (COnception et Réalisation d’un système de veille stratégique à partir d’Informations THEmatiques d’un secteur économique) - Financement région Midi-Pyrénées
Partenaires : laboratoire d’Etudes et de Recherches sur l’Economie, les Politiques, et les Systèmes Sociaux (LEREPS), CLLE-ERSS et IRIT-IC3
vise à la conception et au développement d’un système de veille stratégique pour un secteur d’activité défini au préalable. Le système est élaboré à partir d’une méthode centrée sur la notion de points de vue. Il s’appuie sur des techniques de fouille d’informations à partir de sources électroniques hétérogènes. Il utilisera la base de données SISIFE du LEREPS concernant la veille stratégique du secteur économique de l’Energie en Europe. Le résultat de ce projet doit être un système transposable à d’autres secteurs d’activité qui soit capable de :
expliciter les points de vue cohérents pour tous les acteurs impliqués dans l’exploitation ou l’usage des données de SISIFE ;
d’assister l’alimentation de la base à partir de sources de données hétérogènes identifiées ;
d’assister la production automatique de rapports de veille stratégique adaptés aux exigences des acteurs concernés.
- Référence, pertinence, concernance : contribution à l’approche multidisciplinaire des usages folksonomiques de l’indexation dans le web 2.0 -
Financement : APR PRES Université de Toulouse 2008.
Partenaires : CLLE, IRIT et Laboratoire Jacques Lordat
L’objectif scientifique du projet est de caractériser les nouveaux usages entrainés par l’émergence du Web 2.0 tels que les usages folksonomiques des descripteurs de documents et leurs conséquences sur la recherche d’informations en utilisant les concepts de concernance (ce sur quoi porte le document, aboutness en anglais), de référence et de pertinence.
Présentation détaillée.
- SamProdhys : Conception d’un outil d’aide la décision pour le conception des systèmes dynamiques hybrides en génie des procédés
Financement : BQR Intersite 2006.
À lire dans la même rubrique :
Revenir à la rubrique Projets en cours
|