guirlande-fr

11
Guirlande-fr Gestion et Usages Informatiques des Ressources Langagières pour la Diffusion et l’Étude du Français

Upload: brac

Post on 12-Jan-2016

27 views

Category:

Documents


0 download

DESCRIPTION

Guirlande-fr. Gestion et Usages Informatiques des Ressources Langagières pour la Diffusion et l’Étude du Français. Objectifs généraux. Mise en place d’une grille de serveurs fédérant des ressources linguistiques et des outils de traitement sur celles-ci. - PowerPoint PPT Presentation

TRANSCRIPT

Page 1: Guirlande-fr

Guirlande-fr

Gestion et Usages Informatiques des Ressources Langagières pour la Diffusion

et l’Étude du Français

Page 2: Guirlande-fr

Objectifs généraux

Mise en place d’une grille de serveurs fédérant des ressources linguistiques et des outils de traitement sur celles-ci. Accent mis sur les contenus et le usages

Définir une plate-forme normalisée permettant à d’autres équipes, à terme, d’intégrer des ressources et des outils Reproductibilité des choix techniques

Page 3: Guirlande-fr

Equipes

Infrastructure informatique Loria/LetD

Plate-forme d’ingénierie linguistique Loria/Résédas

Convergence vers le concept ASP (Application Service Provider)

Ressources et utilisateurs ATILF

Apport d’outils d’accès et de ressources de références (Frantext, TLFi)

ILF Apports d’une variété de ressources et d’usages

Page 4: Guirlande-fr

Quelles ressources ?

Ressources textuelles Prose, théatre, poésie, textes divers (e.g. discours

politiques) Faiblement structurées (divisions, paragraphes,

annotation de surface) Ressources lexicales

Dictionnaires, terminologies, lexique, lexiques d’auteurs

Fortement structurées

Page 5: Guirlande-fr

Quels outils ?

Identification des ressources disponibles Extraction de sous-corpus ou de sections pertinentes

(requêtes sur documents semi-structurés) Outils basiques de traitement

Étiquetage morpho-syntaxique (WinBrill, Xerox) Analyse syntaxique locale (TAG, Xerox)

Outils de visualisation Browser spécifiques Poste local de visualisation et d’annotation

Page 6: Guirlande-fr

Principes généraux

Maintien des ressources primaires sur les sites de gestion Maintien de la cohérence éditoriale

Distribution des traitements sur des services en ligne Problème de base: fractionnement raisonné des données

en fonction des traitements E.g. annotation morpho-syntaxique au niveau de la phrase E.g. accès aux dictionnaires par entrée etc.

Infrastructure commune à une palette de cas d’usage Transparence vis-à vis des utilisateurs

Page 7: Guirlande-fr

Principes généraux (suite)

Mise en place d’un réseau combinant l’expérience acquise dans MLIS/Elan et les concepts d’ASP : MLIS/Elan : Fonctions de distributeur de requêtes,

de gestionnaire de ressources et de gestion du réseau

GASP (RNTL) : GASP/Client, GASP/Serveur, GASP/Agent

Page 8: Guirlande-fr

Contexte de normalisation

W3C (World Wide Web Consortium) XML : base de représentation des données dans Guirlande-

FR SOAP : Syntaxe XML pour du RPC (exit Corba?)

TEI (Text Encoding Initiative) En-têtes pour l’identification des ressources Codage fin du contenu des ressources

ISO TC37/SC4 (Ressources Linguistiques) Utilisation et test des propositions de représentation

d’information linguistiques plus fines (annotations ou résultat de calculs)

Page 9: Guirlande-fr

Agenda du projet

Interfaces outils (Spec.)

Validation sur un échantillon d’outils

Outils de visualisation (et itération avec les besoins utilisateurs)

Déploiement d’un réseau

expérimentalTest utilisateursMigration vers les concepts d’ASP

Définition d’une charte de

compatibilité

Mise en conformité d’un ensemble significatif de ressource et intégration dans l’architecture

Services

Réseau

Ressources

T03 T12

T06

T06

T18 T24

T24

T24

Page 10: Guirlande-fr

Workshop techniques

Workshop de définition des besoins utilisateurs Organisation: ATILF Implication des laboratoires de l’ILF

Workshop sur la mise en réseau d’outils et de ressources linguistiques Implication des principaux acteurs européens en la matière

(Sissa, Gate, MPI, DFKI, Arc RLT, Berlin) Workshop technique sur SOAP

Ouvert aux équipes du Loria (Cf. autres ACI Grid/CCH, Maia, Parole etc.

Tutoriel + discussion sur les architectures possibles

Page 11: Guirlande-fr

Validation de l’approcheGuirlande-fr

Mise en œuvre de deux scénarios de référence Retour d’expérience de la part de l’ILF

Simplicité d’intégration de nouvelles ressources ou de nouveaux outils

Concertation avec les autres initiatives internationales

Site Web http://www.loria.fr/projets/Guirlande