guirlande-fr
DESCRIPTION
Guirlande-fr. Gestion et Usages Informatiques des Ressources Langagières pour la Diffusion et l’Étude du Français. Objectifs généraux. Mise en place d’une grille de serveurs fédérant des ressources linguistiques et des outils de traitement sur celles-ci. - PowerPoint PPT PresentationTRANSCRIPT
Guirlande-fr
Gestion et Usages Informatiques des Ressources Langagières pour la Diffusion
et l’Étude du Français
Objectifs généraux
Mise en place d’une grille de serveurs fédérant des ressources linguistiques et des outils de traitement sur celles-ci. Accent mis sur les contenus et le usages
Définir une plate-forme normalisée permettant à d’autres équipes, à terme, d’intégrer des ressources et des outils Reproductibilité des choix techniques
Equipes
Infrastructure informatique Loria/LetD
Plate-forme d’ingénierie linguistique Loria/Résédas
Convergence vers le concept ASP (Application Service Provider)
Ressources et utilisateurs ATILF
Apport d’outils d’accès et de ressources de références (Frantext, TLFi)
ILF Apports d’une variété de ressources et d’usages
Quelles ressources ?
Ressources textuelles Prose, théatre, poésie, textes divers (e.g. discours
politiques) Faiblement structurées (divisions, paragraphes,
annotation de surface) Ressources lexicales
Dictionnaires, terminologies, lexique, lexiques d’auteurs
Fortement structurées
Quels outils ?
Identification des ressources disponibles Extraction de sous-corpus ou de sections pertinentes
(requêtes sur documents semi-structurés) Outils basiques de traitement
Étiquetage morpho-syntaxique (WinBrill, Xerox) Analyse syntaxique locale (TAG, Xerox)
Outils de visualisation Browser spécifiques Poste local de visualisation et d’annotation
Principes généraux
Maintien des ressources primaires sur les sites de gestion Maintien de la cohérence éditoriale
Distribution des traitements sur des services en ligne Problème de base: fractionnement raisonné des données
en fonction des traitements E.g. annotation morpho-syntaxique au niveau de la phrase E.g. accès aux dictionnaires par entrée etc.
Infrastructure commune à une palette de cas d’usage Transparence vis-à vis des utilisateurs
Principes généraux (suite)
Mise en place d’un réseau combinant l’expérience acquise dans MLIS/Elan et les concepts d’ASP : MLIS/Elan : Fonctions de distributeur de requêtes,
de gestionnaire de ressources et de gestion du réseau
GASP (RNTL) : GASP/Client, GASP/Serveur, GASP/Agent
Contexte de normalisation
W3C (World Wide Web Consortium) XML : base de représentation des données dans Guirlande-
FR SOAP : Syntaxe XML pour du RPC (exit Corba?)
TEI (Text Encoding Initiative) En-têtes pour l’identification des ressources Codage fin du contenu des ressources
ISO TC37/SC4 (Ressources Linguistiques) Utilisation et test des propositions de représentation
d’information linguistiques plus fines (annotations ou résultat de calculs)
Agenda du projet
Interfaces outils (Spec.)
Validation sur un échantillon d’outils
Outils de visualisation (et itération avec les besoins utilisateurs)
Déploiement d’un réseau
expérimentalTest utilisateursMigration vers les concepts d’ASP
Définition d’une charte de
compatibilité
Mise en conformité d’un ensemble significatif de ressource et intégration dans l’architecture
Services
Réseau
Ressources
T03 T12
T06
T06
T18 T24
T24
T24
Workshop techniques
Workshop de définition des besoins utilisateurs Organisation: ATILF Implication des laboratoires de l’ILF
Workshop sur la mise en réseau d’outils et de ressources linguistiques Implication des principaux acteurs européens en la matière
(Sissa, Gate, MPI, DFKI, Arc RLT, Berlin) Workshop technique sur SOAP
Ouvert aux équipes du Loria (Cf. autres ACI Grid/CCH, Maia, Parole etc.
Tutoriel + discussion sur les architectures possibles
Validation de l’approcheGuirlande-fr
Mise en œuvre de deux scénarios de référence Retour d’expérience de la part de l’ILF
Simplicité d’intégration de nouvelles ressources ou de nouveaux outils
Concertation avec les autres initiatives internationales
Site Web http://www.loria.fr/projets/Guirlande