27/11/2012Veille & Documentation
Le moteur de recherche : opportunité pour bâtir
une application documentaire
Retour d'expériencesur un corpus documentaire semi-
structuré
27/11/2012Veille & Documentation
Plan de la présentation
le contexteinstitution, corpus documentaire
le projetantécédents, autres usages du moteur
déroulement, interfaces développées
des focus• indexation/restitution• résultats• facettes• utilisation du thésaurus• typologie documentaire
27/11/2012Veille & Documentation
Rhône-Alpes : la région, la Région
La 2ème région de France par sa taille et sa population
Une collectivité territoriale, 2 assemblées : • Conseil régional (CR)• Conseil économique social environnemental régional (CESER)
Les compétences : emploi-formation, lycées, transports, développement économique…
Budget 2012 : 2,4 Mds €
L’administration : 6600 agents
27/11/2012Veille & Documentation
La délibération, document fondateur « Le Conseil régional règle par ses délibérations les affaires de
la région» (Art. L. 4221-1 Code Gén. Collectivités Territoriales)
Acte réglementaire, créateur de droits/obligations Résulte des discussions de l’assembléeExécutoire après publicationEffets perpétuels, tant qu’il n’est pas modifié ou abrogé
27/11/2012Veille & Documentation
Les documents liés aux délibérations
En amont des débats :- rapports préparatoires (directions),- comptes-rendus (commissions thématiques), - avis (CESER)- droit d’initiative, amendements, questions d’actualité, vœux
(groupes d’élus)
Pendant les débats :- procès-verbaux (assemblée plénière)- comptes-rendus (commission permanente)
En aval :- arrêtés (Président)
Produits à partir de modèles, qui harmonisent a minima leur forme et posent des règles de rédaction communes
27/11/2012Veille & Documentation
Les faiblesses de l’interface précédente
Application « Rapports et délibérations » sur l’Intranet (technologie Microsoft Index Server)
Un formulaire multicritères… très critiqué ! - sensible à la casse et l’accentuation - opérateurs obligatoires (ET, OU, SAUF, PRES)- résultats peu parlants- manuel d’utilisation et longues explications en ligne.
Des retours négatifs des usagers finaux, contraints de faire appel aux documentalistes pour trouver le bon document
Un mode de recherche présupposant que l’utilisateur « sait » : ce qu’il cherche précisément et comment l’exprimer
27/11/2012Veille & Documentation
formulaire
résultats
27/11/2012Veille & Documentation
Le moteur FAST à la Région Rhône-Alpes
acquis avec l’Intranet Sharepoint 2007
les usages :
- recherche globale sur les contenus Intranet,
- contextualisation d’informations,
- personnalisation d’affichages,
- mise à disposition de données.
27/11/2012Veille & Documentation
Développer un usage applicatif A la base : un processus et une ressource documentaire contraignants
Inenvisageable de construire une base de données documentaire, vu l’arriéré et les volumes (ex. Région Île-de-France : base Mariane sous CINDOC)
La décision : tirer parti de FAST dans une logique applicative
Quel intérêt ? Moteur pertinent pour des recherches plein texte, sur des contenus non structurés et de gros volumes de données
Quels objectifs ? permettre des recherches qualitatives, donner du sens au corpus
Comment ?Un travail conjoint du Service Veille & Documentation, de la DSI, des développeurs, en lien avec les services producteurs
27/11/2012Veille & Documentation
Le déroulement du projet
1. Étude de l’existantlocalisation documents, bilan de l’application
2. Analyse du besoinretour sur recherches effectuées par les documentalistes, détermination de questions-types
3. Réalisation du prototype à partir d’une V0 isofonctionnelleprocessus d’indexation réitéré de très nombreuses foisconstruction des facettes
4. Validation auprès des services producteurs/gestionnaires5. Publication sur l’Intranet, communication auprès des publics-
cibles6. Suites
déclinaison pour le site webévolutions internes (nouvelles commissions…)suivi des usages
27/11/2012Veille & Documentation
La nouvelle interface
Un nouvel intitulé : « Actes et débats »
Un unique champ de recherche « à la Google »
Une page de résultats efficace et intuitive
Des contraintes réduites en recherche : insensibilité à la casse, aux accents, aux pluriels ; gestion des mots vides ; opérateur ET par défaut; « expression » ; troncature *; exclusion -
Présentation des résultats fortement améliorée : ordre, cartouche sur mesure, résumé dynamique…
Des facettes pour préciser la recherche et naviguer dans les résultats proposés
27/11/2012Veille & Documentation
Deux applications : sur l’Intranet…
Une interface très complète :
- pour les agents et les élus- tous les documents liés à la vie des assemblées (soit 33 000 depuis 1997)- 7 facettes liées au contenant- 3 facettes liées au contenu
27/11/2012Veille & Documentation
… et sur le site web Région
Une interface allégée - pour le « grand public » - 2 entrées : CR, CESER - seulement les documents communicables (17600) - 3 facettes : date, géographie, thème - requête pré-câblée sur les dernières décisions
27/11/2012Veille & Documentation
Focus 1 : indexation et restitution
Processus d’indexation commun
La source : un répertoire informatique où sont déposés les fichiers correspondant aux documents produits par les deux assemblées (CR et CESER)
Fast indexe les fichiers .html, mais affiche les documents .pdf
Recherche Intranet : le pdf affiché est stocké sur serveur interne
Recherche sur le site web : le pdf affiché est stocké sur un serveur externe, ne contenant que les documents communicables
Arborescence identique :- pour les documents PDF et HTML,- sur les serveur interne ou externe.
27/11/2012Veille & Documentation
Focus 2 : les résultats
Ordre déterminé en combinant plusieurs critères : - pertinence du document, - valeur juridique, - fraîcheur.
Pondération : chaque résultat se voit attribuer un rang défini parun score dynamique présence du mot dans le titre, le numéro du document, le corps du texte …et statique boost en fonction de la valeur juridique, du + au moins contraignant
Modulé en fonction de la fraîcheur du document
Un cartouche de résultats dynamique et parlantSource de rebonds : vers le document PDF + documents liés
27/11/2012Veille & Documentation
Le cartouche, le document PDF
27/11/2012Veille & Documentation
Focus 3 : les facettes
Retenues à partir des besoins et pratiques
Typologie : - contenant : type de document, date, mandature, assemblée et
commission concernées, réunion - contenu : vocabulaire métier, territoires, relations entre
documents
Construction: structure du document, propriétés, texte
Les sources principales : - le chemin informatique d’accès au document (URL) ; - le texte intégral du document ; - les métadonnées portées par le document ; - le thésaurus interne.
27/11/2012Veille & Documentation
Champ de recherche
Résultats de rechercheFacettes
« contenant »Facettes
« contenu »
27/11/2012Veille & Documentation
27/11/2012Veille & Documentation
Focus 4 : le recours au thésaurus
Appel au thésaurus interne VOCOM, en l’absence d’indexation
Vocabulaire métier sur mesure (mots-clés, politiques régionales, territoires, organismes partenaires…)
Utilisé pour les facettes DISPOSITIFS et GEOGRAPHIE
Extraction des descripteurs dans le texte des documents
Listes normalisées : mandatures, commissions thématiques
27/11/2012Veille & Documentation
- facette issue de la liste des ACTIONS REGION (VOCOM)
- liste ouverte par défaut sur 5 items
- classement / occurences
- facette issue de l’INDEX GEOGRAPHIQUE (VOCOM) : extrait de la branche Rhône-Alpes
- fermée par défaut
- une taxonomie
Exemple de recherche : entreprise + 2012
27/11/2012Veille & Documentation
Focus 5 : typologie de délibérations
répondre aux les besoins métiers
en l’absence de règles d’écriture, identification d’habitudes et de choix rédactionnels
construction de règles de gestion
plusieurs clés : titres, récurrence de certains mots, commission responsable…
27/11/2012Veille & Documentation
Délibération budgétaireDOB, budget primitif, décision modificative, compte de gestion, compte administratif, taux de fiscalité (directe / indirecte), TIPP, attribution de subvention, caducité des subventions et dépenses similaires, programme prévisionnel des investissementsCommission Finances + présence dans le titre des termes suivants
BUDGET* PRIMITIF*; COMPTE DE GESTION ; COMPTE* ADMINISTRATIF* ; TIPP ; TARIF* FISCALITE*; DECISION* BUDGETAIRE* MODIFICATIVE* ; DECISION* MODIFICATIVE* EXERCICE* ; ORIENTATION* BUDGET*EXONÉRATION* TAXE PROFESSIONNELLE ; EXONÉRATION* COTISATION* VALEUR AJOUTÉE ; RÈGLEMENT BUDGÉTAIRE FINANCIER ; DISPOSITION* BUDGETAIRE* ; DISPOSITION* FINANCIERE* ; PROGRAMME PRÉVISIONNEL INVESTISSEMENT* ; MODELE* CONVENTION* ATTRIBUTIVE* SUBVENTION* ; CADUCITE* SUBVENTION* ; DEPENSE* SUBVENTIONNABLE*
Délibération cadre (création/révision d’une politique régionale)Plan régional en faveur de…Politique régionale…Plan de mandat…Schéma régional…Plan…Plan de soutien…Plan cadre…Stratégie régionale…Modalités d’intervention…Présence dans le titre des termes suivants :
PLAN REGIONAL EN FAVEUR DEPLAN POUR LE DEVELOPPEMENTPLAN REGIONAL POURPLAN REGIONAL DE DEVELOPPEMENTPLAN REGIONAL D’AIDEPLAN REGIONAL DESPOLITIQUE* REGIONALE*PLAN* MANDAT*SCHEMA* REGIONA*PLAN TRIENNALPLAN ROUTIERPLAN* ENERGIE*PLAN* D'ACCES*PLAN* MODERNISATION*PLAN* CAMPUS*PLAN* SAISONNIER*PLAN* SAISONNALITE* TOURISME*PLAN* DEPLACEMENT* URBAIN*PLAN* PREVENTION*PLAN* SOUTIEN*DELIBERATION* CADRE*PLAN* CADRE*STRATEGIE* REGIONALE*STRATEGIES EUROPEENESMODALITE* D’INTERVENTION* PRINCIPE* D'INTERVENTION* MODALITE* MISE ŒUVRE*MODALITE* D'APPLICATION*