QWAM CONTENT INTELLIGENCE Aproged – 9 Juin 2015
Les technologies liées à la gestion de contenus professionnels, levier de la transformation numérique
AGENDA DE LA SESSION
Les nouvelles tendances générales et technologiques liées à la gestion de contenus professionnels (textuels) • Gestion de flux numériques (textuels et multimédia)
• Enrichissement de contenus
• Moteur de recherche spécialisé
• Agrégation et extraction d’informations web
Présentation des solutions Qwam
Cas d’usage
QWAM CONTENT INTELLIGENCE
Tendances générales
ETAT DES LIEUX MULTIPLICATION DES FLUX NUMÉRIQUES Flux externes
Fournisseurs de contenus spécialisés
Flux RSS
Flux presse et média
Revues et journaux électroniques
Sites web
Moteurs web
Bases de données web
ETAT DES LIEUX MULTIPLICATION DES FLUX NUMÉRIQUES Flux internes
Flux et échanges partenaires
Systèmes éditoriaux
Publications internes (mktg, com, …)
CMS, GED diverses
Sites et flux intranet
Moteurs intranet Bases de données métier
TECHNOLOGIES LIÉES AUX CONTENUS Quatre familles de
problématiques dans les applications
- Gestion des flux textuels et
multimédia
- Enrichissement de contenus
- Moteur de recherche
- Agrégation et extraction d’informations web
GESTION DES FLUX TEXTUELS ET MULTIMÉDIA LES TENDANCES GÉNÉRALES
Flux multiples textuels/media hétérogènes en croissance • Applications internes
• Web
• Fournisseurs de contenus et d’applications (via le web)
Flux continu
Multimédia, multilingue
ENRICHISSEMENT DE CONTENUS LES TENDANCES GÉNÉRALES Transition de l’enrichissement manuel historique (via
GED) à l’enrichissement semi-automatique ou automatique • Concerne les éditeurs/fournisseurs de contenus et les
« grands » utilisateurs
Généralisation des technologies d’enrichissement de type sémantique ou autres
Contribution utilisateurs
MOTEUR DE RECHERCHE LES TENDANCES GÉNÉRALES
Les fonctions de recherche sont présentes dans de nombreuses applications web
La navigation à facettes se généralise
Les profils de recherche se multiplient
AGRÉGATION ET EXTRACTION D’INFORMATIONS WEB
LES TENDANCES GÉNÉRALES
Généralisation sur le web des flux RSS et assimilés
Multiplication des applications d’agrégation de flux • Applications autonomes (lecteur de flux)
• Au sein d’application métier
• « Tout le monde fait de la veille »
De nombreux fournisseurs de solutions professionnelles (veille, social média, etc.)
QWAM CONTENT INTELLIGENCE
Tendances technologiques
GESTION DES FLUX TEXTUELS ET MULTIMÉDIA LES TENDANCES TECHNOLOGIQUES
Flux multiples hétérogènes en croissance
GESTION DES FLUX TEXTUELS ET MULTIMÉDIA LES TENDANCES TECHNOLOGIQUES
Peu de solutions spécialisées sur la rationalisation des flux
Nécessité d’industrialisation Composants : • Repository • Annotateur/enrichissement • Moteur d’indexation • Séquenceur de tâches • GED • Workflow
ENRICHISSEMENT DE CONTENUS LES TENDANCES TECHNOLOGIQUES
• Annoter (enrichir de méta-données) les documents pour : Les rendre plus aisément manipulables
Les structurer
Les rassembler
Les lier
Les classer
Les contextualiser
ENRICHISSEMENT DE CONTENUS LES TENDANCES TECHNOLOGIQUES
• Annoter intelligemment : Utiliser au maximum ce qui vient des chaines éditoriales et de
production
Préserver les données déjà présentes : Edition, Auteur, Type d’article/document
Ne porter que sur des champs plein texte : Titre, Sous titre, Chapeau, Texte
ENRICHISSEMENT DE CONTENUS LES TENDANCES TECHNOLOGIQUES Jusqu’à présent surtout des solutions d’éditeurs de
logiciels (text mining)
Emergence de framework open source • Considéré comme une brique
• Effort de constitution de vocabulaire moins poussé
• Prix plus attractif
ENRICHISSEMENT DE CONTENUS LES TENDANCES TECHNOLOGIQUES
Produire des facettes pour plusieurs usages : • Aide à la lecture
• Raffinage (Drill down)
• Top 10
ENRICHISSEMENT DE CONTENUS LES TENDANCES TECHNOLOGIQUES
Produire des facettes pour plusieurs usages : • Graphiques camembert ou barres
• Analytics / Mining
• Geolocalisation
• Linked data
ENRICHISSEMENT DE CONTENUS LES TENDANCES TECHNOLOGIQUES
Les entités nommées : Personnes, organisations, lieux, événements
Les ontologies • Pour enrichir
• Pour classer
ENRICHISSEMENT DE CONTENUS LES TENDANCES TECHNOLOGIQUES
Les concepts : • Clustering décevant => Aller vers une méthode de N-grams
• Détection de thématiques émergentes
• Référentiel d’annotation : ex: E.I, Etat islamique, Daesh ?
• Agnostique et/ou supervisé
ENRICHISSEMENT DE CONTENUS LES TENDANCES TECHNOLOGIQUES
Le croisement avec l’ « usage » utilisateur • Moteur de recommandation
• Les plus consultés
• Documents liés
• Ce que dit le web
ENRICHISSEMENT DE CONTENUS LES TENDANCES TECHNOLOGIQUES
Le machine learning • Classement
• Screening
MOTEUR DE RECHERCHE LES TENDANCES TECHNOLOGIQUES
La brique de moteur d’indexation est disponible en open source
La différenciation se fait par les composants et fonctions périphériques
L’équation devient : • Moteur sémantique = Moteur booléen + annotation +
synonymes + lemmatisation
AGRÉGATION ET EXTRACTION D’INFORMATIONS WEB LES TENDANCES TECHNOLOGIQUES
Généralisation des flux RSS et assimilés • Un canal privilégié par les diffuseurs
• Dialogue machine-humain et machine-machine
• Un document garanti au bout
• Des méta-données de qualité
QWAM CONTENT INTELLIGENCE Qwam en bref :
- Création en 2006
- Entreprise spécialisée dans les solutions logicielles de veille,
recherche, gestion et diffusion de contenus électroniques
- Membre de Cap Digital «Pôle de compétitivité » des technologies
numériques
- 2 projets de R&D « Investissements d’Avenir » en cours
QUI SOMMES NOUS ?
Entreprise spécialisée dans les solutions logicielles de veille, recherche, gestion et diffusion de contenus électroniques
Plus de 150 clients utilisent les solutions Qwam
Projets R&D collaboratifs • Qwam s’est vu attribuer début 2013 un projet de R&D au titre
du Fonds de Soutien Numérique (FSN) « Investissements d’avenir »
• Début 2015, un nouveau projet de Qwam est retenu dans l’appel à projets «Big data» des « Investissements d’Avenir »
LES OFFRES QWAM Qwam Content Intelligence propose un ensemble d’offres et solutions logicielles autour de la gestion d’informations, des moteurs de recherche et de la veille
QES InfoMedia Suite : Plateformes d’agrégation, gestion, recherche et diffusion de flux et d’archives presse et media :
Gestion documentaire de flux numériques de tout type : presse et media (articles, dépêches, web, etc.) audio, vidéo, études, rapports, etc. ; module d’enrichissement sémantique et règles métier ; modules de qualification pour administrateurs et contribution des utilisateurs
Module de gestion des articles et retombées presse (QES PressReview) Module de gestion des informations web (QES WebMonitor) Portail et moteur de recherche et de navigation sur flux numériques presse, media et web
QES InfoMonitor & KM Suite : Plateformes de capitalisation, recherche, veille et gestion et diffusion d’information R&D/innovation, scientifique et technique et concurrentielle
Agrégation de tout type d’information scientifique et technique (brevets, articles IST, news spécialisées, etc.) et stratégique pour la R&D et l’innovation ; veille web avec Ask’n’Read
Module de recherche et surveillance de bases de données scientifiques (QES Biblio) Module de gestion des informations web (QES WebMonitor) Capitalisation et gestion d’informations externes et internes pour gestion des
connaissances Portail et moteur de recherche et de navigation sur bases de connaissances
LES OFFRES QWAM
Qwam Content Intelligence propose un ensemble d’offres et solutions logicielles autour de la gestion d’informations, des moteurs de recherche et de la veille
Ask'n'Read : Solutions de veille web en temps réel
Pour la veille en continu de toute l'information sur le web • Surveillance : médias web, actualités, communiqués de presse, sites d’entreprises et institutionnels, blogs,
forums, réseaux sociaux, sites de recrutement, annonces, etc. • Gestion et diffusion : sélection de l’information ; newsletters et listes de diffusion ; tableaux de bord
Modules complémentaires WebMonitor : • Base de connaissance, portails d’informations, solutions personnalisées
QES GED Suite : Organiser et gérer les ressources documentaires de l’entreprise Centraliser les documents produits par les collaborateurs (études, rapports, etc.), les
documents numérisés, etc. dans un espace unique quelque soit leur format (texte, PDF, image) Gérer simplement les documents via des référentiels métier (liste d’autorité, plan de
classement, etc.) et sémantiques dans un environnement sécurisé et organisé (workflow) Diffuser et partager : portail ergonomique avec interfaces et widgets personnalisés permettant
d’accéder aux documents suivant les profils utilisateur Moteur de recherche évolué (navigation à facettes) et navigation guidée dans bases
documentaires
QWAM CONTENT INTELLIGENCE
Les besoins clients en gestion, agrégation,
diffusion de flux
Les solutions Qwam
LES SOLUTIONS QWAM
Une solution de gestion des flux internes
Une solution de gestion des flux web
Une solution d’intégration des flux internes et flux web (contextualisation, intégration des contenus sur un même métier, etc.)
PRODUCTION INTERNE
QES
LE DATACENTER ASK’N’READ
LE DATACENTER ASK’N READ
INTÉGRATION FLUX INTERNES-EXTERNES CONTEXTUALISATION
INTÉGRATION FLUX INTERNES-EXTERNES QES + ASK’N’READ
CAS D’USAGE 1
- Gestion des flux textuels et multimédia pour
capitalisation, consultation et diffusion ;
moteur de recherche associé
CAS D’USAGE 1 FLUX INTERNES
CAS D’USAGE 2
- Enrichissement documentaire (règles
métier, sémantique) et génération automatique
de concepts et documents liés
CAS D’USAGE 2 AIDE À L’ANNOTATION SUR CHAINE ÉDITORIALE
CAS D’USAGE 3
- Agrégation de flux web contextuels autour de contenus éditoriaux ; création de services à valeur ajoutée autour
des contenus éditoriaux
CAS D’USAGE 3 FLUX INTERNES + FLUX WEB
CAS D’USAGE 4
- Extraction sélective de contenus web :
informations d’entreprise, informations sectorielles, flux d’actualités web en
temps réel, génération de leads, etc.
CAS D’USAGE 4 CONTENUS WEB CIBLÉS
CAS D’USAGE 5
- Flux de veille et d’information
scientifique et technique
CAS D’USAGE 5 FLUX WEB
NOUS CONTACTER INFORMATIONS COMPLÉMENTAIRES & DÉMONSTRATIONS EN LIGNE
Qwam Content Intelligence 22 rue Chauchat
75009 Paris
[email protected] Tel : 01.44.69.59.20
www.qwamci.com @qwamCI