les technologies liées à la gestion de contenus professionnels, levier de la transformation...

Post on 27-Jul-2015

191 Views

Category:

Data & Analytics

1 Downloads

Preview:

Click to see full reader

TRANSCRIPT

QWAM CONTENT INTELLIGENCE Aproged – 9 Juin 2015

Les technologies liées à la gestion de contenus professionnels, levier de la transformation numérique

AGENDA DE LA SESSION

Les nouvelles tendances générales et technologiques liées à la gestion de contenus professionnels (textuels) • Gestion de flux numériques (textuels et multimédia)

• Enrichissement de contenus

• Moteur de recherche spécialisé

• Agrégation et extraction d’informations web

Présentation des solutions Qwam

Cas d’usage

QWAM CONTENT INTELLIGENCE

Tendances générales

ETAT DES LIEUX MULTIPLICATION DES FLUX NUMÉRIQUES Flux externes

Fournisseurs de contenus spécialisés

Flux RSS

Flux presse et média

Revues et journaux électroniques

Sites web

Moteurs web

Bases de données web

ETAT DES LIEUX MULTIPLICATION DES FLUX NUMÉRIQUES Flux internes

Flux et échanges partenaires

Systèmes éditoriaux

Publications internes (mktg, com, …)

CMS, GED diverses

Sites et flux intranet

Moteurs intranet Bases de données métier

TECHNOLOGIES LIÉES AUX CONTENUS Quatre familles de

problématiques dans les applications

- Gestion des flux textuels et

multimédia

- Enrichissement de contenus

- Moteur de recherche

- Agrégation et extraction d’informations web

GESTION DES FLUX TEXTUELS ET MULTIMÉDIA LES TENDANCES GÉNÉRALES

Flux multiples textuels/media hétérogènes en croissance • Applications internes

• Web

• Fournisseurs de contenus et d’applications (via le web)

Flux continu

Multimédia, multilingue

ENRICHISSEMENT DE CONTENUS LES TENDANCES GÉNÉRALES Transition de l’enrichissement manuel historique (via

GED) à l’enrichissement semi-automatique ou automatique • Concerne les éditeurs/fournisseurs de contenus et les

« grands » utilisateurs

Généralisation des technologies d’enrichissement de type sémantique ou autres

Contribution utilisateurs

MOTEUR DE RECHERCHE LES TENDANCES GÉNÉRALES

Les fonctions de recherche sont présentes dans de nombreuses applications web

La navigation à facettes se généralise

Les profils de recherche se multiplient

AGRÉGATION ET EXTRACTION D’INFORMATIONS WEB

LES TENDANCES GÉNÉRALES

Généralisation sur le web des flux RSS et assimilés

Multiplication des applications d’agrégation de flux • Applications autonomes (lecteur de flux)

• Au sein d’application métier

• « Tout le monde fait de la veille »

De nombreux fournisseurs de solutions professionnelles (veille, social média, etc.)

QWAM CONTENT INTELLIGENCE

Tendances technologiques

GESTION DES FLUX TEXTUELS ET MULTIMÉDIA LES TENDANCES TECHNOLOGIQUES

Flux multiples hétérogènes en croissance

GESTION DES FLUX TEXTUELS ET MULTIMÉDIA LES TENDANCES TECHNOLOGIQUES

Peu de solutions spécialisées sur la rationalisation des flux

Nécessité d’industrialisation Composants : • Repository • Annotateur/enrichissement • Moteur d’indexation • Séquenceur de tâches • GED • Workflow

ENRICHISSEMENT DE CONTENUS LES TENDANCES TECHNOLOGIQUES

• Annoter (enrichir de méta-données) les documents pour : Les rendre plus aisément manipulables

Les structurer

Les rassembler

Les lier

Les classer

Les contextualiser

ENRICHISSEMENT DE CONTENUS LES TENDANCES TECHNOLOGIQUES

• Annoter intelligemment : Utiliser au maximum ce qui vient des chaines éditoriales et de

production

Préserver les données déjà présentes : Edition, Auteur, Type d’article/document

Ne porter que sur des champs plein texte : Titre, Sous titre, Chapeau, Texte

ENRICHISSEMENT DE CONTENUS LES TENDANCES TECHNOLOGIQUES Jusqu’à présent surtout des solutions d’éditeurs de

logiciels (text mining)

Emergence de framework open source • Considéré comme une brique

• Effort de constitution de vocabulaire moins poussé

• Prix plus attractif

ENRICHISSEMENT DE CONTENUS LES TENDANCES TECHNOLOGIQUES

Produire des facettes pour plusieurs usages : • Aide à la lecture

• Raffinage (Drill down)

• Top 10

ENRICHISSEMENT DE CONTENUS LES TENDANCES TECHNOLOGIQUES

Produire des facettes pour plusieurs usages : • Graphiques camembert ou barres

• Analytics / Mining

• Geolocalisation

• Linked data

ENRICHISSEMENT DE CONTENUS LES TENDANCES TECHNOLOGIQUES

Les entités nommées : Personnes, organisations, lieux, événements

Les ontologies • Pour enrichir

• Pour classer

ENRICHISSEMENT DE CONTENUS LES TENDANCES TECHNOLOGIQUES

Les concepts : • Clustering décevant => Aller vers une méthode de N-grams

• Détection de thématiques émergentes

• Référentiel d’annotation : ex: E.I, Etat islamique, Daesh ?

• Agnostique et/ou supervisé

ENRICHISSEMENT DE CONTENUS LES TENDANCES TECHNOLOGIQUES

Le croisement avec l’ « usage » utilisateur • Moteur de recommandation

• Les plus consultés

• Documents liés

• Ce que dit le web

ENRICHISSEMENT DE CONTENUS LES TENDANCES TECHNOLOGIQUES

Le machine learning • Classement

• Screening

MOTEUR DE RECHERCHE LES TENDANCES TECHNOLOGIQUES

La brique de moteur d’indexation est disponible en open source

La différenciation se fait par les composants et fonctions périphériques

L’équation devient : • Moteur sémantique = Moteur booléen + annotation +

synonymes + lemmatisation

AGRÉGATION ET EXTRACTION D’INFORMATIONS WEB LES TENDANCES TECHNOLOGIQUES

Généralisation des flux RSS et assimilés • Un canal privilégié par les diffuseurs

• Dialogue machine-humain et machine-machine

• Un document garanti au bout

• Des méta-données de qualité

QWAM CONTENT INTELLIGENCE Qwam en bref :

- Création en 2006

- Entreprise spécialisée dans les solutions logicielles de veille,

recherche, gestion et diffusion de contenus électroniques

- Membre de Cap Digital «Pôle de compétitivité » des technologies

numériques

- 2 projets de R&D « Investissements d’Avenir » en cours

QUI SOMMES NOUS ?

Entreprise spécialisée dans les solutions logicielles de veille, recherche, gestion et diffusion de contenus électroniques

Plus de 150 clients utilisent les solutions Qwam

Projets R&D collaboratifs • Qwam s’est vu attribuer début 2013 un projet de R&D au titre

du Fonds de Soutien Numérique (FSN) « Investissements d’avenir »

• Début 2015, un nouveau projet de Qwam est retenu dans l’appel à projets «Big data» des « Investissements d’Avenir »

LES OFFRES QWAM Qwam Content Intelligence propose un ensemble d’offres et solutions logicielles autour de la gestion d’informations, des moteurs de recherche et de la veille

QES InfoMedia Suite : Plateformes d’agrégation, gestion, recherche et diffusion de flux et d’archives presse et media :

Gestion documentaire de flux numériques de tout type : presse et media (articles, dépêches, web, etc.) audio, vidéo, études, rapports, etc. ; module d’enrichissement sémantique et règles métier ; modules de qualification pour administrateurs et contribution des utilisateurs

Module de gestion des articles et retombées presse (QES PressReview) Module de gestion des informations web (QES WebMonitor) Portail et moteur de recherche et de navigation sur flux numériques presse, media et web

QES InfoMonitor & KM Suite : Plateformes de capitalisation, recherche, veille et gestion et diffusion d’information R&D/innovation, scientifique et technique et concurrentielle

Agrégation de tout type d’information scientifique et technique (brevets, articles IST, news spécialisées, etc.) et stratégique pour la R&D et l’innovation ; veille web avec Ask’n’Read

Module de recherche et surveillance de bases de données scientifiques (QES Biblio) Module de gestion des informations web (QES WebMonitor) Capitalisation et gestion d’informations externes et internes pour gestion des

connaissances Portail et moteur de recherche et de navigation sur bases de connaissances

LES OFFRES QWAM

Qwam Content Intelligence propose un ensemble d’offres et solutions logicielles autour de la gestion d’informations, des moteurs de recherche et de la veille

Ask'n'Read : Solutions de veille web en temps réel

Pour la veille en continu de toute l'information sur le web • Surveillance : médias web, actualités, communiqués de presse, sites d’entreprises et institutionnels, blogs,

forums, réseaux sociaux, sites de recrutement, annonces, etc. • Gestion et diffusion : sélection de l’information ; newsletters et listes de diffusion ; tableaux de bord

Modules complémentaires WebMonitor : • Base de connaissance, portails d’informations, solutions personnalisées

QES GED Suite : Organiser et gérer les ressources documentaires de l’entreprise Centraliser les documents produits par les collaborateurs (études, rapports, etc.), les

documents numérisés, etc. dans un espace unique quelque soit leur format (texte, PDF, image) Gérer simplement les documents via des référentiels métier (liste d’autorité, plan de

classement, etc.) et sémantiques dans un environnement sécurisé et organisé (workflow) Diffuser et partager : portail ergonomique avec interfaces et widgets personnalisés permettant

d’accéder aux documents suivant les profils utilisateur Moteur de recherche évolué (navigation à facettes) et navigation guidée dans bases

documentaires

QWAM CONTENT INTELLIGENCE

Les besoins clients en gestion, agrégation,

diffusion de flux

Les solutions Qwam

LES SOLUTIONS QWAM

Une solution de gestion des flux internes

Une solution de gestion des flux web

Une solution d’intégration des flux internes et flux web (contextualisation, intégration des contenus sur un même métier, etc.)

PRODUCTION INTERNE

QES

LE DATACENTER ASK’N’READ

LE DATACENTER ASK’N READ

INTÉGRATION FLUX INTERNES-EXTERNES CONTEXTUALISATION

INTÉGRATION FLUX INTERNES-EXTERNES QES + ASK’N’READ

CAS D’USAGE 1

- Gestion des flux textuels et multimédia pour

capitalisation, consultation et diffusion ;

moteur de recherche associé

CAS D’USAGE 1 FLUX INTERNES

CAS D’USAGE 2

- Enrichissement documentaire (règles

métier, sémantique) et génération automatique

de concepts et documents liés

CAS D’USAGE 2 AIDE À L’ANNOTATION SUR CHAINE ÉDITORIALE

CAS D’USAGE 3

- Agrégation de flux web contextuels autour de contenus éditoriaux ; création de services à valeur ajoutée autour

des contenus éditoriaux

CAS D’USAGE 3 FLUX INTERNES + FLUX WEB

CAS D’USAGE 4

- Extraction sélective de contenus web :

informations d’entreprise, informations sectorielles, flux d’actualités web en

temps réel, génération de leads, etc.

CAS D’USAGE 4 CONTENUS WEB CIBLÉS

CAS D’USAGE 5

- Flux de veille et d’information

scientifique et technique

CAS D’USAGE 5 FLUX WEB

NOUS CONTACTER INFORMATIONS COMPLÉMENTAIRES & DÉMONSTRATIONS EN LIGNE

Qwam Content Intelligence 22 rue Chauchat

75009 Paris

info@qwamci.com Tel : 01.44.69.59.20

www.qwamci.com @qwamCI

top related