eine diskursanalyse den weinhändlern und winzern … · 4 discours numériques : quels enjeux pour...

40
AdWine Système intelligent de recommandation pour le vin et la gastronomie Christophe CRUZ, MCF HDR, Laboratoire Le2i (UBFC, CNRS FRE 2005) Laurent GAUTIER, PR, Centre Interlangues Texte Image Langage (UBFC, EA 4182) Cyril NGUYEN VAN, IE CNRS, Maison des Sciences de l’Homme Dijon (USR CNRS-uB 3516) Vitagora-Melun Val de Seine Café Comprendre les consommateurs : profils et évolution des marchés 20 Juin 2018 - Campus Meudon-Bellevue du CNRS - Meudon

Upload: hahanh

Post on 14-Sep-2018

214 views

Category:

Documents


0 download

TRANSCRIPT

AdWineSystème intelligent de recommandation pour le

vin et la gastronomie

Christophe CRUZ, MCF HDR, Laboratoire Le2i (UBFC, CNRS FRE 2005)

Laurent GAUTIER, PR, Centre Interlangues Texte Image Langage (UBFC, EA 4182)

Cyril NGUYEN VAN, IE CNRS, Maison des Sciences de l’Homme Dijon (USR CNRS-uB 3516)

Vitagora-Melun Val de Seine CaféComprendre les consommateurs : profils et évolution des marchés

20 Juin 2018 - Campus Meudon-Bellevue du CNRS - Meudon

Structure

1. Traiter les « traces » numériques des consommateurs : pour quoi faire ?

2. Combler le gap discours experts/non experts dans le domaine sensoriel pour mieux communiquer

3. AdWine : Système intelligent de recommandation pour le vin et la gastronomie

4. Par delà Adwine : SmartAd (recommandation sensorielle)

5. Perspectives

2

3

I. Éléments de contextualisation

Discours numériques : Quels enjeux pour la R&D, entre fouille de

données textuelles et informatique ?

4

Discours numériques : Quels enjeux pour la R&D, entre fouille de données textuelles et informatique ?

Éléments de contexte

Utiliser la transition numérique comme source de recherche & valorisation

• Appropriation du web 2.0 (web social)

contribution à l'échange des informations et des interactions

nouvelles formes de communication avec apparition de nouveaux genres dediscours mettant en jeu le spécialisé/professionnel

Nécessité de saisie par des approches « linguistiques » : avis et classement de consos,blogs/forums d’amateurs, etc. => redéfinition des frontières expert / non-expert, prescriptif /descriptif / évaluatif

Nécessité de nouvelles formes de traitement de ces données pour en faire des « corpusintelligents »

• Sous couvert de multimodalité

=> omniprésence des données langagières qui ne peuvent se satisfaire de traitementstrictement quantitatif

5

Big et linked data :

un ’terrain de jeu’ à l’interface entre sémantique et informatique

Enjeux reposant sur une maîtrise et le développement d’outilssémantiques :

• Extraction de l’information : connaissances sémantiques, modélisation dessavoirs encyclopédiques et spécialisés « encapsulés »

• Circulation de l’information : traitement de marqueurs de reprise, citations,ironie, etc.

• Représentation / visualisation de l’information : création de banques dedonnées intelligentes, techniques d’annotation, d’apprentissage-machine

Discours numériques : Quels enjeux pour la R&D, entre fouille de données textuelles et informatique ?

Éléments de contexte

6

Ex. 1 : Analyse des discours évaluatifs pour l’extraction d’opinions

• Essor des sites d’avis de consommateurs

• Traitement du lexique valencé (+, neutre, -) : création de dictionnairesappropriés + traitement de la ‘tonalité’ des textes

• Multiplication des domaines de spécialité mobilisant des « terminologies »hybrides : tourisme, achats, finances, …

Discours numériques : Quels enjeux pour la R&D, entre fouille de données textuelles et informatique ? Un défi pour la linguistique (appliquée) : quelques exemples

7

Ex. 2 : Analyse de blogs / forums pour l’extraction d’informations « terminologiques » en vue de la recommandation

• Réappropriation de l’acte de recommandation par le consommateur, enparticulier dans le domaine sensoriel : vins, plats, repas, parfums, …

• Liens entre ontologie experte d’un domaine et « terminologie consos » pourrecommander à partir des mots du consommateur

• Extraction et catégorisation du lexique de la dégustation avec triple dimension :• Sensorielle• Evaluative• Expressive / hédonique

Discours numériques : Quels enjeux pour la R&D, entre fouille de données textuelles et informatique ? Un défi pour la linguistique (appliquée) : quelques exemples

8

II. Discours experts/non experts dans le domaine sensoriel

Le problème des dimensions évaluatives

9

Discours experts/non experts dans le domaine sensoriel

Contexte

Et après ?

10

• La lisibilité et la compréhension du discours expert par unconsommateur non-expert sont sources de difficultés impactant l’acted’achat

• Problématique :

Soit le non-expert reprend les discours experts sans nécessairementen avoir la maîtrise, engendrant ainsi une confusion sémantique,soit il créée son propre discours incluant une terminologie propreconstruite à partir d’expériences passées mais débouchant sur unecouverture sémantique réduite à dimension technique minimale(i.e. minéralité pour le vin), ou une spécialisation sémantiqueréduite à dimension évaluative maximale (i.e. buvable/buvabilité).

Discours experts/non experts dans le domaine sensoriel

Contexte

11

Un contexte théorique global favorable

• Redécouverte de la place des émotions dans divers contextes considérés commespécialisés (Corbin et al.)

• Intérêt renouvelé pour la question de savoir comment dégager les différentescouches de sens des descripteurs sensoriels pour rendre compte de leur face‘subjective’ articulée à leur face technique ?

“Assuming that some of the wine words mean anything at all, even ifthey are to be interpreted subjectively and evaluatively – what is thestructural analysis of this vocabulary?”

(Lehrer 1975 : 901, souligné par nous)

Discours experts/non experts dans le domaine sensoriel

Contexte

12

Discours experts/non experts dans le domaine sensoriel

Exemple

Recherche sur marqueurs d’émotions

en lien avec l’analyse de sentiments

Reconnaissance du rôle de l’expérience

pouvant devenir moteur de

recommandation

13

Discours experts/non experts dans le domaine sensoriel

Exemple

L’évaluation avant tout

“Wine drinking is basically an aesthetic experience; so quite naturally, theevaluative dimension is the most important one. In fact, the evaluativedimension permeates every other dimension, even ‘descriptive’ ones.”

(Lehrer 1975 : 903, souligné par nous, LG)

Linéarité multiniveaux du langage ne permet pas toujours la distinction entre les niveaux :

Sens technique

Couche expressive

Couche émotionnelle

EVAL

14

III. AdWine

Système intelligent de recommandation pour le vin et la gastronomie

15

« Au service d’une communication ciblée non seulement pour les consommateurs,

mais partant des consommateurs et utilisant les canaux numériques. »

Lauréat AAP CVT Athéna

• Adapter le langage et la terminologie des experts et des professionnels à celles des consommateurs etnon l’inverse.

• Sous forme d’ontologies (au sens informatique): ensemble structuré des termes et conceptsreprésentant le sens d'un champ d'informations (ici l’œnologie).

Outil de recommandation intelligent• croisement ontologies professionnelles et vocabulaire produit par les consommateurs par vin• profilage classique + lexical• extension vers gastronomie et accord mets-vins

=> Recommandation d’un vin à partir du profil spécifique de l’utilisateur consommateur

Présentation

16

L’essor des discours sur le vin remet en cause la dichotomieexpert(s) vs amateur(s) :

• Manifestations dans les discours : frontière floue entre discours prescriptifs, descriptifs et hédoniques

• Manifestations dans la terminologie :termes instables, nouveaux descripteurs

• Accès aux sources d’informations / ressources illimitées

Présentation

17

« Il y a ce qui est Meursault qui estvraiment une référence mondiale pour lesChardonnay avec le côté beurré briochéun peu gras toute la famille des vins avecla même palette aromatique ici on ditque ça *beursaulte alors *beursaulter »

(corpus Bach 2017)

Un exemple (trop) parfait ?

18

• Liste des appellations

• Liste des dénominations

• Liste des arômes

• Liste des cépages

• Liste des descripteurs hédoniques

• Liste de mets

Vocabulaires contrôlés

19

20

Ontologie de description d’un vinDescripteurs hédoniques (extrait)• accrocheur• acerbe• acescence• acescent• acide• acidité• acidulé• acre• agressif• aigre• aigreur• aimable• alcooleux• ambré• amertume• ample• …

21

Mapping entre catégories de discours : l'apport de OenoLex (P. Leroyer / L. Gautier, ToTH 2014)

Pour représenter la dégustation,l’appellation est conventionnellementreliée au lexique dégustatif = ontologie dudiscours institutionnel/terminographie decorpus spécialisé

… mais il nous manque plusieurs éléments : les acteurs, le lieu, la négociationdu sens spécialisé. Il nous faut une ontologie expérientielle.

22

Description expérientielle d’un vin

Chitry 2010 domaine Olivier MORIN

Date : 12.12.2013Lieu : Caveau MorinÉvaluateurs : amateur, producteur

Évaluation visuelle- correcte : robe bien dorée et riche

une robe avec de jolis reflets vertsil est brillant

- incorrecte : ce vin a une couleur jaunâtre- correcte er incorrecte : le vert indique la jeunesse et le cépage

Évaluation olfactive- correcte : on sent le citron, le pamplemousse

il y a aussi une certaine minéralité

Évaluation gustative :- correcte : en bouche, vous aller sentir acidité et sucrosité

Évaluations générale :- correcte : c’est un vin qui peut se conserver encore un peu

Résultat Caveau Morin:

23

Démonstration du prototype

Utilisations possibles :• Sous forme d’application web• Sous forme d’application mobile

Gestion des ressources et interrogationdu moteur de recommandation via uneAPI REST (web) => plateforme SaaS=> Possibilité de développementd’autres formes d’utilisations

Champs de « recherche » modulable àsouhait suivant le profil de l’utilisateur=> Questionnaire pour « catégoriser »le client suivant son niveau d’expertise

24

Démonstration du prototype

25

Démonstration du prototype

26

Démonstration du prototype : fiche « Projet »

27

Démonstration du prototype : données de recherches et d’utilisateurs

28

• Goût

• Mets

• Contexte de consommation

• Historique de recherche

• Favoris

Profil consommateur

• Interrogation

• Inférence des données

Moteur de recommandation • Liste de vins triés par

score

• Présentation des résultats les plus pertinents

Résultats

Processus de recommandation

29

Données d’un vin, données des vins

30

Filière viti-vinicole, grande distribution, restauration

• Constitution d’un dispositif numériqueassocié aux études en sciences humainessur la vigne, le vin et l’oenotourisme ;

• Inscription dans la tendance actuelled’associer les nouvelles technologies à lacommunication autour des vins ;

• Répondre aux besoins de communicationpédagogique sur le vin et d’éducation augoût des consommateurs.

Words4Wine• Ensemble de fonctionnalités multi-

agents indexés sur une base de donnéescommunes ;

• Double visée : professionnels de la filière/ utilisateurs finaux.

Plus-values d’AdWine

31

Words4WineQuand le numérique révolutionne la communication autour du vin

32

IV. SmartAd

Plateforme de recommandation sensorielle basée sur un système de recommandation

intelligent

33

SmartAd

Présentation

• Développement d’un système générique de recommandation hybrided’items présentant une dimension sensorielle dans des domaines oùl’appréhension de l’objet est à la fois sensoriel et technique

• Solution méthodologique et technique pour combler le gapsémantique entre la connaissance descriptive du discours expert,celle du discours institutionnel, et celle du discours de l’amateurnéophyte.

34

SmartAd

Présentation

• Objectif :

Produire des services de recommandation d’items, et exploiter cesconnaissances dynamiques dans un processus d’extraction d’informationdu web 2.0

• Ouverture vers d’autres sens et d’autres discours:o des vins ou des mets (goût) => AdWine;

o des fragrances ou des parfums (odorat) ;

o des choix musicaux (ouïe) ;

o des matières en aménagement intérieur (toucher) ;

o ou encore des perceptions multimodales complexes (ambiances urbaines,traces touristiques).

35

SmartAd

Les systèmes de recommandation

• Aident les utilisateurs à prendre une décision

• SmartAd : utilisation de techniques sémantiques :

• Basé sur des ontologies de domaine spécifique pour créer une structure etcontrôler la représentation

• Exploiter les vocabulaires contrôlés des experts et les vocabulairesspontanés des non-experts avec un enrichissement sémantique grâce auxliens entre ces deux vocabulaires

=> Les termes experts liés aux « termes » non experts sont exploitésdans un système de recommandation hybride intégrant une ontologiebasée sur le contenu et sur la base des vecteurs de mots-clés

36

SmartAd

Les données

• Deux formats : les vocabulaires contrôlés qui décrivent les items, puisles items en eux-mêmes définis en utilisant ces vocabulaires contrôlés

• Ensemble de langages documentaires et de vocabulaires contrôlésmodélise les différents niveaux d’expertise des utilisateurs dans lesystème de recommandation (expert, initié, novice)

vocabulaires constituent le noyau dur terminologique constitutif desdiscours experts/institutionnels visés

• Profiler tout type d’items de tout domaine nécessitant de larecommandation sur des objets sensoriels dont la dimensionprioritairement subjective pour le non-expert pose jusqu’àmaintenant problème pour la modélisation sémantique

38

Fiche d’un item

Ontologie de description

d’un item du domaine

Vocabulaire du discours non-expert

Ontologie du discours expert

Profil de l’utilisateur

(centres d’intérêts)

Moteur de recommandation

Résultats adaptés aux usages, aux contextes de consommation et

à l’évolution de l’environnement de

l’utilisateur

SmartAdFonctionnement général simplifié du processus de recommandation

V. Perspectives

• Interactions entre sémantique, informatique, sciences cognitives,(intelligence artificielle) ;

• Compilation de nouveaux types de données pouvant servirdirectement des problématiques commerciales et marketing orientées« client » ;

• Développement d’une recherche appliquée aux besoins industrielsavec, en retour, des développements méthodologiques et de lacapitalisation de connaissances en recherche fondamentale.

39

Merci !Christophe CRUZ, MCF HDR, Laboratoire Le2i (UBFC, CNRS FRE 2005)

[email protected]

Laurent GAUTIER, PR, Centre Interlangues Texte Image Langage (UBFC, EA 4182)

[email protected]

Cyril NGUYEN VAN, IE CNRS, Maison des Sciences de l’Homme Dijon (USR CNRS-uB 3516)

[email protected]