present_mémoire
TRANSCRIPT
-
8/9/2019 present_mmoire
1/20
L'ANALYSE DES BREVETS
Extraction de connaissances utiles la "conception inventive"
partir de textes de brevets
Encadr par :
M. Franois ROUSSELOT, Matre de Confrences, DE,Universit de Strasbourg
Jury :Madame Amalia TODIRASCU-COURTIER, Matre de Confrences, Universit de StrasbourgMonsieur Thierry GRASS, Professeur, Universit de Strasbourg
Ralis par : Dildar KEREM-WUSoutenu le 18/09/2009
Anne universitaire 2008/2009
Universit de Strasbourg4 rue Blaise Pascal CS 90032 F-67081 Strasbourg cedex
Discipline: UFR Lettres et Sciences Humaines AppliquesSpcialit: Linguistique et Informatique
Pour lobtention du : Diplme de Master en Linguistique et Informatique
-
8/9/2019 present_mmoire
2/20
1/16
SOMMAIRE
PARTIE I Problmatique
PARTIE II Etat des lieux
PARTIE III Analyse et rsultats
PARTIE IV Conclusion et perspectives
-
8/9/2019 present_mmoire
3/20
2/16
PARTIE I PROBLEMATIQUE
Contexte de l'tudemthode statistique (prfiltrage/recherche d'lment) [Gabor]
l'extraction des informations prcises lies la contradiction [Wu]
La TRIZla mthode est efficace
l'identification de la contradiction imprcise
L'analyse des textes de brevetsne rpond pas aux besoins de concepteurs
dpendante du domaine
-
8/9/2019 present_mmoire
4/20
3/16
PARTIE II ETAT DES LIEUX
II.a. L'analyse des textes (HEARST 1992), (BOUHAFS 2005)
intert : analyse de surface utile pour l'extraction d'informationslimitation : notions recherches dterminer pour chaque traitement
II.b.L'analyse des textes de brevets PatAnnot (GHOULA et al. 2008),VIGITEXT (GOUJON 1999)
intrt : capitalise certaines connaissances dans les textes de brevetslimitation : pas de modles de connaissances & application spcifique
II.c. L'analyse des textes de brevets associe la TRIZ InnovationSuite CREAX (MANN & DEWULF 2003a, 2003b)Le PAT-Analyzer (CASCINI & RUSSO 2007a, 2007b)
Intrt : dispose de modles de connaissanceslimitation : pas de dfinitions formelles de la contradiction
-
8/9/2019 present_mmoire
5/20
4/16
PARTIE III ANALYSE ET RESULTATS (1)
III.a. Le corpus de rfrence
-constitution du corpus100 brevets lectroniques en anglais tirs de domaines divers
- caractristiques des documents thmes diffrents & traits linguistiques spcifiques
- caractristiques des textesdomaines divers & traits linguistiques complexes
emploi de rptitions, d'numrations, de symboles, d'abrviations
-
8/9/2019 present_mmoire
6/20
5/16
PARTIE III ANALYSE ET RESULTATS (2)
III.b. L'analyse prliminaire
- outils:TREETAGGER (SCHMID 1994)
LIKES (segments rpts) (ROUSSELOT et al. 2004)
- observations
1) les paramtres et les valeurs sont exprimes par des formesgrammaticales diffrentes
2) les contradictions sont exprimes par des oppositions qui se
manifestent au niveau grammatical, lexical ou syntaxique
3) les valeurs opposes sont soit incompltes, soit trs espaces
-
8/9/2019 present_mmoire
7/20
6/16
PARTIE III ANALYSE ET RESULTATS (3)
- dmarches entreprises1) analyse prliminaire pour l'identification des marqueurs potentiels
2) analyse approfondie base sur les contextes
3) annotation l'aide de l'outil NOOJ ( SILBERZTEIN 2003 )
-identification de marqueurs base sur les segments rpts
1) les termes qui sont frquents mais non-lis un domaine spcifique
2) qui peuvent reprsenter des informations recherches (porteur)
3) ou qui aident reprer des concepts recherchs dans son contexte (pointeur)
4) ou les deux (porteur et pointeur)
-
8/9/2019 present_mmoire
8/20
7/16
PARTIE III ANALYSE ET RESULTATS (4)
III.c. L'analyse approfondie
- outil: LIKES & Wordsmith Tools (SCOTT 2008)
- tude des marqueurs base sur les contextes
- des listes de marqueurs :
1) 60 verbes : verbes de changements, productifsExemples: increase, decrease, release, damage
2) 137 adverbes : jugement ngatif ou positif Exemples: advantageously, appreciably, arbitrarily, arguably...
-
8/9/2019 present_mmoire
9/20
-
8/9/2019 present_mmoire
10/20
9/16
PARTIE III ANALYSE ET RESULTATS (6)
Exemple 1: if (lment) be adj (valeur), then (paramtre)
Ifwater useis low, thenthe system is sized on loading rate and is loading rate limited.Ifwater useis high, then the system will be HRT limited and will be comparatively
much larger than a loading rate limited system.
Exemple 2 : certains marqueurs ncessitentL'interprtation de l'expert
It is difficult to get a good seal between the nozzle outlet or tip and the adjacent gate
surfaces because the surfaces area of the mating components must be kept small to avoidtoo much heat loss. Further, the mating components are subject to wear because ofthermalexpansion and contraction during the molding process.
Valeurs: expansion (high temperature) & contraction (low temperature)
Vert: lmentBlue: paramtreRouge : valeur
-
8/9/2019 present_mmoire
11/20
10/16
PARTIE III ANALYSE ET RESULTATS (7)
Exemple 3 : marqueur reduce
- indique l'existence de paramtres- parfois des limitations numriques
- indique galement des oppositions- un marqueur gnrique et productif
a shape anisotropy of approximately one hundred Oe would be reduced to approximately 75 Oea predetermined moving plane or two-dimensional rotationalforces can be reduced to almost 0.
the sum ofreaction forces acting on the base can be reduced to almost 0. TThese measurements can be reduced to equilibrium vapor and liquid compositions in the cell by
the vacuum pressure can be reduced to 20 torrand the microwave power can be raisedto about 3then the number of gages per seat can be reduced to three providing a good model of ...The mud turbine can utilize a gearbox to reduce the revolutions per minutes.
process treats water to reduce the conductivityof the water to reduce the leakage current.The overall objective is to reduce the unnecessary biopsies and interventions, andincrease the ....
energy can be trapped around the resonator to reduce the radiation loss in the resonatormaterials were mixed in a glove box under a flow of dry nitrogen afterthe pressurewas reduced
Blue: paramtre
Rouge : valeur
-
8/9/2019 present_mmoire
12/20
11/16
PARTIE III ANALYSE ET RESULTATS (8)
III.d. annotation et extraction
- implementation des grammaires dannotation
- deux dictionnaires spcifiques
- 46 graphes sur la base des rsultats de l'analyse
- les contraintes respecter pour effectuer l'annotation
-
8/9/2019 present_mmoire
13/20
12/16
PARTIE III ANALYSE ET RESULTATS (9)
Exemple 4 : un graphe pour localiser les oppositions
: adjectif: terme/termes
: ponctuationJJ$anti: proprit prdfinie
-
8/9/2019 present_mmoire
14/20
-
8/9/2019 present_mmoire
15/20
14/16
PARTIE III ANALYSE ET RESULTATS (11)
Exemple 6 : texte affich en couleurs
Vert: lment
Blue: paramtreRouge : valeur
-
8/9/2019 present_mmoire
16/20
15/16
PARTIE III ANALYSE ET RESULTATS (12)
III.e. Les difficults rencontres
- recours aux experts pour valider les marqueurs
- l'explicitation des valeurs smantiques caches- faible disponibilit de l'expert pour l'annotation
- les listes de marqueurs complter
- les rsultats d'annotation au niveau du rappel amliorer
Paramtre: rappel 46% prcision 75%Valeur: rappel 26% prcision 79%Elment: rappel 13% prcision 60%
-
8/9/2019 present_mmoire
17/20
16/16
PARTIE IV CONCLUSION ETPERSPECTIVES
Conclusion :
- russi extraire des informations pertinentes et utiles
- parvenu aider les concepteurs cerner les contradictions
- l'approche propose reprsente une direction pour l'analyse des brevets
Perspectives :
- intgrer le travail de Kata Gabor
- une chane de traitement complte raliser
- les listes de marqueurs complter
- un travail plus fin sur les oppositions effectuer
-
8/9/2019 present_mmoire
18/20
-
8/9/2019 present_mmoire
19/20
Bibliographie
Ghoula N., Khelif K., Dieng-Kuntz R. (2008)Vers une fouille smantique des brevets : application au domainebiomdicalActes de 8mes Journes Francophones: Extraction et Gestion des Connaissances, INRIA SophiaAntipolis - Mditerrane, pp 19-30
Goujon B. (2000)Utilisation de l'exploration contextuelle pour l'aide la veille technologique, Thse de doctorat,sous la direction de Jean-Pierre Descls, Paris-Sorbonne (Paris-IV), 2000-04
Grabar N. et Hamon T. (2004)Reprage de relations smantiques entre termes : sur la piste de la morphologieActes des 15me Journes Francophones d'Ingnierie des Connaissances (IC'2004) pages 237-248. Lyon. PressesUniversitaires de Grenoble.
Hearst M. (1992)Automatic Acquisition of Hyponyms from Large Text Corpora. In Proceedings of the 14thInternational Conference On Computational Linguistics (COLING), pp 539-545. Nantes.
Mann D., Dewulf S. (2003 )Updating TRIZ: 1985-2002 Patent Research Findings (CREAX Belgique)TRIZCON2003: 5th Annual International Conference of Altshuller Institute for TRIZ Studies, Philadelphia, USA
Sgula P. (2001)Construction de modles de connaissances par analyse linguistique de relations lexicales dans lesdocuments techniques. Thse de Doctorat en Informatique, Universit Toulouse III Paul Sabatier.
Teufel S., Moens M. (2002) Summarizing Scientific Articles -- Experiments with Relevance and Rhetorical Status InComputational Linguistics, 28 (4): 409-445, 2002
-
8/9/2019 present_mmoire
20/20
MERCI !