present_mémoire

Upload: wu

Post on 30-May-2018

213 views

Category:

Documents


0 download

TRANSCRIPT

  • 8/9/2019 present_mmoire

    1/20

    L'ANALYSE DES BREVETS

    Extraction de connaissances utiles la "conception inventive"

    partir de textes de brevets

    Encadr par :

    M. Franois ROUSSELOT, Matre de Confrences, DE,Universit de Strasbourg

    Jury :Madame Amalia TODIRASCU-COURTIER, Matre de Confrences, Universit de StrasbourgMonsieur Thierry GRASS, Professeur, Universit de Strasbourg

    Ralis par : Dildar KEREM-WUSoutenu le 18/09/2009

    Anne universitaire 2008/2009

    Universit de Strasbourg4 rue Blaise Pascal CS 90032 F-67081 Strasbourg cedex

    Discipline: UFR Lettres et Sciences Humaines AppliquesSpcialit: Linguistique et Informatique

    Pour lobtention du : Diplme de Master en Linguistique et Informatique

  • 8/9/2019 present_mmoire

    2/20

    1/16

    SOMMAIRE

    PARTIE I Problmatique

    PARTIE II Etat des lieux

    PARTIE III Analyse et rsultats

    PARTIE IV Conclusion et perspectives

  • 8/9/2019 present_mmoire

    3/20

    2/16

    PARTIE I PROBLEMATIQUE

    Contexte de l'tudemthode statistique (prfiltrage/recherche d'lment) [Gabor]

    l'extraction des informations prcises lies la contradiction [Wu]

    La TRIZla mthode est efficace

    l'identification de la contradiction imprcise

    L'analyse des textes de brevetsne rpond pas aux besoins de concepteurs

    dpendante du domaine

  • 8/9/2019 present_mmoire

    4/20

    3/16

    PARTIE II ETAT DES LIEUX

    II.a. L'analyse des textes (HEARST 1992), (BOUHAFS 2005)

    intert : analyse de surface utile pour l'extraction d'informationslimitation : notions recherches dterminer pour chaque traitement

    II.b.L'analyse des textes de brevets PatAnnot (GHOULA et al. 2008),VIGITEXT (GOUJON 1999)

    intrt : capitalise certaines connaissances dans les textes de brevetslimitation : pas de modles de connaissances & application spcifique

    II.c. L'analyse des textes de brevets associe la TRIZ InnovationSuite CREAX (MANN & DEWULF 2003a, 2003b)Le PAT-Analyzer (CASCINI & RUSSO 2007a, 2007b)

    Intrt : dispose de modles de connaissanceslimitation : pas de dfinitions formelles de la contradiction

  • 8/9/2019 present_mmoire

    5/20

    4/16

    PARTIE III ANALYSE ET RESULTATS (1)

    III.a. Le corpus de rfrence

    -constitution du corpus100 brevets lectroniques en anglais tirs de domaines divers

    - caractristiques des documents thmes diffrents & traits linguistiques spcifiques

    - caractristiques des textesdomaines divers & traits linguistiques complexes

    emploi de rptitions, d'numrations, de symboles, d'abrviations

  • 8/9/2019 present_mmoire

    6/20

    5/16

    PARTIE III ANALYSE ET RESULTATS (2)

    III.b. L'analyse prliminaire

    - outils:TREETAGGER (SCHMID 1994)

    LIKES (segments rpts) (ROUSSELOT et al. 2004)

    - observations

    1) les paramtres et les valeurs sont exprimes par des formesgrammaticales diffrentes

    2) les contradictions sont exprimes par des oppositions qui se

    manifestent au niveau grammatical, lexical ou syntaxique

    3) les valeurs opposes sont soit incompltes, soit trs espaces

  • 8/9/2019 present_mmoire

    7/20

    6/16

    PARTIE III ANALYSE ET RESULTATS (3)

    - dmarches entreprises1) analyse prliminaire pour l'identification des marqueurs potentiels

    2) analyse approfondie base sur les contextes

    3) annotation l'aide de l'outil NOOJ ( SILBERZTEIN 2003 )

    -identification de marqueurs base sur les segments rpts

    1) les termes qui sont frquents mais non-lis un domaine spcifique

    2) qui peuvent reprsenter des informations recherches (porteur)

    3) ou qui aident reprer des concepts recherchs dans son contexte (pointeur)

    4) ou les deux (porteur et pointeur)

  • 8/9/2019 present_mmoire

    8/20

    7/16

    PARTIE III ANALYSE ET RESULTATS (4)

    III.c. L'analyse approfondie

    - outil: LIKES & Wordsmith Tools (SCOTT 2008)

    - tude des marqueurs base sur les contextes

    - des listes de marqueurs :

    1) 60 verbes : verbes de changements, productifsExemples: increase, decrease, release, damage

    2) 137 adverbes : jugement ngatif ou positif Exemples: advantageously, appreciably, arbitrarily, arguably...

  • 8/9/2019 present_mmoire

    9/20

  • 8/9/2019 present_mmoire

    10/20

    9/16

    PARTIE III ANALYSE ET RESULTATS (6)

    Exemple 1: if (lment) be adj (valeur), then (paramtre)

    Ifwater useis low, thenthe system is sized on loading rate and is loading rate limited.Ifwater useis high, then the system will be HRT limited and will be comparatively

    much larger than a loading rate limited system.

    Exemple 2 : certains marqueurs ncessitentL'interprtation de l'expert

    It is difficult to get a good seal between the nozzle outlet or tip and the adjacent gate

    surfaces because the surfaces area of the mating components must be kept small to avoidtoo much heat loss. Further, the mating components are subject to wear because ofthermalexpansion and contraction during the molding process.

    Valeurs: expansion (high temperature) & contraction (low temperature)

    Vert: lmentBlue: paramtreRouge : valeur

  • 8/9/2019 present_mmoire

    11/20

    10/16

    PARTIE III ANALYSE ET RESULTATS (7)

    Exemple 3 : marqueur reduce

    - indique l'existence de paramtres- parfois des limitations numriques

    - indique galement des oppositions- un marqueur gnrique et productif

    a shape anisotropy of approximately one hundred Oe would be reduced to approximately 75 Oea predetermined moving plane or two-dimensional rotationalforces can be reduced to almost 0.

    the sum ofreaction forces acting on the base can be reduced to almost 0. TThese measurements can be reduced to equilibrium vapor and liquid compositions in the cell by

    the vacuum pressure can be reduced to 20 torrand the microwave power can be raisedto about 3then the number of gages per seat can be reduced to three providing a good model of ...The mud turbine can utilize a gearbox to reduce the revolutions per minutes.

    process treats water to reduce the conductivityof the water to reduce the leakage current.The overall objective is to reduce the unnecessary biopsies and interventions, andincrease the ....

    energy can be trapped around the resonator to reduce the radiation loss in the resonatormaterials were mixed in a glove box under a flow of dry nitrogen afterthe pressurewas reduced

    Blue: paramtre

    Rouge : valeur

  • 8/9/2019 present_mmoire

    12/20

    11/16

    PARTIE III ANALYSE ET RESULTATS (8)

    III.d. annotation et extraction

    - implementation des grammaires dannotation

    - deux dictionnaires spcifiques

    - 46 graphes sur la base des rsultats de l'analyse

    - les contraintes respecter pour effectuer l'annotation

  • 8/9/2019 present_mmoire

    13/20

    12/16

    PARTIE III ANALYSE ET RESULTATS (9)

    Exemple 4 : un graphe pour localiser les oppositions

    : adjectif: terme/termes

    : ponctuationJJ$anti: proprit prdfinie

  • 8/9/2019 present_mmoire

    14/20

  • 8/9/2019 present_mmoire

    15/20

    14/16

    PARTIE III ANALYSE ET RESULTATS (11)

    Exemple 6 : texte affich en couleurs

    Vert: lment

    Blue: paramtreRouge : valeur

  • 8/9/2019 present_mmoire

    16/20

    15/16

    PARTIE III ANALYSE ET RESULTATS (12)

    III.e. Les difficults rencontres

    - recours aux experts pour valider les marqueurs

    - l'explicitation des valeurs smantiques caches- faible disponibilit de l'expert pour l'annotation

    - les listes de marqueurs complter

    - les rsultats d'annotation au niveau du rappel amliorer

    Paramtre: rappel 46% prcision 75%Valeur: rappel 26% prcision 79%Elment: rappel 13% prcision 60%

  • 8/9/2019 present_mmoire

    17/20

    16/16

    PARTIE IV CONCLUSION ETPERSPECTIVES

    Conclusion :

    - russi extraire des informations pertinentes et utiles

    - parvenu aider les concepteurs cerner les contradictions

    - l'approche propose reprsente une direction pour l'analyse des brevets

    Perspectives :

    - intgrer le travail de Kata Gabor

    - une chane de traitement complte raliser

    - les listes de marqueurs complter

    - un travail plus fin sur les oppositions effectuer

  • 8/9/2019 present_mmoire

    18/20

  • 8/9/2019 present_mmoire

    19/20

    Bibliographie

    Ghoula N., Khelif K., Dieng-Kuntz R. (2008)Vers une fouille smantique des brevets : application au domainebiomdicalActes de 8mes Journes Francophones: Extraction et Gestion des Connaissances, INRIA SophiaAntipolis - Mditerrane, pp 19-30

    Goujon B. (2000)Utilisation de l'exploration contextuelle pour l'aide la veille technologique, Thse de doctorat,sous la direction de Jean-Pierre Descls, Paris-Sorbonne (Paris-IV), 2000-04

    Grabar N. et Hamon T. (2004)Reprage de relations smantiques entre termes : sur la piste de la morphologieActes des 15me Journes Francophones d'Ingnierie des Connaissances (IC'2004) pages 237-248. Lyon. PressesUniversitaires de Grenoble.

    Hearst M. (1992)Automatic Acquisition of Hyponyms from Large Text Corpora. In Proceedings of the 14thInternational Conference On Computational Linguistics (COLING), pp 539-545. Nantes.

    Mann D., Dewulf S. (2003 )Updating TRIZ: 1985-2002 Patent Research Findings (CREAX Belgique)TRIZCON2003: 5th Annual International Conference of Altshuller Institute for TRIZ Studies, Philadelphia, USA

    Sgula P. (2001)Construction de modles de connaissances par analyse linguistique de relations lexicales dans lesdocuments techniques. Thse de Doctorat en Informatique, Universit Toulouse III Paul Sabatier.

    Teufel S., Moens M. (2002) Summarizing Scientific Articles -- Experiments with Relevance and Rhetorical Status InComputational Linguistics, 28 (4): 409-445, 2002

  • 8/9/2019 present_mmoire

    20/20

    MERCI !