mellet

Upload: lukasesane

Post on 24-Feb-2018

213 views

Category:

Documents


0 download

TRANSCRIPT

  • 7/25/2019 Mellet

    1/15

    Lexicometrica: Topographie et topologie textuelles, 2007

    La topologie textuelle : lgitimation dune notion

    mergente

    Sylvie Mellet

    Laboratoire BCL, Universit Nice Sophia-Antipolis, CNRS ; MSH de Nice, 98 bd E.Herriot, 06200 NICE

    Jean-Pierre Barthlemy

    ENST de Bretagne, BP 832, 29285 Brest Cdex

    ABSTRACT.

    KEYWORDS:

    RESUME.

    MOTS-CLES:

    *

    1

  • 7/25/2019 Mellet

    2/15

  • 7/25/2019 Mellet

    3/15

    Lexicometrica: Topographie et topologie textuelles, 2007

    simposer nous la fois comme une ncessit et comme une interrogationpistmologiques fondamentales : quelle est donc la pertinence et quelle estsurtout la lgitimit scientifique de ce terme topologie qui nous sembleintuitivement juste et dont nous avons dsormais du mal nous passer ?Telle est la question laquelle cet article va essayer de rpondre.

    1. Emergence dune notion, premire tape : lemprunttymologisant naf.

    Un texte nest donc pas un sac dans lequel seraient rassembles envrac ses units constitutives. Un texte est tout le moins une chane linaire,donc un espace ordonn une dimension. Il arrive parfois que soninscription sur la page, signifiante, oblige le placer (et linterprter) dansun espace deux dimensions : tel est le cas, par exemple, pour de nombreux

    pomes dont la structure formelle se lit la surface du texte (succession desdiffrents types de strophes, alternance des rimes sans mme parler desacrostiches ou des calligrammes) ; tel est aussi le cas pour de nombreuxtextes daffiches, publicitaires ou autres. Enfin, il faudrait ajouter ladimension temporelle qui, sous la forme de la mmoire court et longterme, joue un rle fondamental dans la structuration et la rception de touttexte de quelque ampleur4.

    Or qui dit espace dit aussi lieux : lieux privilgis de concentrationde linformation, lieux plus atones de redondance ou de pause informative,lieux de transition et zones de rupture, entre deux dveloppementsthmatiques diffrents par exemple. Autant de topo intrinsques,inhrents tout dploiement textuel. Tout cela est bien connu de toutes lesdisciplines qui ont pour objet dtude le texte, mais on avait cru pouvoirlocculter dans les traitements statistiques (ou ne le rcuprer qua

    posteriori).

    La reconnaissance, la prise en compte de lexistence dans les textesde ces lieux diffrencis nous autorisent-elles parer nos tudes du label de

    la topologie ? Non, bien sr. Tout au plus suggrent-elles lbauche dunrapprochement possible, lequel devient un peu plus insistant cependantlorsquon dclare simultanment quun texte cest aussi un ensemble (E)dunits linguistiques qui ne sont pas indpendantes les unes des autres,muni dune structure ou, plus exactement, de plusieurs structures imbriquesdont lunion constitue cet ensemble. Ces structures dessinent des sous-

    4On devine ici limportance de lapproche rticulaire dfendue notamment par Jean-Marie Viprey (voir Viprey 2006-b).

    3

  • 7/25/2019 Mellet

    4/15

    Lexicometrica: Topographie et topologie textuelles, 2007

    ensembles de (E), dlimits par des zones frontires dont les proprits sontsouvent trs intressantes tudier. Il devient alors tentant de comparer letexte un espace topologique5 dont les formes pourraient tre analysesquantitativement etqualitativement. Lapproche topologique, conformmentaux fondements qui sont lorigine de la discipline, permettrait en effet aulinguiste statisticien dune part de sortir du tout quantitatif, dautre partdarticuler le local et le global6, les micro-structures aux macro-structures.

    2. Emergence dune notion, deuxime tape : le voisinage.

    Nous considrons donc quun texte est une structure linaireconstitue dun ensemble dvnements linguistiques (occurrence dun mot,dun syntagme, dune catgorie grammaticale, etc.) qui, chacun leur tour,

    peuvent tre considrs comme des points remarquables de la chanetextuelle. Mais ce faisant, lanalyste ne saurait dtacher lunit observe deson contexte immdiat, cest--dire de la portion textuelle juge pertinente

    pour lanalyse et qui comprend un certain nombre dautres mots (ou, plusgnralement, dautres vnements linguistiques) situs avant et aprs lui.La pertinence de la taille du contexte varie selon les faits tudis, la tailleglobale du texte, lobjectif de la recherche, etc. Lempan contextuel doitdonc tre dfini par le linguiste en fonction de ces diffrents paramtres ; si

    lensemble des paramtres nest pas matrisable, le choix dune taillearbitraire ajuste par essais/erreurs peut apparatre lgitime et donnerdexcellents rsultats.

    Or quest-ce donc quun nombre [arbitrairement] fix dlments x ide (E) entourant le point x (i.e.loccurrence tudie), sinon un voisinagede

    5Rappelons la hirarchie traditionnelle des structures mathmatiques auxquelles on associedes classes particulires de fonctions (appeles aujourdhui applications ). Ainsi, enallant du moins contraint au plus contraint, on distingue :- les structures ensemblistes dans lesquelles les points sont indpendants les uns des

    autres et auxquelles on peut appliquer des fonctions quelconques ;

    -

    les structures topologiques dont les lments sont lis par des relations de voisinageet auxquelles on appliquera des fonctions continues (sur lensemble des nombresrels par exemple) ;

    - les structures diffrentiables, telles que les courbes et les surfaces, pour lesquelles onpeut, entre autres, calculer des drives ;

    - les structures mtriques telles que les espaces euclidiens, hyperboliques, etc.- les espaces vectoriels.6Larticulation du local et du global tait lun des objectifs principaux de Poincar lorsquilintroduisit la topologie en mathmatique sous le nom d analyse in situ.

    4

  • 7/25/2019 Mellet

    5/15

    Lexicometrica: Topographie et topologie textuelles, 2007

    x7

    ? Et puisque lon peut, selon les besoins de ltude, faire varier cenombre et donc la taille des contextes ainsi dfinis, ne peut-on considrerque chaque point x se trouve muni dune famille de voisinages ? Le textetant ainsi compos dun ensemble doccurrences auxquelles sont associesdes familles de voisinages, il peut lgitimement tre tudi comme unespace topologie discrte.

    Notons au passage que le concept despace topologique donne uncadre formel et un modle mathmatique la notion relativement intuitivedobjet construit. En effet, comme tout objet scientifique, lobjet de lalinguistique textuelle est un objet construit : aucun chercheur ne saurait

    prtendre travailler sur des donnes brutes, ne serait-ce que parce quilslectionne son objet parmi une infinit de possibles en fonction de ses

    intrts et de son projet de recherche. La notion de voisinage, parce quelleaffiche explicitement la slection dune unit remarquable parmi dautres etparce quelle prvoit la pluralit des focales dobservation (tailles desvoisinages), donne un statut pistmologique clair lobjet construit. Elle

    prcise aussi la notion de contextualisation , souvent mise en avant parF. Rastier par exemple. En voici une illustration sommaire dans laquelle on

    prtera attention aux processus de choix et de rduction de lobjet tudi.

    Soit un texte (fictif) quon a transform en objet dtude parrduction ses seules formes verbales et, plus prcisment, la successiondes temps verbaux de lindicatif qui le structure. Nous avons affaire l unesuite, gnralement signifiante et caractristique. Ainsi, une suite telle que :

    [IMP. IMP. PQP. IMP. IMP. PS. IMP. PS. PS. PS. IMP. PQP. PS. PS. PS. PS.PS.]8

    relve, selon la classique distinction benvenistienne, de lhistoire (paropposition au discours) et trahit demble une premire partie introductive

    posant probablement le cadre des vnements narrs (succession de cinqimparfaits et plus-que-parfaits), suivie dune squence narrative au passsimple trs nette (les cinq derniers verbes), avec, entre les deux, une zone detransition (mlange de passs simples et dimparfaits ou plus-que-parfaits)qui rend la frontire entre les deux parties difficile poser. Dans ce cadreainsi schmatis de la narration historique, chaque lment de la forme

    textuelle tudie peut tre caractris par un voisinage assez troit (parexemple de taille (5) et par une mesure de ce voisinage valuant la densit(d, 0 d 5) des paramtres pertinents prsents dans ce voisinage, par

    7Le concept de voisinaged'un point dans un ensemble, au sens intuitif d'entourer, d'treproche, est la base de la dfinition axiomatiquedes espaces topologiques ; ainsi, dans R,ensemble des nombres rels, tout intervalle ]x - h, x + h[, avec h > 0 est un voisinagede x.8IMP= imparfait, PQP= plus-que-parfait, PS= pass simple.

    5

    http://serge.mehl.free.fr/chrono/Hausdorff.htmlhttp://serge.mehl.free.fr/chrono/Hausdorff.html
  • 7/25/2019 Mellet

    6/15

    Lexicometrica: Topographie et topologie textuelles, 2007

    exemple le nombre des formes temporelles descriptives ; une telle mesurepeut rester sommaire, ne prenant en compte que la frquence des imparfaitsou devenir plus complexe en tenant compte aussi de la prsence des plus-que-parfaits jugs quivalents des imparfaits au regard de la propritdescriptive, mais aussi des participes apposs ou de certaines subordonnesquil faudrait alors rintgrer dans la chane syntagmatique et dont on

    pourrait ventuellement pondrer le poids dans la mesure. Cest l que lequalitatif peut tre rintroduit dans lanalyse en fonction des hypothses detravail du chercheur et par le biais de la multiplication des paramtresdescripteurs du voisinage qui permettent datteindre des niveaux decomplexit propres rendre compte de la richesse textuelle.

    On peut aussi ne pas prendre en compte chaque forme verbalesuccessive, mais ne sintresser qu lune dentre elles en particulier. Parexemple centrer ltude sur le temps narratif par excellence, savoir le

    pass simple, et caractriser les variations de ses voisinages au fil du texte.Dautre part la taille (5) du voisinage tant arbitraire, elle peut tre modifieau gr du chercheur ; celui-ci peut aussi vouloir travailler partir dune basede voisinage linguistiquement pertinente (par exemple, la phrase auquelcas il faudra rintgrer dans les donnes les marques de ponctuation forte),et passer ensuite une famille de voisinage plus large si le besoin sen faitsentir (raret des occurrences dun phnomne, significativit de squences

    plus longues que la phrase telles le paragraphe, etc.). On trouvera uneapplication de cette mthode dans Longre, Luong & Mellet (2004).

    La notion de voisinage est donc susceptible de fonder en partie uneapproche topologique de lanalyse textuelle. Elle reste nanmoinsinsuffisante dans la mesure o elle ne prend que partiellement en comptelordre linaire des lments et la rcurrence des figures plus ou moinscomplexes, caractristiques de certains textes ou parties de textes : elle nesuffit donc pas donner accs cette proprit intrinsque de lobjet textequi pourrait tre dcrite comme une structure topologique ou qui, dumoins, pourrait tre value cette aune. Il faut pour cela sintresser desmarqueurs linguistiques qui constituent des schmesordonnsrcurrents, et

    qui sont susceptibles de caractriser telle ou telle partie du texte diffrentsniveaux de granularit et daider ainsi au reprage des diverses zonestextuelles. Les motifs pourraient tre un bon candidat ce rle.

    3. Les motifs : confrontation aux axiomes de la topologie sur unespace fini.

    6

  • 7/25/2019 Mellet

    7/15

    Lexicometrica: Topographie et topologie textuelles, 2007

    On appelle ici motif lassociation rcurrente de n lments delensemble (E) muni de sa structure linaire qui donne une pertinence auxrelations de successivit et de contigut. Ainsi, si lensemble (E) estcompos de x occurrences des lments A, B, C, D, E, F, un premier motif

    pourra tre la rcurrence du groupe linairement ordonn ABD, un autremotif pourra tre la rcurrence du groupe AA9.

    Apparemment simple, cette dfinition soulve pourtant un certainnombre de difficults ds que le linguiste cherche la concrtiser :

    - quelles units linguistiques peuvent prtendre intgrer un motif ? A-t-onle droit de constituer des motifs htrognes, cest--dire associant deslments de nature diffrente (lexmes, catgories grammaticales, ) ?

    Comment distinguer les motifs entirement libres des motifs contraintspar les structures de la langue (non seulement expressions lexicalises,mais aussi enchanements grammaticaux rgis par des rgles dedpendance hirarchique) ?

    - quelle place accorder la ponctuation ? En dautres termes, unenchanement AB,D relve-t-il du motif ABD ? La phrase est-elle uneunit pertinente de localisation des motifs ? En est-elle la seule ?

    - comment grer les espacements ? Si x est une occurrence quelconque ausein du texte, peut-on construire un motif ABxD ? Voire assimilerABxD ABxxD ?

    Ces questions ne semblent pas pouvoir recevoir de rponses a priori.

    Cest lusage et, dans un premier temps, au coup par coup, que le linguisteaura trancher. Ultrieurement, un ensemble de dcisions concrtes pourrasans doute tre gnralis et thoris.

    Pour linstant, et pour revenir notre propos, nous travaillerons surun exemple qui met en jeu les divers types de propositions, principales etsubordonnes, dun texte narratif latin (la variation des units sera doncrelativement contrainte au sein dun cadre grammatical dfini) ; nousadmettrons de ce fait que la phrase est une unit pertinente pour la dtectiondes motifs lis ce type dunits linguistiques (cadre syntaxique phrastiqueclassique) ; enfin nous nexclurons pas a priori la possibilit de motifs

    complexes intgrant des occurrences quelconques en leur sein.Les propositions qui nous intressent sont dune part la proposition

    principale, dautre part certaines subordonnes qui contribuent poser uncadre circonstanciel laction, tels les ablatifs absolus (i.e. une forme de

    9On le voit, les motifs sont susceptibles denglober les segments rpts (A. Salem) ;mais ils sont plus larges puisquils intgrent aussi des codes grammaticaux et pourraientpeut-tre admettre linsertion dune variable parmi les lments stables qui les dfinissent.

    7

  • 7/25/2019 Mellet

    8/15

    Lexicometrica: Topographie et topologie textuelles, 2007

    proposition participiale) et les subordonnes en cum + subjonctif (i.e.lquivalent approximatif des propositions en alors que, comme).Lorganisation de toutes ces propositions structure en effet la narration et lesstylisticiens ont depuis longtemps montr quelles contribuaient caractriser le style dun auteur : certains crivains en effet les utilisent avec

    parcimonie, dautres ne reculent pas devant leur accumulation. Certainsprfrent placer les subordonnes en dbut de phrase, pour poser dabord lecadre de laction principale, dautres au contraire pratiquent volontiers la relance syntaxique en fin de phrase, ajoutant aprs coup des lmentsinformatifs secondaires. Les diffrents motifs et leur frquence respectivecaractrisent donc le style dun auteur ; leur distribution pourrait aussicaractriser les diffrentes parties dune uvre (les parties introductives ou

    de commentaires entre les passages narratifs offrant un cadre plusaccueillant aux accumulations de subordonnes, par exemple). Le niveaulocal ouvre ici sur le niveau global.

    Pour reprer plus aisment ces configurations potentielles, nousdonnerons donc la proposition principale le code P, aux subordonnescirconstancielles, quelle que soit leur nature exacte (participiales ou encum), le code S et au point final de phrase le code $ ; x restera le symboledune occurrence quelconque de toute autre proposition.

    Les motifs pertinents pour cette recherche sont donc susceptibles deprendre, entre autres, les formes suivantes :

    -subordonnes circonstancielles en tte de phrase : $SP, $SSP, $SSSP,

    $SxP, $SSxP, $SSSxP-subordonnes circonstancielles en fin de phrase : PS$, PSS$, PSSS$,

    PSxSS$

    -configuration mixte avec pondration forte sur la fin de phrase :$SxPSS$, $SxxPSS$, $SxxPSSS$, $xSxPSS$

    On voit, partir de cette numration non exhaustive, que les motifssont des ferms qui ont la proprit de ne pas tre ncessairement spars.Lensemble du texte est un motif lui seul ( condition de transiger un peusur la proprit de rcurrence accorde initialement aux motifs) ; lensemblevide peut aussi tre considr comme un motif.

    Par ailleurs, il est clair que lintersection de deux motifs fournit unmotif (plus ou moins pertinent pour la recherche mais cest l un autre

    problme qui ne relve plus de la topologie).

    Un ensemble important de proprits topologiques sont doncsatisfaites.

    En revanche, lunion de deux motifs ne fournit un motif que lorsqueles deux motifs sont conscutifs. Lun des axiomes des structures

    8

  • 7/25/2019 Mellet

    9/15

    Lexicometrica: Topographie et topologie textuelles, 2007

    topologiques stricto sensuest ici pris en dfaut. Cependant, on peut trouverdes squences qui, au moins pour quelques motifs, fournissent une bornesuprieure10: ainsi, dans la liste ci-dessus, $SSSxP est la borne suprieurede lensemble des motifs rassemblant les circonstancielles en tte de

    phrase ; $SxxPSSS$, est la borne suprieure des deux motifs mixtes$SxPSS$, $SxxPSS$, mais pas du dernier motif de lnumration$xSxPSS$. De la mme faon il existe des motifs qui peuvent servir de

    borne infrieure11 un petit nombre dautres motifs : ainsi $S constitue laborne infrieure de tous les motifs plaant les circonstancielles en tte dephrase et des trois premiers motifs des configurations mixtes. On est doncpeut-tre lgitim considrer que lon a bien affaire un ensemble munidun ordre partiel et dans lequel certains lments au moins rpondent aux

    deux conditions de borne infrieure et de borne suprieure, ce qui dfinitune structure topologique de treillis . Au sens strictement mathmatique,tous les lments de lensemble devraient rpondre ces conditions ; on

    peut nanmoins estimer que, dans la perspective qui est la ntre, lexistencede plusieurs points signifiants du texte qui satisfont ces deux conditionssuffit valider la transposition des notions topologiques lanalyse desstructures textuelles.

    4. De la topologie comme proprit intrinsque du texte latopologie des espaces de reprsentation

    Les motifs sont donc de bons candidats fonder une approcheproprement topologique des textes : ils permettent darticuler le local auglobal et rpondent la plupart des axiomes de la topologie sur un espacefini. Comment les exploiter ?

    Tout dabord il est clair que pour apprhender un texte dans toute sacomplexit on ne saurait se contenter de travailler sur une seule de sesdimensions. Le linguiste et/ou le stylisticien doit donc essayer de dtecter

    plusieurs des dimensions pertinentes constitutives de la structure du texte oudes textes sous tude, de caractriser chacune de ces dimensions par lafrquence et la distribution des motifs affrents et de voir ensuite comment

    ces diffrentes classes de motifs sarticulent entre elles pour donner uneimage multidimensionnelle de la structure textuelle. Cette mthode quiprogresse pas pas et cumule les rsultats repose bien videmment sur unehypothse de robustesse statistique ; on peut estimer que lensemble des

    10Il sagit du plus petit lment de lensemble donc du plus petit motif englobant lemotif A et le motif B.11Fait pendant la borne suprieure et peut tre assimile un plus grand dnominateurcommun (plus grand des motifs inclus la fois dans le motif A et dans le motif B).

    9

  • 7/25/2019 Mellet

    10/15

    Lexicometrica: Topographie et topologie textuelles, 2007

    tudes de linguistique statistique accumules depuis les annes 1950 validesuffisamment cette hypothse. Elle nous permet en tous cas de quitter lasimple linarit de la structure de surface pour faire merger les structuresembotes auxquelles on prtend atteindre.

    Dautre part, en linguistique quantitative et analyse des donnestextuelles, la caractrisation dun texte est trs souvent mene dans un butcomparatif : il sagit gnralement dvaluer les ressemblances ou lesdiffrences entre plusieurs textes au moyen de divers calculs de distance, et

    parfois mme daboutir une classification, le tout tant sous-tendu par unprojet interprtatif (caractrisation du style dun auteur, dun genre ou dunsous-genre littraire, dune poque, dtection dune volution diachronique,etc.). Sur ce point on prendra bien garde que les mthodes ici dcrites ne

    relvent pas des statistiques infrentielles : elles ne peuvent donc conduirequ la formulation dhypothses dans une dmarche heuristique, mais nesauraient en aucun cas valider une hypothse pralable ; en particulier, ellesnont aucune valeur probatoire en matire dattribution dauteur.

    Comment donc sopre la comparaison ? Il sagit daffecter chaquetexte un profil (vectoriel ou autre) qui le caractrise en sommant lensembledes informations apportes par ltude des diffrents motifs. Chaque profil,constitu dun mme nombre de descripteurs, est ensuite intgr unematrice rectangulaire dont les textes fournissent lintitul des lignes et dontles descripteurs de profil fournissent les colonnes. A partir de l peuvent treappliques les mthodes classiques de calcul de distance.

    Or on sait que linterprtation de ces calculs passe gnralement parune reprsentation graphique sur un espace deux dimensions12; les plusfrquentes dentre elles sont les mthodes en axes principaux, toutesdrives de la dcomposition aux valeurs singulires: analyse descorrespondances (AC), Latent semantic Indexing (LSI), analyse encomposantes principales (ACP). Ces mthodes peuvent tre qualifies delinaires dans ce contexte, parce quelles projettent les points sur des droitesou des plans. (Lebart 2006 : 593). Les classifications, quant elles,recourent le plus souvent divers types de dendogrammes, sans que soienttotalement exclues les cartes ou les grilles comme, par exemple, dans le casdes cartes auto-organises de Kohonen.

    Quoi quil en soit, toutes ces reprsentations graphiques des fins de

    visualisation pour aider linterprtation possdent leur propre topologie quiest une topologie externeau corpus tudi. Il sagit en outre dune topologiespare alors que la topologie intrinsque des textes est une topologie nonspare. La question qui surgit alors est celle du lien tablir (ou pas) entre

    12Avec le dveloppement des outils informatiques, lergonomie de telles visualisations peuttre amliore par lajout dune troisime dimension, par lemploi de la couleur, voire pardes procds danimation ; cf. Viprey (2006-a).

    10

  • 7/25/2019 Mellet

    11/15

  • 7/25/2019 Mellet

    12/15

    Lexicometrica: Topographie et topologie textuelles, 2007

    ont contribu dlimiter. On peut estimer que ce profil fournit une imageabstraite du texte, une sorte de schme sous-jacent et que lensemble ducorpus acquiert, en effet, une topologie propre lie la runion de cesdiffrents schmes au sein dun mme ensemble.

    Quant au choix de la reprsentation graphique la plus approprie,aucun argument ne nous parat dcisif en la matire. On soulignerasimplement que le lien entre la topologie textuelle et la topologie desespaces de reprsentations (qui, redisons-le encore, nest pas un lien direct,mais un lien double dtente) varie trs certainement en fonction de lareprsentation choisie. Par exemple, lAnalyse Factorielle desCorrespondances (AFC), en dpit de la projection planaire laquelle on estcontraint de la rduire, conserve trs exactement le nombre de dimensions

    initiales ; on peut donc toujours convoquer lensemble des plans factorielssuccessifs qui dcrivent la structure globale sous la forme dun nuage depoints. En revanche lAFC ne permet pas de constituer des classes autourdes lments les plus saillants de la structure ni de dcrire les positionsrelatives des classes dans lespace.

    Lanalyse arbore permet au contraire de constituer des classes, enimposant en outre une contrainte de proximit. Lalgorithme prsent parLuong & Barthlemy (1987) a lavantage dassocier cette structurationclassificatoire une reprsentation des distances (ce qui nest gnralement

    pas le cas dans les reprsentations arbores). Il donne en outre accs ladynamique de construction de larbre, laquelle fournit des lmentsdinformation importants sur les proximits topologiques ; par ce biais, on

    retrouve au niveau du corpus dans son entier larticulation entre le local(la constitution de chaque nud de larbre) et le global (sa structuregnrale). En revanche lanalyse arbore, contrairement lAFC, ne permet

    pas de reprsenter simultanment dans un seul et mme graphe les variablestextuelles (lignes) et les paramtres descripteurs (colonnes)16.

    Cest pourquoi, le linguiste est tent de recourir tantt lun, tantt lautre de ces deux modes de reprsentation spatiale. Mais, en toute rigueur,une tude ne devrait pas les mlanger, du moins sans prcaution et sansargumentaire.

    Conclusion

    - La notion de topologie textuelle pour apprhender la structureinterne dun texte nous parat lgitime travers la construction (certesartfactuelle) de voisinages et de motifs, qui les uns et les autres rpondent

    16Pour une approche complte des reprsentations arbores, voir Barthlemy & Gunoche(1988).

    12

  • 7/25/2019 Mellet

    13/15

    Lexicometrica: Topographie et topologie textuelles, 2007

    parfaitement la fois la ralit de lobjet dtude (encore une fois en tantquobjet construit), aux besoins et aux enjeux de lanalyse et aux axiomesdune vritable topologie.

    - Le passage dune topologie interne textuelle une topologieexterne des reprsentations se fait par le sas de la constitution du corpus etde sa structuration qui dune part repose sur lanalyse textuelle pralable,dautre part conduit une reprsentation spcifique des lments spars quile constituent.

    Rfrences bibliographiques

    Adam J.-M. (2006). Autour du concept de texte. Pour un dialogue desdisciplines de lanalyse de donnes textuelles , inJADT 2006[texte enligne sur Lexicomtrica (http://www.cavi.univ-

    paris3.fr/lexicometrica/jadt/JADT2006-PLENIERE/JADT2006_JMA.pdf)].

    Barthlemy J.-P. & Gunoche A. (1988). Les arbres et les reprsentationsdes proximits. Paris : Masson.

    Barthlemy J.P. & Luong X. (1987). Sur la topologie d'un arbrephylogntique : aspects thoriques, algorithmiques et applications

    l'analyse de donnes textuelles , Mathmatiques et Sciences Humaines100 : 57-80.Barthlemy J.-P. & Luong X. (1998). Reprsenter les donnes textuelles

    par des arbres , in JADT 1998, Actes des 4mes JournesInternationales d'analyse de donnes textuelles, Univ. de Nice : UMR6039, pp. 49-70.

    Brunet . (2006). Navigation dans les rafales , in J.M. Viprey (d.),JADT 06, 8mes Journes internationales dAnalyse statistique desDonnes Textuelles. Besanon : Presses universitaires de Franche-Comt, vol. 1, pp. 15-29.

    Cahiers de praxmatique(2005). Htrognits nonciatives et types desquences textuelles , n45.

    Lafon P. (1981). Statistique des localisations des formes dun texte ,Mots 2 : 157-187.

    Lamalle C. & Salem A. (2202). Types gnraliss et topographie textuelledans lanalyse quantitative des corpus textuels , in A. Morin & P.Sbillot (ds) JADT 2002, 6mes Journes internationales dAnalysestatistique des Donnes Textuelles. Saint-Malo : IRISA / INRIA, vol. 1,

    pp. 403-411.

    13

    http://www.cavi.univ-paris3.fr/lexicometrica/jadt/JADT2006-PLENIERE/JADT2006_JMA.pdfhttp://www.cavi.univ-paris3.fr/lexicometrica/jadt/JADT2006-PLENIERE/JADT2006_JMA.pdfhttp://www.cavi.univ-paris3.fr/lexicometrica/jadt/JADT2006-PLENIERE/JADT2006_JMA.pdfhttp://www.cavi.univ-paris3.fr/lexicometrica/jadt/JADT2006-PLENIERE/JADT2006_JMA.pdfhttp://www.cavi.univ-paris3.fr/lexicometrica/jadt/JADT2006-PLENIERE/JADT2006_JMA.pdfhttp://www.cavi.univ-paris3.fr/lexicometrica/jadt/JADT2006-PLENIERE/JADT2006_JMA.pdfhttp://www.cavi.univ-paris3.fr/lexicometrica/jadt/JADT2006-PLENIERE/JADT2006_JMA.pdfhttp://www.cavi.univ-paris3.fr/lexicometrica/jadt/JADT2006-PLENIERE/JADT2006_JMA.pdfhttp://www.cavi.univ-paris3.fr/lexicometrica/jadt/JADT2006-PLENIERE/JADT2006_JMA.pdfhttp://www.cavi.univ-paris3.fr/lexicometrica/jadt/JADT2006-PLENIERE/JADT2006_JMA.pdfhttp://www.cavi.univ-paris3.fr/lexicometrica/jadt/JADT2006-PLENIERE/JADT2006_JMA.pdf
  • 7/25/2019 Mellet

    14/15

    Lexicometrica: Topographie et topologie textuelles, 2007

    Lebart L. (2004). Validit des visualisations de donnes textuelles , inG.Purnelle, C. Fairon & A. Dister (ds), JADT 2004, 7mes Journesinternationales dAnalyse statistique des Donnes Textuelles. UCL :Presses universitaires de Louvain, vol. 2, pp. 708-715.

    Lebart L. (2006). Explorer lespace des mots : du linaire au non-linaire , in J.M. Viprey (d.), JADT 06, 8mes Journesinternationales dAnalyse statistique des Donnes Textuelles. Besanon :Presses universitaires de Franche-Comt, vol. 2, pp. 593-600.

    Longre D. & Luong X. (2003). Temps verbaux et linarit du texte :recherches sur les distances dans un corpus de textes latins lemmatiss ,Corpus 2 : 119-140.

    Longre D., Luong X. & Mellet S. (2004). Temps verbaux, axesyntagmatique, topologie textuelle : analyse dun corpus lemmatis , inG. Purnelle, C. Fairon & A. Dister (ds), JADT 2004, 7mes Journesinternationales dAnalyse statistique des Donnes Textuelles. UCL :Presses universitaires de Louvain, vol. 2, pp. 743-752.

    Longre D.& Mellet S. (sous presse). Temps verbaux et prose historiquelatine : la recherche de nouvelles mthodes d'analyse statistique , in

    Actes du 13meColloque international de Linguistique latine(ICLL 13,Bruxelles 2005).

    Longre D., Mellet S. & Luong X. (2006). Distance intertextuelle etclassement des textes d'aprs leur structure : mthodes de dcoupage etanalyses arbores , in J.M. Viprey (d.), JADT 06, 8mes Journesinternationales dAnalyse statistique des Donnes Textuelles. Besanon :Presses universitaires de Franche-Comt, vol. 2, pp. 643-654.

    Luong X., Juillard M., Mellet S. & Longre D. (2007). The Concept ofText Topology. Some Applications to Verb-Form Distributions inLanguage Corpora ,Literary and Linguistic Computing 22,2 : 167-186.

    Juillard M. & Luong X. (1989). Unrooted Tree Revisited : Topology andPoetic Data , Computers and the Humanities23 : 215-225.

    Juillard M. (1998). Les lexmes dans l'espace du texte : analyses arboreset bases de voisinage , Cycnos 15 : 57-75.

    Mayaffre D. (2007a). Philologie et/ou hermneutique numrique :nouveaux concepts pour de nouvelles pratiques , in F. Rastier etM. Ballabriga (ds) Corpus en Lettres et Sciences sociales. Des

    documents numriques l'interprtation. Toulouse: Put, pp. 15-26 (lire aussi sur Texto ! Textes et cultures, http://www.revue-texto.net/Archives/Archives.html).

    Mayaffre D. (2007b). Lanalyse des donnes textuelles aujourdhui : ducorpus comme une urne au corpus comme un plan. Retour sur lestravaux actuels de topographie/topologie textuelle , Lexicometrica 7 Topographie et topologie textuelles .

    14

    http://www.revue-texto.net/Archives/http://www.revue-texto.net/Archives/http://www.revue-texto.net/Archives/http://www.revue-texto.net/Archives/http://www.revue-texto.net/Archives/http://www.revue-texto.net/Archives/
  • 7/25/2019 Mellet

    15/15

    Lexicometrica: Topographie et topologie textuelles, 2007

    Pirard S., Degand L. & Bestgen Y. (2004). Vers une rechercheautomatique des marqueurs de la segmentation des discours , , inG.Purnelle, C. Fairon & A. Dister (ds), JADT 2004, 7mes Journesinternationales dAnalyse statistique des Donnes Textuelles. UCL :Presses universitaires de Louvain, vol. 2, pp. 859-864.

    Pirard S. & Bestgen Y. (2006). A la pche aux marqueurs linguistiquesde la structure des discours , in J.M. Viprey (d.), JADT 06, 8mes

    Journes internationales dAnalyse statistique des Donnes Textuelles.Besanon : Presses universitaires de Franche-Comt, vol. 2, pp. 749-758.

    Srant D. & Thoiron Ph. (1988). Topographie des formes rptes ,Revue Informatique et Statistique dans les Sciences humaines 24 : 333-

    343 (Le nombre et le texte : Hommage tienne vrard).Viprey J.-M. (2006-a). Ergonomiser la visualisation AFC dans un

    environnement dexploration textuelle : une projection godsique ,in J.M. Viprey (d.), JADT 06, 8mes Journes internationalesdAnalyse statistique des Donnes Textuelles. Besanon : Pressesuniversitaires de Franche-Comt, vol. 2, pp. 989-1000.

    Viprey J.-M. (2006-b). Structure non squentielle des textes , Langages163 : 71-85.

    15