la linguistique au contact de l'informatique - de la construction des grammaires aux grammaires de...

Upload: franck-dernoncourt

Post on 10-Apr-2018

221 views

Category:

Documents


0 download

TRANSCRIPT

  • 8/8/2019 La Linguistique Au Contact de l'Informatique - De La Construction Des Grammaires Aux Grammaires de Construction

    1/22

    Marcel Cori et Jean-Marie Marandin

    1

    La linguistique au contact de linformatique : de la constructiondes grammaires aux grammaires de construction 1

    1 Nous remercions J. Lon et O. Bonami de leurs relectures et suggestions.

    Marcel CoriUniversit Paris X Nanterre

    FRE CNRS Modles, dynamiques, corpus UFR L L Phi Btiment L

    200 avenue de la Rpublique92001 Nanterre Cedex

    [email protected]

    Jean-Marie MarandinLaboratoire de Linguistique Formelle (CNRS)

    Universit Paris 7 Denis DiderotUFRL, case 7003

    2 place Jussieu75251 Paris Cedex 05

    [email protected]

    La linguistique de la seconde moiti du vingtime sicle est profondment marque par leprogramme de recherche dfini sous le terme de grammaire gnrative. La grammaire gnrativedfinit un nouvel objet pour la linguistique : la comptence. Chomsky reprend le terme degrammaire pour dsigner un modle de comptence. La linguistique se dfinit ds lors comme uneentreprise de construction de grammaires ( grammar design ) qui sont tout la fois des instances dedescription des langues et des modles de la comptence :

    (1) It is assumed that there is a correct generative grammar which determines the structuralcharacteristic of any string, including those that deviate from well-formedness in variousrespects, and that the problem of the linguist is to discover this grammar and to discover thelinguistic theory that determines possible grammars and incorporates universals of language.(Chomsky, 1975 : 44)

    Durant la mme priode, et parfois dans les mmes institutions, se dveloppent un ensemble derecherches, que nous regroupons sous ltiquette informatique , consacres la modlisation desactivits de programmation d'un ordinateur. Ces recherches incluent la thorie de la compilation, leslangages de programmation, l'intelligence artificielle et le traitement automatique des langues (TAL).Chacune sa manire croise le chemin de la linguistique, que ce soit au travers des notions delangage (et des usages du langage), de comptence qui est mis au fondement du programmecognitiviste, ou moins spcifiquement de connaissance. Les langages de programmation doivent tredcrits syntaxiquement, interprts et traduits en langage machine. L'intelligence artificielle seprsente comme la modlisation de toute forme de connaissance ; si la grammaire est une forme deconnaissance, la grammaire est du ressort de l'intelligence artificielle. Le TAL (dont le statut estambigu, entre thorie de la performance et applications industrielles) est directement confront auxaspects systmatiques des langues naturelles.

    La linguistique et l'informatique sont des disciplines en contact comme on dit que deuxlangues sont en contact : ignorance rciproque, rivalit plus ou moins belliqueuse, emprunt etcollaboration. Dans cet article, nous ne construirons qu'un seul fil de l'histoire de ce contact : celuiqui va de l'mergence d'un sous-programme consacr aux grammaires formelles l'mergence d'uneredfinition du programme gnratif initial, les grammaires de constructions. Notre entreprise n'estpas une entreprise d'historiens (ou de sociologues) des sciences ; elle s'apparente davantage unetentative d'histoire rationnelle (Lakatos, 1984) : nous reconstruisons dans l'paisseur des faits

  • 8/8/2019 La Linguistique Au Contact de l'Informatique - De La Construction Des Grammaires Aux Grammaires de Construction

    2/22

    La linguistique au contact de linformatique

    2

    institutionnels et intellectuels les volutions d'un programme de recherche qui aboutissent un pointde vue bien particulier sur la grammaire des langues qui nous intresse, car nous en sommes partieprenante. C'est dire que notre point de vue est engag , partiel et trs nettement dlimit. Enparticulier, nous laisserons de ct les avatars des grammaires transformationnelles (proposs dansles modles Thorie standard, Principes et paramtres, Gouvernement et liage, Programme

    minimaliste) car ils ne nous semblent pas contribuer de faon dcisive l'avancement du projet dfinipar Chomsky que nous rappelons en (1). Ce choix prsuppose que lon peut distinguer dans lesthories linguistiques les propositions et les argumentations qui relvent de la description deslangues et celles qui relvent du choix et de la confection des grammaires.

    Pour la clart, nous reconstruisons trois moments. Le premier est un moment fondateur pour lalinguistique et l'informatique : la dfinition d'une nouvelle discipline, appele par Chomskylinguistique algbrique , consacre l'tude des grammaires formelles. De faon paradoxale, lespremiers rsultats de cette discipline, la hirarchie des grammaires, sont l'origine dedveloppements considrables en informatique, aussi bien en thorie de la compilation que dans ladfinition d'algorithmes d'analyse qui peuvent tre investis dans le TAL, alors qu'ils sont cantonnspar Chomsky servir de base la rfutation des formes non transformationnelles de grammaire. Le

    second est un moment de rforme, o Gazdar joue un rle dterminant : le programme gnratif sescinde en deux. Le rejet des grammaires transformationnelles par les linguistes tenants de la formesyntagmatique des grammaires et les informaticiens tenants de la dclarativit se prsente comme unretour au programme initial, et en particulier comme l'affirmation de la pertinence de l'approcheformelle de la grammaire des langues naturelles. Le troisime moment est contemporain ; on pourraitfiler la mtaphore historique et parler de moment baroque (alors que le programme minimalisteapparat comme une entreprise de contre-rforme dans ses tenants sinon dans ses aboutissantsformels). L'analyse des langues inclut de nouvelles dimensions la suite du dveloppementd'approches formalises en smantique et en pragmatique. On demande aux grammaires d'intgrer cequi relve du signifiant, du signifi et de l'usage des expressions linguistiques. C'est ce que recouvrela notion gnrale de construction. Cela est rendu possible par le dveloppement en informatique desystmes de reprsentation des connaissances complexes et multidimensionnels. HPSG (Pollard etSag) apparat comme le catalyseur contemporain de cette nouvelle approche de la grammaire, ol'entreprise de description des langues prend le pas sur la modlisation de la facult de langage.

    1. Lmergence du paradigme gnratif

    1.1 Le contexteChomsky dcrit longuement le contexte d'mergence du programme gnratif dans l'introduction

    qu'il rdige en 1973 pour la publication en 1975 de The logical structure of linguistic theory (LSLTdornavant) qui date de 1955 ; le passage (2) rsume l'essentiel de cette description :

    (2) Interdisciplinary approaches to language, communication, and human behavior were much invogue -- thus it was hardly surprising that a student in Cambridge in the early 1950s shouldhave come to think of linguistics as, in effect, a branch of cognitive psychology concerned withthe language faculty and its exercise. Roman Jakobson's work was well known and influential.Oxford ordinary language analysis and Wittgenstein's later work were attracting great interest.[...]. Mathematical logic, in particular recursive function theory and metamathematics, werebecoming more generally accessible, and developments in these areas seemed to provide toolsfor a more precise study of natural language as well. All of this I personally found moststimulating.At the same time electronic computers were begining to make their impact. The mathematical

    theory of communication, cybernetics, sound spectography, psychophysics, and experimentalpsychology were in a period of rapid development and much exuberance. Their contribution

  • 8/8/2019 La Linguistique Au Contact de l'Informatique - De La Construction Des Grammaires Aux Grammaires de Construction

    3/22

    Marcel Cori et Jean-Marie Marandin

    3

    lent an aura of science and mathematics to the study of language and aroused muchenthousiasm [...]. A technology of machine translation, automatic abstracting, and informationretrieval was put forward as a practical prospect. It was widely believed that B.F. Skinner'sWilliam James lectures of 1947 offered an account of some of the most complex products of human intelligence in terms of the science of behavior [...]. My personal reaction to this

    particular complex of beliefs, interests, and expectations was almost wholly negative. Thebehaviorist framework seemed to me a dead end, if not an intellectual scandal. The models of language that were being discussed and investigated had little plausibility [..] and I had nopersonal interest in the experimental studies and technological advances. The latter seemed tome in some respect harmful in their impact [...]. As for machine translation and relatedentreprises, they seemed to me pointless as probably quite hopeless.(Chomsky, 1975 : 39)

    Cette prsentation est autant une reconstruction imaginaire qu'une description factuelle ducontexte d'mergence du programme gnratif. Nanmoins, elle restitue correctement le soclepistmologique de la notion clef pour le programme gnratif et pour les rapports entre linguistique

    et informatique, la notion de grammaire. Et cela passe par une claire distinction entre d'un ct lesmathmatiques ( function theory and metamathematics ) et de l'autre l'informatique que Chomskyamalgame l'ennemi qu'il donne au programme naissant : le behaviourisme. L'ide de grammaireprend forme dans le sillage des mathmatiques symboliques et non dans les programmes ou lesthories (mme mathmatises) de la science de l'information naissante. En effet, pour dfinir cequil entend par une grammaire, Chomsky se rfre la notion de systme constructionnel(constructional system ), qui est ainsi au cur du nouveau programme de recherche. La formeorganisatrice d'une grammaire gnrative n'est pas le rpertoire comme c'est le cas pour lesgrammaires traditionnelles 2, mais la forme logique d'une thorie.

    1.1.1. La notion de systme constructionnelUn systme constructionnel (SC dornavant) est, en toute gnralit, la reconstruction logique

    d'un savoir sur une rgion du monde. Carnap en a dessin l'ide, et un type particulier, dans Der logische Aufbau der Welt . C'est Goodman qui, sur la base d'une critique de Carnap, gnralise lanotion dans Structure of Appearance (1951 ; SA dornavant). Les argumentations de Chomsky sontsoutenues par les rsultats auxquels est parvenu Goodman 3.

    Goodman insiste sur le fait que les lments primitifs de toute description peuvent recevoirplusieurs dfinitions adquates ( adequacy ) et que le choix d'un systme de dfinitions dpend de lafonction qu'on assigne au systme global, et en particulier du gain de prcision ( accuracy ) que l'onpense en tirer. Goodman rcuse donc avec force l'ide que la description d'une rgion du mondedemande que soit isol un ensemble unique et fixe d'lments, en particulier d'lments qui auraientle statut de donnes identifies pralablement et indpendamment de la description elle-mme 4. Ildcoule de cette prmisse que tout savoir sur une rgion du monde donne lieu plusieurs systmes(selon la base empirique que l'on se donne au dpart) et que le critre pour valuer les systmes enconcurrence implique ncessairement une valuation de l'effet de connaissance que chacun apporte.

    Chomsky reprend intgralement ces propositions. On peut soutenir que ce sont ces propositionsqui constituent l'essentiel de la rupture avec le programme linguistique contemporain, tel que l'ont 2 Rpertoire des expressions attestes, curieuses, grammaticales ou correctes selon les grammaires.3 Chomsky cite plusieurs fois SA dans l'introduction de LSLT ainsi que dans la premire note de Syntactic Structures .C'est un indice faible tant donn le fait que le rgime de citation et de non-citation chez Chomsky (et plusgnralement dans le groupe qu'il contrle) obit plus une logique institutionnelle qu' la reconnaissance de dettesintellectuelles. La rfrence la structure logique de la thorie est un indice bien plus significatif d'une filiation

    avec SA.4 The consideration relevant in choosing elements for a system is thus not primacy in the cognitive process butserviceability as a basis for an economical, perspicuous and integrated system (Goodman, 1972 : 10).

  • 8/8/2019 La Linguistique Au Contact de l'Informatique - De La Construction Des Grammaires Aux Grammaires de Construction

    4/22

  • 8/8/2019 La Linguistique Au Contact de l'Informatique - De La Construction Des Grammaires Aux Grammaires de Construction

    5/22

    Marcel Cori et Jean-Marie Marandin

    5

    Si la notion de SC donne la forme gnrale et les principes de construction de la notion degrammaire, il reste les mettre en uvre. La notion de gnrativit et de rcursivit sont icidcisives : si une grammaire comporte des mcanismes rcursifs, quels qu'ils soient, elle produirades phrases en nombre infini (Chomsky [1957], 1969 : 27). Grce la rcursivit, une grammairese prsente comme un systme permettant d'engendrer la description structurale d'un nombre infini

    de phrases 9.

    1.2. Les grammaires formellesLe programme de construction des grammaires est insparable de la recherche du meilleur

    systme pour dcrire les langues ( a correct generative grammar ). Dans l'horizon des SC,Chomsky introduit la formalisation des grammaires comme un des instruments de slection ; il poseclairement que la formalisation permet de rfuter ou de corroborer une forme de grammaire ou uneanalyse particulire. Ce recours la formalisation va constituer un des traits les plus stables duprogramme gnratif (cf. (9) ci-dessous). Chomsky appelle la partie des mathmatiques qui permetd'tudier les grammaires linguistique algbrique . De nombreux travaux ne tarderont pas paratre 10. Un des rsultats essentiels se donne sous forme d'une hirarchie des grammaires. Il estremarquable que Chomsky utilise cette recherche pour critiquer un certain nombre de formes degrammaire, et en particulier la forme syntagmatique, et non pour formaliser la forme qu'il propose etdfend : la grammaire transformationnelle.

    1.2.1. La hirarchie de grammairesL'objet de la linguistique algbrique est de caractriser les proprits des grammaires formelles

    ou des grammaires syntagmatiques ( Phrase Structure Grammars, PSG ). Une grammaire formellepermet d'engendrer de manire rcursive, l'aide d'un nombre fini de rgles (de rcriture), unlangage constitu d'un nombre infini d'noncs possibles.

    Plus prcisment, une grammaire formelle met en jeu un vocabulaire V (qui peut tre constitud'un vocabulaire terminal V T et d'un vocabulaire non terminal V N). Les suites finies dlments duvocabulaire, ou mots, sont rcrites daprs les rgles de la grammaire. De la sorte, en partant dunsymbole initial, ou dun mot initial (qui est un axiome), on obtient, par drivation, des suitesterminales. Lensemble des suites terminales qui peuvent tre produites par une grammaire donneconstitue le langage engendr par la grammaire. Par exemple, les deux rgles S a S et S bpermettent dengendrer toutes les suites de la forme a a a b (o le nombre de a est quelconque).

    En apportant des restrictions la forme des rgles, on restreint la classe des langages quipeuvent tre engendrs. Cest ainsi qua t tablie une hirarchie entre classes de langages ou typesde grammaires, connue sous le nom de hirarchie de Chomsky . La formulation la pluscommunment admise considre quatre types de grammaires. Le type 0 correspond la classe deslangages la plus large, puisque les rgles ne connaissent aucune restriction. Les grammaires sensibles

    au contexte ( Context-Sensitive Grammars, CSG ) forment le type 1 : un symbole unique est rcrit,mais cette rcriture peut dpendre dun contexte gauche et/ou droit. Une telle dpendance aucontexte nest pas autorise pour les grammaires indpendantes du contexte ( Context-FreeGrammars, CFG ), qui constituent le type 2. Enfin, le type 3 correspond aux langages qui peuventtre reconnus par des automates nombre fini dtats 11 .

    9 Le terme de description structurale apparat dans Carnap ( Der Aufbau [..], section 12) : Strukturbeschreibung .Chomsky donne (Post, 1944) comme le prototype de l'ide de thorie gnrative (voir par exemple Chomsky, 1966 :83).10 Chomsky et Miller (1958), Chomsky (1959), Chomsky (1963), Chomsky et Schtzenberger (1963).

    11 A tout mot obtenu par drivation dans une grammaire, hormis pour les grammaires de type 0, et pour lesgrammaires qui admettent des rgles o un symbole peut tre rcrit par le mot vide, on associe un arbre : larbre dedrivation. Cet arbre est le vecteur de la description structurale de l'nonc.

  • 8/8/2019 La Linguistique Au Contact de l'Informatique - De La Construction Des Grammaires Aux Grammaires de Construction

    6/22

    La linguistique au contact de linformatique

    6

    1.2.2. Le paradoxe de ChomskyChomsky se sert de ce rsultat pour rejeter un certain nombre de modles possibles de

    grammaire. Il rejette les grammaires de type 3 et les grammaires syntagmatiques indpendantes ducontexte. Cest ce second rejet qui est le plus important. En effet, Chomsky pose que la grammaireprsuppose dans l'analyse en constituants immdiats est une grammaire syntagmatique 12 .L'argument principal fondant le rejet est au dpart son manque d'expressivit (cf. plus haut) :Chomsky veut que la grammaire puisse exprimer les proprits communes plusieurs types d'entitssyntaxiques (par exemple, les proprits communes la phrase active et la phrase passive).Progressivement, une argumentation plus directement empirique se met en place : elle consiste identifier des falsificateurs possibles des grammaires syntagmatiques et, de faon plus restrictive, desgrammaires syntagmatiques CF. Deux ensembles de falsificateurs ont t rassembls. Le premier estcompos de structures gnrales 13:

    (3) a) la constituance non borne ( unbounded branching ),b) les syntagmes discontinus,c) la discordance entre ordre linaire et constituance.

    Le second a t rassembl par (Pullum et Gazdar, 1981). Il est compos d'une liste assezhtroclite de tours particuliers :

    (4) a) l'analyse des comparatives en anglais : *that one is wider than this one is wide ,b) l'analyse de l'expression en langue naturelle des dcimales du nombre ,c) l'analyse de respectively (respectivement ) : John, Mary, David, are a widower, a widow,a widower, respectively ,d) la structure embote du GV en hollandais : NP 1 NP 2 NP n V1 V2 V n,e) l'incorporation en mohawk.

    La rforme syntagmatique se construira sur la rduction de ce double ensemble de contre-exemples. Le point qui nous importe ici pour l'histoire du programme gnratif est le suivant : laformalisation est investie dans la rfutation des formes possibles de grammaire et non dans ladmarche positive de construction de la forme que Chomsky promeut et qu'il va dvelopper : lesgrammaires transformationnelles. Une grammaire transformationnelle est une forme hybride plusieurs composantes 14 o l'essentiel des interconnexions est exprim dans le langage destransformations. Or, les transformations ne donnent pas lieu une formalisation, mais une simpledfinition exprime en termes connotant un traitement informatique : une transformation est dfiniecomme une procdure sur un input pour donner un output. Avec les transformations, un pan duprogramme gnratif abandonne l'exigence d'explicitation formelle pour se contenter de ce que

    Milner (1989) appellera l'pistmologie du dispositif 15

    , dont on retiendra les trois traits suivants : (a)les rgles sont littralises et non formalises, (b) elles reoivent une interprtation causale (lesrgles sont la cause des proprits des noncs) et non smantique (les rgles dcrivent lesproprits des noncs) et (c) elles sont les seuls lments qui soient suffisamment dtaills pour trel'objet d'une falsification, ce qui a pour rsultat de mettre la forme gnrale de la grammaire et ses 12 Lanalyse en constituants immdiats peut tre considre comme un des acquis de la mthode structurale alorsdominante. Le programme gnratif conservera les catgories syntagmatiques et lexicales quelle a permis de dgager.13 Cette liste est prsente dans (Manaster-Ramer et Kac, 1990 : 335). Les auteurs ajoutent un quatrime phnomne : la classification croise. De fait, il ne s'agit pas d'un phnomne particulier, le terme renvoie auxressemblances entre phrases ou syntagmes, ressemblances que la grammaire transformationnelle a analyses commedes relations : le passif, mais aussi les nominalisations (relation entre groupes nominaux et phrases), etc.

    14 Que Chomsky appelle niveaux : niveau syntagmatique, transformationnel et morpho-phonologique.15 Contrairement Milner (1989), nous tenons que l'pistmologie du dispositif ne caractrise pas tout le programmegnratif, mais seulement la version qu'en donne Chomsky et le groupe qu'il dirige.

  • 8/8/2019 La Linguistique Au Contact de l'Informatique - De La Construction Des Grammaires Aux Grammaires de Construction

    7/22

    Marcel Cori et Jean-Marie Marandin

    7

    construits propres (tout particulirement, les notions de transformation, de catgorie vide, etc.) horsdiscussion. L'entreprise de recherche formelle portant sur le systme adquat pour une grammaire vase poursuivre sans Chomsky, et mme le plus souvent contre Chomsky.

    1.2.3. Les grammaires CF en informatique

    Les CFG ont un destin tout contraire en informatique. Trs rapidement, elles donnent la formestandard de la description syntaxique des langages de programmation : la forme BNF ( Backus-Naur Form ). Dans la forme BNF, un langage de programmation est syntaxiquement dcrit par unensemble de rgles de rcriture CF. De plus, l'approfondissement de la caractrisationmathmatique des CFG permet d'tablir qu'elles donnent lieu des algorithmes d'une complexitraisonnable. Ce rsultat est investi en compilation, c'est--dire dans la traduction de programmescrits dans un langage de programmation volu en des programmes crits en langage machine 16 .

    Ce mme rsultat est repris dans le TAL indpendamment du rejet formul par Chomsky : lesalgorithmes danalyse des langues naturelles standards bass sur des CFG sont dfinis dans lesannes soixante. On peut citer les algorithmes de Kuno et Oettinger (1962), l'algorithme CYK(Hays, 1962, Younger, 1967, entre autres) ou l'algorithme de Earley (1970). L'existence de cesalgorithmes sera au cur de la contre-argumentation mene par les tenants de la formesyntagmatique. En effet, ils seront pris comme des modles psychologiquement plausibles de lacomprhension des noncs en langue naturelle.

    1.3 Les ATN La conception des ATN ( Augmented Transition Networks ) est un moment essentiel dans

    l'histoire qui nous occupe (Woods, 1970) : ils vont avoir une position hgmonique en TAL pendantplus dune dcennie 17 . Ils sont la fois une implmentation des grammaires transformationnelles etun modle formel alternatif. Ils doivent remdier aux faiblesses formelles et informatiques desgrammaires transformationnelles tout en constituant un outil de description puissant : The theoryof transformational grammar proposed by Chomsky is one of the most powerful tools for describingthe sentences that are possible in a natural language and the relationships that hold among them, butthis theory as it is currently formalized (to the limited extent to which it is formalized) loses theperspicuousness of the context-free grammar (Woods, 1970 : 599). Ce moment correspond l'essor du langage de programmation LISP. En LISP, les donnes et les programmes sont critsselon la mme syntaxe, celle des structures bien parenthses. Ce qui autorise un ATN tre lafois une structure de donnes et un programme.

    Plus prcisment, un ATN est un rseau d'automates auquel sont associes des conditions et desactions. Le parcours du rseau dautomates seffectue tandis quon progresse dans la reconnaissancedune phrase, lue de gauche droite. Les actions permettent daffecter des valeurs des registres 18 .Ces valeurs sont des valeurs atomiques ou des structures bien parenthses ; elles reprsentent lesproprits de n'importe quelle partie de la phrase analyse ou elles en donnent la descriptionstructurale sous forme arborescente. Elles sont susceptibles de varier lors du parcours desautomates. Les conditions, qui portent sur les valeurs affectes aux registres, dterminent quels sontles parcours valides.

    Les diffrentes valeurs affectes aux registres la fin du parcours dun automate du rseau sont la base du calcul dune valeur unique, qui tient lieu de rsultat du parcours de lautomate (de la

    16 Ainsi, Aho et Ullman reconnaissent la dette de l'informatique envers la linguistique : The original source for thenotion of context-free grammars is Chomsky [1956] and Chomsky [1959]. These grammars were advanced as a wayof defining natural languages rather than computer languages (1977 : 104).17 Les auteurs des outils formels et/ou informatiques pour le TAL qui suivront, comme DCG ou FUG, devront se

    positionner par rapport aux ATN.18 De la mme manire que les langages de programmation affectent des valeurs aux cases de la mmoire desordinateurs.

  • 8/8/2019 La Linguistique Au Contact de l'Informatique - De La Construction Des Grammaires Aux Grammaires de Construction

    8/22

    La linguistique au contact de linformatique

    8

    mme manire que les sous-programmes calculent un rsultat, communiqu au programme qui lesappelle). Le rsultat final correspond lanalyse de la phrase lue ; il se prsente sous la forme d'unarbre htrogne. Ce que nous illustrons sous (5) 19 :

    (5)

    Le long succs que les ATN connatront dans le domaine du TAL fera oublier leur originetransformationnelle. Ils serviront dans des cadres divers et varis. Un ATN, en effet, est un outil noncontraint, qui a la puissance dune machine de Turing. Il permet dassocier un nonc nimportequel type de structure, ce qui est trs pratique dans une perspective d'application industrielle o ilsagit dobtenir un output partir dun nonc : traduction, interrogation en langue naturelle, etc.

    Les ATN seront la cible de deux critiques qui conduiront leur abandon. La premire porte surleur capacit soutenir des modlisations de la comptence ou de la performance. Ils ne peuventservir modliser une grammaire si on admet qu'une grammaire est un modle de la connaissancequ'un locuteur a de sa langue et que cette connaissance peut tre mise en application indiffremmentdans des procdures de reconnaissance ou de production d'noncs. Mais, ils ne peuvent pas nonplus servir modliser les procdures de reconnaissance caractristiques de la performance si onadmet que la grammaire est une ressource neutre et extrieure la procdure elle-mme : en effet,les connaissances grammaticales sont mles aux oprations constitutives de la reconnaissance 20. Cedfaut (radical) est li leur nature procdurale, qui est la cible d'une deuxime critique interne auTAL. Le dveloppement des systmes experts a montr lintrt pratique et thorique de distinguerla base de connaissances du moteur d'infrences, et plus gnralement les connaissances desprocdures. Cela devient un critre de bonne formation des systmes informatiques : un systme est

    jug d'autant meilleur que la partie procdurale est plus gnrale et indpendante de connaissancesparticulires.

    Nanmoins, les ATN enrichissent le rpertoire des outils descriptifs manis par les grammaires :l'affectation de valeurs des registres prfigure les couples attribut/valeur qui formeront les

    19 Le processus danalyse laide dun ATN est qualifi par Woods de reconnaissance transformationnelle . Celasignifie que le rsultat de l'analyse correspond la structure profonde de la phrase analyse. L'ide selon laquelleplusieurs structures de surface peuvent partager une mme structure profonde apparat comme le contenu essentielretenu par les ATN des grammaires transformationnelles.20 Ce qui fonde cette critique va rester constant dans le programme gnratif. On en retrouve les grandes lignes dansl'introduction HPSG : grammars that are to fit into realistic models of processing should be completely order-independent. [...] The differences between, say, comprehension and production should be explained by a theory that

    posits different kinds of processing regimes based on a single linguistic description -- a process-neutral grammar of the language that is consulted by the various processors that function in linguistic activity (Pollard et Sag, 1994 :12).

    type SN temps SV

    dclaratif Pierre rsent aime Marie

  • 8/8/2019 La Linguistique Au Contact de l'Informatique - De La Construction Des Grammaires Aux Grammaires de Construction

    9/22

    Marcel Cori et Jean-Marie Marandin

    9

    spcifications de traits. Et les arbres htrognes (cf. (5) ci-dessus) prfigurent les formalisations venir de la grammaire o cohabitent des informations qui ne se limitent pas la seule structuresyntaxique (cf. (13) ci-dessous).

    2. Le tournant dclaratif : les grammaires syntagmatiques enrichies et les

    grammaires dunification

    2.1 Le contexteLe second moment que nous distinguons est marqu par l'enrichissement des grammaires

    syntagmatiques visant accrotre leur expressivit, la conception du langage de programmationProlog et une grande inventivit dans la conception de nouvelles formes de grammaire, tant du ctdes linguistes (LFG, TAG, GPSG,...) que du ct des informaticiens engags dans le TAL (DCG,PATR II, FUG,..).

    Le dveloppement de l'expressivit des PSG est entrepris trs tt en rponse l'argumentationde Chomsky en faveur de la forme transformationnelle (Yngve, 1960 et Harman, 1963) ; Harman

    dmontre avec force que Chomsky rcuse une version particulire des grammaires syntagmatiques(des grammaires o seule est introduite l'appartenance catgorielle sous la forme de catgoriemonadique tiquetant les nuds), et non les grammaires syntagmatiques en gnral. Mais, c'est legroupe men par Gazdar qui transforme l'essai avec GPSG ( Generalized Phrase StructureGrammar, Gazdar (1982), Gazdar, Klein, Pullum et Sag (1985)). Bresnan donne l'argument deplausibilit psychologique ses lettres de noblesse avec LFG ( Lexical-Functional Grammar )21 . Il estrepris par Gazdar qui, pour le dvelopper, fait appel aux rsultats acquis dans la thorie de lacompilation et dans le TAL 22. Les algorithmes d'analyse qu'autorisent les grammaires CF constituentdes modles de comprhension beaucoup plus plausibles que ceux qu'autorisent les grammairestransformationnelles 23 :

    (6) The sentences of a natural language can be parsed. We do it all the time. Furthermore, we doit very fast [..]. But for transformational grammars, it is not known that processing time canbe any less than a doubly exponential function of sentence length (Peters 1979).Transformational grammars thus fail to provide even the beginnings of an explanation for oneof the most important and most neglected facts about natural languages: parsing is easy andquick. Sentences of a context-free language are provably parsable in a time which is, at worst,proportional to less than the cube of the sentence length.(Gazdar, 1982 : 133)

    Par ailleurs, GPSG fait sauter le verrou bloomfieldien l'encontre de la smantiquefermement maintenu par Chomsky l'ore du programme gnratif 24 : chaque rgle de rcriture est

    21 Le rle de LFG est essentiel plusieurs titres. Bresnan et le groupe qu'elle dirige montrent la pertinence d'analyseslexicalises de nombre de phnomnes traits auparavant en termes transformationnels. Kaplan joue le rle de passeurde solutions labores dans le cadre des ATN vers la linguistique (voir Kaplan, 1995).22 Compiler design for CFL's is a fairly well explored problem (see Aho and Ullman 1972, 1973), but designingcompilers for non-CFL's can be grossly more difficult. Nor is this a concern that can be relagated to the field of computer programming; for those who take seriously the thesis of Fodor (1975), language acquisition for a humanlearner is nothing more or less than the construction of a program to compile the naturel language into the humanmachine code (or whatever intermediate code is used for thinking) (Pullum et Gazdar, 1982 : 139).23 Milner (1981) a raison de souligner que l'hypothse cognitive n'a pas fourni de critre permettant de choisir entredeux analyses possibles d'un mme ensemble de faits linguistiques, mais on voit ici qu'elle joue un rle moteur pourchoisir entre deux formes de grammaires.

    24 The term "grammar" is understood here in a narrow sense, as pure theory of form, thus incorporating syntax andphonology (Chomsky, 1975 : 6). Rappelons que la notion de forme logique (FL) est dfinie dans une grammairetransformationnelle comme le niveau syntaxique susceptible d'tre interprt smantiquement : la FL ne sort pas d'une

  • 8/8/2019 La Linguistique Au Contact de l'Informatique - De La Construction Des Grammaires Aux Grammaires de Construction

    10/22

    La linguistique au contact de linformatique

    10

    accompagne d'une rgle d'interprtation smantique. Cette implmentation directe du principegnral de compositionnalit 25 constitue un argument d'une nature nouvelle en faveur des PSG.

    Paralllement, les recherches en TAL s'affranchissent des ATN. Un moteur puissant d'inventionest un principe mthodologique qui a mri dans la conception des systmes experts : la dclarativit.C'est au nom de ce principe mthodologique, et indpendamment de toute considration

    d'adquation descriptive ou de plausibilit psychologique, que Pereira et Warren, par exemple,dfendent un nouveau formalisme grammatical, les DCG ( Definite Clause Grammars ) :

    (7) The greater clarity and modularity of DCGs is a vital aid in the actual development of systemsof the size and complexity necessary for real natural language analysis. Because the DCGconsists of small independent rules with a declarative reading, it is much easier to extend thesystem with new linguistic constructions, or to modify the kind of structures which are built.(Pereira et Warren, 1980 : 270)

    Les DCG sont historiquement indissociables du langage de programmation Prolog, qui lui-mmenat de l'objectif d'effectuer l'analyse syntaxique des langues naturelles et d'une traduction des

    grammaires CF dans le calcul des prdicats du premier ordre. De la mme manire que la dfinitiondes grammaires concide avec la vogue du langage Algol, que les ATN sont plongs dans LISP, lesformalismes dclaratifs accompagnent le succs de Prolog. Ce remarquable paralllisme entreformalismes grammaticaux et langages de programmation se confirmera dans le troisime momento l'on voit les langages orients objets accompagner les grammaires de construction.

    La tentative de Shieber (1986) marque un tournant dans l'histoire du contact entre linguistiqueet informatique : il s'agit ni plus ni moins que de dgager les traits formels communs aux diffrentsmodles grammaticaux non transformationnels et aux formalismes dclaratifs. C'est ce corpscommun que Shieber dnomme (en se conformant la grammaire de la dnomination des systmesgrammaticaux, cf. grammaire transformationnelle ) grammaire base sur l'unification ou, de faonabrge, grammaire d'unification . Si linguistique et informatique (plus particulirement TAL) sontdes programmes distincts mens par des objectifs indpendants (ce que reconnat Shieber dsl'abord), il n'en reste pas moins que se dessine une convergence qui constitue un des traits dutroisime moment que nous distinguerons dans l'histoire du contact entre linguistique etinformatique.

    2.2 La rforme : l'enrichissement des grammaires syntagmatiquesLes recherches qui s'incarnent dans diffrentes grammaires syntagmatiques partagent un mme

    refus de la forme transformationnelle de la grammaire, qui est analyse comme un dvoiement desobjectifs et des idaux du programme gnratif. Ce refus s'appuie sur quatre lignes d'argumentation.La premire est empirique : la rduction des contre-exemples aux grammaires syntagmatiques.Pullum et Gazdar (1981) montrent que les cinq tours (4) ont t incorrectement analyss ; ils nepeuvent pas tre tenus pour des contre-exemples la thse selon laquelle les langues naturelles sontCF26 . Les trois structures (3) sont plus coriaces : elles font l'objet de multiples tentatives derduction que nous voquerons plus bas. La seconde porte sur l'expressivit des grammairessyntagmatiques : les concepteurs de grammaires montrent quon peut les enrichir de telle sortequelles permettent l'expression claire et distincte des principes organisateurs des langues. Latroisime est formelle : les grammaires syntagmatiques enrichies sont dfinissables formellement ladiffrence des grammaires transformationnelles 27. La quatrime porte sur la plausibilit

    thorie pure de la forme .25 Repris au programme montagovien via l'hypothse connue sous le nom de rule to rule hypothesis propose par

    Bach (1976).26 Cet article est un morceau d'anthologie d'humour.27 The mathematical properties of the resulting baroque systems [les grammaires transformationnelles] are almost

  • 8/8/2019 La Linguistique Au Contact de l'Informatique - De La Construction Des Grammaires Aux Grammaires de Construction

    11/22

    Marcel Cori et Jean-Marie Marandin

    11

    psychologique de la forme grammaticale : on a vu ci-dessus les arguments avancs par Gazdar. Laproposition de Chomsky selon laquelle the theory of phrase structure does not suffice for thecharacterization of linguistic competence of what the language user knows. It is suggested thatlinguistic theory requires a new and more abstract level of description, the level of grammaticaltransformations (Chomsky, 1975 : 8) peut donc tre tenue pour invalide. Les tenants des

    grammaires syntagmatiques peuvent se prsenter comme les continuateurs les plus fidles duprogramme gnratif.Enfin, elles partagent un style pistmologique qui privilgie l'invention formelle prudente plutt

    que la rupture ; c'est ce qu'exprime emblmatiquement ce passage de Gazdar :

    (8) The obvious thing to do if natural languages were ever shown not to be CFL's in the generalcase would be to start exploring minimal enhancements of expressive power to determineexactly what natural languages call for in this regard and how it could be effectively butparsimoniously provided in a way that closely modelled human linguistic capacities.(Pullum et Gazdar, 1981 : 171 ; nous soulignons).

    Nous dcrivons brivement dans ce qui suit certains des outils formels qui ont permisd'augmenter le pouvoir expressif des PSG.

    2.2.1. Les catgories comme ensemble de traits : GPSGL'innovation clef est la dfinition des catgories syntaxiques comme des ensembles de

    spcifications de traits, o les traits sont dfinis comme des couples . L'innovationse nourrit de l'emploi informel des traits dvelopp dans le cadre des grammairestransformationnelles. Il s'agit essentiellement de la dcomposition des catgories majeures en deuxtraits binaires N et V, ainsi que de la dcomposition des catgories syntagmatiques dans le cadre dela thorie X-barre en un type catgoriel et un niveau syntagmatique. Ainsi, la catgoriesyntagmatique GN est analyse et reprsente par {,,}, alors que lacatgorie lexicale N est analyse et reprsente par : {,,}. Toutes lesproprits des expressions peuvent tre exprimes sous forme de traits : un GN singulier latroisime personne et l'accusatif est analys et reprsent par {,, ,, < PLU,->,< CAS,ACC>} 28 .

    Cette dfinition des catgories autorise lcriture de rgles (qui, en GPSG, sont des rgles dedominance immdiate ou des rgles de prcdence linaire 29) plusieurs niveaux de gnralit selonle degr de sous-spcification des catgories. Par exemple, la rgle < est une rgle de prcdence linaire qui permet d'ordonner toute expression sous-catgoriseaprs l'expression qui la sous-catgorise. L'introduction de catgories sous-spcifies ouvre la voie une description hirarchique des objets, qui sera dveloppe dans HPSG, la relation de subsomptionentre catgories dfinissant la hirarchie. En effet, une rgle sous-spcifie rassemble une famille dergles plus spcifies ou compltement spcifies.

    entirely unknown: we are ignorant, for example, as to whether ungrammaticality with respect to such grammars isdecidable, i.e. given an arbitrary string on the terminal vocabulary, no way is known of proving that that string is notgenerated by the grammar. In this situation, claims by grammarians to the effect that such and such a string of wordscannot be generated by their grammar merely reflect their intuitions about the apparatus they are using (Gazdar,1982 : 131).28 A bien des gards, l'innovation consiste gnraliser l'emploi des symboles complexes comme tiquettes de tous lesnuds de l'arbre syntagmatiques et non de les cantonner aux nuds pr-terminaux comme dans la composante

    syntagmatique des grammaires transformationnelles proposes dans Aspects (Chomsky, 1965). Harman (1963)deserves the credit for first seing the potential of PSGs incorporating complex symbols (Gazdar, 1982 : 134).29 Do le nom de format DI/PL.

  • 8/8/2019 La Linguistique Au Contact de l'Informatique - De La Construction Des Grammaires Aux Grammaires de Construction

    12/22

    La linguistique au contact de linformatique

    12

    Par ailleurs, GPSG introduit des outils supplmentaires, en particulier les principes 30 . Troisprincipes rendent compte de l'essentiel des phnomnes lis la structuration syntaxique des languesnaturelles : la Convention des traits de tte rend compte de l'endocentricit des syntagmes (lesyntagme partage les valeurs de certains traits, dfinis une fois pour toutes, avec sa tte), le Principedu contrle et de laccord traite de faon unifie des phnomnes d'accord et le principe des traits de

    pied permet le traitement des dpendances distance, ce qui prserve le rsultat essentiel acquisdans le cadre des grammaires transformationnelles, le traitement local de la dpendance. Les deuxderniers principes requirent une gnralisation du formalisme des traits, puisque la valeur d'un traitpeut tre une catgorie.

    GPSG initie un dplacement, que va systmatiser HPSG : on passe d'une approche o ladrivation est le vecteur des gnralisations linguistiques un systme o sont dclars des principesde bonne formation des diffrentes entits permettant d'analyser les noncs 31 . C'est en ce sens quela recherche dont GPSG est le vecteur converge avec les recherches menes dans le TAL et lareprsentation des connaissances : la thorie syntaxique se donne explicitement dans une formegrammaticale que l'on peut qualifier de dclarative.

    GPSG ne clt pas le problme pos par les structures qui ont t identifies comme les

    falsificateurs possibles des grammaires syntagmatiques CF. La discordance entre ordre etconstituance est porte au rang de principe structural dans le format de la grammaire en distinguantrgle d'ordre et rgle de dominance. La constituance non borne est traite par l'introduction d'untype particulier de rgles, qui fait usage de ltoile de Kleene 32 : A B C*. Cette notation signifieen fait que lon a un nombre infini de rgles : A B, A B C, A B C C, Il en rsulte quel'usage de l'toile de Kleene dans les parties droites des rgles (de mme que lintroduction desmtargles) reprsente plus qu'un minimal enhancement des PSG : elles rompent avec unecaractristique essentielle des PSG, la gnration de langages infinis par des grammaires finies. Cetterupture nest pas indispensable, comme le montreront entre autres les grammaires darbrespolychromes (cf. ci-dessous). Les constituants discontinus ne trouvent pas de solution naturelle dansle cadre de GPSG, malgr les tentatives entre autres de Pullum (1982) et Ojeda (1987).

    2.2.2 La redfinition de la composition des arbres : grammaires darbres adjoints etgrammaires d'arbres polychromes

    L'enrichissement ne concerne pas seulement la forme des catgories. Deux cadres grammaticauxredfinissent l'opration de composition des arbres ( laquelle GPSG ne touche pas). Il s'agit de deuxgrammaires o la notion d'arbre est centrale : les grammaires darbres adjoints ( Tree AdjoiningGrammars, TAG , Joshi, 1985) et les grammaires darbres polychromes ( GAP, Cori et Marandin,1993). Les TAG reposent sur une sparation des grammaires en deux sortes darbres primitifs (lesarbres initiaux et les arbres auxiliaires) et une opration de composition, ladjonction, qui vientinsrer des arbres auxiliaires lintrieur des arbres syntaxiques (alors que, dans les grammaires

    traditionnelles, lopration de substitution place des arbres primitifs aux feuilles des arbressyntaxiques). Cela permet un traitement non transformationnel des relations longue distance.Une GAP est compose d'un ensemble d'arbres dont les branches sont ordonnes par rapport

    un pivot (qui peut tre la tte dans un constituant endocentrique). La composition d'arbres a les deuxproprits suivantes : (a) elle conserve l'ordre des branches par rapport au pivot et (b) elle crase lesniveaux hirarchiques lorsqu'elle met en jeu des catgories de pivot identique. Grce ces deuxproprits, on peut engendrer des constituants branches multiples sans recours l'toile de

    30 A ct des restrictions de cooccurrence de traits, des spcifications de traits par dfaut et des mtargles.31 C'est ce que Milner appelle lois l'indicatif . Cet indicatif ne saurait tre confondu avec le constat de ce qui est

    observable dans la ralit matrielle : la dmarcation dans la langue ne rpond pas toujours la ralit des formesprofres. [...] il n'y a pas de rgles du langage, mais des lois et des proprits (1989 : 253).32 C'est par exemple le cas dans les rgles de la coordination.

  • 8/8/2019 La Linguistique Au Contact de l'Informatique - De La Construction Des Grammaires Aux Grammaires de Construction

    13/22

    Marcel Cori et Jean-Marie Marandin

    13

    Kleene 33 et obtenir les effets d'intrication caractristiques des tours incidents 34 . Il est intressant denoter que les GAP, comme les grammaires DI/PL mais d'une manire diffrente, ne prsupposentpas que les relations d'ordre entre constituants soient rductibles aux relations d'appartenancesyntagmatique.

    De fait, on touche l un problme fondamental de la thorie syntaxique puisqu'il met en jeu la

    notion mme de syntagme telle qu'elle a t faonne dans l'analyse en constituants immdiats,conserve par le programme gnratif et porte au rang de principe organisateur a priori dans lesdiffrents modles transformationnels. La notion de syntagme comme un mixte indissociable derelations de dpendance (par exemple, entre une tte et les constituants qu'elle sous-catgorise),relation d'adjacence sur la chane et un domaine d'opacit perd de son vidence. Ds lors qu'onclate ces diffrentes facettes du syntagme, le cadre formel fourni par les grammaires syntagmatiquesse dfait. Et c'est bien ce que l'on observe, par exemple, dans la thorie syntaxique sous-jacente HPSG : la notion de syntagme est dissoute dans celle de signe, les problmes d'ordre sont disjointsde ceux qui relvent de la mise en relation entre une tte et ses dpendants et les relationssyntagmatiques (par exemple la relation de c-commande) voient leur porte explicative trsfortement relativise.

    Il est donc remarquable, mais non surprenant, que la mise en cause de la notion fondamentalesur laquelle reposent les grammaires syntagmatiques provienne des grammaires qui en ont explor leplus srieusement les implications formelles et empiriques.

    2.3. Les grammaires d'unificationNous prsentons ci-dessous quelques-uns uns des aspects des formalismes dclaratifs qui

    caractrisent ce second moment. Sous les ressemblances que maximise Shieber apparat unediffrence de fond : elle oppose les formalismes qui reposent sur une ide de grammaire (DCG,PATR) et un cadre comme FUG (qui prfigure HPSG), o la forme organisatrice n'est plus lagrammaire, mais un dispositif non spcifique de reprsentation des connaissances 35 .Linguistiquement, cela implique que la syntaxe n'est plus qu'une dimension caractristique parmid'autres des expressions langagires.

    2.3.1 Prolog et les DCGCest dans lobjectif deffectuer lanalyse syntaxique des langues naturelles que des chercheurs,

    au premier rang desquels Colmerauer, ont dfini le langage Prolog (Colmerauer et al., 1973) 36. Ilsagissait dexploiter la similitude entre la reconnaissance dun nonc et la dmonstration dunthorme. Si les rgles de la grammaire et les units du lexique sont vues comme des axiomes, lesthormes sont les noncs qui font partie de la langue. Pour mettre en uvre ce rapprochement, onreprsente les rgles de la grammaire et les units du lexique par des formules logiques.

    Les formules que traite le langage Prolog sont des clauses de Horn, ou clauses dfinies ( DefiniteClause ). De fait, on ne parle de DCG que lorsque les grammaires logiques sont augmentes. Pourles promoteurs des DCG (Pereira et Warren, 1980), en effet, il fallait faire au moins aussi bien que

    33 Constituants coordonns, mais aussi constituants adjoints : cf. le ski dans les Alpes trois mille mtres en t .34 Par exemple : Pierre, dit-il, est venu hier (Cori et Marandin, 1995). L'intrt formel est galement que l'on n'a pas concevoir des structures discontinues pour traiter des constituants incidents.35 Shieber gomme cette diffrence, comme il gomme les diffrences qui existent entre les grammaires syntagmatiquesenrichies et les formalismes dclaratifs. Il y a une part de politique scientifique dans cette entreprise. Pour lacomprhension des enjeux actuels, il est prfrable de marquer ces diffrences. Par exemple, lunit de base dunegrammaire est une rgle pour GPSG, DCG et PATR, alors que cest une structure de traits pour FUG ; la forme de lareprsentation dune phrase est un arbre pour GPSG, alors que cest une structure de traits pour DCG, PATR et FUG.Par exemple encore, lunification joue un rle marginal dans GPSG, alors quelle joue un rle central dans DCG,

    PATR et FUG.36 Prolog a servi d'autres applications, essentiellement lies l'intelligence artificielle, mais aussi aux bases dedonnes.

  • 8/8/2019 La Linguistique Au Contact de l'Informatique - De La Construction Des Grammaires Aux Grammaires de Construction

    14/22

    La linguistique au contact de linformatique

    14

    les ATN, tout en tant dclaratif 37 . Ils ajoutent donc des traits aux rgles, ce qui permet de vhiculerdes valeurs, comme cela seffectue dans les ATN laide des registres. Ces valeurs sont soit desvaleurs atomiques, soit des termes Prolog qui correspondent des structures arborescentes, dontcertaines feuilles peuvent tre tiquetes par des variables. Elles peuvent conditionner l'applicationdes rgles, et elles donnent la description des expressions (syntagmes ou phrases).

    Les dmonstrations, en Prolog, s'effectuent selon le mcanisme de l'unification : afin dedmontrer un but (par exemple qu'une suite de mots constitue une phrase), on cherche l'unifieravec un fait (ici une information lexicale) ou avec le consquent d'une implication (ici la partiegauche d'une rgle). Cest de l que viendra la notion de grammaire dunification, bien que le termene soit pas encore forg.

    2.3.2 Les structures de traitsDe nouveaux formalismes ont suivi les DCG, dont le prototype est PATR II ( Parse and

    Translate , Shieber). Il sagissait de maintenir lidal dclaratif des DCG, tout en apportant desamliorations. Les amliorations consistent essentiellement en une prise de distance par rapport Prolog et la logique des prdicats du premier ordre. En effet, il y a une certaine rigidit dans lasyntaxe de Prolog, qui oblige notamment donner une valeur (ventuellement indtermine) tousles attributs, et maintenir un ordre strict entre les attributs ou leurs valeurs dans les termes.

    Les structures de traits diffrent des termes, auxquels elles se substituent, essentiellement par lefait quelles reprsentent de linformation partielle sur un objet. Ainsi, deux structures de traitsdiffrentes peuvent dcrire un mme objet. Lunification prend alors un nouveau sens : elle devientune opration qui vrifie si deux structures de traits sont compatibles, autrement dit si elles sontsusceptibles de dcrire le mme objet et, dans le cas positif, construit la structure minimale quiregroupe les informations contenues dans les deux structures de dpart.

    La transmission des valeurs de trait seffectue dans les ATN selon un mode procdural. Parexemple, le nombre (singulier ou pluriel) dun verbe devient le nombre du syntagme verbal, puisventuellement de la phrase par affectations successives d'une valeur aux registres de nombreassocis au GV et la phrase. Dans les formalismes dclaratifs, on parle plutt de partage desvaleurs que de transmission. Les DCG ont recours des variables logiques. Les structures de traitsfont appel dautres outils, quil est plus dlicat de formaliser 38 . Deux versions ont t proposes :l'une fait appel des quations qui contraignent les rgles de rcriture, l'autre des graphes qui sonten gnral des graphes sans circuit : le partage des valeurs, encore appel rentrance , est marqu parle fait que deux chemins dans un graphe peuvent converger vers un mme sommet.

    Il y a une grande ressemblance de famille entre DCG et PATR II. L'un et l'autre sappuient surune grammaire indpendante du contexte : la grammaire CF dfinit un ensemble de squelettes quisont enrichis par les termes, les contraintes quationnelles ou les structures de traits. Dans les deuxcas, la structure Prolog ou la structure de traits sert exprimer la description structurale et non lagrammaire elle-mme.

    2.3.3 La dissolution des grammaires dans les structures de traitsLes grammaires d'unification fonctionnelle ( Functional Unification Grammars, FUG ) de Kay

    (1985) constituent un tournant, car elles effacent la distinction entre le langage de la description etles objets dcrits. Les structures de traits prennent le pas sur les grammaires et leurs rgles. Lesrgles sont incluses dans les structures de traits, et une grammaire n'est elle-mme qu'une structurede traits obtenue par la disjonction de structures plus lmentaires, qui chacune correspond une ouplusieurs rgles. La disjonction devenant une opration autorise sur les structures de traits, celacomplexifie la nature de celles-ci, dautant plus que dautres augmentations sont apportes. Il en

    37 Une mme DCG peut servir la reconnaissance ou la gnration.38 Les descriptions linguistiques font souvent usage d'une version non formalise des structures de traits, notes pardes matrices dans lesquelles le partage des valeurs est marqu par des botes numrotes.

  • 8/8/2019 La Linguistique Au Contact de l'Informatique - De La Construction Des Grammaires Aux Grammaires de Construction

    15/22

    Marcel Cori et Jean-Marie Marandin

    15

    rsulte limpossibilit de reprsenter simplement les structures par des graphes et la ncessitdtendre lopration dunification, ce qui donne lieu des tentatives formelles varies (Kasper etRounds, 1986, entre autres).

    L'importance historique de FUG ne tient nullement ses options en thorie linguistique (lefonctionnalisme), de mme que les ATN ont eu une importance qui va bien au-del de leur

    inspiration transformationnelle. Ce qui compte, c'est que les structures de traits sont mises contribution pour dcrire les diffrentes dimensions des expressions langagires et que ce sont lesmmes outils formels qui sont utiliss quelle que soit la dimension.

    De ce point de vue, il est clair que le formalisme adopt doit tre le plus puissant possible. Lesformalismes que l'on a proposs pour reprsenter toute espce de connaissance humaine ont cettepuissance maximale. Les critres de choix du formalisme se trouvent donc profondment modifis.En particulier, le critre qui veut que le formalisme doit tre restreint par les proprits formelles delobjet reprsenter est remplac dans une grammaire multidimensionnelle par un critre qui a uneffet oppos : un formalisme sera dautant meilleur quil est moins contraint et donc plus mme depermettre la modlisation de dimensions formellement htrognes.

    3. Le tournant reprsentationnel : les grammaires de construction

    3.1. Le contexteL'pistmologie des systmes constructionnels est fondamentalement une logique de la

    dcouverte : la formalisation a d'abord pour fonction de clarifier et de mettre au jour l'insu dessavoirs descriptifs. Chomsky l'nonce clairement au seuil du programme gnratif ; Pollard et Sag(1994) le reprennent en introduction l'expos de l'tat standard de HPSG ( Head-driven PhraseStructure Grammar ) :

    (9) Precisely constructed models for linguistic structure can play an important role, both negativeand positive, in the process of discovery itself. By pushing a precise but inadequateformulation to an unacceptable conclusion, we can often expose the exact source of thisinadequacy and, consequently, gain a deeper understanding of the linguistic data. Morepositively, a formalized theory may automatically provide solutions for many problems otherthan those for which it was explicitly designed. Obscure and intuition-bound notions canneither lead to absurd conclusions nor provide new and correct ones, and hence they fail to beusefull in two important respects. I think that some of those linguists who have questioned thevalue of precise and technical development of linguistic theory have failed to recognize theproductive potential in the method of rigorously stating a proposed theory and applying itstrictly to linguistic material with no attempt to avoid unacceptable conclusions by ad hocadjustments or loose formulation.

    (Chomsky, 1957 : 5), cit par (Pollard et Sag, 1994 : 7-8)

    Ce credo pistmologique a montr toute son efficacit dans les approches de la forme deslangues (morphosyntaxe et phonologie) ; on doit porter au crdit du programme que Chomsky alanc et anim une avance empirique considrable. De plus, il a eu un impact dcisif en dehors duchamp arpent par les grammairiens. Le credo chomskyen a t repris dans d'autres faons deprendre le langage (pour reprendre une expression de Goodman) : la smantique formelle, lesthories du discours, la pragmatique, l'usage situ du discours (ethnomthodologie par exemple), lacognition situe (thorie et smantique des situations, par exemple), etc. Les annes quatre-vingtvoient merger des analyses qui se trouvent au confluent de ces diffrentes disciplines. L'analyse desquestions par Ginzburg (1995) est ce titre exemplaire : elle intgre des rsultats et des notions tirs

    de la syntaxe formelle, de la smantique formelle mais aussi de l'analyse de conversation et de lathorie des situations. Et c'est cette intgration qui constitue un dfi pos aussi bien la thorie de la

  • 8/8/2019 La Linguistique Au Contact de l'Informatique - De La Construction Des Grammaires Aux Grammaires de Construction

    16/22

    La linguistique au contact de linformatique

    16

    grammaire qu'aux dispositifs de traitement du langage. C'est ce que reconnat Kay, le concepteur deFUG :

    (10) In practice I take it that the factors that govern the production of a sentence typically comefrom a great variety of different sources, logical, textual, interpersonal and so forth. In general,

    each of these, taken by itself, underdetermines what comes out. When they jointlyoverdetermine it, there must be priorities enabling a choice to be made among the demands of the different sources. When they jointly underdetermine the outcome, the theory must providedefaults and unmarked cases. The point is that we must be prepared to take seriously the claimthat language in general, and individual utterances in particular, fill many different functionsand that these all affect the theory, even at the syntactic level.(Kay, 1985 : 252)

    La notion de grammaire est bouleverse : ses formes possibles et son rapport la manire deprendre le langage (la comptence). Le programme gnratif hritait d'une ontologieunidimensionnelle construite dans le mouvement structuraliste (morphme, constituant, phrase) ; les

    grammaires que nous avons considres jusqu'ici en reconstruisent l'ordre sous la notion de syntaxe .Le programme gnratif des annes quatre-vingt dix hrite d'objets multidimensionnels o chaquedimension apparat irrductible aux autres. On passe d'objets deux facettes (les propritscombinatoires et la constituance phonologique) des objets plusieurs facettes : les facettesformelles, mais aussi les proprits combinatoires smantiques, la valeur pragmatique et la chargediscursive. Cette multidimensionnalit des objets linguistiques a reu le nom de construction 39 et lessystmes en charge de les dcrire celui de grammaire de construction :

    (11) Constructions may specify, not only syntactic, but also lexical, semantic, and pragmaticinformation; lexical items, being mentionable in syntactic constructions, may be viewed, inmany case at least, as constructions themselves; and constructions may be idiomatic in thesense that a large construction may specify a semantics (and/or pragmatics) that is distinctfrom what might be calculated from the associated semantics of the set of smallerconstructions that could be used to build the same morphosyntactic object.(Fillmore et al. , 1988 : 501)

    Si on dfinit une grammaire comme l'intgration de ces dimensions htrognes, la tche desconstructeurs de systme est d'articuler ces dimensions. De ce point de vue, les recherches(pratiques et formelles) menes dans le domaine de la reprsentation des connaissances enintelligence artificielle constituent un rpertoire de notions et d'outils prcieux. C'est ainsi qu'il fautlire les remerciements de Pollard et Sag (cf. (12) ci-dessous) ; on les comparera la citation deChomsky que nous avons place aux dbuts de notre histoire (cf. (2) ci-dessus) : la distinction entremathmatiques et informatique n'y est plus de mise lorsqu'il s'agit de concevoir the internalarchitecture of the system that the linguistic types form :

    (12) We want to emphasize the extent to which HPSG is intellectually indebted to a wide range of recent research traditions in syntax (principally nonderivational approaches ...), semantics(especially situation semantics) and computer science (data theory, knowledge representation,unification-based formalisms).(Pollard et Sag, 1994 : 1)

    39 Comme toujours le langage nous joue son tour favori de l'homonymie : cette notion de construction, qui a sonhistoire dans les approches traditionnelles de la grammaire, est compltement distincte du processus de constructionen jeu dans les systmes constructionnels.

  • 8/8/2019 La Linguistique Au Contact de l'Informatique - De La Construction Des Grammaires Aux Grammaires de Construction

    17/22

    Marcel Cori et Jean-Marie Marandin

    17

    3.2 La reprsentation de la connaissance linguistique : les structures de traits typesLobjectif de base de l'intelligence artificielle est dlaborer des mthodes de reprsentation des

    connaissances matrises par les tres humains. Les frames (Minsky, 1975) reposent sur lide selonlaquelle on dispose d'un certain nombre de schmes, qui dcrivent des types d'objets ou desituations. Devant un objet nouveau ou une situation nouvelle, on slectionne l'un de ces schmesmodlis comme un frame : on attribue des valeurs aux slots qui le composent ; un slot a un nom(slot-name ) et une valeur ( slot-value ) qui peut tre une valeur immdiate, ou bien un pointeur sur unautre frame.

    La parent avec les structures de traits est vidente. On peut mme penser que, dans lesstructures de traits complexes, le fait que la valeur d'un attribut peut tre une autre structure detraits, provient de la notion informatique de pointeur et d' adressage indirect , et vient donc en droiteligne du stockage des informations en machine.

    Les frames sont des objets informatiques procduraux qui, selon la logique de LISP, mlentprogrammes et donnes : la valeur affecte un slot peut tre obtenue par un demon , c'est--dire parl'appel n'importe quelle procdure. Dans une logique plus dclarative, les rseaux smantiques,introduits en 1968 par Quillian (1968), ont donn lieu llaboration de plusieurs systmes dereprsentations de connaissances (entre autres Bobrow et Winograd, 1977, Fahlman, 1979,Brachman et Schmolze, 1984). Ces systmes ont eu des versions de plus en plus formalises, baseessentiellement de graphes, dans lesquels les arcs marquent des relations entre objets ou conceptsreprsents par les sommets. Les arcs, comme les sommets, peuvent tre de nature diverse.

    Certains arcs, tiquets IS-A ( is an instance of ) ou AKO ( a kind of ) jouent un rleparticulier. Ils servent assurer une structuration classificatoire des concepts ou des objets, sous laforme de ce quon appellera une hirarchie dhritage et qui est en fait un graphe sans circuit. De lasorte, il est possible dobtenir une reprsentation des connaissances qui soit conomique, parce quespcifiant les proprits au niveau le plus adquat. Par exemple, si on sait que les oiseaux ont des

    plumes (niveau adquat de spcification dune proprit) et que les poules sont des oiseaux , chaque poule hrite de la proprit d avoir des plumes.

    Les structures de traits types, dont une des expressions les plus acheves est due Carpenter(1992), sont une des formalisations possibles de ces systmes de reprsentation des connaissances.Ces structures supposent lexistence dun ensemble de types, structurs selon une hirarchiedhritage par la relation dinclusion. Par exemple, le type syntagme nominal est inclus dans le typesyntagme , qui lui-mme peut tre inclus dans le type signe . On indique, au niveau adquat de lahirarchie, quels sont les attributs qui sappliquent un type donn (par exemple lattribut temps nesapplique pas tous les objets linguistiques), et quel est le type de la valeur associe un attributpour un type dobjet donn (on ne peut associer lattribut temps nimporte quelle valeur). Cesinformations, gnrales, contraignent les structures de traits particulires, car les sommets de celles-ci doivent tous avoir un type 40.

    On obtient un cadre pour exprimer toute espce de caractrisation du langage ou d'une langueparticulire, alors que la seule gnralit exprime par les grammaires CF porte sur la forme(arborescente) des reprsentations syntaxiques. Ce cadre permet de construire des grammairesmultidimensionnelles alors que les grammaires CF ne se prtent qu' la reprsentation formalise dela forme de ce qui constitue une phrase. Une grammaire CF modlise un ensemble dobjetslinguistiques, alors quune grammaire exprime par une structure de traits type modlise laconnaissance que lon a des objets linguistiques.

    3.3. HPSGHPSG illustre le type de grammaire multidimensionnelle que permettent les structures de traits

    types. Elle se prsente comme une hirarchie de signes : the linguistic types par excellence, the

    40 Les langages orients objet et, un niveau plus formel, les types abstraits de donnes, ont galement tir leurinspiration des frames et des rseaux smantiques et sont largement fonds sur lhritage des proprits.

  • 8/8/2019 La Linguistique Au Contact de l'Informatique - De La Construction Des Grammaires Aux Grammaires de Construction

    18/22

    La linguistique au contact de linformatique

    18

    expressions -- or signs (in roughly the Saussurean sense) -- include not only sentences, but alsowords and subsentential phrases, even multisentence discourses. And a sign is taken to consist notonly of a phonetic form, but of other attributes or features as well. That is, we conceive of signs asstructured complexes of phonological, syntactic, semantic, and phrase-structural information (ibid. : 15). Ce systme est la fois caractris par l'htrognit des facettes constitutives des

    objets manipuls et l'uniformit de la modlisation de ces informations. Nous illustrons ce point avecla reprsentation (13). Cest une reprsentation partielle, contenu purement illustratif, qui est unfragment de la grammaire de langlais et lanalyse dune classe de phrases 41 :

    (13)

    PHON Bagels John likesMODE propINDEX s

    FILLER-DTR [PHON bagels]

    DTRSPHON John likesINDEX sMODE prop

    HEAD-DTRPHON John

    SUBJ-DTR MODE ref DTRS INDEX i

    PHON likesHEAD-DTR MODE prop

    INDEX s

    L'htrognit est capte par la classification dans des dimensions distinctes. L'uniformit de lamodlisation se manifeste de deux faons. (a) Le modle de toute unit est construit sur le mmepatron quelle que soit sa taille : un mot (c'est--dire une unit du lexique) est reprsent de la mmemanire qu'un syntagme ou qu'une phrase, voire un discours. Dans (13), le mot John prsente lesmmes traits que le GN John ; le GN John prsente les mmes traits que la phrase tte et la phraseenchssante 42. (b) Les proprits de ces entits, quelle que soit leur nature, sont exprimes dans lemme format : attribut/valeur. La mtaphore de la carte dveloppe par Goodman pour caractriserles systmes constructionnels rsume bien cette tension entre htrognit des informations ethomognit de la modlisation : the function of a construction system is not to recreate 41 Lattribut PHON (phonologie) a pour valeur la ralisation phonologique du signe ; lattribut MODE (modalit) untype de force illocutoire ; lattribut INDEX un marqueur de rfrence (au sens de la DRT). Lattribut DTRS(daughters) a pour valeur la liste des constituants. Dans (13), la structure comprend un constituant dtach (FILLER-DTR) et la tte (HEAD-DTR) qui correspond une phrase.

    42 HPSG is "fractal" (structurally uniform as the parts get smaller). Every sign down to the word level (not just theroot clause) has features corresponding (inter alia) to phonetic, syntactic, and semantic aspects of linguisticstructures (Pollard, 2000, Lectures on the foundations of HPSG, np.).

  • 8/8/2019 La Linguistique Au Contact de l'Informatique - De La Construction Des Grammaires Aux Grammaires de Construction

    19/22

    Marcel Cori et Jean-Marie Marandin

    19

    experience but rather to map it. [..] A map is schematic, selective, conventional, condensed anduniform (Goodman, 1972 :15) 43.

    4. ConclusionLe fragment d'histoire que nous avons reconstruit montre clairement l'importance dterminante

    des recherches en informatique pour le dveloppement de la linguistique entendue comme entreprisede confection de grammaires qui puissent la fois intgrer la caractrisation de dtail desexpressions des langues naturelles, la spcification des universaux formels du langage naturel et lelien aux modlisations possibles de la performance. Les concepteurs de grammaires ont empruntdes notions, des concepts ou des arguments la thorie de la compilation, aux langages deprogrammation, la modlisation des hypothses du programme cognitiviste et aux dispositifspratiques de traitement d'information en langue naturelle. Les emprunts ont servi aussi bien motiver le rejet de certaines formes de grammaires qu' l'invention de nouvelles formes. D'un ct,Chomsky se sert des premiers rsultats de la linguistique algbrique pour rejeter les grammairessyntagmatiques ; les tenants des grammaires syntagmatiques s'appuient sur les rsultats del'informatique pour rejeter la forme transformationnelle. D'un autre, on voit les solutions laboresdans les ATN, en programmation logique et dans les systmes de reprsentations de connaissancestre reprises et mtamorphoses pour donner lieu de nouveaux formalismes, dont la caractristiquecommune est la dclarativit, et qui voluent vers une plus grande multidimensionnalit. Lesgrammaires transformationnelles et les grammaires syntagmatiques soutenaient une mme vision dulangage dans laquelle l'ordre syntaxique, conu comme un ordre syntagmatique, est le squelette surlequel s'ancrent les dimensions non formelles du langage. Les grammaires multidimensionnelles sontle laboratoire o s'labore une autre vision du langage et de son rapport aux langues.

    Rfrences

    Aho A.V. et Ullman J.D, 1977, Principles of Compiler design , Reading, Massachusetts : Addison Wesley.Bach E., 1976, An extension of classical transformational grammar. Problems in linguistic metatheory,

    Proceedings of the 1976 Conference at Michigan State University : 183-224.Bobrow D.G. et Winograd T., 1977, An Overview of KRL, A Knowledge Representation Language,

    Cognitive Science 1 : 3-46.Brachman R. J. et Schmolze J. G., 1985, An Overview of the KL-ONE Knowledge Representation System,

    Cognitive Science 9 : 171-216.Bresnan J., 1982, The Passive in Lexical Theory, [Bresnan J. ed.] The mental representations of

    grammatical relations , Cambridge : MIT Press.Bresnan J. et Kaplan R., 1982, Introduction : Grammars as mental representations of language, [Bresnan J.

    ed.] The mental representations of grammatical relations , Cambridge : MIT Press.Carpenter B., 1992, The Logic of Typed Feature Structures , Cambridge University Press.Chomsky N., 1956, Three Models for the Description of Language, I.R.E. Transactions on Information

    Theory 2 : 3, 113-124.Chomsky N., 1957, [trad. fr. le Seuil, 1969], Syntactic structures , La Haye : Mouton.Chomsky N., 1959, On certain formal properties of grammars, Information and Control 2 : 2, 137-167.Chomsky N., 1963, Formal Properties of Grammars, [D. Luce, E. Bush, E. Galanter, eds] Handbook of

    Mathematical Psychology , John Wiley et Sons.Chomsky N., 1965, Aspects of the Theory of Syntax , Cambridge : MIT Press.Chomsky N., 1966 [trad. fr.], La notion de "rgle de grammaire", Langages 4 : 81-104.

    43 Goodman ajoute The map not only summarizes, classifies and systematizes, it often discloses facts we couldhardly learn immediately from our explorations , ce qui correspond au credo pistmologique rappel en (9) ci-dessus.

  • 8/8/2019 La Linguistique Au Contact de l'Informatique - De La Construction Des Grammaires Aux Grammaires de Construction

    20/22

    La linguistique au contact de linformatique

    20

    Chomsky N., 1975, Introduction 1973, The logical structure of linguistic theory , Chicago : The University of Chicago Press.

    Chomsky N. et Miller G.A., 1958, Finite State Languages, Information and Control , 1, 91-112.Chomsky N. et Schutzenberger M.P., 1963, The algebraic theory of context-free languages, [Braffort et

    Hirschberg, eds] Computer programming and formal systems, Studies in logic series , Amsterdam :North-Holland, 119-161.

    Colmerauer A., Kanoui H., Roussel P. et Pasero R., 1973, Un Systme de Communication Homme-Machineen Franais , Groupe de Recherche en Intelligence Artificielle, Universit dAix-Marseille.

    Cori M. et Marandin J.-M., 1993, Grammaires d'arbres polychromes, TAL vol. 34, n 1 : 101-132.Cori M. et Marandin J.-M., 1995, Trees and the Representation of Disjunct Constituents, [G.V. Morrill et

    R.T. Oehrle, eds] ESSLLI Conference on Formal Grammar , Barcelone : 61-74.Earley J., 1970, An Efficient Context-Free Parsing Algorithm, Communications of the Association for

    Computing Machinery 13 : 2, 94-102.Encrev P., 1997, L'ancien et le nouveau: quelques remarques sur la phonologie et son histoire, Langages

    n125 : 100-123.Fahlman S.E., 1979, NETL A system for representing and using real-world knowledge , Cambridge : MIT

    Press.

    Fillmore C., Kay P., O'Connor C., 1988, Regularity and idiomaticity in grammatical constructions : the caseof let alone , Language 64 : 501-538.Fodor J., 1975, The language of thought , New York : Thomas Crowell.Gazdar G., 1982, Phrase structure grammar, [Jacobson P. et Pullum G., eds] The Nature of Syntactic

    Representation , 131-186, Dordrecht : D. Reidel Publishing Company.Gazdar G., Klein E., Pullum G. et Sag I., 1985, Generalized Phrase Structure Grammar , Oxford : Basil

    Blackwell.Ginzburg J., 1995, The semantics of interrogatives, [S. Lappin, ed.] Handbook of contemporary semantic

    theory , Oxford : Basil Blackwell.Goodman N., 1951, The structure of appearance, Dordrecht : D. Reidel Publishing Co.Goodman N., 1972, Problems and projects , Indianapolis : Bobbs-Merrill.Harman G.H., 1963, Generative Grammars without Transformation Rules: A Defense of Phrase Structure.

    Language 39, 597-616.Hays D.G., 1962, Automatic language-data processing, [H. Borko, ed.] Computer Applications in the

    Behavorial Sciences , Englewood Cliffs, New Jersey : Prentice Hall, 394-421.Joshi A.K., 1985, Tree adjoining grammars : How much context-sensitivity is required to provide reasonable

    structural descriptions, [D.R. Dowty, L. Karttunen, A.M. Zwicky, eds] Natural language parsing ,Cambridge University Press, 206-250.

    Kaplan R.M., 1995, The formal architecture of LFG, [Dalrymple et al, eds] Formal issues in LFG , Stanford :CSLI.

    Kasper R. et Rounds W., 1986, A logical semantics for feature structures, Proceedings of the 24 th AnnualConference of the Association for Computational Linguistics , New York : 235-242.

    Kay M., 1985, Parsing in functional unification grammar, [D.R. Dowty, L. Karttunen et A.M. Zwicky eds.] Natural language parsing , Cambridge University Press : 251-278.

    Kuno S. et Oettinger A.G., 1962, Multiple-path Syntactic Analyzer, Information Processing VII, 1,Amsterdam : North-Holland, 306-311.

    Lakatos I., 1984 [trad. fr.], Preuves et rfutations , Paris : Hermann.Manaster-Ramer A. et Kac B., 1990, The Concept of Phrase Structure, Linguistics and Philosophy , 13, 325-

    362.Milner J.-C, 1981, Linguistique, biologie, psychologie , Ordres et raisons de langue , Paris : Le Seuil.Milner J.-C., 1989, Introduction une science du langage , Paris : Le Seuil.Minsky M., 1975, A framework for representing knowledge, [P. Winston, ed] The Psychology of Computer

    Vision , New York : McGraw-Hill, 211-277.Murray S., 1993, Theory groups and the study of language in North America. A social history ,

    Amsterdam/Philadelphie : John Benjamins Company.

    Ojeda A., 1987, Discontinuity, Multidominance, and Unbounded Dependency in Generalized Phrase StructureGrammar : some preliminaries, [Huck G. et Ojeda A., eds] Discontinuous Constituency , New-York :Academic Press, 257-282.

  • 8/8/2019 La Linguistique Au Contact de l'Informatique - De La Construction Des Grammaires Aux Grammaires de Construction

    21/22

    Marcel Cori et Jean-Marie Marandin

    21

    Pereira F et Warren D, 1980, Definite Clause Grammars for Language Analysis - A Survey of the Formalismand a Comparison with Augmented Transition Networks, Artificial Intelligence , 13 (3) : 231-278.

    Peters S., 1979, How semantics keeps syntax psychologically computable, Paper presented to the CognitiveStudies Seminar, University of Sussex.

    Pollard C. et Sag I. A. , 1994, Head-Driven Phrase Structure Grammar , Chicago : University of ChicagoPress.

    Post E., 1944, Recursively enumerable sets of positive integers and their decision problems, Bulletin of the American Mathematical Society 50 : 284-316.

    Pullum G.K., 1982, Free word order and phrase structure rules, [Pustejowsky J. et Sells P. eds] Proceedingsof the twelfth Annual Meeting of the North Eastern Linguistic Society , 209-220.

    Pullum G.K. et Gazdar G., 1981, Natural languages and context-free languages, [Savitch W. et al., eds] The formal complexity of natural language , Dordrecht : D. Reidel Publishing Company.

    Quillian M.R., 1968, Semantic memory, [M. Minsky, ed.] Semantic Information Processing , Cambridge :MIT Press, 216-270.

    Shieber S., 1986, An introduction to unification-based approaches to grammar , Stanford : CSLI.Woods W.A. , 1970, Transition Network Grammars for Natural Language Analysis, Communications of the

    ACM , 13 : 10, 591-606.

    Yngve V., 1960, A model and an Hypothesis For Language Structure. Proceedings of the AmericanPhilosophical Society , 104, 444-466.Younger D.H., 1967, Recognition and Parsing of Context-Free Languages in Time n 3. Information and

    Control , 10, 180-208.

  • 8/8/2019 La Linguistique Au Contact de l'Informatique - De La Construction Des Grammaires Aux Grammaires de Construction

    22/22

    La linguistique au contact de linformatique

    Rsum :

    Les auteurs proposent un essai d'histoire rationnelle d'un aspect du programme gnratif dans sarelation linformatique, celui qui va de la dfinition de la notion de grammaire par Chomsky, et en

    particulier de la caractrisation mathmatique des grammaires possibles (la linguistique algbrique), la conception de grammaires multidimensionnelles qui trouvent dans les systmes de reprsentationdes connaissances leur fondation formelle. Les auteurs distinguent trois moments : (a) l'mergencedu programme gnratif et de la notion de grammaire gnrative ; (b) le mouvement de rforme quise cristallise dans le refus de la forme transformationnelle de la grammaire et qui voit linvention denombreux nouveaux formalismes qui auront tous la caractristique dtre dclaratifs ; (c) ledveloppement des grammaires multidimensionnelles qui sont charges d'intgrer les analyses desdimensions formelles (syntaxe et phonologie) et non formelles (smantique, pragmatique) deslangues.