darlu & tassy, 1993

Upload: robertosaurus

Post on 20-Jul-2015

127 views

Category:

Documents


0 download

TRANSCRIPT

Avertissement la version lectronique

La publication du livre La Reconstruction phylogntique. Concepts et Mthodes (Masson, 1993), a connu un certain succs, si lon en juge par le rapide puisement des stocks. Les mauvaises langues insinueront que les raisons de ce succs tiennent davantage la prudente politique ditoriale de lditeur qui na risqu quun tirage fort parcimonieux, plutt qu une vritable popularit du livre lui-mme. Pourtant il semble bien que plusieurs gnrations dtudiants aient su mettre profit les performances des photocopieuses pour pallier une pnurie vite manifeste Depuis la date de parution de ce livre, les mthodes phylogntiques ont connu un dveloppement considrable. Il sagit dune discipline qui nest plus seulement rserve aux chercheurs avertis. Elle sadresse galement aux tudiants ds les premiers cycles et sillustre mme, avec plus ou moins de bonheur, dans les manuels scolaires des classes terminales. Paralllement cet largissement rapide du public, les revues scientifiques internationales ou nationales, comme dailleurs les journaux de vulgarisation, ne craignent plus de publier des arbres phylogntiques. Cest mme devenu une ncessit mthodologique impose par lengouement rcent pour les sciences de lvolution. On assiste galement une vaste diversification des applications, qui quittent parfois le domaine traditionnel de la biologie pour saventurer vers ceux, peut-tre plus incertains, de la linguistique, de lthologie ou de la science des textes. Enfin, de multiples ouvrages, pdagogiques ou savants (voir liste ci-dessous ; nous ne conseillons pas tous ces ouvrages au mme titre, au lecteur den tirer le meilleur parti), ont t publis ces 10 dernires annes, au point quil nexiste que lembarras du choix pour celui qui voudrait tancher sa soif de nouveauts dans le domaine des analyses phylogntiques. Compte tenu de cette floraison bibliographique, il nous a quand mme sembl utile de remettre disposition un livre qui conserve encore, aux dires de certains, quelques vertus pdagogiques, malgr ses dix ans dge, mme si cette qualit sapplique plutt aux single malts quaux manuels de phylogntique. Bien quil soit maintenant incomplet ou dpass sur plusieurs points, il garde cependant lavantage dtre le seul ouvrage crit en franais ce jour

Cette version lectronique de La Reconstruction phylogntique. Concepts et Mthodes reste, sur le fond, la copie du livre paru en 1993. Il ne sagit pas dune nouvelle dition mise jour. Seules quelques coquilles ont t corriges. Il est donc de notre devoir davertir le lecteur daujourdhui quil ne trouvera rien sur les dveloppements les plus rcents, quil sagisse dapproches probabilistes (mthodes baysiennes) ou de cladistique structurale (analyse--trois-taxons). Cette version en ligne a bnfici du travail ddition de Yann Bertrand et Rgis Debruyne et de laccueil de la Socit Franaise de Systmatique sur son site Web. Quils soient tous chaleureusement remercis. Pierre Darlu et Pascal Tassy Avril 2004

1994. Scotland R.W., Siebert D.J., Williams D.M. Models in phylogeny reconstruction. The Systematics Association Publication, special volume n52 Clarendon Press, London. 1996. Harvey P.H., Leigh Brown A.J., Maynard Smith J., Nee S. New uses for new phylogenies. Oxford University Press. 1996. Swofford D.L., Olsen G.J., Waddell P.J., Hillis D.M. Phylogenetic inference. In: Molecular systematics, Hillis D.M., Moritz C., Mable B.K. Eds. Sinaueur Associates Inc. Publishers. 1998. Page R.D.M., Holmes E.C. Molecular evolution. A phylogenetic approach. Blackwell Science. 1998. Kitching I.J., Forey P.L., Humphries C.J., Williams D.M. Cladistics, Second Edition; The Theory and Practice of Parsimony Analysis. The Systematics Association Publication N11, Oxford Science Publication, Oxford University Press. 2000. Nei M., Kumar S. Molecular evolution and phylogenetics. Oxford University Press. 2001 Hall B.G. Phylogenetic trees made easy. A How-to Manual for Molecular Biologists. Sinauer Associates, Inc. 2003. Semple C., Steel M. Phylogenetics. Oxford Lecture Series in Mathematics and its Applications n24 Oxford University Press. 2004. Felsenstein J. Inferring phylogenies. Sinauer Associates Inc. Publishers.

LA RECONSTRUCTION PHYLOGNTIQUEConcepts et mthodes

P. DARLU P. TASSY

ISBN : 2-225-84229-9 ISSN : 0754-4405

Peut-on se mettre d'accord sur une ressemblance ? Et, d'abord, qu'est-ce que la ressemblance ? ... La ressemblance se dpare de l'inessentiel. Elle est l'essentiel rintroduit dans le circuit des formes, des ides, des mtaphores et des alliances essentiel conserv des rapports entre objets et parents d'objets. Edmond Jabs Le Livre des Ressemblances, 1976.

TABLE DES MATIRES(see contents page X)Avertissement la version lectronique ....................................................................................... VII TABLE DES MATIRES ............................................................................................................. IX CONTENTS ....................................................................................................................................X AVANT-PROPOS......................................................................................................................... XI I. DE LA GNALOGIE LA PHYLOGNIE.............................................................................1 1. De Lamarck Haeckel...............................................................................................................1 2. L'arbre phylogntique...............................................................................................................6 3. Quelques dfinitions majeures ...................................................................................................7 3.1. Les sommets ................................................................................................................7 3.2. Les liens.......................................................................................................................8 3.3. Rseaux et arbres .........................................................................................................8 3.4. Varits d'arbres.........................................................................................................10 4. Combien d'arbres ?...................................................................................................................11 II. LA PROBLMATIQUE PHYLOGNTIQUE .......................................................................15 1. Le triple paralllisme .........................................................................................................16 1.1. L'anatomie compare .................................................................................................16 1.2. L'ontognie ................................................................................................................17 1.3. La palontologie ........................................................................................................18 2. Le concept de ressemblance.....................................................................................................19 III. LES OBJETS DE LA PHYLOGNTIQUE : CARACTRES ET TAXONS .......................23 1. Les caractres...........................................................................................................................23 2. Les taxons ................................................................................................................................26 2.1. L'espce et les taxons infra-spcifiques .....................................................................27 2.2. Taxons supra-spcifiques...........................................................................................29 IV. LA MTHODE CLADISTIQUE .............................................................................................31 1. Qu'est-ce que l'analyse cladistique ? ........................................................................................31 1.1. Apomorphie, plsiomorphie et groupes naturels .......................................................31 1.2 Images cladistiques.....................................................................................................35 1.3. Cladogramme et arbre phylogntique ......................................................................35 1.4. Anctres .....................................................................................................................37 2. Homologie et orthologie ..........................................................................................................38 2.1. Dfinition et critres de l'homologie..........................................................................38 2.2. Alignement et mutations multiples ............................................................................40 3. Une mthode hypothtico-dductive........................................................................................41 3.1. Le principe de parcimonie .........................................................................................42 3.2. La notion de congruence............................................................................................44

4. Les critres d'identification du sens de transformation des caractres .....................................45 4.1. Le critre de comparaison extra-groupe.....................................................................46 4.1.1. Combien d'extra-groupes ? .....................................................................................46 4.2. Le critre ontognique ...............................................................................................50 4.3. Les critres palontologique et chorologique ............................................................57 4.4. Polarisation et construction cladistique.................................................................................63 V. LES PROCDURES DE PARCIMONIE .................................................................................69 1. La recherche de l'arbre le plus court ........................................................................................69 1.1. Modles de parcimonie..............................................................................................70 1.2. Algorithmes exacts et heuristiques ............................................................................72 1.3. Longueur de l'arbre, longueur des branches et optimisation des caractres...............86 2. Les caractres : codage, optimisation, pondration..................................................................89 2.1. Caractres binaires et tats multiples .........................................................................89 2.2. Polymorphisme ........................................................................................................102 2.3. Pondration des caractres et des transformations...................................................104 3. L'enracinement de l'arbre .......................................................................................................113 3.1. Racine et anctre......................................................................................................113 3.2. Racine et extra-groupe(s).........................................................................................113 3.3. Racine : dichotomie et trifurcation ..........................................................................115 4. Mesures de l'homoplasie et comparaisons d'arbres ................................................................117 4.1. Mesures de l'homoplasie..........................................................................................117 4.2. Les arbres de consensus...........................................................................................120 4.3. Pondration successive ............................................................................................123 4.4. Les mthodes de r-chantillonnage........................................................................128 5. Les invariants .........................................................................................................................131 5.1. Les invariants de Cavender......................................................................................132 5.2. Les invariants de Lake .............................................................................................133 6. L'volution est-elle parcimonieuse ?......................................................................................138 VI. LA MTHODE DE COMPATIBILIT.................................................................................145 1. La mthode.............................................................................................................................145 2. Compatibilit et parcimonie...................................................................................................148 3. Compatibilit et cladisme.......................................................................................................150 VII. LES MTHODES PHNTIQUES .....................................................................................153 1. Historique...............................................................................................................................154 2. Similitude et distance .............................................................................................................155 2.1. La notion de similitude et de distance......................................................................156 2 .2. Indices de similitude et de distance fonds sur des attributs..................................157 2.3. Indices de distances fondes sur des donnes quantitatives.....................................161 3. Distances patristique, observe, estime ................................................................................163 3.1.Distance patristique ou phyltique............................................................................163 3.2. La distance observe................................................................................................164 3.3. Distance estime ......................................................................................................168 4. Mthodes phntiques de construction d'arbres .....................................................................171 4.1. Les mthodes agglomratives ..................................................................................171 4.2. Les mthodes d'ajustement ......................................................................................178 4.3. Les mthodes de parcimonie....................................................................................188 5. Remarques et conclusions propos des mthodes phntiques .............................................191

VIII. LES MTHODES PROBABILISTES ................................................................................195 1. Introduction............................................................................................................................196 1.1. Gnralits ...............................................................................................................196 1.2. Exemple ...................................................................................................................198 1.3. Conclusions .............................................................................................................203 2. Modle d'volution de caractres quantitatifs ........................................................................204 2.1. La solution de Felsenstein (1973b) ..........................................................................206 2. 2. La mthode du Treeness (Cavalli-Sforza et Piazza, 1975) .....................................209 3. Modle d'volution de caractres discrets..............................................................................211 3 .1. Gnralits ..............................................................................................................211 3.2. Modle d'volution de type Poisson, fonction du temps..........................................213 3.3. Modle d'volution indpendant du temps ..............................................................215 4. Parcimonie et vraisemblance..................................................................................................215 5. Parcimonie, vraisemblance et consistance .............................................................................219 6. Conclusions............................................................................................................................223 CONCLUSION.............................................................................................................................225 RFRENCES BIBLIOGRAPHIQUES......................................................................................230 INDEX..........................................................................................................................................242

CONTENTS

Forewords ...................................................................................................................................... XI I. FROM GENEALOGY TO PHYLOGENY...................................................................................1 1. From Lamarck to Haeckel..........................................................................................................1 2. The phylogenetic tree.................................................................................................................6 3. Some important definitions ........................................................................................................7 4. How many trees ?.....................................................................................................................11 II. THE PHYLOGENETIC PROBLEM.........................................................................................15 1. The threefold parallelism .........................................................................................................16 2. The concept of similarity .........................................................................................................19 III. THE OBJECTS OF PHYLOGENETICS: CHARACTERS AND TAXA ...............................23 1. Characters ................................................................................................................................23 2. Taxa .........................................................................................................................................26 IV. THE CLADISTIC METHOD...................................................................................................31 1. What is cladistic analysis ? ......................................................................................................31 2. Homology and orthology .........................................................................................................38 3. A hypothetico-deductive method .............................................................................................41 4. The criteria of character transformation polarity .....................................................................45 V. PARSIMONY PROCEDURES .................................................................................................69 1. Finding the shortest tree...........................................................................................................69 2. Characters: codage, optimization, weighting ...........................................................................89 3. Rooting the tree......................................................................................................................113 4. Mesuring homoplasy and comparing trees.............................................................................117 5. Invariants ...............................................................................................................................131 VI. THE COMPATIBILITY METHOD ......................................................................................145 1. The method ............................................................................................................................145 2. Compatibility and parsimony.................................................................................................148 3. Compatibility and cladism .....................................................................................................150 VII. PHENETIC METHODS .......................................................................................................153 1. Historical account ..................................................................................................................154 2. Similarity and distance .......................................................................................................155 3. Patristic, observed, and estimated distance ............................................................................163 4. Constructing a tree with phenetic methods ............................................................................171 5. Phenetic methods: remarks and conclusions..........................................................................191 VIII. PROBABILISTIC METHODS............................................................................................195 1. Introduction............................................................................................................................196 2. Evolutionary models of quantitative characters .....................................................................204 3. Evolutionary models of discrete characters ...........................................................................211 4. Parsimony and likelihood.......................................................................................................215 5. Parsimony, likelihood and consistency ..................................................................................219 6. Conclusions............................................................................................................................223 CONCLUSION.............................................................................................................................225 REFERENCES .............................................................................................................................230 INDEX..........................................................................................................................................242

AVANT-PROPOS

La construction phylogntique est l'une des disciplines en plein essor des sciences de l'volution. Depuis une vingtaine d'annes elle s'est constitue comme branche autonome. Assurment, la construction d'arbres gnalogiques est aussi vieille que la recherche volutionniste elle-mme. Mais, longtemps intuitive, elle est aujourd'hui formalise et repose le plus souvent sur une base mathmatique, ou, tout le moins, algorithmique. Ce livre est n de notre exprience en matire de recherche d'abord, exprience de phylognticien pour chacun de nous, plutt de gnticien pour l'un et de palontologue pour l'autre ; mais aussi et surtout, en matire d'enseignement, tant dans le cadre universitaire que dans le cadre de stages de formation permanente du CNRS. Il est vite apparu qu'il restait crire un ouvrage pdagogique en langue franaise accessible aux tudiants, aussi bien qu'aux systmaticiens, biologistes, gnticiens et palontologues qui s'intressent, plus gnralement, aux questions d'volution. Nombreux sont les ouvrages traitant d'un aspect prcis de la recherche phylogntique : manuels de systmatique volutionniste, manuels de taxinomie numrique, manuels de cladistique comme le rcent The Compleat Cladist (Wiley et al., 1991). Plus rares sont les manuels de synthse qui apportent une initiation aux diffrentes approches phylogntiques actuellement pratiques. L'ambition du prsent volume est d'offrir un panorama de ces mthodes, ainsi qu'une discussion de leurs particularits, de leurs performances et de leurs limites. Le lecteur trouvera non seulement une introduction aux mthodes cladistique et phntique de construction d'arbres, qui sont parmi les plus rpandues, mais aussi une introduction aux approches probabilistes, moins frquemment utilises et discutes. En somme, la fonction de ce livre est d'initier le lecteur aux pratiques phylogntiques par le concret - par l'exemple -, mais aussi en l'informant sur le

Avant-propos

X

fond, c'est--dire sur les principes et modles qui sous-tendent chaque mthode. Ainsi devraient tre plus claires les raisons de choisir telle ou telle mthode, plus argumentes en tout cas que le choix de telle d'entre elles parce que c'est ce qui se fait dans la maison . Cet ouvrage n'est pas une introduction aux diffrents logiciels de construction d'arbres existant sur le march. Nanmoins l'usage de l'outil informatique a fortement transform la pratique quotidienne du phylognticien. Nous avons donc cherch intgrer au cours des dveloppements conceptuels touchant chaque mthode, les procdures spcifiquement informatiques. Traditionnellement, la construction d'arbres phylogntiques ressortit au vaste domaine de la systmatique, de la taxinomie. Toutefois nous n'avons pas cherch approfondir la question des liens entre classification et phylognie. Les livres sur la question sont nombreux (voir par exemple le tout rcent ouvrage de Panchen, 1992) et figurent en tout tat de cause dans la bibliographie en fin de volume. C'est vritablement la spcificit de la construction de l'arbre, c'est--dire l'tablissement des liens phylogntiques, qui fait le sujet du prsent livre. Qu'est-ce qui diffrencie la construction d'arbres phylogntiques de celle de simples graphes arborescents ? En quoi se distinguent les diffrentes approches et mthodes ? Qu'est-ce qui distingue une analyse de distance d'une analyse cladistique, ou bien une analyse de parcimonie d'une analyse probabiliste ? Pourquoi donnent-elles ventuellement des rsultats divergents partir des mmes donnes de dpart ? Pourquoi utiliser telle mthode plutt qu'une autre ? Quel est le rapport des constructions phylogntiques la thorie de l'volution en gnral et aux modles sur les processus volutifs en particulier ? Quelle est l'originalit des mthodes probabilistes ? Nous esprons avec ce livre apporter quelques rponses ces questions (et bien d'autres), ainsi que des lments de rflexion propos des nombreux problmes qui persistent aujourd'hui dans le champ de la recherche phylogntique, tant dans le domaine dit traditionnel des recherches morphologiques qu'en biologie molculaire. Ce livre s'adresse aux tudiants de 2e et 3e cycles en biologie volutive, palontologie incluse, en esprant leur faciliter la tche dans le dpouillement et la comprhension de la littrature phylogntique aussi abondante et diversifie que parfois hermtique. Il s'adresse aussi aux chercheurs non phylognticiens qui souhaitent avoir en main un ouvrage sur la question, tant aujourd'hui il est difficile d'apporter des informations volutives indpendamment de toute construction d'arbre. De nombreux points abords dans ce livre sont actuellement discuts voire controverss. Certains sont des sujets de recherches en cours. Nous nous sommes efforcs de ne pas les esquiver, en restant toutefois trs succinct. C'est le cas, par exemple, de nouveaux indices et tests relatifs l'estimation de la robustesse des arbres qui ont t publi durant l'anne 1992 et dont l'efficacit fait l'objet de travaux actuels. C'est le cas galement des constructions d'arbres rticuls incluant des changes gniques. Le plus souvent, nous n'avons donc dvelopp que les mthodes les plus rpandues.

Avant-propos

XI

Cet ouvrage est divis en huit chapitres. Les trois premiers forment une manire d'introduction historique et conceptuelle des thmes de la recherche phylogntique : concepts de gnalogie, d'arbre, de ressemblance, de caractre, d'homologie, de taxon. Les trois suivants (IV,V et VI) appartiennent, en gros, la sphre du cladisme : la mthode cladistique proprement dite, les procdures de parcimonie et la mthode de compatibilit ; approches cladistique et de compatibilit peuvent en effet tre regroupes en ce sens qu'il s'agit d'analyses de caractres. Le chapitre IV prsente la mthode cladistique la fois dans ses principes et dans sa pratique, sous un angle plutt naturaliste. Le chapitre V est lui aussi en grande partie consacr l'approche cladistique - mais sous un angle plus informatique , en ce sens qu'y sont dveloppes les procdures en usage dans les logiciels dits de parcimonie. Nous esprons que les redondances dans les chapitres IV et V seront plus comprises comme des correspondances que comme des rptitions. Le chapitre V contient en outre d'autres procdures de parcimonie non cladistiques au sens strict. Le chapitre VI est consacr la mthode de compatibilit. Le chapitre VII dtaille les mthodes phntiques que l'on rassemble souvent sous le vocable de taxinomie numrique . Quoique ces approches se ressemblent dans la mesure o elles sont toutes des analyses de distance, elles se distinguent les unes des autres notamment par leurs diffrents prsupposs relatifs aux processus volutifs, c'est--dire par les critres de conversion d'arbres de distances en arbres phylogntiques. Le chapitre VIII est consacr aux mthodes probabilistes, mthodes encore marginales dans le domaine de la recherche phylogntique mais dont on peut attendre une expansion prochaine. Nous tenons remercier Herv Le Guyader sans qui nous n'aurions jamais crit ce livre. Merci galement Josu Feingold pour le soutien qu'il nous a toujours apport au sein de l'Unit INSERM U155 et Michle Aosaka, Vronique Barriel, Jean Pierre Bocquet-Appel, Daniel Goujet, Herv Philippe, Dominique Visset pour leurs conseils, suggestions, critiques et aides diverses.

CHAPITRE I

DE LA GNALOGIE LA PHYLOGNIE

1. De Lamarck HaeckelLe terme phylognie fut invent par Ernst Haeckel en 1866 pour dfinir l'enchanement des espces animales et vgtales au cours du temps. Jusqu'alors le concept tait exprim par le terme gnalogie . Ce n'est que dans la dernire dition de l'0rigine des espces (1872) que Charles Darwin introduisit le mot phylogeny avec la dfinition suivante : les lignes gnalogiques de tous les tres organiss. Le mot est rest. Nous dfinirons la phylognie comme le cours historique de la descendance des tres organiss . Haeckel lui-mme avait dfini la phylognie comme l'histoire du dveloppement palontologique des organismes par analogie avec l'ontognie ou histoire du dveloppement individuel. Les termes dveloppement et volution sont tous deux issus de l'embryologie. Pour qualifier les transformations organiques situes dans le temps gologique, le mot volution supplanta progressivement la fin du XIXe sicle celui de dveloppement Haeckel fut l'un des artisans de ce succs qui se fit au dtriment de transformisme , terme synonyme d' volutionnisme et qui reste le plus souvent associ luvre de J.-B. Monet de Lamarck, quoique ce dernier ne l'utilist jamais. Lamarck, en mme temps qu'il conut les bases de la thorie de l'volution, publia dans sa Philosophie zoologique (1809) un schma de filiation des animaux qui empruntait sa forme l'image classique de la gnalogie qui se lit de haut en bas (figure I-1). Ce schma est prsent comme la distribution gnrale des animaux. Ce concept lamarckien exceptionnellement fcond s'oppose explicitement la classification et se veut une construction qui doit exprimer l'ordre reprsentant le plus possible celui mme de la nature, c'est--dire l'ordre qu'elle a suivi dans la production des animaux et qu'elle a minemment caractris par les rapports qu'elle a mis entre les uns et les autres . Les rapports qu'voque Lamarck sont les parents entre les corps vivants .

De la gnalogie la phylognie

2

FIGURE I.1. La filiation des animaux selon Lamarck (1809, vol.2, p.463). Lamarck crit aussi que la distribution doit former une srie et non une ramification rticulaire ; cette srie devant tre une vritable chelle relativement aux grandes masses, c'est--dire les grandes subdivisions du monde animal, les espces (formant) souvent autour des masses dont elles font partie des ramifications latrales dont les extrmits offrent des points vritablement isols . Le concept de phylognie est donc bauch chez Lamarck. Contre la lgende qui fait de Lamarck un incompris qui fut ignor de son temps, il convient de souligner la force de ces bauches lamarckiennes. En outre, c'est un naturaliste lamarckien, Frdric Grard, tardivement reconnu, qui conut en 1845, soit quinze ans avant l'Origine des espces, l'expression thorie de l'volution des tres organiss dans son sens moderne, preuve, s'il en est, de la fcondit de luvre de Lamarck. Nanmoins c'est dans l'Origine des espces de Darwin (1859) qu'on trouve la fois l'ide de phylognie comme cours historique unique suivi par l'volution et l'image de l'arbre phylogntique. Renversant la lecture de la gnalogie, la phylognie est reprsente sous la forme d'un arbre avec un tronc, des branches, des rameaux qui se lit de bas en haut. La seule illustration incluse dans l'Origine des espces est une image de filiation entre espces hypothtiques situes dans un contexte stratigraphique : le temps gologique se lit de bas en haut (figure.I-2). Les premires phylognies jamais publies se lisent de cette faon, qu'il s'agisse de la phylognie du monde vivant par Haeckel (1866) o l'chelle du temps n'est qu'implicite (figure I.3) ou de celle par Albert Gaudry (1866) intgrant divers mammifres actuels et fossiles et o l'chelle du temps est explicite (figure I.4).

De Lamarck Haeckel

3

FIGURE I.2. Le modle de la descendance avec modification selon Darwin (1859, tableau face p.117). A-L : espces ; I-XIV : tages gologiques.

De la gnalogie la phylognie

4

FIGURE I.3. L'arbre phylogntique des tres vivants selon Haeckel (1866, vol.2, pl.1).

De Lamarck Haeckel

5

FIGURE I.4. L'volution des proboscidiens selon Gaudry (1866). Toutefois, donner diffrents taxons leur dimension stratigraphique en les situant dans l'chelle des temps gologiques ne revient pas construire un arbre phylogntique. Agassiz publia par exemple, ds 1844, une gnalogie de la classe des poissons situe dans un cadre stratigraphique o les positions respectives des diffrents groupes reconnus peuvent voquer un arbre. Mais aucune connexion entre ces groupes n'est indique. La raison en est que, selon Agassiz, cette gnalogie n'implique pas de lien volutif : Agassiz tait fixiste.

De la gnalogie la phylognie

6

2. L'arbre phylogntiqueL'arbre phylogntique est une construction-cl dans l'histoire de la biologie et de la gologie. Son succs oprationnel ne s'est jamais dmenti. Imaginons que nous retracions l'histoire de trois espces choisies arbitrairement (actuelles ou fossiles). En remontant le temps, nous pouvons esprer relier les deux espces qui drivent de la mme espce ancestrale ; en remontant plus loin encore, nous rencontrons l'espce ancestrale des trois espces. Le dessin en deux dimensions de ces relations de parent est un arbre compos d'une succession de branchements. Au reste, on n'a jamais trouv meilleure faon d'illustrer, en deux dimensions, les relations de parent entre espces ou groupes d'espces, en fonction du temps (verticalement) et de la diversit taxinomique (horizontalement). Dans le cas de la diversit, de faon conventionnelle et le plus souvent symbolique, la dimension horizontale permet aussi une reprsentation du degr de divergence morphologique de deux branches partir du point de branchement, ce que Darwin nomme la somme des modifications .

FIGURE I.5. Classification des oiseaux fissirostres selon Wallace (1856).

Quelques dfinitions majeures

7

L'arbre phylogntique rompt suivant en cela les anticipations lamarckiennes avec la tradition des reprsentations en rseaux hrites du XVIIIe sicle qui influenaient encore fortement les naturalistes volutionnistes. Les rseaux, comme les arbres, visent relier linairement des groupes selon leurs degrs d'affinits. Cependant la lecture d'un rseau n'impose nullement un point de dpart oblig : il n'y a pas de souche la base du schma. Nelson et Platnick (1981) ont dj fait remarquer que A.-G. Wallace l'autre pre de l'volutionnisme fournit en 1856 un schma de ce type propos des affinits des oiseaux de l'ordre des fissirostres. Il nous manque dans un tel schma qui s'apparente un arbre non enracin, l'indication d'un itinraire : le cours historique (figure I.5). Avec l'arbre phylogntique, l'itinraire nous est donn par le point de dpart oblig : la racine de l'arbre. Le temps gnalogique tant irrversible, l'histoire de la descendance est unique. Le problme de reconstruction d'un fait historique n'admettant qu'une seule solution, l'un des buts de la science volutionniste du XXe sicle fut et reste l'laboration et le perfectionnement des mthodes de reconstruction phylogntique.

3. Quelques dfinitions majeuresLe vocabulaire propre aux phylognticiens prsente quelques particularits, mais aussi quelques ambiguts dans la mesure o il rsulte d'un mlange de termes issus de la thorie des graphes, et dont l'usage n'est pas toujours correct, et d'autres termes, gnralement plus imags, hrits de la tradition volutionniste remontant au XIXe sicle. Quelques claircissements sont donc ncessaires. Partant de dfinitions de la thorie des graphes, nous expliquerons les termes consacrs maintenant par l'usage, en levant toute ambigut. Les relations entre divers objets (populations, espces, taxons, units volutives) peuvent tre reprsentes selon un diagramme assez gnral tel que celui de la Figure I.6a. On y distingue des sommets et des liens, appels aussi arcs ou artes, reliant ces sommets.

3.1. Les sommetsOn distingue les sommets internes ou nuds (figure I.6 : N5, N6, N7, N8) et les sommets externes ou feuilles (T0, T1, T2, T3, T4). Dans le contexte phylogntique, ces derniers, pour lesquels on dispose de donnes observes, sont les extrmits ou taxons terminaux, ou units volutives (UE). Les nuds constituent gnralement des taxons ou des UE hypothtiques (UEH) dans la mesure o leur existence n'est pas fonde sur l'observation de caractres mais rsulte seulement du processus de reconstruction lui-mme.

De la gnalogie la phylognie

8

3.2. Les liensLa relation entre deux sommets constitue un lien appel souvent segment ou branche. Deux nuds internes sont relis par un lien interne (l65, l68, l76, l78 et l85) tandis qu'un nud et une feuille sont relis par un lien externe, dsign gnralement comme une branche terminale ou priphrique (l50, l16, l27, l37, l48). A chacun des liens, on peut associer une mesure, comme par exemple une distance, gntique ou autre, une dure, une quantit d'volution ou un nombre de mutations. On peut galement y associer un poids qui peut tre une vitesse d'volution, un effectif, un taux de mutation, un cot quelconque etc. Un poids nul le long d'un lien entre deux UE revient supprimer ce lien, donc fusionner deux UE. Par ailleurs un lien peut tre orient, c'est--dire avoir une mesure et/ou un poids diffrent selon que la relation est parcourue dans un sens ou dans un autre. Un poids nul le long d'un lien orient signifie que l'orientation est univoque, d'un nud vers un autre et non en sens inverse. C'est le sens classique en phylogntique. On dira que le premier nud est l'anctre par rapport au second dfini comme descendant. Une autre caractristique concerne le nombre de liens attachs un sommet : ce nombre peut varier d'un sommet un autre. Dans le cas de la figure I.6a (liens non orients), il est gal 1 pour un sommet externe (T0 T4), 3 pour N5, 4 pour tous les autres. Dans la figure I.6b (liens orients univoques), il faut distinguer le nombre des liens pointant vers le sommet de ceux qui en partent. La figure I-6 montre deux types de relations entre UE : dans la premire (a) aucun sens d'volution n'est explicite puisque les liens sont non orients. En revanche, dans la seconde (b) les liens sont orients depuis T0 (UEH ancestrale) jusqu'aux taxons terminaux (T1 T4). Dans les deux cas, la longueur des liens peut tre reprsente proportionnellement la mesure reliant les taxons entre eux, ou, au contraire, n'avoir aucune signification autre que de dcrire les relations entre les nuds.

3.3. Rseaux et arbresIl est ncessaire de distinguer d'abord entre rseaux et arbres, ces derniers pouvant tre non enracins ou enracins. 3.3.1. Le rseau Il s'agit d'un graphe connexe (il existe au moins un chemin entre chaque paire de sommets) et cyclique (c'est--dire assimilable une chane dont les extrmits concident).

Quelques dfinitions majeures

9T0 l50 N5 l 85 N 8 T4 l48 l65 N6 l16 l68 l78 N 8 T4 l 48

T0 l50 N5 l 85 l65 T1 l16 l76 N7 l 27 T2 l37 T3 T2 l78 l76 N7 l27 N6 l68

T1

l 37 T3

a)

b)

FIGURE I.6. Schma des liens non orients (a) ou orients (b) entre 5 sommets terminaux ou branches (T0 T4) et 4 nuds (N5 N8) (a) ou orients (b). 3.3.2. L'arbre 1) L'arbre non enracin (unrooted tree) est un graphe connexe non cyclique. Il n'existe donc pas de boucle, c'est--dire qu'un seul et unique chemin permet de passer d'un sommet un autre. Il n'y a qu'une faon de joindre entre elles deux UE. De ce fait, les sommets terminaux (les feuilles) ne sont relis aux nuds internes que par un seul lien non orient (branche). Cela revient en fait attribuer un poids nul aux branches qui permettraient un cycle. Par exemple, sur la figure I.6, le lien l68 entre les nuds N6 et N8 et le lien l78 entre les nuds N7 et N8 sont supprims dans la figure I.7. Le terme de rseau (network) est souvent considr comme synonyme d'arbre non enracin, bien que cet usage ne correspondent pas au vocabulaire de la thorie des graphes (Barthlmy et Gunoche, 1988). Dans la mesure du possible, on vitera d'utiliser ce terme, sauf cas particuliers comme celui o il existe des mlanges entre UE diffrents niveaux de l'arbre. 2) L'arbre enracin comporte une contrainte supplmentaire par rapport l'arbre non enracin dans la mesure o on est amen dfinir une origine appele souvent racine ou anctre. Les liens sont alors orients de manire univoque de telle faon qu'un seul lien se dirige sur un sommet tandis que deux liens (dichotomie ou bifurcation) ou plusieurs liens (polytomie ou multifurcation) peuvent en partir. C'est le cas de la figure I.7b, dduite de la figure I.6b en supprimant les liens l68 et l78, et o l'anctre est T0.

De la gnalogie la phylognie

10T0

T0

T4

T1

a)

b)

T2

T3

T1

T2

T3

T4

FIGURE I.7. Schmas des liens non orients (a) ou orients (b) quand les liens l68 et l78 de la figure I.6a et I.6b ont un poids nul. L'arbre (a) est non enracin tandis que l'arbre (b) possde une racine T0 Dans le vocabulaire de la systmatique moderne, un usage regrettable met parfois en synonymie les mots arbre et phylognie. Or, un arbre n'est pas ncessairement enracin alors qu'une phylognie est une histoire et a donc un point de dpart, la racine, et une seule orientation de lecture. L'expression d'arbre phylogntique n'est donc pas redondante, tandis que l'expression phylognie non enracine est proscrire catgoriquement. Par la suite nous rserverons le plus souvent le terme d'arbre pour qualifier un arbre enracin, parlant d'arbre non enracin ou, plus rarement, de rseau pour les autres types d'arbres.

3.4. Varits d'arbresa Le dendrogramme est un arbre exprimant les liens entre taxons sous la forme d'une succession de branchements. Il ne dsigne rien d'autre qu'un arbre dont les lments terminaux sont les taxons ou UE observs. Ce terme est assez large pour ne rien exprimer quant la procdure utilise pour son obtention. b Le cladogramme est un dendrogramme exprimant les relations phylogntiques entre taxons et construit partir de l'analyse cladistique o les points de branchements (les nuds) sont dfinis par des synapomorphies. Ce mot a t cr la mme anne par Mayr (1965) et par Camin et Sokal (1965) avec des sens un peu diffrents. c Le phnogramme est un dendrogramme produit par la taxinomie numrique o les relations entre taxons expriment les degrs de similitude globale, dfini simultanment par Mayr (1965) et par Camin et Sokal (1965). d Le phylogramme est un dendrogramme exprimant les branchements cladistiques et le degr de divergence adaptative subsquente aux branchements (Mayr, 1969).

Combien d'arbres ?

11

4. Combien d'arbres ?Il n'existe qu'un seul arbre reliant diffrentes units volutives passes ou actuelles : c'est l'arbre volutif, celui qui raconte l'histoire de la descendance. L'ambition de la reconstruction phylogntique est de distinguer cet arbre vrai parmi l'ensemble des arbres que l'on peut thoriquement reconstruire partir des diffrentes UE observes. Il est donc important de connatre le nombre T de tous ces arbres possibles. Les mthodes dcrites dans ce livre conduisent effectuer un choix, gnralement limit un seul arbre, parmi tous les arbres possibles. Dans le cas simple o le nombre n d'UE est gal 4 (A, B, C, D), la figure I.8 montre que 4 arbres non enracins sont possibles dont trois (Tx, Ty, Tz) possdent deux nuds internes et le quatrime (Tw) un seul nud interne. Ces quatre solutions sont obtenues par l'insertion de la quatrime UE (ici D) sur l'une des trois branches reliant les trois autres UE (A, B et C) ou sur le nud joignant ces trois branches. Pour passer d'un arbre non enracin un arbre enracin, il suffit de placer l'anctre sur l'une quelconque des branches. On supposera que la position de l'origine est distincte des nuds et des UE. Pour chacun des arbres Tx, Ty et Tz, il y aura donc 5 localisations possibles pour cette origine, soit 15 arbres diffrents au total. Avec Tw, 4 positions sont possibles pour cette origine. En conclusion, 19 arbres diffrents reliant entre elles 4 UE seulement peuvent donc tre construits. De la mme faon, si, au lieu de vouloir placer sur un arbre non enracin de 4 UE une origine ou un anctre, on souhaitait agglomrer une cinquime UE, 15 positions seraient galement possibles partir de Tx, Ty et Tz (reprsentes sur la figure I.8) et 4 partir de Tw. Le cas de figure de 4 arbres construits partir de 4 UE sera privilgi par plusieurs mthodes de reconstruction comme la mthode des invariants (Chapitre V.5). Le calcul du nombre total d'arbres non enracins prsentant 3 segments par nuds internes repose sur le raisonnement rcurrent suivant (Edwards et CavalliSforza, 1964 ; Cavalli-Sforza et Edwards, 1967 ; Felsenstein, 1978a) : un arbre non enracin de ce type ayant n UE possde : ni = n 2 nuds internes, si = n 3 segments internes, sn = n segments externes. Il est possible de rajouter une UE supplmentaire sur chacun des segments, internes ou externes, donc en si + sn = 2n 3 endroits possibles. Si le nombre des rseaux diffrents pour n 1 UE est Tn 1, ce nombre sera, pour n UE, gal : Tn = Tn 1 * (2(n 1) 3) Finalement on peut donc crire : Tn = (2k 5)k=3 n

De la gnalogie la phylognieA B A B

12

C A C A B A

C

Tw

D B

B

Tx

D

C

Ty

D

D

Tz

C

A

E

C

A

E

B

A

E

B

B A E B A

Tx 1

D C E

C A

Ty1

D B E

D A

Tz1

C B

Tx 2E

D C

C A

Ty 2E

D B

D A

Tz 2E

C B

B A

Tx3E

D C

C A

Ty 3E

D B

D A

Tz 3E

C B

B A

Tx 4

D C E

C A

Ty 4

D B E

D A

Tz 4

C B E

B

Tx 5

D

C

Ty5

D

D

Tz 5

C

FIGURE I.8. Reprsentation des 15 arbres diffrents non enracins que l'on peut obtenir partir de 5 UE : A, B, C, D, E. Lorsque A est considr comme l'anctre, ces 15 arbres deviennent les 15 arbres diffrents enracins que l'on peut obtenir partir de 4 UE diffrentes (B, C, D et E).

Combien d'arbres ?

13

Le nombre total d'arbres enracins dichotomiques diffrents ayant n UE terminaux s'obtiendrait, par un raisonnement analogue :' Tn = (2k 3) k=2 n

Le nombre d'arbres devient trs vite lev lorsque n, le nombre d'UE, augmente. Ainsi, avec n = 10 et n = 20, les nombres d'arbres dichotomiques sont respectivement : T'10 = 34 459 425 et T'20 = 8 200 794 532 637 891 559 375 >8*1021 On comprend que la recherche exhaustive de l'arbre le plus parcimonieux ou le plus vraisemblable, par numration de tous les arbres possibles, ne soit ralisable que lorsque n ne dpasse pas la dizaine, mais devienne quasiment impossible ds lors que n la dpasse, mme avec les ordinateurs les plus puissants. Ce rsultat implique que soit mise en application une stratgie de recherche de l'arbre le plus parcimonieux ou le plus vraisemblable qui n'impose pas cette recherche exhaustive. Une telle stratgie doit tre efficace en ce sens qu'elle ne doit laisser que peu ou pas de chance de ne pas trouver l'arbre recherch. Plusieurs algorithmes seront dcrits dans le chapitre V qui permettent de raliser ce travail.

CHAPITRE II

LA PROBLMATIQUE PHYLOGNTIQUE

La construction phylogntique est une entreprise vnrable qui plonge ses racines dans les oeuvres des grands volutionnistes du XIXe sicle, Lamarck, Darwin, Haeckel. Mais ses bases conceptuelles, la rgle du jeu de construction, n'ont que rarement t abordes sur le fond. La construction phylogntique s'appuie sur le concept de base de la descendance avec modification . Quels sont les caractres observs chez deux ou plusieurs espces qui indiquent une proche parent ? Ce sont ceux hrits de leur anctre commun. Le postulat de base est que la ressemblance est intelligible en termes d'ascendance commune. Le problme gnral est donc celui de l'infrence sur l'anctre et sur ses caractres partir de l'observation des caractres des taxons terminaux (figure II.1).

FIGURE II.1. Le domaine de l'observation et de l'infrence dans la construction phylogntique (A, B, C : taxons ; triangles : caractres). Jusqu' luvre de taxinomie fondamentale de l'entomologiste Willi Hennig (1950), la construction phylogntique obissait au principe du triple paralllisme (threefold parallelism), une expression conue par le zoologiste Louis Agassiz (1859) et reprise par Haeckel pour exprimer que l'anatomie compare, l'ontognie et la palontologie fournissent les sources de la reconstruction phylogntique.

La problmatique phylogntique

16

1. Le triple paralllisme Agassiz, l'un des grands anatomistes du XIXe sicle, n'tait pas volutionniste. Ce fut mme l'un des opposants les plus rsolus au darwinisme. Il ne conut le principe du triple paralllisme que dans la perspective de la classification biologique. Haeckel, darwinien militant, reprit son compte ce principe dans une perspective volutionniste. Ce transfert claire les liens profonds entre classification et phylognie. Selon Agassiz, partisan des crations rptes, tablir les affinits entre les tres organiss et les situer dans leur contexte stratigraphique, c'est faire oeuvre de classificateur. Selon Haeckel et les volutionnistes modernes, une telle pratique relve de la reconstruction phylogntique. On ne s'tonnera donc pas que les diffrentes approches mthodologiques concernant la construction des arbres phylogntiques se sont d'abord opposes au travers des coles de systmatique. Mais quoique les systmaticiens s'affrontrent, et s'affrontent toujours, sur le statut des classifications biologiques et sur la nature des informations qu'elles transmettent, l'accord s'est fait sur nombre de principes d'analyse phylogntique. Il reste que les dbats sur les classifications ne sont pas non plus sans effet sur les pratiques phylogntiques. Nous y reviendrons la fin de ce chapitre. L'anatomie compare, l'ontognie et la palontologie offrirent donc selon Haeckel la triple source des informations phylogntiques.

1.1. L'anatomie compareL'anatomie compare fournit d'abord des informations collectes sur l'actuel et s'applique naturellement la morphologie. La recherche des homologies similitudes lies la descendance est la base mme de l'anatomie compare. Le critre primordial d'identification des traits homologues est l'identit de position ou principe des connexions d'Etienne Geoffroy Saint-Hilaire repris par Richard Owen : un organe est homologue chez deux espces ou plus si, sous quelque forme ou fonction que ce soit, il a les mmes connexions avec d'autres organes. Dans le bras, l'os impair mince et allong de l'homme, qui s'articule avec l'omoplate et l'avant-bras, est homologue celui de la taupe, plus large que haut et dont l'orientation est diffrente (le coude regarde vers le haut) mais dont les connexions sont identiques : c'est l'humrus. Richard Owen qui, le premier, usa du terme homologie (1845) Geoffroy Saint-Hilaire parlait pour le mme concept d' analogie fut un systmaticien non darwinien qui ne se proccupait que de classification et non de phylognie. La perspective volutionniste explique l'homologie par la descendance. Les espces partageant des traits homologues sont apparentes ; le terme apparent n'a pas qu'une signification classificatoire : il a un sens gnalogique. Si l'on se replace dans le contexte de l'anatomie compare du XIXe sicle, il apparat donc que le critre de reconnaissance de l'homologie est indpendant de la dfinition du concept et de son explication volutionniste. L'identification de l'homologie par l'anatomie compare repose sur le principe structural des

Le triple paralllisme

17

connexions, et conoit la ressemblance dans le cadre d'un rapport de position. Il reste que le critre de ressemblance a toujours pos nombre de problmes aux classificateurs. Diffrents traits jugs homologues chez diffrentes espces indiquaient ventuellement des regroupements diffrents. Par exemple, de nombreuses espces de mammifres possdent un humrus pourvu d'une crte supra-condylienne saillante. D'un point de vue structural cette crte est homologue chez ces espces : elle est toujours situe l'extrmit distale de l'os, sur la face latrale et au-dessus du condyle articulaire. Or les mammifres qui montrent cette crte, comme le blaireau, le phoque ou l'lphant, ne sont pas pour autant troitement apparents. Les systmaticiens du XVIIIe sicle cherchrent rsoudre le problme des contradictions induites par la rpartition des caractres par le principe de subordination des caractres , conu par A.-L. de Jussieu. Les caractres constants sont plus importants que les caractres inconstants . Ce principe, o perce la notion de congruence, fut quelque peu altr au XIXe sicle et transform en un principe de recherche des caractres fondamentaux , les bons caractres, ceux dont on pense a priori qu'ils sont plus importants que les autres. Si elle contribua la conception des grands plans d'organisation des tres vivants, l'application de ce principe ne permit pas de rsoudre parfaitement les contradictions. Le principe d'homologie, vu comme un rapport de position, ne le permit pas non plus. On sait aujourd'hui que la source des contradictions est le processus volutif lui-mme : des caractres identiques du point de vue de la ressemblance sont apparus indpendamment chez diffrentes espces. En ralit, pour tre plus efficace du point de vue de la reconstruction phylogntique, la notion d'homologie doit tre soumise l'application d'un autre principe, celui de congruence. On reprendra cette question dans le chapitre IV, en lui associant la question de l'homologie molculaire. Le cadre gnral de l'application de l'anatomie compare la reconstruction phylogntique est fourni par la notion de complexit. Ce qui est simple est primitif et ce qui est complexe est volu. Il s'agit bien d'un cadre gnral et non d'une loi qui ne souffrirait pas d'exception. En effet, la perte d'un organe peut aboutir un tat plus simple que l'tat initial. Une espce volue peut sembler, certains gards, plus simple que son anctre.

1.2. L'ontognieL'ontognie fournit une source directe d'observation des transformations. Au cours du dveloppement individuel, des caractres juvniles peuvent se transformer et changer de forme (et mme de fonction) chez l'adulte. L'embryologie fournit une information empirique particulirement fconde : aux premiers stades du dveloppement les embryons appartenant divers grands groupes taxinomiques se ressemblent plus entre eux qu'ils ne ressemblent leurs formes adultes. Autrement dit, au cours du dveloppement, ce qui apparat d'abord est gnral, ce qui se transforme subsquemment est particulier (prcdence ontognique). Le pionnier de l'embryologie compare, K.E. von Baer, nona quelques lois embryologiques dont celle de la prcdence. ontognique. Von Baer, toutefois, n'tait pas darwinien. C'est Haeckel qui interprta la loi nonce par von Baer sous l'expression devenue fameuse,

La problmatique phylogntique

18

quoique vite controverse : l'ontognie rcapitule la phylognie . Autrement dit, ce qui apparat d'abord dans l'ontognie est primitif. De la sorte, les donnes recueillies par l'observation de l'ontognie peuvent tre interprtes des fins de reconstruction phylogntique. La loi de rcapitulation de Haeckel, dite encore loi biogntique fondamentale , ne souffrait, pour son auteur, aucune exception. Or les exceptions, sur lesquelles insistrent notamment au XXe sicle Sir Gavin de Beer (1930, 1958) et Stephen Jay Gould (1977), discrditrent d'une certaine manire, la loi biogntique, d'autant que celle-ci avait t souvent prise au pied de la lettre : au cours du dveloppement, l'embryon tout entier, devrait passer par les stades adultes de ses anctres fossiles, ce qui n'est videmment pas le cas. Nous verrons plus loin que la loi biogntique redfinie au niveau des caractres, et non des organismes tout entiers, garde tout son intrt phylogntique.

1.3. La palontologieLa palontologie fournit des informations directement issues du temps gologique. Les tres fossiliss nous donnent des lments de ce qui a vritablement eu lieu au cours du temps, et sont des fragments de la vie passe. L'interprtation phylogntique des fossiles est subordonne au principe de l'anatomie compare : la mise en vidence des homologies. Mais, depuis Gaudry, la position stratigraphique des fossiles est tenue pour fournir une information primordiale vis--vis de la reconstruction phylogntique. L'anciennet reprsente un lment pour identifier ce qui est primitif. Si, l'poque de la publication de la Philosophie zoologique ou de l'Origine des espces, les archives palontologiques n'taient gure importantes, il n'en est plus de mme aujourd'hui. La ralit des fossiles ne pouvant tre mise en doute, le critre palontologique est devenu au cours du XXe sicle le principal critre phylogntique pour maints biologistes. De ce point de vue, la phylognie des groupes organiques sans archives fossiles, ou pour lesquels l'enregistrement fossile est trs lacunaire, tait considre comme largement spculative. Le rle prminent ainsi accord aux fossiles tait tout entier d la dimension chronologique, mais non la manire de traiter l'information qu'ils transmettent. En ralit, les caractres morphologiques des fossiles taient analyss ni plus ni moins comme ceux des formes actuelles : selon les critres de l'anatomie compare. Simplement, grce aux fossiles, les homologies pouvaient, d'une certaine manire, tre dates . A l'inverse, l'irruption au cours des annes soixante de nouveaux caractres qui ne se fossilisent pas (les caractres biochimiques), allait rapidement se traduire par des phylognies sans fossiles. Celles-ci, par contre-coup, relativisrent l'importance accorde la palontologie. On en vint minimiser l'information apporte par les fossiles : ceux-ci, souvent fragmentaires, n'apporteraient au fond que de faibles renseignements. Une fois encore, c'tait plus la nature des caractres utiliss que la faon d'interprter l'information transmise qui dicta une telle attitude. Aucune de ces trois sources d'infrence phylogntique n'est l'abri de l'erreur d'interprtation. Des traits tenus pour homologues peuvent n'tre que des analogies sans rapport avec la filiation : des similitudes dues aux phnomnes de

Le concept de ressemblance

19

convergence ou de paralllisme, c'est--dire des traits observs chez telle et telle espce mais en fait apparus indpendamment. Convergence et paralllisme sont deux phnomnes identiques. On parle conventionnellement de convergence lorsque ces fausses similitudes sont rencontres chez des espces loignes, et de paralllisme lorsqu'elles sont rencontres chez des espces proches. Nous considrons les deux concepts comme identiques du point de vue de l'analyse des caractres. Dans le cours de l'ontognie, les phnomnes d'htrochronie c'est-dire la variation du tempo de dveloppement peuvent brouiller la reconstruction des tats ancestraux. L'arrt du dveloppement de tel ou tel organe peut aboutir la persistance chez l'adulte d'un caractre non point ancestral mais tout simplement non transform. La palontologie rencontre les mmes difficults que l'anatomie compare puisque l'analyse des fossiles n'est en quelque sorte que cette dernire applique aux formes disparues. Les phnomnes de convergence et de paralllisme sont frquemment rencontrs.

2. Le concept de ressemblanceLes trois coles de systmatique que l'on reconnat gnralement des fins pdagogiques systmatique volutionniste, systmatique phntique et systmatique cladistique peuvent tre aisment caractrises en fonction de leur relation au concept de ressemblance (ou de similitude). Le cadre conceptuel des approches vues au paragraphe prcdent est celui de la similitude. En gros, plus les tres se ressemblent plus leurs parents sont troites. Plus les caractres complexes se ressemblent, plus importantes sont les chances d'tre en prsence de caractres homologues. Enfin on peut penser a priori que des formes globalement similaires qui se succdent stratigraphiquement sont lies par des relations d'anctre descendant. Or la similitude n'est pas donne, elle n'existe pas en soi : elle est interprte. Les critres d'interprtation sont la base des diffrentes mthodes d'analyse phylogntique : les infrences gnalogiques, sous quelque forme que ce soit, sont fondes sur un traitement de la ressemblance. Rien n'est plus controvers que l'interprtation de la ressemblance des fins phylogntiques. Du point de vue de l'analyse des caractres, le concept de similitude peut tre divis en homologie et homoplasie. L'homologie est une similitude hrite d'un anctre commun, tandis que l'homoplasie est une similitude qui n'est pas hrite d'un anctre commun (Simpson, 1961 : 78). Le terme homoplasie a t conu par Lankester (1870) et signifiait l'apparition indpendante de caractres similaires chez des espces proches. Aujourd'hui on subdivise l'homoplasie en convergence et rversion. La convergence est l'apparition indpendante chez deux espces (ou plus) d'un mme caractre. La rversion est l'apparition d'un caractre ayant l'apparence de la morphologie ancestrale. La figure II.2 rsume les diffrentes catgories de similitude. Soit l'arbre (A (BC)). Sur la figure II.2A le caractre x' prsent chez B et C est hrit de l'anctre de (BC) : homologie. Sur la figure II.2B le caractre x' prsent chez A et chez C n'est pas hrit d'un anctre commun (homoplasie) : il est apparu deux fois : convergence. Sur la figure II.2C, le

La problmatique phylogntique

20

caractre prsent chez A et chez C n'est pas hrit d'un anctre commun (homoplasie) : il est ancestral chez A et secondairement transform chez C : rversion. Ainsi, quoique non distinguables, les caractres x' chez A et x' chez C ne sont pas homologues sur la figure II.2B ; de mme que le caractre x chez A et x chez C sur la figure II.2C.

FIGURE II.2. Les diffrentes catgories de ressemblance. 2A: ressemblance due l'homologie ; 2B : ressemblance due la convergence ; 2C : ressemblance due la rversion. A, B, C : taxons ; x x' et x x' x : volution du caractre. Pour les systmaticiens phnticiens, adeptes de la taxinomie numrique (Sokal et Sneath, 1963 ; Sneath et Sokal, 1973), les combinaisons de taxons ne peuvent tre scientifiquement fondes que sur la base de la similitude globale exprime par des calculs de matrices de distances et d'indices de similitude. Simplement rsume, l'approche phntique se fonde sur l'analyse, sous forme quantitative, du plus grand nombre de caractres chez les espces tudies, homologies et homoplasies mles : ce qui se ressemble s'assemble. Pour les systmaticiens volutionnistes (Simpson, 1961 ; Mayr, 1969), la similitude globale seule ne peut fournir la base de la reconstruction phylogntique en raison des fausses similitudes que sont les homoplasies, c'est--dire les convergences et rversions. Dans cette perspective, seule la similitude lie aux traits homologues permet la construction phylogntique. Pour les systmaticiens partisans de la systmatique phylogntique encore dnomme cladisme (Hennig, 1950, 1966 ; Eldredge et Cracraft, 1980 ; Wiley, 1981 ; Nelson et Platnick, 1981 ; Schoch, 1986 ; Matile et al., 1987 ; d'UdekemGevers, 1990), le concept mme d'homologie doit tre raffin et prcis pour que l'on puisse construire des arbres phylogntiques prcis. Il convient d'identifier les tats primitifs (plsiomorphe) et driv (apomorphe) des caractres homologues. Pour Hennig, seul le partage par diffrentes espces de caractres drivs est signe de parent troite. L'argumentation de Hennig est rsume par la figure II.3. Les espces B et C partagent un caractre driv z' hrit d'un anctre commun qui leur est propre : elles sont donc troitement apparentes. En revanche, le fait que les espces A et B partagent deux caractres primitifs x et y n'implique pas qu'elles soient troitement apparentes, mme si les caractres x et y sont des homologies chez A et chez B, en ce sens qu'ils ne sont pas des caractres soumis

Le concept de ressemblance

21

au phnomne d'homoplasie. Les relations de parent entre taxons mises en vidence par le partage de traits drivs sont reprsentes par un schma appel cladogramme (telle la figure II.3). Avec cet exemple on voit l'clatement dfinitif du concept de similitude avec l'introduction des notions d'apomorphie et de plsiomorphie et, corrlativement, celle du cladogramme.

FIGURE II.3. Schma d'argumentation phylogntique selon Hennig. A, B, C : espces ; v v', w w', x x' , y y' , z z' : transformations des caractres (barre blanche : tat plsiomorphe ; barre noire : tat apomorphe). L'interprtation de la similitude, selon qu'elle est globale ou dcoupe en plsiomorphie, apomorphie et homoplasie, fournit la source des approches contradictoires de la phylognie que l'on rencontre actuellement. Aprs des polmiques animes, au cours des annes soixante-dix, systmaticiens volutionnistes et cladistes sont aujourd'hui d'accord sur de nombreux aspects touchant aux bases mthodologiques de la construction phylogntique (Mayr, 1986). Ce n'est que sur le lien entre phylognie et classification que persistent des dsaccords fondamentaux, point qui chappe au sujet de ce livre et que nous n'aborderons pas ici. On trouvera dans Tassy (1986) une illustration des dbats sur la nature des classifications biologiques et dans Tassy (1991) une histoire des constructions phylogntiques. En revanche, propos de reconstruction phylogntique, les points de vue phntique et cladistique se fondent sur des bases opposes. Les approches concurrentes de la construction phylogntique en usage actuellement ressortissent donc essentiellement aux deux conceptions du traitement de la similitude. Ou bien l'on admet, malgr la dmonstration de Hennig (figure II.3) que la phylognie peut tre construite partir de la similitude globale : c'est l'approche phntique. Ou bien l'on admet que seule l'analyse des caractres des fins de partition en plsiomorphie, apomorphie et homoplasie, permet de construire la phylognie: c'est l'approche cladistique.

La problmatique phylogntique

22

Les approches probabilistes (chapitre VIII), s'loignent sensiblement des mthodologies phntique et cladistique. Ces mthodes ncessitent l'adoption pralable et explicite d' un modle d'volution des caractres. Une fois ce modle pos, elles permettent de comparer diffrents arbres et de choisir le meilleur c'est--dire le plus vraisemblable au sens statistique du terme. L'ancien triple paralllisme se trouve infod la problmatique phylogntique gnrale : toutes les analyses des caractres (quels qu'ils soient) ports par tous les taxons (quels qu'ils soient : fossiles ou actuels , espces ou groupes d'espces) reposent sur l'identification des tats de transformations : plsiomorphe apomorphe. Il n'y a pas vritablement d'un ct les phylognies palontologiques ou, plus gnralement, morphologiques, et, de l'autre ct, les phylognies molculaires ; mais plutt des phylognies fondes sur les diffrents traitements de la similitude. Aujourd'hui, les reconstructions phylogntiques sont grandement facilites par l'informatique. Les mthodes informatises de l'analyse phylogntique sont naturellement issues des travaux des coles cladistique et phntique. Paralllement la diffusion de luvre de Hennig au cours des annes soixante, sont apparus des traitements informatiques de la similitude qui se situent dans la sphre des ides cladistiques : c'est ce que l'on appelle les mthodes de parcimonie. Par ailleurs, les techniques de groupements morphologiques sur la base de la similitude globale ont t adaptes des fins phylogntiques au moyen de diverses procdures mathmatiques et d'hypothses sur les processus volutifs. Cet ouvrage est donc subdivis en trois parties principales. L'une consacre l'approche cladistique et aux procdures de parcimonie (chapitres IV et V), avec une place part faite aux analyses dites de compatibilit (chapitre VI). Une deuxime est consacre aux approches phntiques (chapitre VII). Une troisime est consacre une mthode originale qui n'est issue ni des coles cladistique ou volutionniste ni phntique : c'est une approche probabiliste (chapitre VIII). En pralable la prsentation des diffrentes mthodes de constructions d'arbres phylogntiques, le chapitre suivant vise clairer succinctement certains concepts de base de la systmatique en gnral, dj entrevus : les taxons et les caractres.

CHAPITRE III

LES OBJETS DE LA PHYLOGNTIQUE : CARACTRES ET TAXONS

1. Les caractresOn appelle caractre tout attribut observable d'un organisme. En tant que tel, le caractre permet de faire des comparaisons entre organismes. En systmatique, la notion d'observation du caractre est indissociable de celle de sa reprsentation. Le moyen par lequel l'observation du caractre devient reprsentation est le codage, sous quelque forme que ce soit. D'un point de vue pratique, les expressions caractre et tat de caractre seront parfois considrs comme synonymes. Si la couleur des yeux est un caractre, les yeux bleus sont un tat de ce caractre. Dans une comparaison entre organismes qui sont pourvus ou dpourvus de yeux, le caractre discriminant sera la prsence ou l'absence de yeux. Dans une comparaison entre organismes pourvus de yeux, le caractre discriminant pourra tre, ventuellement, la couleur des yeux. D'un point de vue phylogntique, pour exprimer une srie de transformations d'un caractre ayant deux tats a et b, on pourra dire indiffremment que l'tat a du caractre se transforme en l'tat b, ou bien que le caractre a se transforme en caractre b. Prenons l'exemple de la morphologie du radius (figure III.1). Un observateur distingue deux morphologies de l'extrmit distale : l'apophyse stylode est massive ou gracile. Il pourra ainsi comparer des taxons pourvus de l'un ou l'autre des deux types d'apophyse. Afin d'exprimer ces morphologies, il parlera indiffremment du caractre apophyse stylode massive prsent ou absent (dans le second cas, l'apophyse est gracile), ou bien de l'tat massif ou gracile du caractre forme de l'apophyse stylode .

Les objets de la phylogntique : caractres et taxons

24

FIGURE III.1. Caractre et tats de caractre: vue antrieure de l'extrmit distale du radius ( A : carnivore (Panthera leo); B : ongul (Oryx dammah); a.s. : apophyse stylode. L'apophyse stylode se prsente sous deux tats : apophyse stylode massive (A) ou gracile (B). De la mme faon, la prsence ou l'absence de tel nuclotide dans un site donn de la squence d'un gne sera dcrite gnralement comme tant un tat de caractre ou, plus rarement, comme un caractre. La prsence chez un organisme d'une adnine (A) sur un site S est le caractre de cet organisme ; on prfrera cependant dire que l'adnine est l'un des quatre tats possibles du caractre site S , puisque l'adnine est l'une des quatre bases constituant les nuclotides. Un site peut galement correspondre une insertion (I) ou une dltion (D). Dans ce cas il s'agit d'un caractre sous deux tats (figure III.2).Homme Chimpanz Gorille Orang Macaque Atele ACDGCGACAACAGCGCTDAGIATTACCACTACAIAAAADAATTDTCTICACAGGDTAAAGGCTTADCCGDCGGIG GCDGCGACAACAGCGCTDAGIDTTACCACTACAIAAAADAATTDTCTICACAGGDTCGAGGCTDDATCGDTGGIG ATDGACACAACAGCGTTTAAIATTACCGCTACAIADAAIAADTITCTITACAGADTCGATGCTTAACCGDTGTIG GCIAAGGTGGTGCTACCTGADDCCGTTATAGTGDGDDGIGGDGIGTDDTTTGAGICAADTCGADDDTTTACCTDG GTIAAGGTGGTGCTATCDGDDDCCGTTGTAGTGDGDDGIGGDGIGTDDTTTGAAICGADTCGATTATTTACCTDA GTIAACGTGTDDDDDDDDDDDDCCGTTGTAGTGDGDDGIGGDAIGTDDTCTGGAIGAAGTCGATTATTCACDDDA

FIGURE III.2. Caractres et tats de caractre. Squences de nuclotides composes de 75 sites aligns chez six espces. Chaque site correspond un caractre. Le site 1 prsente deux tats : A (Adnine) ou G (Guanine). Le site 3 prsente deux tats correspondant une insertion I et une dltion D (Sites informatifs de la - Globine ; d'aprs Barriel et Darlu, 1990). On distingue diffrents types de caractres : les caractres intrinsques aux espces tudies et les caractres extrinsques ;

Les caractres

25

les caractres discrets (discontinus) ou continus. Les caractres intrinsques sont les caractres que l'on observe sur les organismes eux-mmes. Ils sont de nature morphologique, chromosomique, biochimique, physiologique, thologique (chant des oiseaux par exemple). Les caractres extrinsques sont les caractres dfinissant le contexte cologique, gographique et gologique dans lequel se situent ces taxons. Ces caractres ne sont pas utiliss dans la construction phylogntique. Pour des raisons qui tiennent l'histoire des sciences naturelles, la construction phylogntique se fonde d'abord sur la recherche des homologies pour des caractres morphologiques discrets. Les caractres morphologiques ont trait la forme au sens le plus large : ce sont les caractres phnotypiques. L'anatomie externe et interne des tres vivants a fourni de tout temps la source du savoir morphologique : squelette externe des arthropodes, coquille, forme des feuilles, forme des organes reproducteurs, constitution du bois, squelette interne des vertbrs, systmes nerveux et vasculaire, systme digestif et caractres myologiques, systme reproducteur et placentation etc. Tous ces caractres peuvent tre transcrits sous la forme de caractres discontinus, discrets, subdiviss en deux tats ou plus (tats multiples). Ils peuvent parfois tre exprims sous forme quantitative, c'est--dire mtrique. Sous ce dernier aspect, l'information morphologique est le plus souvent traite par des mthodes multivaries (analyses factorielles) plutt que par des mthodes phylogntiques. L'apparition, ces trente dernires annes, de caractres biochimiques a ractiv la problmatique phylogntique tout en s'intgrant parfaitement dans le cadre gnral de l'analyse de la similitude. Les caractres biochimiques se traitent diffremment selon qu'il s'agit de caractres discrets ou continus : les squences d'acides amins dans les protines ou les squences de nuclotides dans l'ADN ou l'ARN fournissent des donnes (comparaison des sites) qui sont analyses comme des caractres discontinus, souvent par les mmes mthodes que celles conues pour des caractres discrets morphologiques ; les donnes de ractions immunologiques, d'hybridation d'ADN ou de frquences allliques s'expriment sous forme quantitative : raction immunitaire plus ou moins forte d'une espce par rapport un antisrum, taux d'hybridation plus ou moins lev entre les brins d'ADN appartenant deux espces diffrentes, frquences variables de diffrents allles selon les espces. Ce type de caractre ne peut tre analys, dans une perspective phylogntique, que par des mthodes quantitatives. Le polymorphisme alllique mis en vidence par l'lectrophorse est un exemple de caractre qui peut tre trait comme un caractre discret ou comme un caractre continu. En effet, si l'on ne considre que la prsence ou l'absence de telle forme alllique dans une espce, il s'agit d'un caractre discret (voir chapitre IV, paragraphe 6.2). En revanche si l'on prend galement en considration la frquence de ces formes allliques dans les diffrentes espces, il s'agit alors d'un caractre continu. Cette deuxime faon contient une information plus riche, mme s'il s'avre difficile de la prendre en compte dans une analyse phylogntique.

Les objets de la phylogntique : caractres et taxons

26

2. Les taxonsUn taxon est un groupe d'organismes reconnu en tant qu'unit formelle chacun des niveaux de la classification (Simpson, 1961). Elephas maximus, l'lphant d'Asie, est un taxon de rang spcifique ; Elephas est un taxon de rang gnrique ; les Elephantidae sont un taxon de rang familial ; les Proboscidea sont un taxon de rang ordinal, etc. Le mot taxonomie , sous cette orthographe, est selon son inventeur (Candolle, 1813) construit partir de taxis (arrangement) et de nomos (loi) et signifie la thorie des classifications . L'orthographe fut corrige en taxinomie par Littr. Le mot taxon ne fut invent et introduit dans la nomenclature botanique que 137 ans plus tard (Lam, 1950) ; son premier usage dans la littrature zoologique est plus tardif encore (Mayr et al., 1953). Deux concepts ont t plus rcemment drivs de celui de taxon. Il s'agit de l'UTO : Unit Taxinomique Oprationnelle (OTU, Operational Taxonomic Unit de Sokal et Sneath, 1963) et de l'UTH : Unit Taxinomique Hypothtique (HTU : Hypothetical Taxonomic Unit de Farris, 1970). Selon leurs concepteurs, l'UTO est l'unit pragmatique soumise l'investigation, tandis que l'UTH est l'anctre hypothtique d'un nombre donn d'UTOs, reconstruit en mme temps qu'est reconstruit l'arbre phylogntique. En dernier lieu, l'UE : Unit Evolutive (EU : Evolutionary Unit de Meacham, 1984) est l'organisme tudi dans une analyse phylogntique : il correspond donc l'UTO des phnticiens. Par extension et simplification, on considrera dans ce livre les taxons terminaux comme les lments de base de l'analyse phylogntique, qu'ils soient reconnus formellement, c'est--dire classifis, ou bien qu'ils soient des UTOs ou UEs. Ils correspondent aux taxons liminaux de Dupuis (1988), c'est-dire les feuilles de l'arbre au sens de la thorie des graphes (Barthlemy et Gunoche, 1988 ; d'Udekem-Gevers, 1990). L'espce est gnralement considre comme un taxon part : l'espce seule aurait un statut biologique objectif (paragraphe 2.1). Mais les analyses phylogntiques n'ont pas toutes des espces comme objets directs d'tude. Ces derniers peuvent tre des taxons de rang infra-spcifique : des sous-espces ou des populations ; ou bien de rang supra-spcifique : des genres, des familles, des ordres, etc. Le lien logique qui rassemble ces diffrents objets d'tude est double : il rside d'une part dans la dimension taxinomique des objets, et, d'autre part, dans leur dimension phylogntique. Dimension taxinomique : les taxons sur lesquels s'applique l'enqute phylogntique, c'est--dire ceux dont on essaie de mettre en vidence les relations de parent, sont les taxons terminaux. Ils doivent avoir une identit. Ils doivent tre reconnaissables, ne serait-ce que par un seul attribut qui leur soit propre. Dimension phylogntique : les taxons terminaux doivent reprsenter une section non arbitraire de l'arbre phylogntique. Mais si les taxons sont des groupements d'organismes de rang gnrique ou familial (ou au-del), ils ont eux-

Les taxons

27

mmes une histoire : ils sont composs d'espces dont les relations ont la forme d'un arbre. Ces taxons terminaux doivent tre - en principe - des groupes naturels ou groupes monophyltiques, ou encore monophylons .

2.1. L'espce et les taxons infra-spcifiquesLes mcanismes volutifs oprent au niveau des organismes classs dans la catgorie de base de la hirarchie linnenne : l'espce. Il en ressort a priori que l'espce devrait donc tre l'unit de base de l'arbre phylogntique. Une espce conue dans une perspective biologique est un pool gntique ferm, en cela dissoci des autres espces dfinies semblablement : entre individus appartenant des espces diffrentes existe une barrire empchant l'interfcondit. Le lien objectif invoqu pour justifier le statut privilgi accord l'espce rside dans le critre d'interfcondit. La spciation est la production d'une nouvelle espce (ou plus) partir d'une espce ancestrale (espce mre ou espce souche) ; autrement dit, l'apparition de nouveaux pools gntiques partir d'un pool gntique ancestral. De la sorte, la phylognie est, strictement parlant, l'histoire des spciations depuis la premire forme vivante, il y a prs de quatre milliards d'annes jusqu' la diversit biologique actuelle (2 millions d'espces vivantes recenses, avec probablement 6 12 millions de plus qui restent dcrire, selon les estimations actuelles). Parce qu'il met en vidence les relations de parent entre espces nes de spciations successives, l'arbre phylogntique est une hirarchie. Cette hirarchie est le fruit de l'histoire. Mais au niveau des espces et des populations, c'est--dire au niveau o oprent les mcanismes de la spciation, la phylognie reste largement inconnue. En effet, on est loin de connatre les relations de parent entre les deux millions d'espces vivantes connues. Pour bien des groupes on n'a mme aucune ide des relations phylogntiques entre espces. Les constructions phylogntiques sont des reprsentations partielles, plus ou moins importantes ou exhaustives, de l' arbre de la vie . Ce sont des hypothses mises sur les relations de parents entre espces ou groupes d'espces choisis pour diverses raisons, partir d'un ensemble de donnes observes et interprtes : les caractres. Si du point de vue biologique les individus rangs dans la catgorie espce ont un statut particulier (d l'interfcondit), il n'en est pas tout fait de mme d'un point de vue taxinomique. L'espce elle-mme est en effet un agrgat de populations. Les populations, de tailles fort variables selon les espces, correspondent, si elles sont bien dlimites gographiquement aux sous-espces des nomenclatures zoologiques. En gnral, les populations ne sont pas gntiquement isoles les unes des autres. C'est pourquoi les relations entre populations sont le plus souvent de nature rticulaire et pas seulement hirarchique. La thorie volutionniste fait de la population le lieu des mcanismes volutifs, et, par l-mme, l'unit de l'volution. Dans la mesure o la population, et non l'espce, est cette unit, l'espce elle-mme devient un taxon comme un autre : un regroupement d'units qui lui sont subordonnes. L'examen des relations de parent entre populations ou taxons infra-spcifiques de quelque statut que ce soit, aboutit le plus souvent la

Les objets de la phylogntique : caractres et taxons

28

construction d'un rseau si les units analyses ne sont pas isoles les unes des autres. Les relations intra-spcifiques de ce type sont nommes tokogniques par Hennig (1966) : les relations entre les taxons terminaux ne sont alors pas ncessairement hirarchiques. Si le concept de phylognie se conoit comme l'histoire des ruptures dans les pools gntiques et de l'apparition de pools gntiques nouveaux, isols les uns des autres, l'histoire des parents entre les constituants de ces pools (entre ces populations) sera plutt une tokognie qu'une phylognie. Nanmoins l'usage a prvalu qui maintient le terme phylognie pour des reconstructions d'arbres dont les taxons terminaux sont des populations. Le systme phylogntique a pour but d'mettre des hypothses de parent entre units vues comme des ensembles reconnaissables, isols des autres units dfinies semblablement, et qui constituent donc des ensembles ferms. Ces units peuvent tre des espces, mais en tout tat de cause, elles ne seront pas forcment identiques aux units de l'volution. En effet, l'unit sur laquelle s'expriment les mcanismes volutifs est la population (rduite ventuellement quelques individus), non ncessairement isole des autres populations appartenant la mme espce. Ces units phylogntiques, les plus petits ensembles ferms, ne sont donc pas ncessairement des espces au sens biologique du terme. Mais comme la population n'a pas de statut taxinomique, les phnticiens et les cladistes ont tent de rsoudre le dilemme de deux faons diffrentes. L'une, l'approche des phnticiens, est de nier l'espce biologique tout statut privilgi. La conception de l'UTO des phnticiens est lie ce problme. L'objet des investigations systmatiques, le taxon terminal, est un objet de convention, oprationnel et les groupements de ces objets sont oprs sur la base de la similitude globale exprime au moyen d'indices mathmatiques. Cette approche n'est sujette aucune contradiction logique dans un systme de pure ressemblance globale. Mais elle se heurte deux points de vue. Point de vue phylogntique : la similitude globale n'est pas ncessairement un indicateur de la proche parent. Point de vue biologique : par exemple, chez les espces fort dimorphisme sexuel la simple mesure de la similitude globale n'associe pas toujours mle et femelle dans une mme UTO. L'autre approche s'inscrit dans une perspective phylogntique. Elle vise dfinir l'espce dans un contexte historique. Tel est le point de vue de Hennig (1966) selon lequel une espce n'est qu'un lment de l'arbre phylogntique situ entre deux spciations. Autrement dit l'espce en tant que bio-espce temporelle (time bio-species de Bonde, 1981), est un pool gntique born historiquement par deux ruptures : celle qui lui a donn naissance et celle o il se subdivise son tour. Cette dfinition rsout le dilemme entre espce biologique (achronique) et espce chronologique, dans la mesure o chacune des deux dfinitions d'espces rpond celle de pool gntique ferm. Mais alors un autre paradoxe surgit de cet accord. L'objectivit du concept d'espce biologique rside - en principe - dans le comportement des membres de l'espce vis--vis de la reproduction, et non dans la nomenclature du systmaticien. En revanche, l'espce chronologique ainsi dfinie n'obit qu' une hypothse formule par le systmaticien : celle de la succession des spciations, c'est--dire l'hypothse phylogntique. Rares sont les biologistes qui ont accept la dfinition hennigienne de l'espce. Mais la question de la dimension chronologique de l'espce demeure, et elle seule est pertinente dans le systme phylogntique.

Les taxons

29

Le statut particulier des populations allopatriques (distribues dans des aires disjointes) a men certains cladistes une autre rvision nergique du statut de l'espce : toute population reconnaissable serait une espce. Selon Nelson et Platnick (1981), l'espce est le plus petit ensemble identifiable d'organismes qui se reproduisent entre eux ayant un ensemble unique de caractres. D'aprs cette dfinition la sous-espce est comprise comme une espce. De la sorte, on maintiendrait aux units volutives (les populations) le statut formel d'espce. A vrai dire, peu importe le statut formel des taxons terminaux. Ce qui importe est que les caractres distinctifs soient fixs dans les taxons terminaux, qu'il s'agisse d'espces ou de sous-espces. Mme si les caractres sont polymorphes une telle exigence est acceptable, ds lors qu'une explication volutive de ce polymorphisme est possible. Cela revient dire qu'une hirarchie (une histoire) peut merger de l'tude des variations du polymorphisme.

2.2. Taxons supra-spcifiquesCes taxons terminaux sont - en principe - des groupes naturels ou groupes monophyltiques. Ces groupes renferment la totalit de la descendance partir d'une espce ancestrale. C'est cette seule condition qu'ils possdent une dimension phylogntique qui est, au sens strict, chronologique : une date d'origine et une date de diffrenciation, voire, ventuellement, une date d'extinction ; cela, pour tous les membres du taxon terminal et a contrario pour aucun des taxons situs hors du groupe en question. La figure III.3 montre les relations de parent entre trois taxons terminaux A, B et C, avec B et C troitement apparents. Ces taxons sont des taxons de rang supra-spcifique dont la figure III.3B montre la composition et l'histoire. Par exemple, le taxon C est compos des espces 5 10. C'est un groupe monophyltique qui rassemble tous les descendants de l'espce ancestrale c, celle partir de laquelle s'est diffrenci le taxon C. Sa date d'origine est aussi celle du taxon B, proche parent de C. L'anctre b du taxon (BC) est ncessairement plus ancien que l'anctre c du taxon C inclus dans (BC). La dimension chronologique des taxons implique que la structure de l'arbre phylogntique est hirarchique. La hirarchie l'embotement des taxons est tributaire du degr d'anciennet des espces ancestrales. Ds lors que les taxon