Inferring Phylogenies

advertisement
Felsenstein FM
4/22/04
11:47 AM
Page iii
Inferring Phylogenies
Joseph Felsenstein
University of Washington
Sinauer Associates, Inc. • Publishers
Sunderland, Massachusetts
© Sinauer Associates, Inc. This material cannot be copied, reproduced, manufactured
or disseminated in any form without express written permission from the publisher.
Contents
Preface
xix
1 Parsimony methods
A simple example . . . . . . . . . .
Evaluating a particular tree .
Rootedness and unrootedness
Methods of rooting the tree . . . .
Branch lengths . . . . . . . . . . . .
Unresolved questions . . . . . . . .
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
1
1
1
4
6
8
9
2 Counting evolutionary changes
The Fitch algorithm . . . . . . . . . . . . . . .
The Sankoff algorithm . . . . . . . . . . . . .
Connection between the two algorithms
Using the algorithms when modifying trees .
Views . . . . . . . . . . . . . . . . . . . .
Using views when a tree is altered . . .
Further economies . . . . . . . . . . . . . . .
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
11
11
13
16
16
16
17
18
3 How many trees
are there?
Rooted bifurcating trees . . . . . . . . . .
Unrooted bifurcating trees . . . . . . . . .
Multifurcating trees . . . . . . . . . . . . .
Unrooted trees with multifurcations
Tree shapes . . . . . . . . . . . . . . . . . .
Rooted bifurcating tree shapes . . .
Rooted multifurcating tree shapes .
Unrooted Shapes . . . . . . . . . . .
Labeled histories . . . . . . . . . . . . . .
Perspective . . . . . . . . . . . . . . . . . .
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
19
20
24
25
28
29
29
30
32
35
36
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
v
© Sinauer Associates, Inc. This material cannot be copied, reproduced, manufactured
or disseminated in any form without express written permission from the publisher.
vi
4 Finding the best tree
by heuristic search
Nearest-neighbor interchanges . . . . .
Subtree pruning and regrafting . . . . .
Tree bisection and reconnection . . . . .
Other tree rearrangement methods . . .
Tree-fusing . . . . . . . . . . . . . .
Genetic algorithms . . . . . . . . .
Tree windows and sectorial search
Speeding up rearrangements . . . . . .
Sequential addition . . . . . . . . . . . .
Star decomposition . . . . . . . . . . . .
Tree space . . . . . . . . . . . . . . . . .
Search by reweighting of characters . . .
Simulated annealing . . . . . . . . . . .
History . . . . . . . . . . . . . . . . . . .
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
37
38
41
44
44
44
45
46
46
47
48
50
51
52
53
5 Finding the best tree
by branch and bound
A nonbiological example . . . . .
Finding the optimal solution . . .
NP-hardness . . . . . . . . . . . .
Branch and bound methods . . .
Phylogenies: Despair and hope .
Branch and bound for parsimony
Improving the bound . . . . . . .
Using still-absent states . . .
Using compatibility . . . . .
Rules limiting the search . . . . .
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
54
54
57
59
60
60
61
64
64
64
65
6 Ancestral states
and branch lengths
Reconstructing ancestral states . . . . . . . . . . . . . . . . . . . . . . . .
Accelerated and delayed transformation . . . . . . . . . . . . . . . . . . .
Branch lengths . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
67
67
70
70
7 Variants of parsimony
Camin-Sokal parsimony . . . . . . .
Parsimony on an ordinal scale . . . .
Dollo parsimony . . . . . . . . . . . .
Polymorphism parsimony . . . . . .
Unknown ancestral states . . . . . .
Multiple states and binary coding . .
Dollo parsimony and multiple states
73
73
74
75
76
78
78
80
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
© Sinauer Associates, Inc. This material cannot be copied, reproduced, manufactured
or disseminated in any form without express written permission from the publisher.
vii
Polymorphism parsimony and multiple states
Transformation series analysis . . . . . . . . . .
Weighting characters . . . . . . . . . . . . . . .
Successive weighting and nonlinear weighting
Successive weighting . . . . . . . . . . . .
Nonsuccessive algorithms . . . . . . . . .
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
81
81
82
83
83
85
8 Compatibility
Testing compatibility . . . . . . . . . . . . . . . .
The Pairwise Compatibility Theorem . . . . . . .
Cliques of compatible characters . . . . . . . . .
Finding the tree from the clique . . . . . . . . . .
Other cases where cliques can be used . . . . . .
Where cliques cannot be used . . . . . . . . . . .
Perfect phylogeny . . . . . . . . . . . . . . .
Using compatibility on molecules anyway .
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
87
88
89
91
92
94
94
95
96
9 Statistical properties of parsimony
Likelihood and parsimony . . . . . . . . . . . . . . . . .
The weights . . . . . . . . . . . . . . . . . . . . . .
Unweighted parsimony . . . . . . . . . . . . . . .
Limitations of this justification of parsimony . . .
Farris’s proofs . . . . . . . . . . . . . . . . . . . . .
No common mechanism . . . . . . . . . . . . . . .
Likelihood and compatibility . . . . . . . . . . . .
Parsimony versus compatibility . . . . . . . . . . .
Consistency and parsimony . . . . . . . . . . . . . . . .
Character patterns and parsimony . . . . . . . . .
Observed numbers of the patterns . . . . . . . . .
Observed fractions of the patterns . . . . . . . . .
Expected fractions of the patterns . . . . . . . . . .
Inconsistency . . . . . . . . . . . . . . . . . . . . .
When inconsistency is not a problem . . . . . . . .
The nucleotide sequence case . . . . . . . . . . . .
Other situations where consistency is guaranteed
Does a molecular clock guarantee consistency? . .
The Farris zone . . . . . . . . . . . . . . . . . . . .
Some perspective . . . . . . . . . . . . . . . . . . . . . .
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
97
97
100
100
101
102
103
105
107
107
107
110
111
111
113
114
115
117
118
120
121
10 A digression on history and philosophy
How phylogeny algorithms developed . .
Sokal and Sneath . . . . . . . . . . .
Edwards and Cavalli-Sforza . . . . .
Camin and Sokal and parsimony . .
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
123
. 123
. 123
. 125
. 129
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
© Sinauer Associates, Inc. This material cannot be copied, reproduced, manufactured
or disseminated in any form without express written permission from the publisher.
viii
Eck and Dayhoff and molecular parsimony . . . . . . . . .
Fitch and Margoliash popularize distance matrix methods
Wilson and Le Quesne introduce compatibility . . . . . . .
Jukes and Cantor and molecular distances . . . . . . . . . .
Farris and Kluge and unordered parsimony . . . . . . . . .
Fitch and molecular parsimony . . . . . . . . . . . . . . . .
Further work . . . . . . . . . . . . . . . . . . . . . . . . . . .
What about Willi Hennig and Walter Zimmerman? . . . .
Different philosophical frameworks . . . . . . . . . . . . . . . .
Hypothetico-deductive . . . . . . . . . . . . . . . . . . . . .
Logical parsimony . . . . . . . . . . . . . . . . . . . . . . .
Logical probability? . . . . . . . . . . . . . . . . . . . . . . .
Criticisms of statistical inference . . . . . . . . . . . . . . .
The irrelevance of classification . . . . . . . . . . . . . . . .
11 Distance matrix methods
Branch lengths and times . . . . . . . . . . . . . . .
The least squares methods . . . . . . . . . . . . . .
Least squares branch lengths . . . . . . . . .
Finding the least squares tree topology . . . .
The statistical rationale . . . . . . . . . . . . . . . .
Generalized least squares . . . . . . . . . . . . . .
Distances . . . . . . . . . . . . . . . . . . . . . . . .
The Jukes-Cantor model—an example . . . . . . .
Why correct for multiple changes? . . . . . . . . .
Minimum evolution . . . . . . . . . . . . . . . . . .
Clustering algorithms . . . . . . . . . . . . . . . . .
UPGMA and least squares . . . . . . . . . . . . . .
A clustering algorithm . . . . . . . . . . . . .
An example . . . . . . . . . . . . . . . . . . .
UPGMA on nonclocklike trees . . . . . . . . .
Neighbor-joining . . . . . . . . . . . . . . . . . . .
Performance . . . . . . . . . . . . . . . . . . .
Using neighbor-joining with other methods .
Relation of neighbor-joining to least squares
Weighted versions of neighbor-joining . . . .
Other approximate distance methods . . . . . . . .
Distance Wagner method . . . . . . . . . . . .
A related family . . . . . . . . . . . . . . . . .
Minimizing the maximum discrepancy . . .
Two approaches to error in trees . . . . . . .
A puzzling formula . . . . . . . . . . . . . . . . . .
Consistency and distance methods . . . . . . . . .
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
130
131
133
134
134
136
136
136
138
139
141
142
143
145
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
147
147
148
148
153
153
154
155
156
158
159
161
161
162
162
165
166
168
169
169
170
171
171
171
172
172
173
174
© Sinauer Associates, Inc. This material cannot be copied, reproduced, manufactured
or disseminated in any form without express written permission from the publisher.
ix
A limitation of distance methods . . . . . . . . . . . . . . . . . . . . . . .
175
12 Quartets of species
The four point metric . . . . . . . . . . . . . . . . . .
The split decomposition . . . . . . . . . . . . . . . .
Related methods . . . . . . . . . . . . . . . . .
Short quartets methods . . . . . . . . . . . . . . . . .
The disk-covering method . . . . . . . . . . . . . . .
Challenges for the short quartets and DCM methods
Three-taxon statement methods . . . . . . . . . . . .
Other uses of quartets with parsimony . . . . . . . .
Consensus supertrees . . . . . . . . . . . . . . . . . .
Neighborliness . . . . . . . . . . . . . . . . . . . . . .
De Soete’s search method . . . . . . . . . . . . . . .
Quartet puzzling and searching tree space . . . . . .
Perspective . . . . . . . . . . . . . . . . . . . . . . . .
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
176
177
178
182
182
183
185
186
188
189
191
192
193
194
13 Models of DNA evolution
Kimura’s two-parameter model . . . . . . . . . .
Calculation of the distance . . . . . . . . . . . . .
The Tamura-Nei model, F84, and HKY . . . . . .
The general time-reversible model . . . . . . . .
Distances from the GTR model . . . . . . .
The general 12-parameter model . . . . . . . . .
LogDet distances . . . . . . . . . . . . . . . . . .
Other distances . . . . . . . . . . . . . . . . . . .
Variance of distance . . . . . . . . . . . . . . . . .
Rate variation between sites or loci . . . . . . . .
Different rates at different sites . . . . . . .
Distances with known rates . . . . . . . . .
Distribution of rates . . . . . . . . . . . . . .
Gamma- and lognormally distributed rates
Distances from gamma-distributed rates . .
Models with nonindependence of sites . . . . . .
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
196
196
198
200
204
206
210
211
213
214
215
215
216
216
217
217
221
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
14 Models of protein evolution
Amino acid models . . . . . . . . . . . . . . . . . . . . . . . . . . . .
The Dayhoff model . . . . . . . . . . . . . . . . . . . . . . . . . . . .
Other empirically-based models . . . . . . . . . . . . . . . . . . . . .
Models depending on secondary structure . . . . . . . . . . .
Codon-based models . . . . . . . . . . . . . . . . . . . . . . . . . . .
Inequality of synonymous and nonsynonymous substitutions
Protein structure and correlated change . . . . . . . . . . . . . . . .
222
. . . 222
. . . 222
. . . 223
. . . 225
. . . 226
. . . 227
. . . 228
© Sinauer Associates, Inc. This material cannot be copied, reproduced, manufactured
or disseminated in any form without express written permission from the publisher.
x
15 Restriction sites, RAPDs, AFLPs, and microsatellites
Restriction sites . . . . . . . . . . . . . . . . . . . . . .
Nei and Tajima’s model . . . . . . . . . . . . . .
Distances based on restriction sites . . . . . . . .
Issues of ascertainment . . . . . . . . . . . . . . .
Parsimony for restriction sites . . . . . . . . . . .
Modeling restriction fragments . . . . . . . . . . . . .
Parsimony with restriction fragments . . . . . .
RAPDs and AFLPs . . . . . . . . . . . . . . . . . . . .
The issue of dominance . . . . . . . . . . . . . . .
Unresolved problems . . . . . . . . . . . . . . . .
Microsatellite models . . . . . . . . . . . . . . . . . . .
The one-step model . . . . . . . . . . . . . . . . .
Microsatellite distances . . . . . . . . . . . . . . .
A Brownian motion approximation . . . . . . . .
Models with constraints on array size . . . . . .
Multi-step and heterogeneous models . . . . . .
Snakes and Ladders . . . . . . . . . . . . . . . . .
Complications . . . . . . . . . . . . . . . . . . . .
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
230
230
230
233
234
235
236
239
239
240
240
241
241
242
244
246
246
246
247
16 Likelihood methods
Maximum likelihood . . . . . . . . . . . . . .
An example . . . . . . . . . . . . . . . .
Computing the likelihood of a tree . . . . . .
Economizing on the computation . . . .
Handling ambiguity and error . . . . . .
Unrootedness . . . . . . . . . . . . . . . . . .
Finding the maximum likelihood tree . . . .
Inferring ancestral sequences . . . . . . . . .
Rates varying among sites . . . . . . . . . . .
Hidden Markov models . . . . . . . . .
Autocorrelation of rates . . . . . . . . .
HMMs for other aspects of models . . .
Estimating the states . . . . . . . . . . .
Models with clocks . . . . . . . . . . . . . . .
Relaxing molecular clocks . . . . . . . .
Models for relaxed clocks . . . . . . . .
Covarions . . . . . . . . . . . . . . . . .
Empirical approaches to change of rates
Are ML estimates consistent? . . . . . . . . .
Comparability of likelihoods . . . . . .
A nonexistent proof? . . . . . . . . . . .
A simple proof . . . . . . . . . . . . . . .
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
248
248
249
251
253
255
256
256
259
260
262
264
265
265
266
266
267
268
269
269
270
270
271
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
© Sinauer Associates, Inc. This material cannot be copied, reproduced, manufactured
or disseminated in any form without express written permission from the publisher.
xi
Misbehavior with the wrong model . . . . . . . . . . . . . . . . . . .
Better behavior with the wrong model . . . . . . . . . . . . . . . . .
272
274
17 Hadamard methods
The edge length spectrum and conjugate spectrum
The closest tree criterion . . . . . . . . . . . . . . .
DNA models . . . . . . . . . . . . . . . . . . . . . .
Computational effort . . . . . . . . . . . . . . . . .
Extensions of Hadamard methods . . . . . . . . .
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
275
. 279
. 281
. 284
. 285
. 286
18 Bayesian inference of phylogenies
Bayes’ theorem . . . . . . . . . . . . . .
Bayesian methods for phylogenies . . .
Markov chain Monte Carlo methods . .
The Metropolis algorithm . . . . . . . .
Its equilibrium distribution . . . .
Bayesian MCMC . . . . . . . . . .
Bayesian MCMC for phylogenies . . . .
Priors . . . . . . . . . . . . . . . . .
Proposal distributions . . . . . . . . . .
Computing the likelihoods . . . . . . . .
Summarizing the posterior . . . . . . . .
Priors on trees . . . . . . . . . . . . . . .
Controversies over Bayesian inference .
Universality of the prior . . . . . .
Flat priors and doubts about them
Applications of Bayesian methods . . .
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
288
288
291
292
292
293
294
295
295
296
298
299
300
301
301
302
304
19 Testing models, trees, and clocks
Likelihood and tests . . . . . . . . . . . . . . . . . . . .
Likelihood ratios near asymptopia . . . . . . . . . . .
Multiple parameters . . . . . . . . . . . . . . . . . . .
Some parameters constrained, some not . . . . .
Conditions . . . . . . . . . . . . . . . . . . . . . .
Curvature or height? . . . . . . . . . . . . . . . .
Interval estimates . . . . . . . . . . . . . . . . . . . . .
Testing assertions about parameters . . . . . . . . . .
Coins in a barrel . . . . . . . . . . . . . . . . . . .
Evolutionary rates instead of coins . . . . . . . .
Choosing among nonnested hypotheses: AIC and BIC
An example using the AIC criterion . . . . . . .
The problem of multiple topologies . . . . . . . . . . .
LRTs and single branches . . . . . . . . . . . . .
Interior branch tests . . . . . . . . . . . . . . . . . . . .
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
307
307
308
309
310
310
311
311
312
313
314
315
317
318
319
320
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
© Sinauer Associates, Inc. This material cannot be copied, reproduced, manufactured
or disseminated in any form without express written permission from the publisher.
xii
Interior branch tests using parsimony . . . . . . . . .
A multiple-branch counterpart of interior branch tests
Testing the molecular clock . . . . . . . . . . . . . . . . . .
Parsimony-based methods . . . . . . . . . . . . . . . .
Distance-based methods . . . . . . . . . . . . . . . . .
Likelihood-based methods . . . . . . . . . . . . . . . .
The relative rate test . . . . . . . . . . . . . . . . . . .
Simulation tests based on likelihood . . . . . . . . . . . . .
Further literature . . . . . . . . . . . . . . . . . . . . .
More exact tests and confidence intervals . . . . . . . . . .
Tests for three species with a clock . . . . . . . . . . .
Bremer support . . . . . . . . . . . . . . . . . . . . . .
Zander’s conditional probability of reconstruction . .
More generalized confidence sets . . . . . . . . . . . .
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
321
322
322
323
323
323
324
328
329
329
330
330
331
332
20 Bootstrap, jackknife, and permutation tests
The bootstrap and the jackknife . . . . . . . . . . . . . . . . . . . .
Bootstrapping and phylogenies . . . . . . . . . . . . . . . . . . . .
The delete-half jackknife . . . . . . . . . . . . . . . . . . . . . . . .
The bootstrap and jackknife for phylogenies . . . . . . . . . . . . .
The multiple-tests problem . . . . . . . . . . . . . . . . . . . . . . .
Independence of characters . . . . . . . . . . . . . . . . . . . . . .
Identical distribution — a problem? . . . . . . . . . . . . . . . . .
Invariant characters and resampling methods . . . . . . . . . . . .
Biases in bootstrap and jackknife probabilities . . . . . . . . . . .
P values in a simple normal case . . . . . . . . . . . . . . . .
Methods of reducing the bias . . . . . . . . . . . . . . . . . .
The drug testing analogy . . . . . . . . . . . . . . . . . . . . .
Alternatives to P values . . . . . . . . . . . . . . . . . . . . . . . .
Probabilities of trees . . . . . . . . . . . . . . . . . . . . . . .
Using tree distances . . . . . . . . . . . . . . . . . . . . . . . .
Jackknifing species . . . . . . . . . . . . . . . . . . . . . . . .
Parametric bootstrapping . . . . . . . . . . . . . . . . . . . . . . .
Advantages and disadvantages of the parametric bootstrap .
Permutation tests . . . . . . . . . . . . . . . . . . . . . . . . . . . .
Permuting species within characters . . . . . . . . . . . . . .
Permuting characters . . . . . . . . . . . . . . . . . . . . . . .
Skewness of tree length distribution . . . . . . . . . . . . . .
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
335
335
337
339
340
342
343
343
344
346
346
349
352
355
356
356
357
357
358
359
359
361
362
21 Paired-sites tests
An example . . . . . . . . . . . . . . .
Multiple trees . . . . . . . . . . . . . .
The SH test . . . . . . . . . . . . .
Other multiple-comparison tests
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
364
365
369
370
371
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
© Sinauer Associates, Inc. This material cannot be copied, reproduced, manufactured
or disseminated in any form without express written permission from the publisher.
xiii
Testing other parameters . . . . . . . . . . . . . . . . . . . . . . . . . . . .
Perspective . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
22 Invariants
Symmetry invariants . . . . . . . . . . . . . . . .
Three-species invariants . . . . . . . . . . . . . .
Lake’s linear invariants . . . . . . . . . . . . . . .
Cavender’s quadratic invariants . . . . . . . . .
The K invariants . . . . . . . . . . . . . . . .
The L invariants . . . . . . . . . . . . . . . .
Generalization of Cavender’s L invariants .
Drolet and Sankoff’s k-state quadratic invariants
Clock invariants . . . . . . . . . . . . . . . . . . .
General methods for finding invariants . . . . .
Fourier transform methods . . . . . . . . .
Gröbner bases and other general methods .
Expressions for all the 3ST invariants . . . .
Finding all invariants empirically . . . . . .
All linear invariants . . . . . . . . . . . . . .
Special cases and extensions . . . . . . . . .
Invariants and evolutionary rates . . . . . . . . .
Testing invariants . . . . . . . . . . . . . . . . . .
What use are invariants? . . . . . . . . . . . . . .
23 Brownian motion and gene frequencies
Brownian motion . . . . . . . . . . . . . . . .
Likelihood for a phylogeny . . . . . . . . . .
What likelihood to compute? . . . . . . . . .
Assuming a clock . . . . . . . . . . . . .
The REML approach . . . . . . . . . . .
Multiple characters and Kronecker products
Pruning the likelihood . . . . . . . . . . . . .
Maximizing the likelihood . . . . . . . . . . .
Inferring ancestral states . . . . . . . . . . . .
Squared-change parsimony . . . . . . .
Gene frequencies and Brownian motion . . .
Using approximate Brownian motion .
Distances from gene frequencies . . . .
A more exact likelihood method . . . .
Gene frequency parsimony . . . . . . .
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
372
372
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
373
375
376
378
380
380
381
382
385
385
386
386
387
387
388
388
389
389
389
390
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
391
391
392
395
399
401
402
404
406
408
409
410
412
412
413
413
© Sinauer Associates, Inc. This material cannot be copied, reproduced, manufactured
or disseminated in any form without express written permission from the publisher.
xiv
24 Quantitative characters
Neutral models of quantitative characters . . . . . . . . . . .
Changes due to natural selection . . . . . . . . . . . . . . . .
Selective correlation . . . . . . . . . . . . . . . . . . . . .
Covariances of multiple characters in multiple lineages
Selection for an optimum . . . . . . . . . . . . . . . . .
Brownian motion and selection . . . . . . . . . . . . . .
Correcting for correlations . . . . . . . . . . . . . . . . . . . .
Punctuational models . . . . . . . . . . . . . . . . . . . . . . .
Inferring phylogenies and correlations . . . . . . . . . . . . .
Chasing a common optimum . . . . . . . . . . . . . . . . . .
The character-coding “problem” . . . . . . . . . . . . . . . .
Continuous-character parsimony methods . . . . . . . . . . .
Manhattan metric parsimony . . . . . . . . . . . . . . .
Other parsimony methods . . . . . . . . . . . . . . . . .
Threshold models . . . . . . . . . . . . . . . . . . . . . . . . .
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
415
416
419
419
420
421
422
422
424
425
426
426
428
428
429
429
25 Comparative methods
An example with discrete states . . . . . . . .
An example with continuous characters . . .
The contrasts method . . . . . . . . . . . . . .
Correlations between characters . . . . . . . .
When the tree is not completely known . . .
Inferring change in a branch . . . . . . . . . .
Sampling error . . . . . . . . . . . . . . . . . .
The standard regression and other variations
Generalized least squares . . . . . . . .
Phylogenetic autocorrelation . . . . . .
Transformations of time . . . . . . . . .
Should we use the phylogeny at all? . .
Paired-lineage tests . . . . . . . . . . . . . . .
Discrete characters . . . . . . . . . . . . . . .
Ridley’s method . . . . . . . . . . . . . .
Concentrated-changes tests . . . . . . .
A paired-lineages test . . . . . . . . . . .
Methods using likelihood . . . . . . . .
Advantages of the likelihood approach
Molecular applications . . . . . . . . . . . . .
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
432
432
433
435
436
437
438
439
442
442
442
442
443
443
444
444
445
446
446
448
448
26 Coalescent trees
Kingman’s coalescent . . . . . . .
Bugs in a box—an analogy . . . .
Effect of varying population size
Migration . . . . . . . . . . . . . .
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
450
. 454
. 460
. 460
. 461
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
© Sinauer Associates, Inc. This material cannot be copied, reproduced, manufactured
or disseminated in any form without express written permission from the publisher.
xv
Effect of recombination . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
Coalescents and natural selection . . . . . . . . . . . . . . . . . . . . . . .
Neuhauser and Krone’s method . . . . . . . . . . . . . . . . . . . . .
27 Likelihood calculations on coalescents
The basic equation . . . . . . . . . . . . .
Using accurate genealogies—a reverie . .
Two random sampling methods . . . . . .
A Metropolis-Hastings method . . .
Griffiths and Tavaré’s method . . . .
Bayesian methods . . . . . . . . . . . . . .
MCMC for a variety of coalescent models
Single-tree methods . . . . . . . . . . . . .
Slatkin and Maddison’s method . . .
Fu’s method . . . . . . . . . . . . . .
Summary-statistic methods . . . . . . . .
Watterson’s method . . . . . . . . . .
Other summary-statistic methods . .
Testing for recombination . . . . . .
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
464
467
468
470
470
471
473
473
476
482
482
484
484
485
485
485
486
486
28 Coalescents and species trees
488
Methods of inferring the species phylogeny . . . . . . . . . . . . . . . . . 491
Reconciled tree parsimony approaches . . . . . . . . . . . . . . . . . 492
Likelihood . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 493
29 Alignment, gene families, and genomics
Alignment . . . . . . . . . . . . . . . . . . . . . .
Why phylogenies are important . . . . . . .
Parsimony method . . . . . . . . . . . . . . . . .
Approximations and progressive alignment
Probabilistic models . . . . . . . . . . . . . . . . .
Bishop and Thompson’s method . . . . . .
The minimum message length method . . .
The TKF model . . . . . . . . . . . . . . . .
Multibase insertions and deletions . . . . .
Tree HMMs . . . . . . . . . . . . . . . . . .
Trees . . . . . . . . . . . . . . . . . . . . . .
Inferring the alignment . . . . . . . . . . . .
Gene families . . . . . . . . . . . . . . . . . . . .
Reconciled trees . . . . . . . . . . . . . . . .
Reconstructing duplications . . . . . . . . .
Rooting unrooted trees . . . . . . . . . . . .
A likelihood analysis . . . . . . . . . . . . .
Comparative genomics . . . . . . . . . . . . . . .
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
© Sinauer Associates, Inc. This material cannot be copied, reproduced, manufactured
or disseminated in any form without express written permission from the publisher.
496
497
497
498
500
502
502
502
503
506
507
507
509
509
510
511
512
514
515
xvi
Tandemly repeated genes . . . . . . . . . . . . .
Inversions . . . . . . . . . . . . . . . . . . . . . .
Inversions in trees . . . . . . . . . . . . . . . . . .
Inversions, transpositions, and translocations . .
Breakpoint and neighbor-coding approximations
Synteny . . . . . . . . . . . . . . . . . . . . . . . .
Probabilistic models . . . . . . . . . . . . . . . .
Genome signature methods . . . . . . . . . . . . . . .
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
. 515
. 516
. 516
. 516
. 517
. 517
. 518
. 519
30 Consensus trees and distances between trees
Consensus trees . . . . . . . . . . . . . . . . . . . .
Strict consensus . . . . . . . . . . . . . . . . .
Majority-rule consensus . . . . . . . . . . . .
Adams consensus tree . . . . . . . . . . . . .
A dismaying result . . . . . . . . . . . . . . .
Consensus using branch lengths . . . . . . .
Other consensus tree methods . . . . . . . . .
Consensus subtrees . . . . . . . . . . . . . . .
Distances between trees . . . . . . . . . . . . . . .
The symmetric difference . . . . . . . . . . .
The quartets distance . . . . . . . . . . . . . .
The nearest-neighbor interchange distance .
The path-length-difference metric . . . . . . .
Distances using branch lengths . . . . . . . .
Are these distances truly distances? . . . . . .
Consensus trees and distances . . . . . . . . .
Trees significantly the same? different? . . . .
What do consensus trees and tree distances tell us?
The total evidence debate . . . . . . . . . . .
A modest proposal . . . . . . . . . . . . . . .
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
31 Biogeography, hosts, and parasites
Component compatibility . . . . . .
Brooks parsimony . . . . . . . . . . .
Event-based parsimony methods . .
Relation to tree reconciliation .
Randomization tests . . . . . . . . .
Statistical inference . . . . . . . . . .
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
539
. 540
. 541
. 543
. 545
. 545
. 546
32 Phylogenies and paleontology
Stratigraphic indices . . . . . .
Stratophenetics . . . . . . . . .
Stratocladistics . . . . . . . . . .
Controversies . . . . . . . . . .
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
521
521
522
523
524
525
526
526
528
528
529
530
530
531
531
533
534
534
535
536
537
547
548
549
550
552
© Sinauer Associates, Inc. This material cannot be copied, reproduced, manufactured
or disseminated in any form without express written permission from the publisher.
xvii
A not-quite-likelihood method . . . . . . .
Stratolikelihood . . . . . . . . . . . . . . . .
Making a full likelihood method . . .
More realistic fossilization models . .
Fossils within species: Sequential sampling
Between species . . . . . . . . . . . . . . . .
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
. 553
. 553
. 554
. 554
. 555
. 557
33 Tests based on tree shape
Using the topology only . . . . . . . .
Imbalance at the root . . . . . . .
Harding’s probabilities of tree shapes
Tests from shapes . . . . . . . . . . . .
Measures of overall asymmetry .
Choosing a powerful test . . . . .
Tests using times . . . . . . . . . . . .
Lineage plots . . . . . . . . . . . .
Likelihood formulas . . . . . . .
Other likelihood approaches . . .
Other statistical approaches . . .
A time transformation . . . . . .
Characters and key innovations . . . .
Work remaining . . . . . . . . . . . . .
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
559
559
560
561
562
563
564
564
565
567
569
569
570
571
571
34 Drawing trees
Issues in drawing rooted trees . . .
Placement of interior nodes .
Shapes of lineages . . . . . . .
Unrooted trees . . . . . . . . . . . .
The equal-angle algorithm . .
n-Body algorithms . . . . . .
The equal-daylight algorithm
Challenges . . . . . . . . . . . . . .
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
573
574
574
576
578
578
580
582
584
35 Phylogeny software
Trees, records, and pointers . . . . . . . . . . . .
Declaring records . . . . . . . . . . . . . . . . . .
Traversing the tree . . . . . . . . . . . . . . . . .
Unrooted tree data structures . . . . . . . . . . .
Tree file formats . . . . . . . . . . . . . . . . . . .
Widely used phylogeny programs and packages
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
585
. 585
. 586
. 587
. 589
. 590
. 591
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
References
595
Index
645
© Sinauer Associates, Inc. This material cannot be copied, reproduced, manufactured
or disseminated in any form without express written permission from the publisher.
Download