Uploaded by johnykandi2

Παλινδρομηση Διακύμανση kalippos book

advertisement
Γ
ραμμι
κάΜοντέ
λακαιΣχε
δι
ασμός
& Ανάλ
υσηΠε
ι
ραμάτ
ων
Αλ
έ
ξ
ανδροςΚαραγρηγορί
ου,
Καθηγητ
ής
Πανε
πι
στ
ήμι
οΑι
γαί
ου
ΕμμανουήλΝε
κτ
άρι
οςΚαλλι
γέ
ρης
,
Δι
δάκτ
ωρ
Πανε
πι
στ
ήμι
οΑι
γαί
ου
Γραμμικά Μοντέλα και Σχεδιασμός & Ανάλυση Πειραμάτων
με Εφαρμογές σε R και Minitab
Γραμμικά Μοντέλα και Σχεδιασμός & Ανάλυση Πειραμάτων
με Εφαρμογές σε R και Minitab
Αλέξανδρος Καραγρηγορίου
Καθηγητής
Πανεπιστήμιο Αιγαίου
Εμμανουήλ Νεκτάριος Καλλιγέρης
Διδάκτωρ
Πανεπιστήμιο Αιγαίου
ΚΑΛΛΙΠΟΣ
ΑΝΟΙΚΤΕΣ ΑΚΑΔΗΜΑΪΚΕΣ ΕΚΔΟΣΕΙΣ
www.kallipos.gr
Τίτλος πρωτοτύπου: «Γραμμικά Μοντέλα και Σχεδιασμός & Ανάλυση Πειραμάτων με Εφαρμογές σε R και Minitab»
Copyright © 2023, ΚΑΛΛΙΠΟΣ, ΑΝΟΙΚΤΕΣ ΑΚΑΔΗΜΑΪΚΕΣ ΕΚΔΟΣΕΙΣ
Το παρόν έργο διατίθεται με τους όρους της άδειας Creative Commons Αναφορά Δημιουργού – Μη Εμπορική Χρήση – Παρόμοια Διανομή 4.0. Για να δείτε τους όρους της άδειας αυτής επισκεφτείτε τον ιστότοπο
https://creativecommons.org/licenses/by‐nc‐sa/4.0/legalcode.el
Αν τυχόν κάποιο τμήμα του έργου διατίθεται με διαφορετικό καθεστώς αδειοδότησης, αυτό αναφέρεται ρητά
και ειδικώς στην οικεία θέση.
Συντελεστές έκδοσης
Γλωσσική επιμέλεια:
Ευγενία Παξινού
Τεχνική επεξεργασία:
Δημήτριος Καρατζίδης
ΚΑΛΛΙΠΟΣ
Εθνικό Μετσόβιο Πολυτεχνείο
Ηρώων Πολυτεχνείου 9
15780 Ζωγράφου
www.kallipos.gr
Βιβλιογραφική αναφορά:
Διαθέσιμο στο:
Καραγρηγορίου, Α., & Καλλιγέρης, Ε. Ν. (2023). Γραμμικά Μοντέλα
και Σχεδιασμός & Ανάλυση Πειραμάτων με Εφαρμογές σε R και Minitab
[Προπτυχιακό εγχειρίδιο]. Αθήνα: Κάλλιπος, Ανοικτές Ακαδημαϊκές
Εκδόσεις.
http://dx.doi.org/10.57713/kallipos-70
ISBN:
978-618-5667-84-9
Αφιερώνεται στην Ίλια και στη Χριστιάνα.
Α. Καραγρηγορίου
Αφιερώνεται στη μητέρα μου, Αριστέα, και στους φίλους μου, Θανάση και
Κίμωνα.
Ε. Ν. Καλλιγέρης
ΠΕΡΙΕΧΟΜΕΝΑ
Πίνακας Συντομεύσεων - Ακρωνυμίων
xv
Πρόλογος
xvii
1
Εισαγωγή στη Στατιστική Ανάλυση
1
2
Απλή Γραμμική Παλινδρόμηση
2.1 Εισαγωγή . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
2.2 Ευθεία παλινδρόμησης . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
2.3 Απλό γραμμικό μοντέλο και προϋποθέσεις . . . . . . . . . . . . . . . . . . . . . .
2.4 Εκτιμητές ελαχίστων τετραγώνων . . . . . . . . . . . . . . . . . . . . . . . . . .
2.5 Το θεώρημα Gauss-Markov . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
2.6 Πίνακας ανάλυσης διακύμανσης (ANOVA) . . . . . . . . . . . . . . . . . . . . .
2.7 Συντελεστής προσδιορισμού R2 και συντελεστής γραμμικής συσχέτισης . . . . . .
2.8 Έλεγχος υποθέσεων, διαστήματα εμπιστοσύνης και πρόβλεψη . . . . . . . . . . . .
2.8.1 Έλεγχος υποθέσεων . . . . . . . . . . . . . . . . . . . . . . . . . . . .
2.8.2 Διαστήματα εμπιστοσύνης . . . . . . . . . . . . . . . . . . . . . . . . .
2.8.2.1
Διάστημα εμπιστοσύνης για τους συντελεστές παλινδρόμησης .
2.8.2.2
Διάστημα εμπιστοσύνης για τη συνάρτηση παλινδρόμησης . . .
2.8.2.3
Διάστημα εμπιστοσύνης για την πρόβλεψη νέων παρατηρήσεων
2.9 Εφαρμογές στην R . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
2.10 Άλυτες ασκήσεις . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
5
6
6
12
14
19
21
24
28
28
29
29
30
31
32
42
Βιβλιογραφία
45
3
47
48
48
51
52
54
Πολλαπλή Παλινδρόμηση
3.1 Εισαγωγή . . . . . . . . . . . . . . . . . . .
3.2 Πολλαπλό γραμμικό μοντέλο και προϋποθέσεις
3.3 Εκτιμητές ελαχίστων τετραγώνων . . . . . . .
3.4 Πίνακας ανάλυσης διακύμανσης (ANOVA) . .
3.5 Το θεώρημα Gauss-Markov . . . . . . . . . .
i
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
ii
ΠΕΡΙΕΧΟΜΕΝΑ
3.6
3.7
3.8
3.9
3.10
Εκτιμήτριες μεγίστης πιθανοφάνειας . . . . . . . . . . . . . . . . . . . . . . . . . .
Προσαρμοσμένος συντελεστής προσδιορισμού και συντελεστής μερικού προσδιορισμού
Έλεγχος υποθέσεων, διαστήματα εμπιστοσύνης και πρόβλεψη . . . . . . . . . . . . . .
Εφαρμογές στην R . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
Άλυτες ασκήσεις . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
.
.
.
.
.
57
58
59
60
69
Βιβλιογραφία
73
4
75
76
76
77
78
79
80
81
81
81
82
83
87
88
90
91
99
Διαγνωστικοί Έλεγχοι Προϋποθέσεων Γραμμικού Μοντέλου Παλινδρόμησης
4.1 Εισαγωγή . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
4.2 Μη γραμμικότητα και μετασχηματισμοί . . . . . . . . . . . . . . . . . .
4.3 Έλεγχος κανονικότητας των σφαλμάτων . . . . . . . . . . . . . . . . .
4.3.1 Ο έλεγχος Kolmogorov-Smirnov για ένα δείγμα . . . . . . . . .
4.3.1.1
Ο έλεγχος Κανονικότητας του Lilliefors . . . . . . .
4.3.2 Ο έλεγχος Anderson-Darling για ένα δείγμα . . . . . . . . . . .
4.3.3 Ο έλεγχος Shapiro-Wilk για ένα δείγμα . . . . . . . . . . . . .
4.3.4 Ακραίες τιμές . . . . . . . . . . . . . . . . . . . . . . . . . . .
4.4 Έλεγχος ανεξαρτησίας των σφαλμάτων . . . . . . . . . . . . . . . . . .
4.5 Έλεγχος ομοσκεδαστικότητας των σφαλμάτων . . . . . . . . . . . . . .
4.6 F έλεγχος έλλειψης καλής προσαρμογής . . . . . . . . . . . . . . . . .
4.7 Box-Cox μετασχηματισμοί . . . . . . . . . . . . . . . . . . . . . . . .
4.8 Επηρεάζουσες παρατηρήσεις . . . . . . . . . . . . . . . . . . . . . . .
4.9 Συνέπειες παραβίασης προϋποθέσεων παλινδρόμησης . . . . . . . . . . .
4.10 Εφαρμογές στην R . . . . . . . . . . . . . . . . . . . . . . . . . . . .
4.11 Άλυτες ασκήσεις . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
Βιβλιογραφία
101
5
103
104
104
105
105
105
105
106
106
Κριτήρια Αξιολόγησης Μοντέλων
5.1 Εισαγωγή . . . . . . . . . . . . .
5.2 Κριτήριο Rp2 . . . . . . . . . . .
5.3 Κριτήρια F P Ep και AICp . . . .
5.4 Κριτήριο BICp . . . . . . . . . .
5.5 Εναλλακτικά κριτήρια αξιολόγησης
2
5.5.1 Κριτήριο M SEp ή Radj,p
5.5.2 Κριτήριο Cp . . . . . . .
5.6 Εφαρμογές στην R . . . . . . . .
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
Βιβλιογραφία
109
6
111
112
114
117
118
119
120
121
124
Ειδικά Θέματα Παλινδρόμησης
6.1 Έξτρα (ή διαδοχικά) αθροίσματα τετραγώνων . .
6.2 Έλεγχοι υποθέσεων . . . . . . . . . . . . . . .
6.3 Εκτιμητές σταθμισμένων ελαχίστων τετραγώνων
6.4 Πολυσυγγραμμικότητα . . . . . . . . . . . . .
6.5 Συντελεστής διόγκωσης της διακύμανσης (VIF)
6.6 Ψευδομεταβλητές . . . . . . . . . . . . . . . .
6.7 Εφαρμογή στην R . . . . . . . . . . . . . . . .
6.8 Άλυτες ασκήσεις . . . . . . . . . . . . . . . . .
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
ΠΕΡΙΕΧΟΜΕΝΑ
iii
Βιβλιογραφία
127
7
129
130
131
134
136
137
137
140
143
144
144
145
145
146
147
148
149
149
149
150
151
160
160
161
162
Ανάλυση Διακύμανσης κατά έναν Παράγοντα
7.1 Εισαγωγή . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
7.2 Πλήρως Τυχαιοποιημένο Σχέδιο . . . . . . . . . . . . . . . . . . . . . . . . . .
7.3 Γραφική ανάλυση μέσων . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
7.4 Μονοπαραγοντική ανάλυση διακύμανσης . . . . . . . . . . . . . . . . . . . . . .
7.4.1 Πρότυπο σταθερών επιδράσεων . . . . . . . . . . . . . . . . . . . . . .
7.4.1.1
Εκτίμηση και έλεγχος υποθέσεων . . . . . . . . . . . . . . . .
7.4.1.2
Διαστήματα εμπιστοσύνης . . . . . . . . . . . . . . . . . . .
7.4.2 Πρότυπο τυχαίων επιδράσεων . . . . . . . . . . . . . . . . . . . . . . .
7.5 Μελέτη πολλαπλών συγκρίσεων . . . . . . . . . . . . . . . . . . . . . . . . . . .
7.5.1 Διαστήματα Fisher LSD . . . . . . . . . . . . . . . . . . . . . . . . . .
7.5.2 Διαστήματα Bonferroni . . . . . . . . . . . . . . . . . . . . . . . . . .
7.5.3 Διαστήματα Tukey . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
7.5.4 Διαστήματα Dunnett . . . . . . . . . . . . . . . . . . . . . . . . . . . .
7.6 Ανάλυση καταλοίπων . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
7.6.1 Γραφικές μέθοδοι ανάλυσης καταλοίπων . . . . . . . . . . . . . . . . . .
7.6.2 Στατιστικές μέθοδοι ανάλυσης καταλοίπων . . . . . . . . . . . . . . . . .
7.6.2.1
Οι έλεγχοι A-D, K-S και S-W . . . . . . . . . . . . . . . . . .
7.6.2.2
Ο Wald-Wolfowitz έλεγχος των ροών . . . . . . . . . . . . .
7.6.2.3
Οι έλεγχοι Bartlett και Levene για την ισότητα των διασπορών .
7.7 Εφαρμογές στο Minitab και την R . . . . . . . . . . . . . . . . . . . . . . . . . .
7.8 Σχόλια και χρήσιμες σημειώσεις . . . . . . . . . . . . . . . . . . . . . . . . . . .
7.8.1 Σχόλια και χρήσιμες σημειώσεις - Minitab . . . . . . . . . . . . . . . . .
7.8.2 Σχόλια και χρήσιμες σημειώσεις - R . . . . . . . . . . . . . . . . . . . . .
7.9 Άλυτες ασκήσεις . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
Βιβλιογραφία
165
8
167
168
169
172
172
172
174
175
177
180
186
186
191
199
203
204
209
225
225
Σχεδιασμός Πειραμάτων
8.1 Εισαγωγή . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
8.2 Σχέδιο τυχαιοποιημένων πλήρων ομάδων (μεταβλητές πλαισίου) . . . . . . . . . . . . .
8.2.1 Πρότυπα σταθερών και τυχαίων επιδράσεων . . . . . . . . . . . . . . . . . . .
8.2.1.1
Πρότυπο σταθερών επιδράσεων . . . . . . . . . . . . . . . . . . .
8.2.1.2
Εκτίμηση και έλεγχος υποθέσεων . . . . . . . . . . . . . . . . . . .
8.2.1.3
Κλασικά διαστήματα εμπιστοσύνης και πολλαπλές συγκρίσεις . . . .
8.2.1.4
Πρότυπο τυχαίων επιδράσεων . . . . . . . . . . . . . . . . . . . .
8.2.2 Αναπλήρωση χαμένων/ελλειπουσών μετρήσεων . . . . . . . . . . . . . . . . .
8.3 Σχέδιο Λατινικού Τετραγώνου . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
8.4 Διπαραγοντικά πειράματα πλήρους τυχαιοποίησης (Διπαραγοντική ανάλυση διακύμανσης)
8.4.1 Πρότυπο με και χωρίς αλληλεπίδραση . . . . . . . . . . . . . . . . . . . . . .
8.4.2 Πρότυπο σταθερών επιδράσεων . . . . . . . . . . . . . . . . . . . . . . . . .
8.4.3 Πρότυπο τυχαίων επιδράσεων . . . . . . . . . . . . . . . . . . . . . . . . . .
8.4.4 Πρότυπο μεικτών επιδράσεων . . . . . . . . . . . . . . . . . . . . . . . . . .
8.4.5 Πρότυπο με μεταβλητές πλαισίου και σχέδια Λατινικού Τετραγώνου . . . . . . .
8.5 Εφαρμογές στο Minitab και στην R . . . . . . . . . . . . . . . . . . . . . . . . . . . .
8.6 Σχόλια και χρήσιμες σημειώσεις . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
8.6.1 Σχόλια και χρήσιμες σημειώσεις - Minitab . . . . . . . . . . . . . . . . . . . .
iv
ΠΕΡΙΕΧΟΜΕΝΑ
8.7
8.6.2 Σχόλια και χρήσιμες σημειώσεις - R . . . . . . . . . . . . . . . . . . . . . . . . 227
Άλυτες ασκήσεις . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 227
Βιβλιογραφία
231
9
233
234
235
240
241
242
248
249
253
263
264
265
282
282
Πειράματα f Παραγόντων με 2 επίπεδα
9.1 2f παραγοντικά πειράματα . . . . . . . . . . . . . . . . . .
9.1.1 Το 22 παραγοντικό πείραμα . . . . . . . . . . . . .
9.1.2 Το 23 παραγοντικό πείραμα . . . . . . . . . . . . .
9.1.3 Η γενική περίπτωση του 2f παραγοντικού πειράματος
9.1.4 Το πρότυπο της παλινδρόμησης . . . . . . . . . . .
9.2 Κλασματικά παραγοντικά πειράματα . . . . . . . . . . . . .
9.2.1 Σύγχυση και ανάλυση (διακριτική ικανότητα) . . . .
9.2.2 Κλάσματα ενός δευτέρου πλήρους τυχαιοποίησης . .
9.2.3 Κλάσματα μικρότερα του ενός δευτέρου . . . . . . .
9.2.4 Σχεδιασμοί ομαδοποίησης . . . . . . . . . . . . . .
9.3 Εφαρμογές στο Minitab . . . . . . . . . . . . . . . . . . . .
9.4 Σχόλια και χρήσιμες σημειώσεις - Minitab . . . . . . . . . .
9.5 Άλυτες ασκήσεις . . . . . . . . . . . . . . . . . . . . . . . .
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
Βιβλιογραφία
285
10 Ειδικά Θέματα Ανάλυσης Διακύμανσης
10.1 f - Παραγοντική ανάλυση διακύμανσης . . . . . . . . . . . . . . . . . . . .
10.2 Μη παραμετρική ανάλυση διακύμανσης . . . . . . . . . . . . . . . . . . . .
10.3 Ανάλυση συνδιακύμανσης . . . . . . . . . . . . . . . . . . . . . . . . . . .
10.3.1 Ανάλυση συνδιακύμανσης σε πλήρως τυχαιοποιημένο σχεδιασμό . . .
10.3.2 Ανάλυση συνδιακύμανσης με έναν παράγοντα και μεταβλητή πλαισίου
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
Βιβλιογραφία
11 Εισαγωγή στα Γενικευμένα Γραμμικά Μοντέλα
11.1 Εισαγωγή . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
11.2 Το μη γραμμικό μοντέλο . . . . . . . . . . . . . . . . . . . . . . . . . .
11.2.1 Γενικό πρότυπο . . . . . . . . . . . . . . . . . . . . . . . . . .
11.2.2 Εκτίμηση παραμέτρων μη γραμμικού μοντέλου . . . . . . . . . .
11.3 Πρότυπο γενικευμένου γραμμικού μοντέλου . . . . . . . . . . . . . . .
11.3.1 Εκτιμητής μέγιστης πιθανοφάνειας . . . . . . . . . . . . . . . .
11.4 Έλεγχος υποθέσεων και διαστήματα εμπιστοσύνης - Ο έλεγχος κατά Wald
11.4.1 Λ - τεστ λόγου πιθανοφανειών . . . . . . . . . . . . . . . . . .
11.4.2 Έλεγχος κατά Wald . . . . . . . . . . . . . . . . . . . . . . .
11.4.3 Σύνολα εμπιστοσύνης . . . . . . . . . . . . . . . . . . . . . .
11.5 Έλεγχοι καλής προσαρμογής . . . . . . . . . . . . . . . . . . . . . . .
11.5.1 Deviance . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
11.5.2 χ2 - έλεγχοι καλής προσαρμογής . . . . . . . . . . . . . . . . .
11.5.2.1 Ο έλεγχος κατά Pearson . . . . . . . . . . . . . . .
11.5.2.2 Ο έλεγχος κατά Hosmer και Lemeshow . . . . . . .
11.5.3 Ψευδο-συντελεστής προσδιορισμού R2 . . . . . . . . . . . . . .
11.6 Το δίτιμο λογιστικό μοντέλο παλινδρόμησης . . . . . . . . . . . . . . .
11.6.1 Εκτίμηση παραμέτρων . . . . . . . . . . . . . . . . . . . . . .
287
288
294
300
300
306
307
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
309
310
310
310
310
311
312
314
314
315
316
316
316
319
319
320
321
321
322
ΠΕΡΙΕΧΟΜΕΝΑ
11.6.2 Ερμηνεία συντελεστών δίτιμου λογιστικού μοντέλου παλινδρόμησης
11.7 Το Poisson μοντέλο παλινδρόμησης . . . . . . . . . . . . . . . . . . . . .
11.7.1 Εκτίμηση παραμέτρων . . . . . . . . . . . . . . . . . . . . . . .
11.7.2 Ερμηνεία συντελεστών Poisson μοντέλου παλινδρόμησης . . . . .
11.7.3 Poisson μοντέλο παλινδρόμησης με αντιστάθμιση . . . . . . . . .
11.8 Επεκτάσεις . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
11.8.1 Γραμμικά μεικτά μοντέλα . . . . . . . . . . . . . . . . . . . . . .
11.8.2 Γενικευμένα γραμμικά μεικτά μοντέλα . . . . . . . . . . . . . . .
11.9 Εφαρμογές στην R . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
v
323
325
325
326
326
327
327
327
327
Βιβλιογραφία
333
Παραρτήματα
335
Α Απαντήσεις Ασκήσεων Αυτοαξιολόγησης
Α.1 Άσκηση Αυτοαξιολόγησης Κεφάλαιο 2 . . . . . . . . . . . . . . .
Α.2 Άσκηση Αυτοαξιολόγησης Κεφάλαιο 3 . . . . . . . . . . . . . . .
Α.3 Άσκηση Αυτοαξιολόγησης Κεφάλαιο 4 . . . . . . . . . . . . . . .
Α.4 Άσκηση Αυτοαξιολόγησης Κεφάλαιο 5 - Ενότητα 5.4 . . . . . . . .
Α.5 Άσκηση Αυτοαξιολόγησης Κεφάλαιο 5 - Ενότητα 5.5 . . . . . . . .
Α.6 Άσκηση Αυτοαξιολόγησης Κεφάλαιο 7 . . . . . . . . . . . . . . .
Α.7 Άσκηση Αυτοαξιολόγησης Κεφάλαιο 8 . . . . . . . . . . . . . . .
Α.8 Άσκηση Αυτοαξιολόγησης Κεφάλαιο 9 - Ενότητα 9.1 . . . . . . . .
Α.9 Άσκηση Αυτοαξιολόγησης Κεφάλαιο 9 - Ενότητα 9.2.1 . . . . . . .
Α.10 Άσκηση Αυτοαξιολόγησης Κεφάλαιο 9 - Ενότητα 9.2.2 - 1η Άσκηση
Α.11 Άσκηση Αυτοαξιολόγησης Κεφάλαιο 9 - Ενότητα 9.2.2 - 2η Άσκηση
Α.12 Άσκηση Αυτοαξιολόγησης Κεφάλαιο 9 - Ενότητα 9.2.3 . . . . . . .
.
.
.
.
.
.
.
.
.
.
.
.
337
337
337
338
338
339
339
339
340
341
341
341
342
.
.
.
.
.
.
.
.
.
.
343
343
343
344
344
345
345
345
346
346
346
Εισαγωγή στο Minitab
Α.13 Λήψη και Εγκατάσταση
Α.14 Διεπαφή χρήστη . . . .
Α.15 Γραμμή εργαλειών . . .
Α.15.1 File . . . . . .
Α.15.2 Edit . . . . .
Α.15.3 Data . . . . .
Α.15.4 Calc . . . . .
Α.15.5 Stat . . . . .
Α.15.6 Graph . . . .
Α.16 Φύλλο εργασίας . . . .
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
Β Εγκαθιστώντας την R και το R-Studio
349
Β.1 Λήψη και Εγκατάσταση . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 349
Β.2 Η διεπαφή χρήστη του R-Studio . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 349
Πίνακες Ποσοστιαίων Σημείων
351
vi
ΠΕΡΙΕΧΟΜΕΝΑ
ΚΑΤΑΛΟΓΟΣ ΣΧΗΜΑΤΩΝ
7
8
9
10
12
14
26
2.9
Σκεδασμογραφήματα πιθανών μορφών συσχέτισης μεταξύ X και Y . . . . . . . . . . . .
Σκεδασμογράφημα των X και Y χωρίς (α) και με (β)προσαρμογή κατάλληλης καμπύλης.
Κατανομή της Y για τρεις διαφορετικές τιμές της X. . . . . . . . . . . . . . . . . . . .
Το Απλό Γραμμικό Μοντέλο Παλινδρόμησης. . . . . . . . . . . . . . . . . . . . . . . .
Το απλό γραμμικό μοντέλο παλινδρόμησης . . . . . . . . . . . . . . . . . . . . . . . .
Σφάλματα (αποστάσεις) μεταξύ παρατηρήσεων και ευθείας παλινδρόμησης . . . . . . . .
Διάγραμμα διασποράς Πίνακα 2.5 . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
Διάγραμμα διασποράς μεταξύ X και Y με προσαρμογή της εκτιμώμενης ευθείας παλινδρόμησης . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
98% Δ.Π. για το Y0 όταν x0 = 7 . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
3.1
Πολλαπλό μοντέλο παλινδρόμησης με 2 ανεξάρτητες μεταβλητές . . . . . . . . . . . . .
49
4.1
4.2
4.3
4.4
4.5
4.6
4.7
Γραφική διερεύνηση γραμμικότητας . . . . . . . . . . . .
Γραφική διερεύνηση ανεξαρτησίας . . . . . . . . . . . . .
Γραφική διερεύνηση ομοσκεδαστικότητας . . . . . . . . .
Συνιστώσες σφάλματος - Απλό γραμμικό μοντέλο . . . . .
Γραφική διερεύνηση ανεξαρτησίας . . . . . . . . . . . . .
Γραφική διερεύνηση ομοσκεδαστικότητας . . . . . . . . .
Συμπεριφορά log - πιθανοφάνειας για διάφορες τιμές του λ
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
77
82
83
87
93
95
98
7.1
7.2
7.3
7.4
7.5
7.6
7.7
ANOVA Πρότυπο - Αντοχή . . . . . . . . . . . . .
ANOVA Πρότυπο - Αντοχή . . . . . . . . . . . . .
Διάγραμμα Κουκκίδων - Σωλήνες Πίεσης . . . . . .
Διερεύνηση Κανονικότητας - Σωλήνες Πίεσης . . .
Διερεύνηση Ομοσκεδαστικότητας - Σωλήνες Πίεσης
Γραφική Διερεύνηση Ανεξαρτησίας - Σωλήνες Πίεσης
Ανάλυση Μέσων, α = 5% - Σωλήνες Πίεσης . . . .
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
135
136
152
156
157
157
159
8.1
8.2
8.3
Διάγραμμα Κουκκίδων . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 190
Διάγραμμα Κύριων Επιδράσεων . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 190
Διάγραμμα Αλληλεπιδράσεων . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 191
2.1
2.2
2.3
2.4
2.5
2.6
2.7
2.8
vii
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
36
42
viii
ΚΑΤΑΛΟΓΟΣ ΣΧΗΜΑΤΩΝ
8.4
8.5
8.6
8.7
8.8
Πολλαπλές Συγκρίσεις Tukey 95% Διαστήματα Εμπιστοσύνης - Αντοχή .
Πολλαπλές Συγκρίσεις Tukey 94.5% Διαστήματα Εμπιστοσύνης - Αντοχή
Πολλαπλές Συγκρίσεις Dunnett 95% Διαστήματα Εμπιστοσύνης - Αντοχή
Διάγραμμα Κύριων Επιδράσεων - Σωλήνες . . . . . . . . . . . . . . . .
Διάγραμμα Αλληλεπιδράσεων - Σωλήνες . . . . . . . . . . . . . . . . .
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
213
214
215
218
219
10.1 Boxplot Friedman . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 300
Β.1
Διεπαφή χρήστη Minitab . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 350
ΚΑΤΑΛΟΓΟΣ ΠΙΝΑΚΩΝ
2.1
2.2
2.3
2.4
2.5
2.6
2.7
2.8
2.9
2.10
2.11
2.12
Τιμές 10 ζευγών παρατηρήσεων (xi , yi ). . . . . . . . . . . . . . . . . . . . .
Τιμές 5 παρατηρήσεων (xi1 , xi2 , yi ) . . . . . . . . . . . . . . . . . . . . . .
Τιμές 15 παρατηρήσεων (xi1 , xi2 , yi ) . . . . . . . . . . . . . . . . . . . . . .
Πίνακας ANOVA Απλής Γραμμικής Παλινδρόμησης . . . . . . . . . . . . . .
Τιμές 17 ζευγών παρατηρήσεων (xi , yi ) . . . . . . . . . . . . . . . . . . . . .
Υπολογισμός ποσοτήτων για τον προσδιορισμό του r . . . . . . . . . . . . . .
Χωρία απόρριψης της μηδενικής υπόθεσης για τους συντελεστές παλινδρόμησης
Τιμές 11 ζευγών παρατηρήσεων (xi , yi ) . . . . . . . . . . . . . . . . . . . . .
Τιμές 6 ζευγών παρατηρήσεων (xi , yi ) . . . . . . . . . . . . . . . . . . . . .
Ημιτελής Πίνακας ANOVA Άσκησης 9 . . . . . . . . . . . . . . . . . . . . .
Τιμές 10 ζευγών παρατηρήσεων (xi , yi ) . . . . . . . . . . . . . . . . . . . . .
Τιμές 10 ζευγών παρατηρήσεων (xi , yi ) . . . . . . . . . . . . . . . . . . . . .
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
7
11
11
22
25
27
29
32
37
43
44
44
3.1
3.2
3.3
3.4
3.5
3.6
3.7
3.8
Πίνακας ANOVA Πολλαπλής Γραμμικής Παλινδρόμησης . . . . . . . . . . . .
Χωρία απόρριψης της μηδενικής υπόθεσης για τους συντελεστές παλινδρόμησης
Τιμές 6 παρατηρήσεων (xi1 , xi2 , yi ) . . . . . . . . . . . . . . . . . . . . . .
Τιμές 25 παρατηρήσεων (xi1 , xi2 , yi ) . . . . . . . . . . . . . . . . . . . . . .
Τιμές 11 παρατηρήσεων (xi1 , xi2 , yi ) . . . . . . . . . . . . . . . . . . . . . .
Τιμές 8 παρατηρήσεων (xi1 , xi2 , yi ) . . . . . . . . . . . . . . . . . . . . . .
Τιμές 5 ζευγών παρατηρήσεων (t, yi ) . . . . . . . . . . . . . . . . . . . . . .
Τιμές 16 παρατηρήσεων (xi1 , xi2 , yi ) . . . . . . . . . . . . . . . . . . . . . .
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
53
59
61
65
69
70
70
71
4.1
4.2
4.3
4.4
4.5
4.6
4.7
Τιμές 11 ζευγών παρατηρήσεων (xi , yi ) .
Τιμές 10 ζευγών παρατηρήσεων (xi , yi ) .
Πίνακας ANOVA . . . . . . . . . . . .
Συνήθεις μετασχηματισμοί Box − Cox
Τιμές 9 παρατηρήσεων (xi1 , xi2 , yi ) . .
Τιμές 8 ζευγών παρατηρήσεων (xi , yi ) .
Τιμές 18 ζευγών παρατηρήσεων (xi , yi ) .
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
. 85
. 86
. 86
. 87
. 96
. 99
. 100
5.1
Τιμές AIC και BIC μοντέλων slm.1 και slm.2 . . . . . . . . . . . . . . . . . . . . . 108
.
.
.
.
.
.
.
ix
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
x
ΚΑΤΑΛΟΓΟΣ ΠΙΝΑΚΩΝ
6.1
6.2
6.3
6.4
Τιμές 13 παρατηρήσεων (xi1 , xi2 , xi3 , xi4 , yi ) . . .
Τιμές SSR και SSE μοντέλων Α έως Ε . . . . . . . .
Πίνακας ANOVA − Έξτρα αθροίσματα τετραγώνων
Τιμές 12 ζευγών παρατηρήσεων (xi , yi ) . . . . . . .
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
112
113
114
125
7.1
7.2
7.3
7.4
7.5
7.6
7.7
7.8
7.9
7.10
7.11
7.12
7.13
7.14
7.15
7.16
7.17
7.18
7.19
7.20
7.21
Πίνακας Δεδομένων - Πλήρως Τυχαιοποιημένο Σχέδιο . . . . . . . . . . . . . .
Πίνακας ANOVA . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
Παράδειγμα Σύγκρισης 4 γραμμών παραγωγής - Βασική Γραφική Ανάλυση Μέσων
Πίνακας ANOVA . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
Παράδειγμα - Δεδομένα σύγκρισης 4 γραμμών παραγωγής . . . . . . . . . . . .
Πίνακας ANOVA - Δεδομένα σύγκρισης 4 γραμμών παραγωγής . . . . . . . . .
Πίνακας Δεδομένων - 3 πληθυσμοί . . . . . . . . . . . . . . . . . . . . . . . .
Πίνακας ANOVA - 3 πληθυσμοί . . . . . . . . . . . . . . . . . . . . . . . . .
Πίνακας Δεδομένων - Σωλήνες Πίεσης . . . . . . . . . . . . . . . . . . . . . .
Πίνακας ANOVA - Σωλήνες Πίεσης . . . . . . . . . . . . . . . . . . . . . . .
Πολλαπλές Συγκρίσεις Tukey - Σωλήνες Πίεσης . . . . . . . . . . . . . . . . .
Διερεύνηση Ομοσκεδαστικότητας - Σωλήνες Πίεσης . . . . . . . . . . . . . . .
Στατιστική Διερεύνηση Ανεξαρτησίας - Σωλήνες Πίεσης . . . . . . . . . . . . .
One-way ANOVA - Χρήσιμες εντολές στην R . . . . . . . . . . . . . . . . . .
Σύνολο Δεδομένων 1 - Παράγοντας A . . . . . . . . . . . . . . . . . . . . . .
Σύνολο Δεδομένων 2 - Παράγοντας B . . . . . . . . . . . . . . . . . . . . . .
Σύνολο Δεδομένων 3 - Παράγοντας C . . . . . . . . . . . . . . . . . . . . . .
Σύνολο Δεδομένων 4 - Παράγοντας D . . . . . . . . . . . . . . . . . . . . . .
Σύνολο Δεδομένων 5 - Παράγοντας E . . . . . . . . . . . . . . . . . . . . . .
Σύνολο Δεδομένων 6 - Παράγοντας F . . . . . . . . . . . . . . . . . . . . . .
Σύνολο Δεδομένων 7 - Παράγοντας G . . . . . . . . . . . . . . . . . . . . . .
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
132
134
135
138
139
139
141
142
151
153
154
156
158
162
162
163
163
163
163
163
164
8.1
8.2
8.3
Τυχαιοποιημένος Τμηματικός Σχεδιασμός Πλήρων Ομάδων . . . . . . . . . . . . . . .
Πίνακας ANOVA - Τυχαιοποιημένος Τμηματικός Σχεδιασμός Πλήρων Ομάδων . . . . .
Πίνακας ANOVA - Τυχαιοποιημένος Τμηματικός Σχεδιασμός Πλήρων Ομάδων - Σταθερές
Επιδράσεις . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
Πίνακας Δεδομένων . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
Πίνακας ANOVA . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
Αναθεωρημένος Πίνακας ANOVA . . . . . . . . . . . . . . . . . . . . . . . . . . . .
4 × 4 Σχέδιο Λατινικού Τετραγώνου . . . . . . . . . . . . . . . . . . . . . . . . . . .
5 × 5 Σχέδιο Λατινικού Τετραγώνου . . . . . . . . . . . . . . . . . . . . . . . . . . .
Πίνακας Δεδομένων - 5 × 5 Σχέδιο Λατινικού Τετραγώνου . . . . . . . . . . . . . . . .
Πίνακας ANOVA - m × m Σχέδιο Λατινικού Τετραγώνου . . . . . . . . . . . . . . . .
Πίνακας ANOVA - 5 × 5 Σχέδιο Λατινικού Τετραγώνου . . . . . . . . . . . . . . . . .
Πίνακας Δεδομένων - Διπαραγοντική Ανάλυση με ή χωρίς Αλληλεπίδραση . . . . . . . .
Πίνακας Δεδομένων - Γραφικές Μέθοδοι . . . . . . . . . . . . . . . . . . . . . . . . .
Πίνακας ANOVA - Διπαραγοντική Ανάλυση με Αλληλεπίδραση - Σταθερές Επιδράσεις . .
Πίνακας ANOVA - Διπαραγοντική Ανάλυση χωρίς Αλληλεπίδραση - Σταθερές Επιδράσεις
Πίνακας Δεδομένων - Διπαραγοντική Ανάλυση - Σταθερές Επιδράσεις . . . . . . . . . .
Πίνακας ANOVA - Με Αλληλεπίδραση . . . . . . . . . . . . . . . . . . . . . . . . . .
Πίνακας ANOVA - Χωρίς Αλληλεπίδραση . . . . . . . . . . . . . . . . . . . . . . . .
Πίνακας Δεδομένων - Διπαραγοντική Ανάλυση - Τυχαίες Επιδράσεις . . . . . . . . . . .
Πίνακας ANOVA - Διπαραγοντική Ανάλυση - Τυχαίες Επιδράσεις . . . . . . . . . . . .
Variance Components . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
170
171
8.4
8.5
8.6
8.7
8.8
8.9
8.10
8.11
8.12
8.13
8.14
8.15
8.16
8.17
8.18
8.19
8.20
8.21
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
173
178
178
179
181
182
182
183
185
187
189
192
194
195
196
197
201
202
203
ΚΑΤΑΛΟΓΟΣ ΠΙΝΑΚΩΝ
xi
8.22 Πίνακας ANOVA- Διπαραγοντική Ανάλυση με Αλληλεπίδραση και Μεταβλητή Πλαισίου
8.23 Πίνακας ANOVA - Διπαραγοντική Ανάλυση με Αλληλεπίδραση σε Σχέδιο Λατινικού Τετραγώνου . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
8.24 Πίνακας Δεδομένων - Λατινικό Τετράγωνο . . . . . . . . . . . . . . . . . . . . . . . .
8.25 Πίνακας ANOVA - Λατινικό Τετράγωνο . . . . . . . . . . . . . . . . . . . . . . . . .
8.26 Πίνακας Δεδομένων - Λατινικό Τετράγωνο - Εναλλακτικό Πρότυπο . . . . . . . . . . . .
8.27 Πίνακας Δεδομένων - Αντοχή . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
8.28 Πίνακας Δεδομένων - Αντοχή - Λατινικό Τετράγωνο . . . . . . . . . . . . . . . . . . .
8.29 Πίνακας ANOVA - Αντοχή . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
8.30 ANOVA Συντελεστές - Αντοχή . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
8.31 Πολλαπλές Συγκρίσεις Tukey - Αντοχή . . . . . . . . . . . . . . . . . . . . . . . . . .
8.32 Πολλαπλές Συγκρίσεις Tukey 95% Διαστήματα Εμπιστοσύνης - Αντοχή . . . . . . . . .
8.33 Πολλαπλές Συγκρίσεις Dunnett - Αντοχή . . . . . . . . . . . . . . . . . . . . . . . . .
8.34 Πολλαπλές Συγκρίσεις Dunnett 95% Διαστήματα Εμπιστοσύνης - Αντοχή . . . . . . . .
8.35 Πίνακας ANOVA - 3 × 3 Λατινικό Τετράγωνο - Αντοχή . . . . . . . . . . . . . . . . .
8.36 Πίνακας Δεδομένων (2 επαναλήψεις ανά θεραπεία) - Σωλήνες . . . . . . . . . . . . . .
8.37 Πίνακας ANOVA - Σταθερές Επιδράσεις - Σωλήνες . . . . . . . . . . . . . . . . . . .
8.38 ANOVA Συντελεστές - Σταθερές Επιδράσεις - Σωλήνες . . . . . . . . . . . . . . . . . .
8.39 Πολλαπλές Συγκρίσεις Tukey A - Σωλήνες . . . . . . . . . . . . . . . . . . . . . . . .
8.40 Πολλαπλές Συγκρίσεις Tukey B - Σωλήνες . . . . . . . . . . . . . . . . . . . . . . . .
8.41 Πίνακας ANOVA - Τυχαίες Επιδράσεις - Σωλήνες . . . . . . . . . . . . . . . . . . . . .
8.42 Εκτιμητές Συνιστωσών Διασποράς - Τυχαίες Επιδράσεις - Σωλήνες . . . . . . . . . . . .
8.43 Πίνακας ANOVA - Μεικτό Πρότυπο - Σωλήνες . . . . . . . . . . . . . . . . . . . . . .
8.44 Εκτιμητές Συνιστωσών Διασποράς - Μεικτό Πρότυπο - Σωλήνες . . . . . . . . . . . . .
8.45 Μέσες Τιμές Επιπέδων - Μεικτό Πρότυπο - Σωλήνες . . . . . . . . . . . . . . . . . . .
8.46 Τwo-way ANOVA - Χρήσιμες εντολές στην R . . . . . . . . . . . . . . . . . . . . . .
8.47 Σύνολο Δεδομένων 1 - Παράγοντας Α - Μεταβλητή Πλαισίου O . . . . . . . . . . . . .
8.48 Σύνολο Δεδομένων 2 - Παράγοντας Α - Μεταβλητή Πλαισίου O . . . . . . . . . . . . .
8.49 Σύνολο Δεδομένων 3 - Παράγοντας Α - Μεταβλητή Πλαισίου O . . . . . . . . . . . . .
8.50 Σύνολο Δεδομένων 4 - Παράγοντας Α - Μεταβλητή Πλαισίου O . . . . . . . . . . . . .
8.51 Σύνολο Δεδομένων 5 - Παράγοντας Ενδιαφέροντος - Μεταβλητές Πλαισίου O και OO . .
8.52 Σύνολο Δεδομένων 6 - A και B (3 επαναλήψεις ανά θεραπεία) . . . . . . . . . . . . . .
8.53 Σύνολο Δεδομένων 7 - A και B (5 επαναλήψεις ανά θεραπεία) . . . . . . . . . . . . . .
205
Πίνακας Δεδομένων - 22 Παραγοντικό Πείραμα με n = 4 επαναλήψεις . . . . . . . . . .
Πίνακας Αλγεβρικών Προσήμων - 22 Παραγοντικό Πείραμα με n = 4 επαναλήψεις . . .
Πίνακας ANOVA - Παράδειγμα 22 Παραγοντικό Πείραμα με n = 4 επαναλήψεις . . . .
Θεραπείες στο 23 Παραγοντικό Πείραμα . . . . . . . . . . . . . . . . . . . . . . . . .
Πίνακας Αλγεβρικών Προσήμων στο 23 Παραγοντικό Πείραμα . . . . . . . . . . . . . .
Πίνακας Μεταβλητών Παλινδρόμησης στο 22 Παραγοντικό Πείραμα . . . . . . . . . . .
Πίνακας Μεταβλητών Παλινδρόμησης στο 23 Παραγοντικό Πείραμα . . . . . . . . . . .
Πίνακας Δεδομένων - Ανάλυση Παλινδρόμησης - 22 Παραγοντικό με 4 επαναλήψεις . . .
Συντελεστές Παλινδρόμησης - 22 Παραγοντικό Πείραμα . . . . . . . . . . . . . . . . .
Πίνακας Δεδομένων στο 23 Παραγοντικό Πείραμα με n = 2 επαναλήψεις . . . . . . . .
Συντελεστές Παλινδρόμησης - 23 Παραγοντικό Πείραμα . . . . . . . . . . . . . . . . .
Συντελεστές Παλινδρόμησης - 23 Παραγοντικό Πείραμα (Τροποποιημένο) . . . . . . . .
Πίνακας Αλγεβρικών Προσήμων στο 23 Παραγοντικό Πείραμα . . . . . . . . . . . . . .
Πίνακας Αλγεβρικών Προσήμων στο 23−1 Κλασματικό Παραγοντικό Πείραμα - 1η περίπτωση . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
235
238
239
240
241
242
243
244
244
246
247
247
249
9.1
9.2
9.3
9.4
9.5
9.6
9.7
9.8
9.9
9.10
9.11
9.12
9.13
9.14
206
207
208
208
209
210
211
211
212
213
214
215
216
217
219
220
221
222
223
223
224
225
225
227
227
228
228
228
228
229
229
250
xii
ΚΑΤΑΛΟΓΟΣ ΠΙΝΑΚΩΝ
9.15 Πίνακας Αλγεβρικών Προσήμων στο 23−1 Κλασματικό Παραγοντικό Πείραμα - 2η περίπτωση . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 250
9.16 Πίνακας Αλγεβρικών Προσήμων στο 23 Παραγοντικό Πείραμα - 3η περίπτωση . . . . . . 251
9.17 Παραλλαγές στο 23−1 Παραγοντικό Πείραμα - Προσδιορίζουσα I = AC . . . . . . . . 252
9.18 Παραλλαγές στο 23−1 Παραγοντικό Πείραμα - 4η περίπτωση - Προσδιορίζουσα I = ABC 252
9.19 Πίνακας Αλγεβρικών Προσήμων - Προσδιορίζουσα I = BCD . . . . . . . . . . . . . . 255
9.20 Θεραπείες - Προσδιορίζουσα I = BCD . . . . . . . . . . . . . . . . . . . . . . . . . 256
9.21 Θεραπείες - Προσδιορίζουσα I = BCD . . . . . . . . . . . . . . . . . . . . . . . . . 256
9.22 Παραλλαγές στο 24−1 Παραγοντικό Πείραμα - Προσδιορίζουσα I = BCD . . . . . . . 257
9.23 Πίνακας Αλγεβρικών Προσήμων - Προσδιορίζουσα I = ABCDE . . . . . . . . . . . 258
9.24 Πίνακας Αλγεβρικών Προσήμων - Προσδιορίζουσα I = ABCDE . . . . . . . . . . . 260
9.25 Πίνακας ANOVA - Παράδειγμα 25−1 Κλασματικό Παραγοντικό Πείραμα . . . . . . . . 260
9.26 Πίνακας ANOVA - 25−1 Κλασματικό Παραγοντικό Πείραμα με Αλληλεπιδράσεις . . . . 261
9.27 Πίνακας ANOVA - 25−1 Κλασματικό Παραγοντικό Πείραμα - Σημαντικές Κύριες Επιδράσεις 262
9.28 Εκτιμητές Συντελεστών Παλινδρόμησης & Επιδράσεων - 25−1 Κλασματικό Παραγοντικό
Πείραμα με Αλληλεπιδράσεις . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 262
9.29 Πίνακας Δεδομένων - Μονάδα Παραγωγής - n = 4 επαναλήψεις . . . . . . . . . . . . . 266
9.30 Πίνακας ANOVA - Μονάδα Παραγωγής . . . . . . . . . . . . . . . . . . . . . . . . . 267
9.31 Συντελεστές ANOVA - Μονάδα Παραγωγής . . . . . . . . . . . . . . . . . . . . . . . 268
9.32 Μέσες Τιμές Επιπέδων - Μονάδα Παραγωγής . . . . . . . . . . . . . . . . . . . . . . . 269
9.33 Πίνακας ANOVA - Σημαντικές Επιδράσεις - Μονάδα Παραγωγής . . . . . . . . . . . . 269
9.34 Κωδικοποίηση Επιπέδων Παραγόντων - Μονάδα Παραγωγής . . . . . . . . . . . . . . 271
9.35 Συντελεστές Παλινδρόμησης - Μονάδα Παραγωγής . . . . . . . . . . . . . . . . . . . 272
9.36 Συντελεστές Παλινδρόμησης - Σημαντικές Επιδράσεις - Μονάδα Παραγωγής . . . . . . 272
9.37 Πίνακας Αλγεβρικών Προσήμων - Μονάδα Παραγωγής - Προσδιορίζουσα I = ABCD . 274
9.38 24−1 Κλασματικός Σχεδιασμός - Προσδιορίζουσα I = ABCD . . . . . . . . . . . . . 275
9.39 24−1 Κλασματικός Σχεδιασμός - Παραλλαγές - Προσδιορίζουσα I = ABCD . . . . . . 276
9.40 Πίνακας Δεδομένων - Μονάδα Παραγωγής - 23 κλάσμα - Προσδιορίζουσα I = ABCD . 276
9.41 24−1 Κλασματικός Σχεδιασμός - ANOVA - Προσδιορίζουσα I = ABCD . . . . . . . . 277
9.42 Θεραπείες - Μονάδα Παραγωγής - Προσδιορίζουσα I = BCD . . . . . . . . . . . . . 278
9.43 Παραλλαγές στο 24−1 Παραγοντικό Πείραμα - Μονάδα Παραγωγής - Προσδιορίζουσα
I = BCD . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 279
9.44 24−1 Κλασματικός Σχεδιασμός - Προσδιορίζουσα I = BCD . . . . . . . . . . . . . . 280
9.45 24−1 Κλασματικός Σχεδιασμός - Παραλλαγές - Προσδιορίζουσα I = BCD . . . . . . . 281
9.46 24−1 Κλασματικός Σχεδιασμός - ANOVA Προσδιορίζουσα I = BCD . . . . . . . . . . 281
9.47 Συγκριτικός Πίνακας - Πλήρες Πείραμα και Κλασματικά Πειράματα . . . . . . . . . . . 282
9.48 Σύνολο Δεδομένων - Πέντε Παράγοντες . . . . . . . . . . . . . . . . . . . . . . . . . 284
10.1 Πίνακας Δεδομένων στο 32 Παραγοντικό Πείραμα με n = 1 . . . . . . . . . . . . . . .
10.2 Παλινδρόμηση - Εκτίμηση Συντελεστών - Παράδειγμα 32 Παραγοντικό Πείραμα . . . . .
10.3 Πίνακας ANOVA - Παλινδρόμηση - Παράδειγμα 32 Παραγοντικό Πείραμα . . . . . . .
10.4 Πίνακας Δεδομένων στο 32 Παραγοντικό Πείραμα με n = 2 επαναλήψεις . . . . . . . .
10.5 Παλινδρόμηση - Εκτίμηση Συντελεστών - Παράδειγμα 32 Παραγοντικό Πείραμα . . . . .
10.6 Πίνακας ANOVA Παλινδρόμηση - Παράδειγμα 32 Παραγοντικό Πείραμα . . . . . . . .
10.7 Πίνακας ANOVA - Διπαραγοντική Ανάλυση με Αλληλεπίδραση - 32 Παραγοντικό Πείραμα
10.8 Πίνακας Δεδομένων - Παράδειγμα Kruskal - Wallis . . . . . . . . . . . . . . . . . . .
10.9 Πίνακας Δεδομένων και Τάξεων - Παράδειγμα Kruskal - Wallis . . . . . . . . . . . . .
10.10 Αποτελέσματα Ελέγχου Kruskal-Wallis . . . . . . . . . . . . . . . . . . . . . . . . . .
10.11 Δεδομένα - Παράδειγμα Friedman . . . . . . . . . . . . . . . . . . . . . . . . . . . .
289
290
291
292
293
293
294
297
297
297
298
ΚΑΤΑΛΟΓΟΣ ΠΙΝΑΚΩΝ
xiii
10.12 Περιγραφικά Χαρακτηριστικά - Παράδειγμα Friedman . . . . . . . . . . . . . . . . . .
10.13 Αποτελέσματα Ελέγχου Friedman . . . . . . . . . . . . . . . . . . . . . . . . . . . .
10.14 Πίνακας ANCOVA . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
10.15 Πίνακας Δεδομένων - Πωλήσεις . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
10.16 Πίνακας ANCOVA - Πωλήσεις . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
10.17 Πίνακας ANCOVA - Πωλήσεις . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
10.18 Συντελεστές Προτύπου - Πωλήσεις . . . . . . . . . . . . . . . . . . . . . . . . . . . .
10.19 Πίνακας Αθροισμάτων Τετραγώνων - ANCOVA (2 παράγοντες, αλληλεπίδραση, 1 ομάδα)
299
299
302
304
304
305
305
306
11.1 Στοιχεία κανονικής μορφής γνωστών κατανομών . . . . . . . . . . . . . . . . . . . . . 312
11.2 Συνήθεις συναρτήσεις σύνδεσης γνωστών κατανομών . . . . . . . . . . . . . . . . . . . 313
11.3 Πιθανοφάνεια κορεσμένου γενικευμένου γραμμικού μοντέλου κάτω από διάφορες κατανομές 319
Α.1 3 × 3 Σχέδιο Λατινικού Τετραγώνου 1η περίπτωση . . . . . . . . . . . . . . . . . . . . 339
Α.2 3 × 3 Σχέδιο Λατινικού Τετραγώνου 2η περίπτωση . . . . . . . . . . . . . . . . . . . . 340
Α.3 Πίνακας ANOVA - Παράδειγμα 23 Παραγοντικό Πείραμα με n = 2 επαναλήψεις . . . . 340
Β.1
Β.2
Β.3
Β.4
Β.5
Β.6
Β.7
Β.8
Β.9
Β.10
Διακριτές κατανομές . . . . . . . . . . . . . . . .
Συνεχείς κατανομές . . . . . . . . . . . . . . . . .
Αθροιστική συνάρτηση τυπικής κανονικής κατανομής
Ποσοστιαία σημεία tn;α . . . . . . . . . . . . . . .
2
Ποσοστιαία σημεία Xn;α
. . . . . . . . . . . . . . .
Ποσοστιαία σημεία Fn,m;0.1 . . . . . . . . . . . .
Ποσοστιαία σημεία Fn,m;0.05 . . . . . . . . . . . .
Ποσοστιαία σημεία Fn,m;0.025 . . . . . . . . . . .
Ποσοστιαία σημεία Fn,m;0.01 . . . . . . . . . . . .
Ποσοστιαία σημεία Kolmogorov-Smirnov Dn (α) .
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
352
353
354
355
356
357
358
359
360
361
xiv
ΚΑΤΑΛΟΓΟΣ ΠΙΝΑΚΩΝ
ΠΙΝΑΚΑΣ ΣΥΝΤΟΜΕΥΣΕΩΝ - ΑΚΡΩΝΥΜΙΩΝ
xv
xvi
ΠΙΝΑΚΑΣ ΣΥΝΤΟΜΕΥΣΕΩΝ - ΑΚΡΩΝΥΜΙΩΝ
β.ε.
ΓΓΜ
ΓΜΜ
ΓΓΜΜ
Δ.Ε.
Δ.Π.
ΕΕΤ
ΕΜΠ
Θ.δ.ό.
ΣΣΕ
τ.μ.
A-D
AIC
ANOVA
BIC/SIC
BLUE
Cp
CL
FPE
IDE
K-S
K-W
LDL
LSD
MLE
OLS
P-P Plot
Q-Q Plot
SR
SR*
SRsemi
S-W
UDL
VIF
SSx
MSx
SSR/MSR
SSE/MSE
SSTO
SST /MST
SSPE/MSPE
SSLF/MSPLF
βαθμοί ελευθερίας
Γενικευμένα Γραμμικά Μοντέλα
Γραμικά Μικτά Μοντέλα
Γενικευμένα Γραμμικά Μικτά Μοντέλα
Διάστημα Εμπιστοσύνης
Διάστημα Πρόβλεψης
Εκτιμητής Ελαχίστων Τετραγώνων
Εκτιμητής Μεγίστης Πιθανοφάνειας
Θα δειχθεί ότι
Στατιστική Συνάρτηση Ελέγχου
Τυχαία Μεταβλητή
Anderson-Darling Test
Akaike Information Criterion
Analysis of Variance
Bayesian/Schwarz Information Criterion
Best Linear Unbiased Estimator
Mallows’ Criterion
Central Line
Final Prediction Error Criterion
Integrated Development Environment
Kolmogorov - Smirnov Test
Kruskal - Wallis Test
Lower Decision Limit
Least Significant Difference
Maximum Likelihood Estimator
Ordinary Least Squares (Estimator)
Probability-Probability Plot
Quantile-Quantile Plot
Standardized Residuals
Studentized Residuals
Semi-Studentized Residuals
Shapiro-Wilk Test
Upper Decision Limit
Variance Inflation Factor
Sum of Squares due to x (=A, B, AB, C, O)
Mean Squared Error due to x (=A, B, AB, C, O)
Sum of Squares due to Regression/Mean Square due to Regression
Sum of Squared Errors/Mean Squared Error
Total Sum of Squares
Sum of Squares due to Treatments /Mean Square due to Treatments
Sum of Squares of Pure Error /Mean Squared Pure Error
Sum of Squares of Lack-of-Fit /Mean Square Lack-of-Fit
ΠΡΟΛΟΓΟΣ
Το βιβλίο αυτό έχει στόχο να αποτελέσει διδακτικό εγχειρίδιο τόσο για φοιτητές των οποίων το αντικείμενο
σπουδών είναι η Στατιστική, ο Πειραματικός Σχεδιασμός και η Ανάλυση Δεδομένων, όσο και για φοιτητές
που σπουδάζουν επιστήμες όπου η Στατιστική αποτελεί βασικό εργαλείο (Στατιστικής) Ανάλυσης.
Σημειώνεται ότι το παρόν σύγγραμμα μπορεί να χρησιμοποιηθεί τόσο σε ανώτερο προπτυχιακό όσο και σε μεταπτυχιακό επίπεδο και προϋποθέτει βασικές γνώσεις στατιστικής συμπερασματολογίας (Εκτιμητική, Έλεγχοι Υποθέσεων, Διαστήματα Εμπιστοσύνης). Ταυτόχρονα, η χρησιμότητα του βιβλίου ξεπερνά τον ακαδημαϊκό χώρο και μπορεί να αποτελέσει χρήσιμο εργαλείο για τον Εφαρμοσμένο Ερευνητή (Practitioner) σε
πληθώρα επιστημονικών πεδίων όπου βρίσκει εφαρμογή η Στατιστική, συμπεριλαμβανομένης της Διοικητικής Επιστήμης, των Επιστημών Υγείας, των Κοινωνικο-Οικονομικών Επιστημών, των Επιστημών του Μηχανικού, των Γεωπονικών και Γεωφυσικών Επιστημών κ.ά.
Η συγγραφή του βιβλίου αυτού έχει βασιστεί στις διαλέξεις συναφών πανεπιστημιακών μαθημάτων του 1ου
και 2ου κύκλου σπουδών που οι συγγραφείς έχουν διδάξει στο Πανεπιστήμιο Maryland, στο Πανεπιστήμιο
Κύπρου, στο Ελληνικό Ανοικτό Πανεπιστήμιο και στο Πανεπιστήμιο Αιγαίου.
Η ύλη του συγγράμματος απλώνεται σε 11 κεφάλαια, εκ των οποίων τα πρώτα 6 αφορούν την Ανάλυση Παλινδρόμησης, τα επόμενα 4 την Ανάλυση Διακύμανσης και τον Σχεδιασμό & Ανάλυση Πειραμάτων και το
τελευταίο, τα Γενικευμένα Γραμμικά Μοντέλα. Κάθε κεφάλαιο συνοδεύεται από εφαρμογές στην R ή/και στο
Minitab, Ασκήσεις Αυτοαξιολόγησης, καθώς και Άλυτες Ασκήσεις οι οποίες στοχεύουν στην κάλυψη όλου
του εύρους της θεματολογίας που έχει αναπτυχθεί. Πολλά από τα δεδομένα των εφαρμογών, αλλά και των άλυτων ασκήσεων, αφορούν προβλήματα που έχουν τεθεί ως θέματα εργαστηριακών ή/και γραπτών εξετάσεων
σε διάφορα Πανεπιστήμια που δίδαξαν οι συγγραφείς. Στη βιβλιογραφία αναφέρονται οι σημαντικότερες ελληνόγλωσσες και ξενόγλωσσες πηγές που αφορούν το επιστημονικό πεδίο που πραγματεύεται το σύγγραμμα,
στις οποίες μπορεί να ανατρέξει ο αναγνώστης για περαιτέρω εμβάθυνση.
Σημαντικοί στατιστικοί πίνακες, απαραίτητοι για την εφαρμογή των τεχνικών και μεθόδων που καλύπτει
το σύγγραμμα, καθώς και μία εισαγωγή στην R και το Minitab, παρατίθενται στο Παράρτημα. Επιπλέον,
στο πλαίσιο του παρόντος εγχειριδίου κατασκευάστηκε ένα φιλικό προς τον χρήστη διαδικτυακό εργαλείο
εύρεσης ποσοστιαίων σημείων, καθώς και υπολογισμού πιθανοτήτων. Το link για το εργαλείο μπορείτε να το
βρείτε πατώντας εδώ.
xvii
xviii
ΠΡΟΛΟΓΟΣ
Οι συγγραφείς θα ήθελαν από τη θέση αυτή να ευχαριστήσουν όλους τους φοιτητές τους οποίους είχαν την
τύχη να γνωρίσουν μέσα από τις Πανεπιστημιακές διαλέξεις τους, όλα αυτά τα χρόνια, οι οποίοι συνέβαλαν
και συνεχίζουν να συμβάλλουν καθοριστικά στη διαμόρφωση της διδακτικής/παιδευτικής τους προσέγγισης.
Ιδιαίτερες ευχαριστίες απευθύνονται στη συνάδελφο κα Σόνια Μαλεφάκη, Καθηγήτρια του Πανεπιστημίου
Πατρών, για την κριτική ανάγνωση του συγγράμματος, στον συνάδελφο κο Χρήστο Χρήστου του Οργανισμού Ανοικτών Τεχνολογιών του Πανεπιστημίου Αιγαίου (fossaegean), για τη σχεδίαση και επιμέλεια του
εξωφύλλου αλλά και για τη συνεχή στήριξή του, καθώς και στη συνάδελφο κα Ευγενία Παξινού για τη γλωσσική επιμέλεια του συγγράμματος.
Παρά την προσεκτική ανάγνωση και επιμέλεια των κεφαλαίων, είναι πιθανό να υπάρχουν κάποια τυπογραφικά
ή/και άλλα λάθη. Για όποιες αστοχίες την ευθύνη φέρουμε ακέραια οι συγγραφείς, και παρακαλείστε να μας τις
υποδείξετε μαζί με όποια σχόλια ή εισηγήσεις, στις ηλεκτρονικές διευθύνσεις alex.karagrigoriou@gmail.com
και Burgundyekalligeres@gmail.com.
Τέλος, θα θέλαμε να συγχαρούμε την ομάδα του Έργου ΚΑΛΛΙΠΟΣ+ για την ιδέα και υλοποίηση της διεύρυνσης της βάσης Ανοικτών Ηλεκτρονικών Ακαδημαϊκών Συγγραμμάτων, καλύπτοντας μια τόσο ευρεία γκάμα
επιστημονικών πεδίων.
Αλέξανδρος Καραγρηγορίου & Εμμανουήλ Νεκτάριος Καλλιγέρης
Καρλόβασι, Σάμος, Ελλάδα
Μάιος, 2022
ΚΕΦΑΛΑΙΟ 1
ΕΙΣΑΓΩΓΗ ΣΤΗ ΣΤΑΤΙΣΤΙΚΗ ΑΝΑΛΥΣΗ
Σύνοψη
Το παρόν κεφάλαιο παρουσιάζει τον βασικό ορισμό, τη σημασία και τη χρησιμότητα της στατιστικής
ανάλυσης όσον αφορά τόσο τη στατιστική συμπερασματολογία όσο και τη στατιστική μοντελοποίηση.
Προαπαιτούμενη γνώση
Το κεφάλαιο προϋποθέτει τη γνώση και κατανόηση βασικών πιθανοθεωρητικών και στατιστικών όρων.
Προσδοκώμενα μαθησιακά αποτελέσματα
Μετά τη μελέτη του παρόντος κεφαλαίου ο αναγνώστης αναμένεται να:
• αντιλαμβάνεται τη σημασία και τη χρησιμότητα της στατιστικής ανάλυσης, καθώς και από τι
αυτή συνίσταται,
• αντιλαμβάνεται τις τρεις πτυχές της στατιστικής συμπερασματολογίας,
• αντιλαμβάνεται την ανάγκη μοντελοποίησης δηλαδή της επιλογής ενός κατάλληλου στατιστικού μοντέλου, μέσω της στατιστικής ανάλυσης.
Καραγρηγορίου, Α., & Καλλιγέρης, Ε. Ν. (�2023). «Γραμμικά Μοντέλα και Σχεδιασμός & Ανάλυση Πειραμάτων με Εφαρμογές
σε R και Minitab».
Αθήνα: Κάλλιπος, Ανοικτές Ακαδημαϊκές Εκδόσεις. http://dx.doi.org/10.57713/kallipos-70
Creative Commons Αναφορά Δημιουργού - Μη Εμπορική Χρήση - Παρόμοια Διανομή 4.0
2
ΕΙΣΑΓΩΓΗ ΣΤΗ ΣΤΑΤΙΣΤΙΚΗ ΑΝΑΛΥΣΗ
Η σημασία του όρου «ανάλυση» μπορεί να είναι αφηρημένη, όπως όταν αναφερόμαστε στην ανάλυση ενός
γεγονότος ή στην ανάλυση μιας υπόθεσης, ή μπορεί να έχει πιο συγκεκριμένη μορφή, όπως όταν αναφερόμαστε στη χημική ανάλυση, στη βιοϊατρική ανάλυση κτλ. Σε οποιαδήποτε όμως μορφή του, ο όρος «ανάλυση»
δηλώνει τη βαθύτερη κατανόηση κάποιου θέματος ή κάποιου φαινομένου, και μέσω αυτής την κατανόηση του
μηχανισμού που το διέπει, την εξαγωγή συμπερασμάτων ή πορισμάτων ή/και την αξιοποίησή τους για σκοπούς πρόβλεψης ή πρόγνωσης. Το βασικό πρόβλημα της όποιας ανάλυσης αφορά την αδυναμία του Ερευνητή
να αξιοποιήσει το σύνολο των μονάδων/στοιχείων (πληθυσμός) που θα μπορούσαν δυνητικά να ληφθούν
υπόψη για τη μελέτη του υπό εξέταση φαινομένου. Διέξοδο στην προαναφερθείσα αδυναμία, η οποία συχνά
έγκειται στην έλλειψη πόρων ή/και χρόνου, δίνει η Στατιστική επιτρέποντας την αξιοποίηση ενός κατάλληλου υποσυνόλου του πληθυσμού το οποίο, εφόσον είναι αξιόπιστο και αμερόληπτο και άρα αντιπροσωπευτικό
του πληθυσμού, αρκεί, ώστε να εξαχθούν συμπεράσματα τα οποία μπορούν να αναχθούν στον συνολικό πληθυσμό.
Ορισμός 1.1. Ως Στατιστική ορίζεται η Επιστήμη όπου διατυπώνονται τα αξιώματα και η μεθοδολογία που διέπουν:
α) τον σχεδιασμό και τον τρόπο συλλογής δεδομένων - πληροφοριών,
β) την οργάνωση, ταξινόμηση, κατανομή και ανάλυση δεδομένων και
γ) τη διατύπωση συμπερασμάτων και πορισμάτων, καθώς και τη λήψη αποφάσεων.
Η Στατιστική αποτελεί την επιστήμη που διέπει όλες τις πτυχές της στατιστικής ανάλυσης. Αν και για πολλά
χρόνια ήταν αποκλειστικά συνδεδεμένη με την ανάλυση δεδομένων, τους τελευταίους 2 αιώνες αναπτύχθηκε
ραγδαία για να ικανοποιήσει τις ανάγκες που δημιουργήθηκαν από τον σχεδιασμό, τη συλλογή, την οργάνωση και την ανάλυση των δεδομένων σχετικών με διάφορες ανθρώπινες ή μη δραστηριότητες. Σήμερα, μετά
τα γιγαντιαία βήματα του 20ού αιώνα, η Στατιστική καταπιάνεται με τον Σχεδιασμό Πειραμάτων (Design of
Experiments), την Περιγραφική Στατιστική (Descriptive Statistics) καθώς και τη Στατιστική Συμπερασματολογία (Inferential Statistics) για ένα σύνολο (Πληθυσμός). Για την επίτευξη των ανωτέρω, η Στατιστική
βασίζεται σε πληροφορίες που προέρχονται και συλλέγονται από ένα κατάλληλο υποσύνολο (Δείγμα) του
συνόλου, δηλαδή του πληθυσμού.
Η Στατιστική Συμπερασματολογία υποδιαιρείται σε τρεις κλάδους:
1. Εκτίμηση με Σημείο ή Σημειοεκτιμητική (Point Estimation) – Προσεγγιστικός υπολογισμός άγνωστων
ποσοτήτων ή χαρακτηριστικών (παραμέτρων) του πληθυσμού.
2. Εκτίμηση με Διάστημα (Interval Estimation)– Κατασκευή διαστημάτων εμπιστοσύνης τα οποία περιλαμβάνουν με μεγάλη πιθανότητα άγνωστες ποσότητες (χαρακτηριστικά) του πληθυσμού.
3. Έλεγχος Υποθέσεων (Hypotheses Testing)– Αποδοχή ή απόρριψη εικασιών σχετικών με άγνωστες
ποσότητες (χαρακτηριστικά) του υπό εξέταση πληθυσμού.
Μεταξύ των στόχων της Στατιστικής περιλαμβάνεται και ο προσδιορισμός του στατιστικού μοντέλου, δηλαδή
η αναζήτηση μιας μαθηματικής σχέσης (έστω προσεγγιστικής) που να αποτελεί τον μηχανισμό που παράγει
ένα φαινόμενο ή μια διεργασία και άρα τα σχετικά δεδομένα. Για παράδειγμα, σε πολλά πρακτικά προβλήματα
(όπως στη Διοικητική Επιστήμη, την Οικονομία, τη Μηχανολογία, τις Κοινωνικές και Πολιτικές Επιστήμες,
τις Επιστήμες Περιβάλλοντος και τις Γεωεπιστήμες, τις Βιολογικές Επιστήμες κλπ.) δύο ή και περισσότερες
μεταβλητές εμφανίζουν κάποιου είδους σχέση, που σε κάποιες περιπτώσεις μπορεί να είναι και έντονη. Στην
περίπτωση που μια από τις μεταβλητές είναι ιδιαίτερου ενδιαφέροντος, τότε μπορεί ο Ερευνητής να επιχειρήσει την αναζήτηση κατάλληλου μοντέλου το οποίο να εκμεταλλεύεται τη σχέση των εμπλεκόμενων μεταβλητών με σκοπό είτε να μπορέσει να περιγράψει όσο πιο αποτελεσματικά γίνεται το υπό εξέταση φαινόμενο (τη
ΓΡΑΜΜΙΚΑ ΜΟΝΤΕΛΑ ΚΑΙ ΣΧΕΔΙΑΣΜΟΣ & ΑΝΑΛΥΣΗ ΠΕΙΡΑΜΑΤΩΝ ΜΕ ΕΦΑΡΜΟΓΕΣ ΣΕ R ΚΑΙ MINITAB
3
μεταβλητή ενδιαφέροντος) είτε να προβεί σε προβλέψεις της μεταβλητής ενδιαφέροντος. Στις πλείστες των
περιπτώσεων, ο Ερευνητής αναζητά ένα απλό και ευέλικτο μοντέλο το οποίο να είναι εύκολα αξιοποιήσιμο
αλλά συγχρόνως να είναι σε θέση να ερμηνεύει ικανοποιητικά τα πειραματικά δεδομένα.
Ταυτόχρονα, στο πλαίσιο βελτιστοποίησης της μοντελοποίησης, συχνά αναγνωρίζονται νέες ελεγχόμενες
(προβλέπουσες) μεταβλητές (ποσοτικές ή μη) που αναφέρονται με τον όρο παράγοντες ή ανεξάρτητες μεταβλητές, και η εμπλοκή τους στην υπό εξέταση διεργασία επιδρά καθοριστικά στη μεταβλητή ενδιαφέροντος
ή μεταβλητή απόκρισης (εξαρτημένη μεταβλητή). Έτσι, συχνά απαιτείται ο σχεδιασμός κατάλληλων πειραμάτων που να λαμβάνουν υπόψη τους τις ελεγχόμενες αυτές μεταβλητές, με στόχο τον καθορισμό των κατάλληλων συνδυασμών των τιμών τους που θα οδηγήσουν στη βελτιστοποίηση της μεταβλητής απόκρισης
(μεγιστοποίηση επιθυμητής απόδοσης ή ελαχιστοποίηση μη αποδεκτής απόδοσης). Γενικά, η έννοια της μοντελοποίησης αφορά ένα σύνολο λειτουργιών (των εμπλεκόμενων παραγόντων) που συνδυάζονται ιδανικά
ώστε τα εισερχόμενα (input variables, ελεγχόμενες ή ανεξάρτητες μεταβλητές, παράγοντες) σε μια διεργασία να οδηγήσουν σε χρήσιμα εξερχόμενα (output variable, μεταβλητή απόκρισης). Θα πρέπει να τονιστεί
ότι αν προσεχθεί η φάση του πειραματικού σχεδιασμού τα οφέλη που θα προκύψουν μπορεί να είναι τεράστια.
Για τη μεγιστοποίηση των ωφελημάτων αρκεί να αξιοποιηθεί όλη η προτέρα γνώση ή αλλιώς όλη η διαθέσιμη
πληροφορία που συνήθως πρέπει να «εξαχθεί», και να αξιοποιηθεί από το σύνολο διαθέσιμων δεδομένων τα
οποία θα πρέπει να έχουν συλλεχθεί με τρόπο αξιόπιστο και έγκυρο και ταυτόχρονα να είναι τα κατάλληλα για
τη μελέτη του συγκεκριμένου προβλήματος. Σημειώνεται ότι η σαφής διατύπωση του προβλήματος και η εις
βάθος κατανόησή του, διευκολύνει τον σωστό σχεδιασμό και τη συλλογή των κατάλληλων δεδομένων, η ανάλυση των οποίων μπορεί να συμβάλει καθοριστικά στην αποτύπωση συμπερασμάτων με ουσιαστικά οφέλη. Η
αξιοποίηση της τεχνολογίας στην τρέχουσα εποχή των Μεγάλης Κλίμακας Δεδομένων (Big Data) διευρύνει
τις δυνατότητες του Ερευνητή ώστε αυτός να δύναται με προηγμένες τεχνικές να αξιοποιήσει τον τεράστιο
όγκο των διαθέσιμων δεδομένων και με την πληροφορία που θα συλλέξει από αυτά να βελτιώσει τη διαδικασία
μοντελοποίησης είτε αυτή απαιτείται για σκοπούς περιγραφής ενός φαινομένου ή μιας διεργασίας είτε αυτή
απαιτείται για σκοπούς πρόβλεψης.
Ανάμεσα στην πληθώρα τεχνικών και μεθόδων που είναι διαθέσιμες για τη Στατιστική Ανάλυση και την εύρεση ενός στατιστικού μοντέλου, περιλαμβάνονται η Ανάλυση Γραμμικής Παλινδρόμησης και ο Σχεδιασμός και
Ανάλυση Πειραμάτων (συμπεριλαμβανομένης και της Ανάλυσης Διακύμανσης), με τις οποίες και καταπιάνεται
το παρόν εγχειρίδιο. Οι στόχοι του εγχειριδίου περιλαμβάνουν:
(α) τη σκιαγράφηση της διερεύνησης σχέσεων μεταξύ χαρακτηριστικών ενός φαινομένου ή μιας διεργασίας, και της χρησιμότητας της ανάλυσης παλινδρόμησης, παρουσιάζοντας στην πράξη τα κύρια χαρακτηριστικά και τις εφαρμογές της στην πράξη,
(β) τη σκιαγράφηση της χρησιμότητας του πειραματικού σχεδιασμού, παρουσιάζοντας τα βασικά στοιχεία
και τις βασικές αρχές που διέπουν τα διάφορα πειραματικά σχέδια (πλάνα), συμπεριλαμβανομένης της
κλασικής Ανάλυσης Διακύμανσης.
Η ανάλυση παλινδρόμησης που αποτελεί το πρώτο μέρος του παρόντος συγγράμματος περιλαμβάνει τις μεθόδους και τεχνικές της Στατιστικής που αφορούν και σχετίζονται με τις σχέσεις μεταξύ μεταβλητών. Ταυτόχρονα, παρουσιάζονται και μελετώνται σε θεωρητικό και εφαρμοσμένο επίπεδο, τα πρότυπα (μοντέλα)
παλινδρόμησης που συνδέουν την τυχαία παρατήρηση της μεταβλητής απόκρισης με τους εμπλεκόμενους
παράγοντες και τα τυχαία σφάλματα. Τα πρότυπα αυτά είναι πιθανοτικά πρότυπα που αντικατοπτρίζουν την
αντίληψη που έχει ο Ερευνητής για τη σχέση μεταξύ των εμπλεκόμενων μεταβλητών είτε αυτή είναι ορατή και
προφανής είτε είναι λιγότερο προφανής, αλλά ο βαθμός σχέσης εκτιμάται/προσδοκάται ότι είναι σημαντικά
υψηλός.
Η ανάλυση διακύμανσης και ο σχεδιασμός πειραμάτων, που αποτελούν το δεύτερο και κυριότερο μέρος του
4
ΕΙΣΑΓΩΓΗ ΣΤΗ ΣΤΑΤΙΣΤΙΚΗ ΑΝΑΛΥΣΗ
παρόντος συγγράμματος, περιλαμβάνουν μια πλειάδα πειραματικών σχεδίων (δειγματοληπτικών πλάνων)
για κάλυψη όλων των δυνατών περιπτώσεων που μπορεί να χρειαστεί να εφαρμόσει ο Ερευνητής. Η ενότητα
περιλαμβάνει τις μεθόδους και τεχνικές της Στατιστικής για την ανάλυση των πειραματικών αυτών σχεδίων,
αναδεικνύοντας τις πρακτικές προεκτάσεις τους.
ΚΕΦΑΛΑΙΟ 2
ΑΠΛΗ ΓΡΑΜΜΙΚΗ ΠΑΛΙΝΔΡΟΜΗΣΗ
Σύνοψη
Το παρόν κεφάλαιο παρουσιάζει και μελετά το πρότυπο απλής γραμμικής παλινδρόμησης, καθώς και τις προϋποθέσεις που το διέπουν.
Προαπαιτούμενη γνώση
Το κεφάλαιο προϋποθέτει τη γνώση και την κατανόηση βασικών εννοιών στατιστικής συμπερασματολογίας, με έμφαση στην εκτιμητική και τους ελέγχους υποθέσεων.
Προσδοκώμενα μαθησιακά αποτελέσματα
Μετά τη μελέτη του παρόντος κεφαλαίου, ο αναγνώστης αναμένεται να:
• εφαρμόζει το απλό γραμμικό μοντέλο παλινδρόμησης και να αντιλαμβάνεται και να κατανοεί
τις προϋποθέσεις που πρέπει να πληρούνται για την εφαρμογή του,
• εκτιμά της αναγκαίες παραμέτρους συμπεριλαμβανομένης της κατασκευής διαστημάτων εμπιστοσύνης και της διεξαγωγής ελέγχων υποθέσεων,
• κατασκευάζει τον κατάλληλο πίνακα ανάλυσης διακύμανσης,
• υπολογίζει και να ερμηνεύει τη συσχέτιση μεταξύ των εμπλεκόμενων μεταβλητών και να σχεδιάζει το διάγραμμα διασποράς τους,
• να εφαρμόζει το πρότυπο απλής γραμμικής παλινδρόμησης με τη χρήση στατιστικών πακέτων.
Καραγρηγορίου, Α., & Καλλιγέρης, Ε. Ν. (�2023). «Γραμμικά Μοντέλα και Σχεδιασμός & Ανάλυση Πειραμάτων με Εφαρμογές
σε R και Minitab».
Αθήνα: Κάλλιπος, Ανοικτές Ακαδημαϊκές Εκδόσεις. http://dx.doi.org/10.57713/kallipos-70
Creative Commons Αναφορά Δημιουργού - Μη Εμπορική Χρήση - Παρόμοια Διανομή 4.0
6
ΑΠΛΗ ΓΡΑΜΜΙΚΗ ΠΑΛΙΝΔΡΟΜΗΣΗ
2.1 Εισαγωγή
Τα Γενικευμένα Γραμμικά Μοντέλα (ΓΓΜ) είναι μία περιοχή της Στατιστικής και αποτελούν τον πυρήνα ενός
από τα σημαντικότερα εργαλεία του Στατιστικού Ερευνητή, της Ανάλυσης Παλινδρόμησης (Regression Analysis). Ο όρος «παλινδρόμηση» χρεώνεται στον ανθρωπολόγο Sir Francis Galton (1822-1911) ο οποίος σε
μία μελέτη του το 1886 [21], έδειξε ότι το ύψος των ατόμων των οποίων οι γονείς είναι (πολύ) ψηλοί ή (πολύ)
κοντοί, τείνει («γυρνά πίσω», «παλινδρομεί») προς το μέσο ύψος του συνολικού πληθυσμού. Η Ανάλυση
Γραμμικής Παλινδρόμησης, με την οποία ασχολείται το παρόν κεφάλαιο, βασίζεται στα Γραμμικά Μοντέλα τα
οποία αποτελούν υποπερίπτωση των ΓΓΜ. Η παλινδρόμηση αποσκοπεί στη διερεύνηση της σχέσης μεταξύ
δύο ή περισσότερων μεταβλητών για σκοπούς εκτίμησης (προσέγγισης) ή/και πρόβλεψης των τιμών της μίας
μέσω των τιμών της άλλης (ή των άλλων).
2.2 Ευθεία παλινδρόμησης
Δύο είναι τα είδη των μεταβλητών που εμπλέκονται στην Ανάλυση Παλινδρόμησης:
α) οι ανεξάρτητες ή ελεγχόμενες ή επεξηγηματικές μεταβλητές ή συμμεταβλητές (independent ή input ή
explanatory variablesr ή covariates) και
β) οι εξαρτημένες μεταβλητές ή μεταβλητές απόκρισης (dependent variables ή response variables).
Στις πειραματικές ή παρεμβατικές έρευνες, ως ανεξάρτητη μεταβλητή X ορίζεται κάθε ελεγχόμενη μεταβλητή, δηλαδή κάθε μεταβλητή για την οποία ο Ερευνητής δύναται να επιλέξει/ορίσει τις τιμές που αυτή θα
λάβει (π.χ. το ύψος της θερμοκρασίας για την εκτέλεση ενός πειράματος ή μίας διεργασίας, η τιμή πώλησης
ενός προϊόντος ή μίας υπηρεσίας κ.ά.), ενώ ως εξαρτημένη μεταβλητή Y ορίζεται η μη ελεγχόμενη μεταβλητή, η τιμή της οποίας αποτελεί απόρροια της/των τιμής/ών που έχει/ουν επιλεγεί από τον Ερευνητή, για
την/τις ανεξάρτητη/τες μεταβλητή/τές (π.χ. η έκλυση ενέργειας κατά την εκτέλεση ενός πειράματος ή μίας
διεργασίας, οι πωλήσεις ενός προϊόντος ή μίας υπηρεσίας). Στην κατηγορία αυτή εμπίπτουν μεταξύ άλλων,
και οι κλινικές μελέτες (clinical trials).
Στις μη πειραματικές μελέτες ή μελέτες παρατήρησης, η ταξινόμηση των μεταβλητών σε ανεξάρτητες και
εξαρτημένες γενικώς δεν είναι ευδιάκριτη, διότι στις μελέτες αυτές όλες οι μεταβλητές είναι τυχαίες και άρα μη
ελεγχόμενες από τον Ερευνητή, ο οποίος δεν παρεμβαίνει στην εκτέλεση του πειράματος αλλά παρατηρεί και
καταγράφει (π.χ. το μορφωτικό επίπεδο και τον μισθό των εργαζομένων μίας μελέτης, το ποσοστό οξυγόνου
στο αίμα και το αν καπνίζουν ή όχι οι συμμετέχοντες σε μία έρευνα). Άρα, είναι σαφές ότι είναι στη διακριτική
ευχέρεια του Ερευνητή ποια μεταβλητή θα θεωρήσει ως εξαρτημένη και ποια/ες ως ανεξάρτητη/τες. Στην
κατηγορία αυτή περιλαμβάνονται μεταξύ άλλων οι μελέτες ασθενών μαρτύρων (case control studies).
Αν οι μεταβλητές συνδέονται με μία συναρτησιακή σχέση της μορφής y = f (x) ώστε για κάθε τιμή, έστω x,
που επιλέγει ο Ερευνητής για την X, να προσδιορίζεται με απόλυτη ακρίβεια (δηλαδή χωρίς σφάλμα) η Y ,
μέσω της γνωστής συναρτησιακής σχέσης f (·), οι δύο μεταβλητές έχουν μία αιτιοκρατική σχέση ή προσδιοριστική σχέση (deterministic), όπως για παράδειγμα συμβαίνει με τα λίτρα βενζίνης που απαιτούνται για να
γεμίσει το ρεζερβουάρ και το ποσό που καταβάλλει ο καταναλωτής στον βενζινοπώλη. Θα πρέπει μάλιστα να
σημειωθεί ότι, όσες φορές και να εκτελέσει ο Ερευνητής το πείραμα, επιλέγοντας την ίδια τιμή x για την ανεξάρτητη μεταβλητή X, η τιμή της εξαρτημένης μεταβλητής που θα προκύπτει, θα είναι η ίδια. Ως εκ τούτου,
στο Σκεδασμογράφημα, όλα τα ζεύγη παρατηρήσεων (x, y) θα είναι ακριβώς πάνω στην καμπύλη y = f (x).
Σημειώνεται ότι το Σκεδασμογράφημα ή Διάγραμμα Διασποράς (Scatter Plot) είναι η γραφική παράσταση των
διαθέσιμων παρατηρήσεων (xi , yi ), i = 1, ..., n, που μπορεί να καθορίσει μία ιδεατή καμπύλη (ή ειδικότερα
μία ευθεία) η οποία δίνει στην Ερευνητή μία γενική μορφή της σχέσης μεταξύ των εμπλεκόμενων μεταβλητών. Στην αντίπερα όχθη, οι μη προσδιοριστικές σχέσεις ονομάζονται στοχαστικές ( stochastic) ή πιθανοτικές
ΓΡΑΜΜΙΚΑ ΜΟΝΤΕΛΑ ΚΑΙ ΣΧΕΔΙΑΣΜΟΣ & ΑΝΑΛΥΣΗ ΠΕΙΡΑΜΑΤΩΝ ΜΕ ΕΦΑΡΜΟΓΕΣ ΣΕ R ΚΑΙ MINITAB
7
(probabilistic). Εδώ, αν εκτελεστεί το πείραμα πολλές φορές κάτω από τις ίδιες συνθήκες (δηλαδή για μία
συγκεκριμένη τιμή x της X), δεν προκύπτει μία κοινή, σταθερή τιμή y του Y , με αποτέλεσμα το σκεδασμογράφημα να θυμίζει ένα νεφέλωμα που αν και δίνει μία διάχυτη εικόνα, αυτή δεν αντιστοιχεί σε μία συγκεκριμένη
καμπύλη. Στο Σχήμα 2.1 παρουσιάζονται τρία Σκεδασμογραφήματα (με προσαρμογή της καταλληλότερης
καμπύλης) τα οποία αφορούν πιθανές μορφές συσχέτισης μεταξύ των X και Y .
Σχήμα 2.1: Σκεδασμογραφήματα πιθανών μορφών συσχέτισης μεταξύ X και Y .
Παράδειγμα 2.1. Για ένα πλήθος 10 μηνών, ο Πίνακας 2.1 δίνει τον αριθμό των τεμαχίων ενός συγκεκριμένου
ανταλλακτικού (X) που κατασκεύασε μία εταιρεία για καθέναν από τους 10 μήνες, καθώς και τον αριθμό των
εργατοωρών (Y ) που χρειάστηκαν κάθε φορά.
Πίνακας 2.1: Τιμές 10 ζευγών παρατηρήσεων (xi , yi ).
# ανά μήνα
X
Y
1
30
73
2
20
50
3
60
128
4
80
170
5
40
87
6
50
108
7
60
135
8
30
69
9
70
148
10
60
132
Τα ζεύγη των τιμών (xi , yi ), i = 1, ..., 10, δίνονται γραφικά στο Σχήμα 2.2(α) από όπου φαίνεται ότι
υπάρχει μία σχέση μεταξύ των μεταβλητών X και Y , υπό την έννοια ότι όταν αυξάνεται η τιμή της μίας, τότε
αυξάνεται και της άλλης. Είναι λοιπόν φανερό ότι η σχέση που συνδέει τις δύο μεταβλητές δεν είναι τέλεια,
αφού υπάρχει μία ελαφρά διακύμανση (σκεδασμός) των σημείων. Λόγω του παρατηρηθέντος σκεδασμού, το
Σχήμα 2.2(α) αναφέρεται ως Σκεδασμογράφημα ή Διάγραμμα Διασποράς (Scatter Plot). Ο παρατηρηθείς
σκεδασμός, που πιθανόν να οφείλεται σε εξωγενείς και συνήθως μη ελεγχόμενους παράγοντες, συχνά αναφέρεται στη βιβλιογραφία ως σφάλμα. Το Σχήμα 2.2(β) δείχνει τη σχέση μεταξύ των δύο μεταβλητών η οποία
περιγράφεται με μία ευθεία γραμμή.
Παρατηρούμε ότι τα περισσότερα σημεία βρίσκονται πάνω στην ευθεία που αντιπροσωπεύει τη (στατιστική)
σχέση μεταξύ X και Y , η οποία όμως μπορεί να αποδειχθεί πολύ χρήσιμη για την εξαγωγή κάποιων γενικών
συμπερασμάτων αναφορικά με το υπό μελέτη φαινόμενο.
8
ΑΠΛΗ ΓΡΑΜΜΙΚΗ ΠΑΛΙΝΔΡΟΜΗΣΗ
(α)
(β)
Σχήμα 2.2: Σκεδασμογράφημα των X και Y χωρίς (α) και με (β)προσαρμογή κατάλληλης καμπύλης.
Για τα περισσότερα φαινόμενα, η εύρεση της συναρτησιακής σχέσης που συνδέει τις μεταβλητές είναι αδύνατη,
αφού η σχέση αυτή είναι συνήθως πολύπλοκη. Για τον λόγο αυτό, επιδιώκεται ο προσδιορισμός της στατιστικής σχέσης που συνδέει τις μεταβλητές, δηλαδή η προσέγγιση της συναρτησιακής σχέσης μέσω ενός μαθηματικού μοντέλου παλινδρόμησης. Το μοντέλο αυτό, αν και ενδέχεται να μην έχει καμία φυσική σημασία, μπορεί να
αξιοποιηθεί για την εξαγωγή συμπερασμάτων αναφορικά με το φαινόμενο που μελετάται, καθώς και για σκοπούς πρόβλεψης. Ένα μοντέλο παλινδρόμησης (regression model) θα πρέπει να περιέχει τα δύο συστατικά
της στατιστικής σχέσης μεταξύ των μεταβλητών:
1. την τάση της εξαρτημένης μεταβλητής να μεταβάλλεται με έναν συστηματικό/μαθηματικό τρόπο σε
σχέση με την ανεξάρτητη/ες μεταβλητή/τές και
2. τον σκεδασμό (διασπορά) των παρατηρήσεων γύρω από την καμπύλη της στατιστικής σχέσης.
Από τα παραπάνω είναι φανερό ότι από τη μία πλευρά η εξαρτημένη μεταβλητή Y θα πρέπει να έχει κάποια
κατανομή για κάθε τιμή της ανεξάρτητης μεταβλητής X, ενώ από την άλλη, οι μέσες τιμές των κατανομών αυτών θα πρέπει να μεταβάλλονται σε σχέση με την ανεξάρτητη μεταβλητή X με έναν συστηματικό/μαθηματικό
τρόπο.
Το Σχήμα 2.3 δείχνει την κατανομή της Y για τρεις διαφορετικές τιμές της X του Παραδείγματος 2.1. Από
το ίδιο σχήμα, είναι φανερή η μαθηματική σχέση σύμφωνα με την οποία μεταβάλλονται οι μέσες τιμές των
κατανομών της Y σε σχέση με τη X. Η μαθηματική αυτή σχέση ονομάζεται συνάρτηση παλινδρόμησης (regression function) ή μοντέλο παλινδρόμησης της Y ως προς τη X, ενώ η γραφική της αναπαράσταση ονομάζεται καμπύλη παλινδρόμησης (regression line). Η συνάρτηση παλινδρόμησης μπορεί να είναι είτε γραμμική
(linear), όπως αυτή του Παραδείγματος 2.1, είτε μη γραμμική (non linear).
Εάν το μοντέλο παλινδρόμησης έχει περισσότερες από μία ανεξάρτητες μεταβλητές, τότε θα πρέπει να γίνει
αναγωγή των πιο πάνω όρων στον χώρο. Εάν για παράδειγμα, υπάρχουν δύο ανεξάρτητες μεταβλητές, τότε η
γραφική αναπαράσταση της μαθηματικής σχέσης, με την οποία μεταβάλλονται οι μέσες τιμές των κατανομών
της Y , ονομάζεται επιφάνεια παλινδρόμησης (regression surface).
ΓΡΑΜΜΙΚΑ ΜΟΝΤΕΛΑ ΚΑΙ ΣΧΕΔΙΑΣΜΟΣ & ΑΝΑΛΥΣΗ ΠΕΙΡΑΜΑΤΩΝ ΜΕ ΕΦΑΡΜΟΓΕΣ ΣΕ R ΚΑΙ MINITAB
9
Σχήμα 2.3: Κατανομή της Y για τρεις διαφορετικές τιμές της X.
Συμπερασματικά, και για την περίπτωση μίας ανεξάρτητης μεταβλητής, η ευθεία
y = β0 + β1 x,
(2.1)
με β0 , β1 ∈ R, δεν δύναται να περιγράψει ιδανικά τη σχέση των X και Y , αφού όπως ειπώθηκε παραπάνω,
αν το X λάβει δύο ή περισσότερες φορές την ίδια συγκεκριμένη τιμή x, το αποτέλεσμα, δηλαδή το y, δεν θα
είναι το ίδιο. Οι διαφορετικές τιμές του y ή αλλιώς ο σκεδασμός που παρατηρείται, μπορεί να οφείλονται σε
τυχαία σφάλματα μέτρησης.
Ως εκ τούτου, στην εξίσωση (2.1) προστίθεται ένας ακόμα όρος ο οποίος, για δεδομένη τιμή της X, μπορεί να περιγράψει τη διαφορά της παρατηρούμενης από τη θεωρητική τιμή της Y (δηλαδή β0 + β1 x που
θα έπρεπε να έχει λάβει, αν δεν υπήρχε το σφάλμα). H ποσότητα αυτή ονομάζεται στοχαστική διαταραχή ή
διαταρακτικός όρος ή σφάλμα, και ορίζεται ως:
ϵ = y − (β0 + β1 x)
και το αντίστοιχο στοχαστικό μοντέλο (πρότυπο) που είναι γνωστό ως Απλό Γραμμικό Μοντέλο Παλινδρόμησης (Simple Linear Regression Model):
y = β0 + β1 x + ϵ,
(2.2)
όπου y η τιμή της εξαρτημένης μεταβλητής (ή μεταβλητής απόκρισης) Y , x η τιμή της ανεξάρτητης μεταβλητής X, ε το τυχαίο σφάλμα και β0 και β1 οι συντελεστές παλινδρόμησης του μοντέλου.
10
ΑΠΛΗ ΓΡΑΜΜΙΚΗ ΠΑΛΙΝΔΡΟΜΗΣΗ
Σχήμα 2.4: Το Απλό Γραμμικό Μοντέλο Παλινδρόμησης.
Ένα από τα σημαντικότερα προβλήματα της ανάλυσης παλινδρόμησης, είναι η επιλογή των ανεξάρτητων μεταβλητών του μοντέλου παλινδρόμησης. Σε πολλές επιστημονικές περιοχές, όπως στις Κοινωνικο-Πολιτικές
Επιστήμες, είναι δύσκολο να επιλεγούν οι ανεξάρτητες μεταβλητές που επηρεάζουν την εξαρτημένη μεταβλητή Y . Υπάρχει μάλιστα πιθανότητα κάποιες από τις ανεξάρτητες μεταβλητές που πιστεύεται ότι πρέπει
να περιληφθούν στο παλινδρομικό μοντέλο, να μην μπορούν να μετρηθούν άμεσα (π.χ. τα ετήσια έσοδα μίας
οικογένειας σε 5 ή 10 χρόνια).
Στην ουσία, το κύριο πρόβλημα είναι η επιλογή ενός συνόλου ανεξάρτητων μεταβλητών το οποίο να είναι,
υπό κάποια έννοια, «κατάλληλο» για τους σκοπούς της μελέτης. Προφανώς, ένα τέτοιο σύνολο μπορεί να είναι πάρα πολύ μεγάλο. Παραδείγματος χάρη, οι πωλήσεις κινητών τηλεφώνων μίας εταιρείας σε μία περιοχή
μπορεί να εξαρτάται από το μέγεθος του πληθυσμού, το κατά κεφαλήν εισόδημα, το ποσοστό του πληθυσμού
συγκεκριμένης ηλικιακής ομάδας, το ποσοστό των οικογενειών με παιδιά στο σπίτι, κτλ. Για την επιλογή των
ανεξάρτητων μεταβλητών λαμβάνονται υπόψη η σημασία της υποψήφιας μεταβλητής για το υπό μελέτη φαινόμενο, καθώς και ο βαθμός που η συγκεκριμένη μεταβλητή επιδρά στη μείωση του σκεδασμού της Y , αφού
προηγουμένως ληφθεί υπόψη η επίδραση των άλλων μεταβλητών που ήδη έχουν επιλεγεί ως ανεξάρτητες
μεταβλητές του μοντέλου. H επιλογή των ανεξάρτητων μεταβλητών οδηγεί και στην επιλογή της συναρτησιακής μορφής του μοντέλου παλινδρόμησης.
Στον τομέα αυτό, ο Ερευνητής έχει στη διάθεσή του τεχνικές που αναφέρονται ως Κριτήρια Επιλογής Μοντέλου (Model Selection Criteria) και του επιτρέπουν να κάνει την καταλληλότερη επιλογή ανάλογα με τους
σκοπούς που έχει θέσει.
Η ανάλυση παλινδρόμησης επιτρέπει στον Ερευνητή είτε να περιγράψει (description) ένα φαινόμενο ή μία
διεργασία είτε να ελέγξει (control) ένα φαινόμενο είτε να κάνει προβλέψεις (predictions) αναφορικά με κάποιο φαινόμενο. Τα προαναφερθέντα αποτελούν τους κύριους σκοπούς που εξυπηρετεί η ανάλυση παλινδρόμησης. Σημειώνεται δε, ότι σε πολλές περιπτώσεις η μελέτη ενός μοντέλου παλινδρόμησης μπορεί να στοχεύει
και σε συνδυασμούς των παραπάνω κύριων σκοπών.
Παράδειγμα 2.2. Για ένα δείγμα 5 ατόμων καταγράφονται τα ετήσια έσοδα (Y ), ο αριθμός ετών εκπαίδευσης
(X1 ) και η ηλικία (X2 ) του καθενός. Τα δεδομένα xi1 , xi2 , yi , δίνονται στον Πίνακα 2.2.
ΓΡΑΜΜΙΚΑ ΜΟΝΤΕΛΑ ΚΑΙ ΣΧΕΔΙΑΣΜΟΣ & ΑΝΑΛΥΣΗ ΠΕΙΡΑΜΑΤΩΝ ΜΕ ΕΦΑΡΜΟΓΕΣ ΣΕ R ΚΑΙ MINITAB
11
Πίνακας 2.2: Τιμές 5 παρατηρήσεων (xi1 , xi2 , yi )
#
X1
X2
Y
1
6
28
10
2
12
40
20
3
10
32
17
4
8
36
12
5
9
34
11
Ο σκοπός του Παραδείγματος 2.2 είναι περιγραφικός, αφού επιδιώκεται η περιγραφή της (εξαρτημένης) μεταβλητής Y με τη βοήθεια κάποιων ανεξάρτητων μεταβλητών.
Παράδειγμα 2.3. Το μοντέλο παλινδρόμησης, που βασίζεται στα δεδομένα 67 αντιπροσωπειών μίας χρηματοοικονομικής εταιρείας, περιλαμβάνει το άμεσο κόστος λειτουργίας για όλο το έτος, ως την εξαρτημένη μεταβλητή Y ,
και τέσσερις ανεξάρτητες μεταβλητές: μέσο μέγεθος εκκρεμών δανείων, αριθμός εκκρεμών δανείων, αριθμός νέων
αιτήσεων για δανειοδότηση και κώδικας μισθολογικής κλίμακας.
Ο σκοπός του Παραδείγματος 2.3 είναι ο έλεγχος που επιδιώκει η διοίκηση της εταιρείας με στόχο τον καθορισμό κριτηρίων κόστους της κάθε αντιπροσωπείας.
Παράδειγμα 2.4. Τα παρακάτω δεδομένα έχουν εξαχθεί από ένα πολύ μεγαλύτερο σύνολο δεδομένων και δίνουν
τον βαθμό Y στο G.C.E. test (άριστα το 1000), τον βαθμό X1 στα υποχρεωτικά μέρη του G.C.E. (άριστα το 200)
και τον βαθμό X2 στο S.C.E.L. test (άριστα το 100) το οποίο δόθηκε σε προγενέστερο χρόνο.
Πίνακας 2.3: Τιμές 15 παρατηρήσεων (xi1 , xi2 , yi )
#
X1
X2
Y
1
111
68
476
2
92
46
457
3
90
50
540
4
107
59
551
5
98
50
575
6
150
66
698
11
130
57
634
7
118
54
545
12
118
51
637
8
110
51
574
13
91
44
390
9
117
59
645
14
118
61
562
10
94
97
556
15
109
66
560
Ο σκοπός του Παραδείγματος 2.4 είναι η δυνατότητα πρόβλεψης της βαθμολογίας στο G.C.E. test με βάση
τις βαθμολογίες στο υποχρεωτικό μέρος του G.C.E. και στο S.C.E.L. test.
Σε πολλές περιπτώσεις, η μελέτη ενός μοντέλου παλινδρόμησης μπορεί να στοχεύει και σε συνδυασμούς των
κύριων σκοπών που αναφέρθηκαν πιο πάνω. Για παράδειγμα, από τη στιγμή που θα κατασκευαστεί ένα μοντέλο για τα ετήσια έσοδα (Παράδειγμα 2.2), αυτό μπορεί να χρησιμοποιηθεί για να εκτιμηθούν τα ετήσια
έσοδα ατόμου συγκεκριμένης ηλικίας με συγκεκριμένα έτη σπουδών. Σχετικά με το Παράδειγμα 2.1, η γνώση
του μοντέλου παλινδρόμησης επιτρέπει την εκτίμηση των εργατοωρών που απαιτούνται για την παραγωγή
συγκεκριμένου αριθμού ανταλλακτικών. Επιπλέον, και αφού η παραγωγή ολοκληρωθεί, μπορούν να συγκριθούν οι εργατοώρες που τελικά απαιτήθηκαν με αυτές που εκτιμήθηκε ότι απαιτούνται για σκοπούς καθαρά
διοικητικού ελέγχου.
12
ΑΠΛΗ ΓΡΑΜΜΙΚΗ ΠΑΛΙΝΔΡΟΜΗΣΗ
2.3 Απλό γραμμικό μοντέλο και προϋποθέσεις
Η κύρια διαφορά μεταξύ ενός στοχαστικού και ενός αιτιοκρατικού μοντέλου (προτύπου), είναι ότι τα συμπεράσματα που διατυπώνονται στην περίπτωση του στοχαστικού μοντέλου λαμβάνουν υπόψη τους την αβεβαιότητα, τα σφάλματα ή αλλιώς την τυχαιότητα που υπάρχει στο υπό μελέτη φαινόμενο. Τα σφάλματα αυτά,
ως τυχαία, θα πρέπει να έχουν μία κατανομή. Αυτό συνεπάγεται ότι η Y θα μεταβάλλεται (τυχαία) ανάλογα
με τις τιμές της X, και άρα θα αποτελεί και αυτή, όπως και τα σφάλματα, μία τυχαία μεταβλητή και ως τέτοια
θα πρέπει να έχει μία κατανομή. Κατ’ αυτόν τον τρόπο, η Στατιστική εισέρχεται στη μελέτη ώστε να παίξει τον
δικό της καθοριστικό ρόλο.
Υποθέσεις για την τυχαία μεταβλητή ϵ:
1. έχει σταθερή μέση τιμή (E(ϵ) = 0) και σταθερή διασπορά σ 2 , δηλαδή υπάρχει ομοσκεδαστικότητα
(V ar(ϵ) = E(ϵ2 ) = σ 2 ),
2. για τυχαίο δείγμα ϵ1 , ϵ2 , ..., ϵn , τα σφάλματα είναι μεταξύ τους ασυσχέτιστα ανά δύο, δηλαδή cov(ϵi , ϵj )i̸=j =
0 και
3. (προαιρετική) ακολουθεί την Κανονική κατανομή με μέση τιμή και διασπορά όπως στην Υπόθεση 1.
Οι παραπάνω υποθέσεις μπορούν να συνοψιστούν ως εξής:
i.i.d.
ϵi ∼ N (0, σ 2 ),
i = 1, ..., n.
Ως συνέπεια των προαναφερθεισών υποθέσεων και για την περίπτωση του απλού γραμμικού μοντέλου παλινδρόμησης όπως αυτό παρουσιάζεται στη σχέση (2.2), προκύπτει ότι:
i.i.d.
Y ≡ Y |X = x ∼ N (β0 + β1 x, σ 2 ),
(2.3)
αφού η Y αποτελεί: (1) συνάρτηση της τυχαίας μεταβλητής ϵ και (2) δεσμευμένη τυχαία μεταβλητή ως προς
X = x.
Σχήμα 2.5: Το απλό γραμμικό μοντέλο παλινδρόμησης
ΓΡΑΜΜΙΚΑ ΜΟΝΤΕΛΑ ΚΑΙ ΣΧΕΔΙΑΣΜΟΣ & ΑΝΑΛΥΣΗ ΠΕΙΡΑΜΑΤΩΝ ΜΕ ΕΦΑΡΜΟΓΕΣ ΣΕ R ΚΑΙ MINITAB
13
Ο προφανής στόχος του Ερευνητή είναι ο προσδιορισμός των εκτιμητών, έστω αυτοί βˆ0 , βˆ1 και σ̂ 2 , των παραμέτρων β0 , β1 και σ 2 αντίστοιχα, ώστε στη συνέχεια να είναι δυνατή η αξιοποίηση του μοντέλου, π.χ. για
σκοπούς πρόβλεψης. Προφανώς, οι εν λόγω εκτιμήσεις θα γίνουν με τη βοήθεια διαθέσιμων παρατηρήσεων
έστω (x1 , y1 ), (x2 , y2 ), ..., (xn , yn ).
Αναδιατυπώνοντας τη σχέση (2.2) με τη βοήθεια των διαθέσιμων παρατηρήσεων, έχουμε:
yi = β0 + β1 xi + ϵi ,
i = 1, ..., n.
Διαθέτοντας τα βˆ0 και βˆ1 , είναι δυνατόν για οποιαδήποτε τιμή της X να προσεγγιστεί (εκτιμηθεί) η τιμή της
Y μέσω της σχέσης:
ŷi = βˆ0 + βˆ1 xi ,
(2.4)
για τα διαθέσιμα δεδομένα x1 , ..., xn , καθώς και να προβλεφθεί η τιμή της μεταβλητής απόκρισης για οποιαδήποτε άλλη εύλογη τιμή xh της ανεξάρτητης μεταβλητής X, από τη σχέση:
ŷh = βˆ0 + βˆ1 xh .
Η πιο πάνω σχέση ονομάζεται εκτιμήτρια συνάρτηση (ή ευθεία) παλινδρόμησης (estimated regression
function) και αποτελεί εκτίμηση/προσέγγιση εκείνης της συνάρτησης που περιγράφει με τον ιδανικότερο
τρόπο (με βάση το κριτήριο/μέθοδο που έχει επιλεγεί για τον προσδιορισμό των εκτιμητών), τη συμπεριφορά των δεδομένων.
Όσον αφορά το σ̂ 2 , αυτό θα χρησιμοποιηθεί ώστε να διαπιστωθεί ο βαθμός ορθότητας (ακρίβειας) της εκτίμησης της μεταβλητής απόκρισης Y και κατ’ επέκταση των εκτιμητριών των παραμέτρων β0 και β1 .
Αφού στην πιο πάνω σχέση τα σφάλματα ϵi είναι μη παρατηρήσιμα, είναι αναμενόμενο η ποσότητα β̂0 + β̂1 xi
να μην ισούται με την παρατηρηθείσα τιμή yi που αντιστοιχεί στην τιμή xi της ανεξάρτητης μεταβλητής Xi ,
αλλά με μία τιμή που αναμένεται να είναι αρκετά κοντά στο yi και η οποία συμβολίζεται, όπως δηλώνεται και
στην ίδια τη σχέση, με ŷi . Έτσι προκύπτουν οι διαφορές:
ε̂i = yi − ŷi = β0 − β̂0 + β1 − β̂1 xi ,
i = 1, ..., n,
(2.5)
που ονομάζονται κατάλοιπα (residuals)και αντιπροσωπεύουν ένα είδος εκτίμησης ή προσέγγισης των (μη
παρατηρούμενων) σφαλμάτων ϵi τα οποία είναι μη παρατηρήσιμα, i = 1, ..., n (για τις ιδιότητές του, δείτε
το Θεώρημα 2.2).
Πέρα από την εύρεση του κατάλληλου μοντέλου στο οποίο καταλήγει ο Ερευνητής μέσω των τεχνικών και
των μεθόδων της Στατιστικής, θα χρειαστεί να ληφθούν υπόψη και τα ακόλουθα:
α) Ένα στατιστικό μοντέλο συνήθως περιλαμβάνει σημαντικές παραμέτρους που παίζουν καθοριστικό ρόλο.
Ο προσδιορισμός του ζητούμενου μοντέλου είναι ταυτόσημος με την εκτίμηση των εν λόγω παραμέτρων. Σε κάθε υπό εξέταση φαινόμενο, ο Ερευνητής δύναται να θεωρήσει κάποιες από τις παραμέτρους ως «άμεσου ενδιαφέροντος», ενώ κάποιες άλλες όχι. Οι παράμετροι οι οποίες δεν θεωρούνται
«άμεσου ενδιαφέροντος» αναφέρονται ως οχληρές (nuisance parameters).
β) To στατιστικό μοντέλο ενδέχεται να επιδέχεται αναθεώρηση.
Πολλές φορές οι κατάλληλες πληροφορίες δεν είναι διαθέσιμες, και ως αποτέλεσμα η εύρεση του κατάλληλου μοντέλου καθίσταται μία απαιτητική διαδικασία, αφού ο Ερευνητής μπορεί να ξεκινήσει με
κάποιο αρχικό - λογικό μοντέλο, αλλά στη συνέχεια να προβεί σε τροποποιήσεις αν διαπιστωθεί ότι
η ορθότητα του μοντέλου είναι επισφαλής. Βέβαια υπάρχουν περιπτώσεις όπου θεωρητικά αποτελέσματα ή προτέρα εμπειρία καθιστούν την εύρεση του μοντέλου μία «εύκολη υπόθεση».
14
ΑΠΛΗ ΓΡΑΜΜΙΚΗ ΠΑΛΙΝΔΡΟΜΗΣΗ
2.4 Εκτιμητές ελαχίστων τετραγώνων
Έχοντας n ζεύγη παρατηρήσεων (x1 , y1 ), (x2 , y2 ), ..., (xn , yn ), και θεωρώντας ότι το γραμμικό μοντέλο
παλινδρόμησης (2.2) είναι κατάλληλο για να εκφράσει τη σχέση μεταξύ των μεταβλητών Y και X, είναι
δυνατόν, με τη χρήση της Μεθόδου Ελαχίστων Τετραγώνων (Least Squares Method), να υπολογιστούν οι
λεγόμενοι Συνήθεις Εκτιμητές Ελαχίστων Τετραγώνων (ΕΕΤ, Ordinary Least Squares (OLS) Estimators)
β̂0 και β̂1 των άγνωστων παραμέτρων (συντελεστών παλινδρόμησης) β0 και β1 . Στο Σχήμα 2.6 δίνονται τα
δεδομένα (xi , yi ), η συνάρτηση παλινδρόμησης E (Yi ) = β0 + β1 xi , καθώς και οι αποκλίσεις των παραχωρηθεισών τιμών yi από τις αναμενόμενες (από τη συνάρτηση παλινδρόμησης) τιμές E (Yi ).
Σχήμα 2.6: Σφάλματα (αποστάσεις) μεταξύ παρατηρήσεων και ευθείας παλινδρόμησης
Σε ό,τι ακολουθεί θεωρούμε ότι πληρούνται οι Υποθέσεις 1 και 2 της Ενότητας 2.3.
Πρόταση 2.1. Οι εκτιμήτριες ελαχίστων τετραγώνων (ΕΕΤ) των παραμέτρων β0 και β1 του μοντέλου (2.2),
δίνονται από τις σχέσεις:
Pn
β̂1 =
i=1 xi yi −
Pn
i=1
όπου:
• x̄ =
• ȳ =
Pn
i=1
xi
i=1
n
yi
x2i −
Pn
y
xi
i=1 i
Pn n 2
( i=1 xi )
n
i=1
και β̂0 = ȳ − β̂1 x̄,
(2.6)
και
n
Pn
Pn
.
Απόδειξη Πρότασης 2.1. Έστω Q(·) η ποσότητα (quantity) που αντιπροσωπεύει το άθροισμα των τετραγωνικών σφαλμάτων, η οποία περιλαμβάνει ταυτόχρονα τα β0 και β1 :
Q(β0 , β1 ) =
n
X
i=1
ϵ2i =
n
X
i=1
(yi − E(Yi ))2 =
n
X
(yi − (β0 + β1 xi ))2 .
(2.7)
i=1
Για την ελαχιστοποίηση της σχέσης (2.7) ως προς β0 και β1 , παραγωγίζουμε, αντίστοιχα:
n
n
n
X
X
X
∂Q(β0 , β1 )
= −2 (yi − (β0 + β1 xi )) = −2
yi + 2 (β0 + β1 xi ),
∂β0
i=1
i=1
i=1
και
(2.8)
ΓΡΑΜΜΙΚΑ ΜΟΝΤΕΛΑ ΚΑΙ ΣΧΕΔΙΑΣΜΟΣ & ΑΝΑΛΥΣΗ ΠΕΙΡΑΜΑΤΩΝ ΜΕ ΕΦΑΡΜΟΓΕΣ ΣΕ R ΚΑΙ MINITAB
n
n
n
X
X
X
∂Q(β0 , β1 )
= −2
xi (yi − (β0 + β1 xi )) = −2
xi y i + 2
xi (β0 + β1 xi ).
∂β1
i=1
i=1
i=1
15
(2.9)
Θέτοντας τις σχέσεις (2.8) και (2.9) ίσες με το μηδέν, και λύνοντάς τες ως προς yi , καταλήγουμε στις κανονικές
εξισώσεις (normal equations):
n
X
yi =
n
X
i=1
n
X
(β0 + β1 xi ) = nβ0 + β1
n
X
i=1
xi y i =
i=1
n
X
xi
(2.10)
i=1
xi (β0 + β1 xi ) = β0
i=1
n
X
xi + β1
i=1
n
X
x2i .
(2.11)
i=1
Πολλαπλασιάζοντας τη σχέση (2.10) με x̄ και αφαιρώντας την από τη σχέση (2.11), έχουμε:
n
X
Pn
Pn
xi y i −
i=1
i=1
xi
n
i=1
yi
= β1
" n
X
x2i
−
Pn
(
i=1
Sxy
≡
Sxx
Pn
i=1
xi y i −
Pn
i=1
Pn
=
#
n
i=1
⇔ β̂1 =
xi )2
i=1 (xi − x̄)(yi −
Pn
2
i=1 (xi − x̄)
ȳ)
Pn
Pn
xi
y
i=1 i
n
Pn
( i=1 xi )2
n
i=1
x2i −
Pn
(xi − x̄)yi
.
2
i=1 (xi − x̄)
= Pi=1
n
Λύνοντας τη σχέση (2.10) ως προς β0 , προκύπτει ότι:
β̂0 = ȳ − β̂1 x̄.
Μένει να δειχτεί ότι η ποσότητα Q(β0 , β1 ), λαμβάνει ελάχιστο στο σημείο (β̂0 , β̂1 ). Για να συμβεί αυτό, θα πρέπει
ο πίνακας H των δεύτερων μερικών παραγώγων της Q, να είναι θετικά ορισμένος (δηλαδή x′ Qx > 0, ∀x ∈ Rn ).
Οπότε, αρκεί να δειχθεί ότι (ν.δ.ό.) η ορίζουσα του πίνακα H είναι θετική:
|H| =
∂ 2 Q(β0 ,β1 )
∂β02
∂ 2 Q(β0 ,β1 )
∂β0 ∂β1
2n
=
∂ 2 Q(β0 ,β1 )
∂β1 ∂β0
∂ 2 Q(β0 ,β1 )
∂β12
(β̂0 ,β̂1 )
2
Pn
i=1
2
xi 2
Pn
i=1
Pn
i=1
xi
= 4n
x2i
n
X
(xi − x̄)2 ,
i=1
το οποίο είναι πάντα θετικό και συνεπώς, λαμβάνουμε ελάχιστο στο σημείο (β̂0 , β̂1 ).
Οι εκτιμητές β̂0 και β̂1 ονομάζονται εκτιμητές ελαχίστων τετραγώνων (ΕΕΤ) των παραμέτρων β0 και β1 ,
αντίστοιχα και ερμηνεύονται ως εξής:
• β̂0 : Εκτιμά τη μέση (αναμενόμενη) τιμή της , όταν η X = 0 (με την προϋπόθεση ότι η τιμή X = 0
περιλαμβανόταν μεταξύ των παρατηρήσεων βάσει των οποίων προσδιορίστηκε η εκτιμήτρια ευθεία
παλινδρόμησης).
• β̂1 : Εκτιμά τη μεταβολή της μέσης τιμής της για κάθε μοναδιαία αύξηση της τιμής της x.
16
ΑΠΛΗ ΓΡΑΜΜΙΚΗ ΠΑΛΙΝΔΡΟΜΗΣΗ
Παράδειγμα 2.5. Για το γραμμικό μοντέλο του Παραδείγματος 2.1 και με τη βοήθεια των τύπων της (2.6),
προκύπτει ότι:
β̂1 = 2 και β̂0 = 10.
Ως εκ τούτου, η εκτιμώμενη συνάρτηση παλινδρόμησης είναι η ακόλουθη:
ŷi = 10 + 2xi ,
i = 1, ..., 10.
Έστω ότι ενδιαφερόμαστε για τον μέσο αριθμό εργατοωρών που απαιτούνται για την παραγωγή x0 = 55 ανταλλακτικών. Τότε, η εκτιμήτρια ποσότητα ισούται με:
ŷ0 = 10 + 2 · 55 = 120.
Η τιμή ŷi που αντιστοιχεί στην τιμή της ανεξάρτητης μεταβλητής X = xi των δεδομένων, υπολογίζεται από την
εκτιμήτρια συνάρτηση παλινδρόμησης και ονομάζεται εκτιμώμενη τιμή (fitted value) της εξαρτημένης μεταβλητής
Y.
Πρόταση 2.2. Οι ΕΕΤ γράφονται ως γραμμικοί συνδυασμοί των παρατηρήσεων yi :
β̂1 =
n
X
ki yi
(2.12)
i=1
β̂0 =
n X
1
n
i=1
− ki x̄ yi ,
(2.13)
−x̄
όπου ki = Pn xi(x
2.
i −x̄)
i=1
Απόδειξη Πρότασης 2.2. Παρατηρούμε ότι:
n
X
(xi − x̄)(yi − ȳ) =
Pn
i=1 (xi
− x̄) =
(xi − x̄)yi −
Pn
i=1
n
X
(xi − x̄)ȳ
i=1
i=1
i=1
Όμως,
n
X
xi − nx̄ = 0. Άρα,
n
X
(xi − x̄)(yi − ȳ) =
i=1
n
X
(xi − x̄)yi .
i=1
Κατά συνέπεια, η εκτιμήτρια β̂1 παίρνει τη μορφή:
β̂1 =
n
X
i=1
!
n
X
(xi − x̄)
y
=
ki y i .
Pn
i
2
i=1 (xi − x̄)
i=1
Ομοίως, και η απόδειξη για το β̂0 .
Πρόταση 2.3. Οι τυχαίες μεταβλητές (τ.μ.) Ȳ = ȳ και β̂1 είναι μεταξύ τους ασυσχέτιστες, δηλαδή:
Cov(ȳ, β̂1 ) = 0.
(2.14)
ΓΡΑΜΜΙΚΑ ΜΟΝΤΕΛΑ ΚΑΙ ΣΧΕΔΙΑΣΜΟΣ & ΑΝΑΛΥΣΗ ΠΕΙΡΑΜΑΤΩΝ ΜΕ ΕΦΑΡΜΟΓΕΣ ΣΕ R ΚΑΙ MINITAB
17
Απόδειξη Πρότασης 2.3.
P
n
i=1
Cov(ȳ, β̂1 ) = Cov 
n

n
yi X
,
kj yj 
j=1
n X
n
n
X
1X
1
=
kj Cov(Yi , Yj ) =
ki V ar(Yi )
n i=1 j=1
i=1 n
P
σ 2 ni=1 (xi − x̄)
=
= 0.
P
n ni=1 (xi − x̄)2
Πρόταση 2.4. Βασιζόμενοι στις Υποθέσεις 1 και 2 (Ενότητα 2.3), για τα σφάλματα ισχύει ότι:
σ2
2
i=1 (xi − x̄)
& V ar(β̂1 ) = Pn
E(β̂1 ) = β1
E(β̂0 ) = β0
& V ar(β̂0 ) = σ
(2.15)
1
x̄2
+ Pn
2
n
i=1 (xi − x̄)
2
!
(2.16)
σ2
Cov(β̂0 , β̂1 ) = −x̄ Pn
.
2
i=1 (xi − x̄)
Απόδειξη Πρότασης 2.4. Από τους ορισμούς της μέσης τιμής και της διασποράς, για το β̂1 έχουμε:
n
X
E(β̂1 ) = E
!
ki yi =
=
Pn
i=1 (xi
Pn
=
β1 (
n
X
n
X
i=1
!
xi − x̄
(β0 + β1 xi )
Pn
2
i=1 (xi − x̄)
P
− x̄) + β1 ni=1 (xi − x̄)xi
Pn
2
i=1 (xi − x̄)
i=1 (xi
V ar(β̂1 ) = V ar
ki E(Yi ) =
i=1
i=1
β0
n
X
P
P
n
2
− x̄)xi − ni=1 (xi − x̄)x̄)
i=1 (xi − x̄)
=
β
= β1 .
Pn
1 Pn
2
2
i=1 (xi − x̄)
i=1 (xi − x̄)
!
ki yi =
i=1
n
X
ki2 V ar(Yi ) =
i=1
n
X
i=1
xi − x̄
Pn
2
i=1 (xi − x̄)
Pn
(xi − x̄)2 2
σ2
σ
=
= Pni=1
.
P
n
2
( i=1 (xi − x̄)2 )2
i=1 (xi − x̄)
Αντιστοίχως για το β̂0 έχουμε:
E(β̂0 ) = E
n X
1
i=1
n
!
− ki x̄ yi =
n X
1
i=1
n
− ki x̄ E(Yi )
!2
σ2
18
ΑΠΛΗ ΓΡΑΜΜΙΚΗ ΠΑΛΙΝΔΡΟΜΗΣΗ
=
n
X
i=1
= β0
!
1
xi − x̄
− Pn
x̄ (β0 + β1 xi )
2
n
i=1 (xi − x̄)
n
X
i=1
!
!
n
X
xi − x̄
xi − x̄
1
1
− Pn
−
x̄
+
β
x̄ xi
P
1
n
2
2
n
i=1 (xi − x̄)
i=1 (xi − x̄)
i=1 n
Pn
! !
P
n
i=1 (xi − x̄)xi −
i=1 (xi − x̄)x̄
x̄
Pn
2
i=1 (xi − x̄)
= β0 + β1 x̄ −
= β0 + β1 (x̄ − x̄) = β0 .
V ar(β̂0 ) = V ar
n X
1
n
i=1
=
n
X
i=1
=
n
X
i=1
!
− ki x̄ yi =
=σ
n
i=1
− ki x̄
2
V ar(Yi )
! !2
1
xi − x̄
x̄
− Pn
2
n
i=1 (xi − x̄)
σ2
!
2x̄(xi − x̄)
x̄2 (xi − x̄)2
1
2
−
+
P
P
n
2 σ
n
2
2
2
n
( i=1 (xi − x̄) )
i=1 (xi − x̄)
P
2
n X
1
1 x̄2 ni=1 (xi − x̄)2
− P
n ( ni=1 (xi − x̄)2 )2
!
!
=σ
2
1
x̄2
− Pn
.
2
n
i=1 (xi − x̄)
Τέλος, για τη συνδιασπορά των β̂0 και β̂1 έχουμε:
Cov β̂0 , β̂1 = Cov ȳ − β̂1 x̄, β̂1
= Cov ȳ, β̂1 − Cov β̂1 x̄, β̂1
από Πρόταση 2.3
====
−x̄Cov β̂1 , β̂1
= −x̄V ar β̂1
σ2
.
2
i=1 (xi − x̄)
= −x̄ Pn
Από τις σχέσεις (2.15) και (2.16) γίνεται αντιληπτό ότι τα β̂0 και β̂1 αποτελούν αμερόληπτες εκτιμήσεις των
β0 και β1 , αντίστοιχα. Παράλληλα, παρατηρούμε από την Πρόταση 2.4 ότι:
β̂0 + β̂1 x = β0 + β1 x ≡ E(Y )
(2.17)
έτσι ώστε η τυχαία μεταβλητή β̂0 + β̂1 x να αποτελεί αμερόληπτη εκτιμήτρια της μέσης τιμής της μεταβλητής
απόκρισης y:
\
E
(Y ) = β̂0 + β̂1 x ≡ ŷ.
(2.18)
ΓΡΑΜΜΙΚΑ ΜΟΝΤΕΛΑ ΚΑΙ ΣΧΕΔΙΑΣΜΟΣ & ΑΝΑΛΥΣΗ ΠΕΙΡΑΜΑΤΩΝ ΜΕ ΕΦΑΡΜΟΓΕΣ ΣΕ R ΚΑΙ MINITAB
19
2.5 Το θεώρημα Gauss-Markov
Οι ΕΕΤ β̂0 και β̂1 είναι οι καλύτεροι γραμμικοί αμερόληπτοι εκτιμητές των β0 και β1 , αντίστοιχα, βάσει του
θεωρήματος Gauss − M arkov το οποίο ακολουθεί.
Θεώρημα 2.1 (Gauss-Markov [21]). Κάτω από τις Υποθέσεις 1 και 2, οι ΕΕΤ β̂0 και β̂1 είναι οι Καλύτερες
Γραμμικά Αμερόληπτες Εκτιμήσεις (BLUE–Βest Linear Unbiased Estimators) των συντελεστών παλινδρόμησης
β0 και β1 αντίστοιχα, του μοντέλου παλινδρόμησης (2.2).
Απόδειξη Θεωρήματος 2.1. Από την Πρόταση 2.4 γνωρίζουμε ότι το β̂1 αποτελεί αμερόληπτη εκτιμήτρια του
β1 . Θα δείξουμε ότι (θ.δ.ό.) ο β̂1 έχει τη μικρότερη διασπορά μεταξύ όλων των γραμμικών αμερόληπτων εκτιμητριών της μορφής:
β̃1 =
n
X
ci yi .
i=1
Αρχικώς, πρέπει ν.δ.ό. το β̃1 αποτελεί αμερόληπτη εκτιμήτρια του συντελεστή παλινδρόμησης β1 :
n
X
E(β̃1 ) = E
!
ci y i =
i=1
=
n
X
n
X
ci E(Yi )
i=1
ci (β0 + β1 xi ) = β0
i=1
n
X
ci + β 1
i=1
n
X
ci x i ≡ β 1 .
i=1
Για να ισχύει η παραπάνω σχέση θα πρέπει:
n
X
ci = 0
και
n
X
ci xi = 1.
i=1
i=1
−x̄
Έστω ci = ki + di , i = 1, ..., n, όπου ki = Pn xi(x
2.
i −x̄)
i=1
Όσον αφορά τη διασπορά του β̃1 :
V ar(β̃1 ) = V ar
n
X
!
ci yi = V ar
i=1
= V ar
n
X
n
X
!
ki yi + V ar
= V ar(β̂1 ) +
= V ar(β̂1 ) +
n
X
i=1
i=1
!
di yi + 2Cov
i=1
n
X
n
X
ki y i ,
ki di Cov(Yi , Yi )
i=1
n
X
n
X
i=1
d2i V ar(Yi ) + 2
d2i σ 2 + 2
n
X
ki y i +
i=1
n
X
i=1
Η ποσότητα
(ki + di )yi = V ar
i=1
i=1
Pn
!
ki di σ 2 .
i=1
ki di = 0 (γιατί;).
Άρα,
V ar(β̃1 ) = V ar(β̂1 ) +
n
X
i=1
d2i σ 2
n
X
i=1
n
X
i=1
!
di y i
!
di y i
20
ΑΠΛΗ ΓΡΑΜΜΙΚΗ ΠΑΛΙΝΔΡΟΜΗΣΗ
και επειδή
Pn
i=1
d2i σ 2 ≥ 0 καταλήγουμε ότι:
V ar(β̂1 ) ≤ V ar(β̃1 ).
Η ίδια απόδειξη ισχύει και για το β̂0 .
Μία από τις συνηθέστερες υποθέσεις σχετικά με το γραμμικό μοντέλο παλινδρόμησης, είναι αυτή σύμφωνα
με την οποία τα σφάλματα ϵ1 , ..., ϵn , είναι τ.μ. που ακολουθούν την κανονική κατανομή με μέση τιμή 0 και
διασπορά σ 2 . Η υπόθεση της κανονικότητας δικαιολογείται στις περισσότερες των περιπτώσεων, αφού τα
σφάλματα αντιπροσωπεύουν συνήθως είτε σφάλματα μετρήσεων (measurement errors) είτε την επίδραση
παραγόντων/μεταβλητών που δεν περιλαμβάνονται στο μοντέλο αλλά επηρεάζουν την εξαρτημένη μεταβλητή ανεξάρτητα από τη μεταβλητή (ή μεταβλητές) X του μοντέλου. Κατά συνέπεια, τείνουν να συμμορφώνονται με το κεντρικό οριακό θεώρημα, έτσι ώστε η κατανομή τους να προσεγγίζει ασυμπτωτικά την κανονική.
Το γεγονός ότι για το μοντέλο (2.2) τα ϵi , i = 1, ..., n, είναι ασυσχέτιστες τ.μ. σε συνδυασμό με την υπόθεση της κανονικότητας, οδηγεί στην ανεξαρτησία των ϵi .
Ως επακόλουθο της Υπόθεσης 3 της κανονικότητας των ϵi , οδηγούμαστε στο ότι:
i.i.d.
Yi ∼ N β0 + β1 xi , σ 2 ,
i = 1, ..., n,
(2.19)
& V ar(Yi ) = σ 2 .
(2.20)
από όπου προκύπτει ότι για κάθε i έχουμε ότι:
E(Yi ) = β0 + β1 xi
Με δεδομένη την υπόθεση της κανονικότητας, μπορούμε να υπολογίσουμε εκ νέου τις εκτιμήτριες των β0 , β1
και σ 2 , αυτή τη φορά με τη μέθοδο της μεγίστης πιθανοφάνειας. Λόγω της (2.19), η συνάρτηση πιθανοφάνειας δίνεται από τον τύπο:
L(β0 , β1 , σ 2 ) =
1
(2πσ 2 )
e− 2σ2
n/2
1
Pn
i=1
(yi −β0 −β1 xi )2
.
(2.21)
Για τον προσδιορισμό των εκτιμητριών μεγίστης πιθανοφάνειας (ΕΜΠ, MLE) των β0 , β1 και σ 2 απαιτείται
η μεγιστοποίηση της L ή ισοδύναμα η μεγιστοποίηση της συνάρτησης lnL, δηλαδή:
n
n
1 X
n
L(β0 , β1 , σ 2 ) = − ln2π − ln2σ 2 − 2
(yi − β0 − β1 xi )2 .
2
2
2σ i=1
(2.22)
Θέτοντας τις πρώτες μερικές παραγώγους της (2.22) ίσες με το 0, και αντικαθιστώντας τα β0 , β1 και σ 2 με
τις αντίστοιχες εκτιμήτριες β̂0 , β̂1 και σ̂ 2 , παίρνουμε τις σχέσεις:
n X
yi − β̂0 − β̂1 xi = 0
(2.23)
i=1
n
X
xi yi − β̂0 − β̂1 xi = 0
(2.24)
i=1
n X
i=1
yi − β̂0 − β̂1 xi
2
= nσ̂ 2 .
(2.25)
ΓΡΑΜΜΙΚΑ ΜΟΝΤΕΛΑ ΚΑΙ ΣΧΕΔΙΑΣΜΟΣ & ΑΝΑΛΥΣΗ ΠΕΙΡΑΜΑΤΩΝ ΜΕ ΕΦΑΡΜΟΓΕΣ ΣΕ R ΚΑΙ MINITAB
21
Παρατηρούμε ότι οι σχέσεις (2.23) και (2.24) ταυτίζονται με τις κανονικές εξισώσεις (2.10) και (2.11) με
αποτέλεσμα οι ΕΜΠ β̂0 και β̂1 να ταυτίζονται με τους ΕΕΤ όπως αυτοί δίνονται από τη σχέση (2.6). Τέλος,
αντικαθιστώντας τη σχέση (2.5) στη σχέση (2.23) και αξιοποιώντας τη σχέση (2.18) καταλήγουμε στον
ΕΜΠ της παραμέτρου σ̂ 2 :
Pn
2
i=1 ϵ̂i
σ̂ 2 =
n
Pn
i=1
=
(yi − ŷi )2
≡
n
Pn
i=1
2
\
yi − E
(Yi )
n
.
(2.26)
Οι ΕΜΠ β̂0 και β̂1 έχουν τις ίδιες ιδιότητες με τους ΕΕΤ καθώς, όπως προαναφέρθηκε, ταυτίζονται. Σημειώνεται ότι ο ΕΜΠ σ̂ 2 είναι μεροληπτική εκτιμήτρια (biased) και γι’ αυτό για την εκτίμηση του σ 2 προτιμάται/συστήνεται η αμερόληπτη εκτιμήτρια MSE (βλ. Ενότητα 2.6, Πρόταση 2.6), η οποία δίνεται από τη
σχέση:
2
Pn
\
Pn
P
2
y
−
E
(Y
)
n
i
i
i=1
ϵ̂2
(yi − ŷi )
M SE = i=1 i = i=1
≡
.
(2.27)
n−2
n−2
n−2
2.6 Πίνακας ανάλυσης διακύμανσης (ANOVA)
Έχοντας προσαρμόσει το μοντέλο στα υπό εξέταση δεδομένα, ο Ερευνητής ενδιαφέρεται να εξετάσει εάν η
μεταβλητότητα (ο σκεδασμός, η διασπορά) των τιμών της εξαρτημένης μεταβλητής ερμηνεύεται επαρκώς
(δηλαδή στατιστικώς σημαντικά) από τη μεταβλητότητα που «συνοδεύει» το προτεινόμενο μοντέλο παλινδρόμησης. Τον σκοπό αυτό εξυπηρετεί η Ανάλυση Διακύμανσης (Analysis of Variance) η οποία μελετά
την Ολική Μεταβλητότητα (Ολικό Άθροισμα Τετραγώνων, SSTO–Sum of Squares Total) ως συνάρτηση δύο συνιστωσών: (1) της Μεταβλητότητας που οφείλεται στην Παλινδρόμηση (Άθροισμα Τετραγώνων Παλινδρόμησης, SSR–Sum of Squares due to Regression (SSR)) (δηλαδή την μεταβλητότητα
των δεδομένων που έχει επιτύχει να δικαιολογήσει το προτεινόμενο μοντέλο) και (2) της Μεταβλητότητας
που οφείλεται στα Σφάλματα (Άθροισμα Τετραγώνων των Σφαλμάτων, SSE–Sum of Squares Error)
(δηλαδή τη μεταβλητότητα που αν και ενυπάρχει στα δεδομένα, δεν δύναται το προτεινόμενο μοντέλο να
δικαιολογήσει-εξηγήσει). Είναι αυτονόητο ότι όσο μικρότερη είναι η τιμή του SSE τόσο καλύτερο είναι το
προτεινόμενο μοντέλο. Στην ιδανική (θεωρητική) περίπτωση που SSE ≡ 0, η απλή γραμμική παλινδρόμηση αποτελεί το τέλειο μοντέλο.
Τα παραπάνω μπορούν να εκφραστούν ως:
SST O = SSR + SSE,
(2.28)
όπου:
• SSR =
• SSE =
Pn
i=1 (ŷi
Pn
− ȳ)2 = β̂12
2
i=1 ϵ̂i =
• SST O = Syy =
Pn
i=1 (xi
Pn
2
i=1 (yi − ŷi ) =
Pn
i=1 (yi
− ȳ)2 =
− x̄)2 = β̂12 Sxx ∼ σ 2 χ21 ,
Pn
Pn
i=1
i=1
yi − β̂0 − β̂1 xi
2
∼ σ 2 χ2n−2 και
yi2 − nȳ 2 ∼ σ 2 χ2n−1 .
Παρατηρούμε ότι κάθε άθροισμα τετραγώνων διαιρεμένο με την ποσότητα σ 2 , αποτελεί τ.μ. από την κατανομή χ2 , αφού πρόκειται για άθροισμα τυποποιημένων κανονικών τ.μ. που έχουν υψωθεί στο τετράγωνο. Οι
βαθμοί ελευθερίας (β.ε.) προκύπτουν αν σε κάθε περίπτωση ληφθεί υπόψη ο αριθμός των εμπλεκόμενων εκτιμητριών. Άρα, οι β.ε. των SSE και SST O είναι n − 2 και n − 1 αντίστοιχα, αφού στην πρώτη περίπτωση
χάνονται 2 β.ε. λόγω της εκτίμησης των δύο συντελεστών παλινδρόμησης, ενώ στη δεύτερη χάνεται μόνο ένας
β.ε. λόγω της εκτιμήτριας ȳ. Η αθροιστική σχέση SST O = SSR + SSE ισχύει κατ’ αντιστοιχία και για
22
ΑΠΛΗ ΓΡΑΜΜΙΚΗ ΠΑΛΙΝΔΡΟΜΗΣΗ
τους β.ε., με αποτέλεσμα η ποσότητα SSR να έχει αναγκαστικά 1 β.ε.
Διαιρώντας τα SSR και SSE με τους αντίστοιχους βαθμούς ελευθερίας (1 και n − 2), προκύπτει το Μέσο
Άθροισμα Τετραγώνων της Παλινδρόμησης (MSR–Mean Square due to Regression) και το Μέσο Άθροισμα Τετραγώνων των Σφαλμάτων (M SE–Mean Squared Error), αντίστοιχα:
P
n
SSE
ϵ̂2
και M SE =
= i=1 i .
n−2
n−2
SSR
M SR =
1
(2.29)
Πρόταση 2.5 (Θεώρημα Cochran [16]). Οι ποσότητες SSR, SSE και SST O αποτελούν ανεξάρτητες τυχαίες μεταβλητές, καθεμία από τις οποίες διαιρεμένη με τους αντίστοιχους β.ε. ακολουθεί τη χ2 κατανομή.
Ως συνέπεια της προηγούμενης πρότασης έχουμε την ελεγχοσυνάρτηση:
M SR
F =
=
M SE
SSR
1
SSE
n−2
=
χ21
1
χ2n−2
n−2
= F1,n−2 = t2n−2 ,
(2.30)
η οποία αξιοποιείται για τον έλεγχο:
H0 : β1 = 0
H1 : β1 ̸= 0,
vs
με την H0 να απορρίπτεται εάν F > F1,n−2;α .
Ο Πίνακας 2.4 συνοψίζει τα παραπάνω μέσω του λεγόμενου Πίνακα ANOVA.
Πίνακας 2.4: Πίνακας ANOVA Απλής Γραμμικής Παλινδρόμησης
Μέσο
Πηγή
Μεταβλητότητας
Βαθμοί
Ελευθερίας
Άθροισμα
Τετραγώνων
Παλινδρόμηση
1
SSR
M SR
M SR H0
∼
M SE
Σφάλμα
n−2
SSE
M SE
–
Ολική
n−1
SST O
–
–
F
Άθροισμα
Τετραγώνων
F1,n−2
Πρόταση 2.6. Το M SE αποτελεί αμερόληπτη εκτιμήτρια της διασποράς σ 2 των σφαλμάτων, δηλαδή:
E(M SE) = σ 2 .
Απόδειξη Πρότασης 2.6.
E(SSE) = E
n
X
!
(yi − ŷi )2 =
i=1
=
n X
n X
E(yi − ŷi )2
i=1
2 V ar(yi − ŷi ) + E(yi − ŷi )
i=1
=
n
X
i=1
(V ar(yi − ŷi )) =
n X
i=1
V ar(yi − (β̂0 + β̂1 xi ))
ΓΡΑΜΜΙΚΑ ΜΟΝΤΕΛΑ ΚΑΙ ΣΧΕΔΙΑΣΜΟΣ & ΑΝΑΛΥΣΗ ΠΕΙΡΑΜΑΤΩΝ ΜΕ ΕΦΑΡΜΟΓΕΣ ΣΕ R ΚΑΙ MINITAB
=
n X
23
V ar(yi − (ȳ − β̂1 x̄ + β̂1 xi ))
i=1
=
n X
V ar(yi − ȳ − β̂1 (xi − x̄))
i=1
=
n X
V ar(yi − ȳ) + V ar(β̂1 (xi − x̄)) − 2Cov(yi − ȳ, β̂1 (xi − x̄))
i=1
=
n X
V ar(yi − ȳ) + V ar(β̂1 )(xi − x̄)2 − 2Cov((yi − ȳ)(xi − x̄), β̂1 )
i=1
=
n
X
V ar(yi − ȳ) + V ar(β̂1 )
i=1
=
n
X
n
X
n
X
(xi − x̄) − 2Cov
2
i=1
!
(yi − ȳ)(xi − x̄), β̂1
i=1
(V ar(yi ) + V ar(ȳ) − 2Cov(yi , ȳ)) + V ar(β̂1 )
i=1
n
X
(xi − x̄)2
i=1
− 2Cov β̂1
n
X
!
(xi − x̄) , β̂1
2
i=1
=
n
X
i=1
σ2
− 2Cov yi ,
σ +
n
2
− 2V ar(β̂1 )
n
X
Pn
i=1
yi
!!
+ V ar(β̂1 )
n
n
X
(xi − x̄)2
i=1
(xi − x̄)2
i=1
=
n
X
i=1
=
n
X
i=1
Άρα,
σ2
σ +
− 2Cov yi ,
n
2
σ2
σ2
−2
σ +
n
n
2
Pn
i=1
n
yi
!!
− V ar(β̂1 )
n
X
(xi − x̄)2
i=1
!
− σ 2 = (n − 1)σ 2 − σ 2 = (n − 2)σ 2 .
E(SSE) = (n − 2)σ 2 ⇔ E(M SE) = σ 2 .
Θεώρημα 2.2. Έστω το γραμμικό μοντέλο παλινδρόμησης yi = β0 +β1 xi +ϵi , i = 1, ..., n, και η αντίστοιχη
εκτιμήτρια συνάρτηση παλινδρόμησης ŷi = β̂0 + β̂1 xi , i = 1, ..., n. Τότε:
1.
Pn
i=1 ϵ̂i
= 0.
24
ΑΠΛΗ ΓΡΑΜΜΙΚΗ ΠΑΛΙΝΔΡΟΜΗΣΗ
2.
3.
4.
Pn
i=1 ϵ̂i xi
Pn
i=1 ϵ̂i ŷi
Pn
i=1
= 0.
= 0.
yi =
Pn
i=1
ŷi .
5. Το SSE είναι ελάχιστο.
6. Το κέντρο βάρους των δεδομένων (x̄, ȳ) αποτελεί πάντοτε σημείο της εκτιμήτριας συνάρτησης παλινδρόμησης.
Απόδειξη Θεωρήματος 2.2.
1.
Pn
i=1 ϵˆi
Pn
=
i=1 (yi
− ŷi ) =
Pn
i=1 (yi
− β̂0 − β̂1 xi ) =
Pn
i=1
yi − nβ̂0 − β̂1
Pn
i=1
xi = 0 (βλ.
(2.23)).
2.
Pn
i=1 ϵ̂i xi
=
Pn
i=1 (yi
Pn
− β̂0 − β̂1 xi )xi =
i=1
xi yi − β̂0
Pn
i=1
xi − β̂1
Pn
i=1
x2i = 0 (βλ. (2.24)).
3. Αφήνεται ως άσκηση.
4.
Pn
i=1 ŷi =
Pn
i=1
β̂0 + β̂1 xi = nβ̂0 + β̂1
Pn
i=1
xi =
Pn
i=1
yi (βλ. (2.10)).
5. Σύμφωνα με τη μέθοδο ελαχίστων τετραγώνων, οι εκτιμήτριες β̂0 και β̂1 των συντελεστών παλινδρόμησης
β0 και β1 , αντίστοιχα, είναι εκείνες οι τιμές για τις οποίες η ποσότητα
Q(β0 , β1 ) =
n
X
ϵ2i ,
i=1
ελαχιστοποιείται. Άρα:
minQ(β0 , β1 ) =
β0 ,β1
n
X
(yi − β̂0 − β̂1 xi )2 .
i=1
6. Θέτοντας στην εκτιμήτρια συνάρτηση παλινδρόμησης xi = x̄, και χρησιμοποιώντας τον τύπο του β̂0 από
τη σχέση (2.6), έχουμε:
ŷ = β̂0 + β̂1 x̄ = (ȳ − β̂1 x̄) + β̂1 x̄ = ȳ.
Άρα, το (x̄, ȳ) είναι σημείο της εκτιμήτριας συνάρτησης παλινδρόμησης.
2.7 Συντελεστής προσδιορισμού R2 και συντελεστής γραμμικής συσχέτισης
Ένα πρόβλημα μοντελοποίησης δύναται να προσεγγιστεί μέσω μίας πληθώρας υποψήφιων μοντέλων. Θα
πρέπει λοιπόν, να αναζητηθεί κατάλληλη ποσότητα η οποία να δύναται να ποσοτικοποιήσει τον βαθμό καταλληλότητας κάθε προτεινόμενου μοντέλου. Μία τέτοια ποσότητα αποτελεί ο Συντελεστής Προσδιορισμού
R2 (Coefficient of Determination), ο οποίος ορίζεται ως:
R2 =
SSR
SSE
=1−
,
SST O
SST O
0 ≤ R2 ≤ 1,
(2.31)
− x̄)2
.
− ȳ)2
(2.32)
που από τους τύπους των SSR και SST O ισούται με:
2
R =
Sxx
β̂12
Syy
Pn
=
β̂12
i=1 (xi
Pn
i=1 (yi
ΓΡΑΜΜΙΚΑ ΜΟΝΤΕΛΑ ΚΑΙ ΣΧΕΔΙΑΣΜΟΣ & ΑΝΑΛΥΣΗ ΠΕΙΡΑΜΑΤΩΝ ΜΕ ΕΦΑΡΜΟΓΕΣ ΣΕ R ΚΑΙ MINITAB
25
Το R2 ερμηνεύεται ως το ποσοστό (%) της μεταβλητότητας της εξαρτημένης μεταβλητής Y που επεξηγείται
από το προτεινόμενο μοντέλο παλινδρόμησης. Ειδικά για την περίπτωση της απλής γραμμικής παλινδρόμησης, μπορεί να ειπωθεί ότι το R2 μετρά το πόσο ισχυρή είναι η γραμμική σχέση μεταξύ των δύο εμπλεκόμενων
μεταβλητών X και Y . Τιμές πλησίον του ένα (100%) υποδηλώνουν ισχυρή γραμμική εξάρτηση μεταξύ της
X και της Y , ενώ τιμές πλησίον του μηδενός (0%) υποδηλώνουν ασθενή γραμμική εξάρτηση μεταξύ των δύο
και κατ’ επέκταση ακαταλληλότητα του προτεινομένου μοντέλου γραμμικής παλινδρόμησης. Η μορφή της
πιο πάνω σχέσης επιβεβαιώνει ότι σχεδόν μηδενικές τιμές του SSE ισοδυναμούν με τιμές του R2 πλησίον
του 1 και κατά συνέπεια, με ισχυρή γραμμική σχέση και άρα καταλληλότητα του προτεινομένου μοντέλου.
Με άλλα λόγια, το μοντέλο έχει καταφέρει να δικαιολογήσει ένα πολύ μεγάλο ποσοστό της μεταβλητότητας
των δεδομένων, με αποτέλεσμα το SSE να είναι αριθμητικά ασήμαντο και το μοντέλο να παρουσιάζει υψηλό
βαθμό καταλληλότητας.
Είναι προφανές ότι η μελέτη της γραμμικής σχέσης που μπορεί να συνδέει δύο μεταβλητές X και Y παρουσιάζει ιδιαίτερο ενδιαφέρον, αφού αυτή μπορεί εύκολα να μελετηθεί μέσω μίας απλής συναρτησιακής σχέσης
(μιας ευθείας). Είναι συχνό το φαινόμενο ο Ερευνητής να ενδιαφέρεται για τη σχέση που ενδεχομένως συνδέει δύο μεταβλητές, όπως παραδείγματος χάρη, τις μεταβλητές που αφορούν τα έσοδα και τα έξοδα μίας
επιχείρησης ή εκείνες που αφορούν την αύξηση (ή τη μείωση) της τιμής μίας μεταβλητής και τον αντίκτυπο
που αυτή έχει στη βελτιστοποίηση (ή ακόμα και στη μεγιστοποίηση) της αποδοτικότητας μίας διεργασίας.
Έτσι, το πρώτο και βασικότερο ερώτημα που καλείται να απαντήσει ο Ερευνητής είναι το πώς θα μετρήσει
τον βαθμό (την ένταση, το μέγεθος) της (γραμμικής) σχέσης μεταξύ των X και Y . Αν μία τέτοια σχέση
είναι αρκετά ισχυρή, τότε η μελέτη της σχέσης (2.1) είναι αναγκαία. Ο Πίνακας 2.5 δίνει 17 ζεύγη τιμών
(x1 , y1 ), (x2 , y2 ), ..., (x17 , y17 ) για δύο μεταβλητές X και Y , ενώ η γραφική τους παράσταση (Διάγραμμα
Διασποράς, Σκεδασμογράφημα) δίνεται στο Σχήμα 2.7 από όπου φαίνεται ότι υπάρχει αρκετά ισχυρή γραμμική σχέση μεταξύ των X και Y , και άρα ενδείκνυνται η εφαρμογή και μελέτη της απλής γραμμικής παλινδρόμησης.
Πίνακας 2.5: Τιμές 17 ζευγών παρατηρήσεων (xi , yi )
#
X
Y
6
229.9
146.3
12
168
136
1
93.5
91.3
7
59
53
13
323
259
2
171
133
8
91
80
14
302
250
3
192.4
155.4
9
70
60
15
284
227
4
206.4
180.6
10
82
76
16
239
177
5
279
241.8
11
146
116
17
311
248
26
ΑΠΛΗ ΓΡΑΜΜΙΚΗ ΠΑΛΙΝΔΡΟΜΗΣΗ
Σχήμα 2.7: Διάγραμμα διασποράς Πίνακα 2.5
Στην πράξη, για τον προσδιορισμό του βαθμού γραμμικής σχέσης χρησιμοποιείται ο συντελεστής r του οποίου
ο ορισμός, για ένα σύνολο n παρατηρήσεων (xi , yi ), δίνεται ακολούθως.
Ορισμός 2.1. Ο δειγματικός συντελεστής γραμμικής συσχέτισης (sample correlation coefficient) συμβολίζεται
με r και είναι η ποσότητα που μετρά την ισχύ (τον βαθμό, το μέγεθος, την ένταση) της γραμμικής σχέσης μεταξύ
δύο μεταβλητών X και Y με βάση ένα σύνολο n παρατηρήσεων (xi , yi ):
Sxy
q
r=√
,
Sxx · Syy
−1 ≤ r ≤ 1,
(2.33)
όπου:
• Sxy =
• Sxx =
• Syy =
Pn
i=1 (xi
Pn
i=1 (xi
Pn
i=1 (yi
− x̄)(yi − ȳ) =
− x̄)2 =
− ȳ)2 =
Pn
i=1
Pn
i=1
Pn
i=1
xi yi − nx̄ȳ,
x2i − nx̄2 και
yi2 − nȳ 2 = SST O.
Ο συντελεστής της σχέσης (2.33) ονομάζεται συντελεστής γραμμικής συσχέτισης κατά Pearson (Pearson’s correlation coefficient) και αποτελεί φυσικό (δειγματικό) εκτιμητή (natural estimator) του αντίστοιχου πληθυσμιακού (θεωρητικού) συντελεστή γραμμικής συσχέτισης, ο οποίος για δύο (τυχαίες) μεταβλητές, έστω x
και y, ορίζεται ως:
Cov(X, Y )
ρ= q
, −1 ≤ ρ ≤ 1,
V ar(X)V ar(Y )
όπου:
• Cov(X, Y ) = E(X − µX )(Y − µY ),
µX = E(X),
µY = E(Y ),
• V ar(X) = E(X 2 ) − µ2X και
• V ar(Y ) = E(Y 2 ) − µ2Y .
Για το ρ ισχύουν τα εξής:
1. Αν ρ = +1 τότε υπάρχει πλήρης θετική γραμμική σχέση μεταξύ των X και Y .
ΓΡΑΜΜΙΚΑ ΜΟΝΤΕΛΑ ΚΑΙ ΣΧΕΔΙΑΣΜΟΣ & ΑΝΑΛΥΣΗ ΠΕΙΡΑΜΑΤΩΝ ΜΕ ΕΦΑΡΜΟΓΕΣ ΣΕ R ΚΑΙ MINITAB
27
2. Αν ρ = −1 τότε υπάρχει πλήρης αρνητική γραμμική σχέση μεταξύ των X και Y .
3. Αν ρ = 0 τότε δεν υπάρχει γραμμική σχέση μεταξύ των X και Y .
4. Τιμές του ρ πλησίον του +1 ή του −1 δηλώνουν ισχυρή γραμμική σχέση, ενώ τιμές πλησίον του 0
ασθενή έως ανύπαρκτη γραμμική σχέση.
Στην απλή γραμμική παλινδρόμηση και για τη σχέση (2.31), ισχύει ότι:
√
r ≡ R2 ,
αφού λαμβάνοντας υπόψη τους ορισμούς των r και SSR, ισχύει η σχέση:
Sxy
= SSR.
Sxx
Παράδειγμα 2.6. Να υπολογιστεί ο δειγματικός συντελεστής γραμμικής συσχέτισης για τις παρατηρήσεις: (xi , yi ) =
(2, 5), (1, 3), (5, 6), (0, 2).
Λύση
Στον Πίνακα 2.6 υπολογίζονται όλες οι ποσότητες που συντελούν στον προσδιορισμό του r.
Πίνακας 2.6: Υπολογισμός ποσοτήτων για τον προσδιορισμό του r
#
xi
yi
xi − x̄
yi − ȳ
(xi − x̄)2
(yi − ȳ)2
(xi − x̄)(yi − ȳ)
1
2
5
0
1
0
1
0
2
1
3
−1
−1
1
1
1
3
5
6
3
2
9
4
6
4
0
2
−2
−2
4
4
4
Αθροίσματα
x̄ = 2
ȳ = 4
0
0
Sxx = 14
Syy = 10
Sxy = 11
Άρα:
11
√ = 0.93,
14 · 10
τιμή που υποδηλώνει ισχυρότατη γραμμική σχέση μεταξύ των δύο μεταβλητών.
r=√
Ο δειγματικός συντελεστής γραμμικής συσχέτισης R μπορεί να αξιοποιηθεί για την εφαρμογή του ελέγχου:
H0 : ρ = ρ∗
vs H1 : ρ ̸= ρ∗ .
Η κατάλληλη ελεγχοσυνάρτηση είναι η ακόλουθη:
=
1
2
log
1+r
1−r
− 12 log
q
1+ρ∗
1−ρ∗
1
n−3
προσεγγιστικά
∼ N (0, 1) .
Στην ειδική περίπτωση του ελέγχου για απουσία συσχέτισης (δηλαδή για ρ∗ = 0), τότε:
H0 : ρ = 0
η (2.34) μετατρέπεται σε:
s
T =r
vs
H1 : ρ ̸= 0
n − 2 H0
∼ tn−2 .
1 − r2
(2.34)
28
ΑΠΛΗ ΓΡΑΜΜΙΚΗ ΠΑΛΙΝΔΡΟΜΗΣΗ
2.8 Έλεγχος υποθέσεων, διαστήματα εμπιστοσύνης και πρόβλεψη
2.8.1 Έλεγχος υποθέσεων
Έστω βi , i = 0, 1, οι συντελεστές παλινδρόμησης του μοντέλου yi = β0 + β1 xi + ϵi . Δύο είναι οι έλεγχοι
που συνήθως απασχολούν τον Ερευνητή:
• Δίπλευροι Έλεγχοι (Two-Sided Tests):
H0 : βi = βi∗
vs
H1 : βi ̸= βi∗ ,
i = 0, 1.
• Μονόπλευροι Έλεγχοι (One-Sided Tests):
και
H0 : βi ≥ βi∗
vs
H1 : βi < βi∗ ,
i = 0, 1
H0 : βi ≤ βi∗
vs
H1 : βi > βi∗ ,
i = 0, 1
όπου βi∗ ∈ R δοθείσα τιμή. Σημειώνεται ότι αν και οι πιο πάνω έλεγχοι παρουσιάζουν γενικό ενδιαφέρον,
κυριότερος από την πλευρά της γραμμικής παλινδρόμησης, είναι ο έλεγχος:
H0 : β1 = 0
H1 : β1 ̸= 0,
vs
αφού η αποδοχή της H1 υποδηλώνει την ύπαρξη γραμμικότητας μεταξύ των Y και X και άρα την καταλληλότητα του μοντέλου της γραμμικής παλινδρόμησης. Από την άλλη, η αποδοχή της μηδενικής υπόθεσης H0
καταδεικνύει ότι ο συντελεστής της μεταβλητής X είναι μηδέν (δηλαδή η κλίση της ευθείας είναι μηδέν) και
άρα δεν υφίσταται γραμμική σχέση μεταξύ των Y και X.
i.i.d.
Πρόταση 2.7. Αν Yi ∼ N (β0 + β1 xi , σ 2 ) (δηλαδή υπό την Υπόθεση 3 της κανονικότητας), τότε οι ποσότητες β̂0 και β̂1 ακολουθούν κανονική κατανομή ως γραμμικές συναρτήσεις (από Πρόταση 2.2) ανεξάρτητων
κανονικών τ.μ.:
!
σ2
β̂1 ∼ N β1 , Pn
(2.35)
2
i=1 (xi − x̄)
β̂0 ∼ N β0 , σ
2
1
x̄2
+ Pn
2
n
i=1 (xi − x̄)
!!
.
(2.36)
Στην περίπτωση όπου το σ 2 είναι άγνωστο, τότε αυτό αντικαθίσταται από την αμερόληπτη εκτιμήτρια M SE
(από Πρόταση 2.6), και έτσι η διασπορά των βˆ1 και β̂0 εκτιμάται από τις ποσότητες:
V\
ar(β̂1 ) = Pn
M SE
2
i=1 (xi − x̄)
και
V\
ar(β̂0 ) = M SE
!
1
x̄2
+ Pn
,
2
n
i=1 (xi − x̄)
αντίστοιχα, ενώ η συνδιασπορά τους από την ποσότητα:
M SE
\
Cov(
β̂0 , β̂1 ) = −x̄ Pn
.
2
i=1 (xi − x̄)
ΓΡΑΜΜΙΚΑ ΜΟΝΤΕΛΑ ΚΑΙ ΣΧΕΔΙΑΣΜΟΣ & ΑΝΑΛΥΣΗ ΠΕΙΡΑΜΑΤΩΝ ΜΕ ΕΦΑΡΜΟΓΕΣ ΣΕ R ΚΑΙ MINITAB
29
Θεώρημα 2.3. Για την εφαρμογή ενός από τους ελέγχους:
≤
H0 : βi ≥ βi∗
=
>
vs H1 : βi < βi∗ , i = 0, 1,
̸=
χρησιμοποιείται η Στατιστική Συνάρτηση Ελέγχου (Ελεγχοσυνάρτηση, ΣΣΕ):
t(β̂i ) =
r
όπου se(β̂i ) =
V\
ar(β̂i ),
β̂i − βi∗
se(β̂i )
H0
∼ tn−2 ,
i = 0, 1,
(2.37)
i = 0, 1.
Στον Πίνακα 2.7 παρουσιάζεται η περιοχή (χωρίο) απόρριψης της H0 ανάλογα με τη μορφή της H1 όπου
tn−2;α αποτελεί το 100(1 − α)% ποσοστημόριο της κατανομής t, με n − 2 β.ε. Οι β.ε. είναι n − 2 για κάθε
έλεγχο του Θεωρήματος 2.3, διότι χάνονται 2 β.ε. όταν το σ 2 εκτιμάται από το M SE, μιας και το τελευταίο
εμπεριέχει τους 2 ΕΕΤ των β0 και β1 , αντίστοιχα.
Πίνακας 2.7: Χωρία απόρριψης της μηδενικής υπόθεσης για τους συντελεστές παλινδρόμησης
Μορφή H1
Απόρριψη H0
H1 : βi < βi∗
t(β̂i ) < −tn−2;α
H1 : βi > βi∗
t(β̂i ) > tn−2;α
H1 : βi ̸= βi∗
t(β̂i ) > tn−2;α/2
Όσον αφορά τον έλεγχο στατιστικής σημαντικότητας του συντελεστή βi , αυτός ορίζεται ως:
H0 : βi = 0
vs
H1 : βi ̸= 0, i = 0, 1,
με ΣΣΕ την (2.37), θέτοντας βi∗ = 0, και περιοχή απόρριψης της H0 την t(β̂i ) > tn−2;α/2 .
Σημείωση: Ο έλεγχος της στατιστικής σημαντικότητας του συντελεστή β1 δύναται να διενεργηθεί είτε μέσω
της σχέσης (2.37) είτε μέσω της (2.30), κάνοντας χρήση φυσικά της αντίστοιχης κρίσιμης περιοχής. Προσοχή! Το προαναφερθέν ισχύει μόνο στο πλαίσιο της Απλής Γραμμικής Παλινδρόμησης.
2.8.2 Διαστήματα εμπιστοσύνης
2.8.2.1 Διάστημα εμπιστοσύνης για τους συντελεστές παλινδρόμησης
Βασιζόμενοι στο Θεώρημα 2.3, το Διάστημα Εμπιστοσύνης (Δ.Ε., confidence interval) με συντελεστή εμπιστοσύνης 1 − α ή αλλιώς το 100(1 − α)% Δ.Ε. για το βi , i = 0, 1, δίνεται από τον τύπο:
β̂i ± tn−2;α/2 se β̂i ,
(2.38)
r
όπου se(β̂i ) =
V\
ar(β̂i ), i = 0, 1.
Σημείωση: Ένας έλεγχος που οδηγεί στην απόρριψη της υπόθεσης βi = 0, δεν συνεπάγεται αναγκαστικά τη
σχέση αιτίου-αποτελέσματος μεταξύ των X και Y , γιατί οι μεταβλητές αυτές μπορεί να επηρεάζονται ταυτόχρονα από μία τρίτη μεταβλητή η οποία δεν περιλαμβάνεται στο μοντέλο.
30
ΑΠΛΗ ΓΡΑΜΜΙΚΗ ΠΑΛΙΝΔΡΟΜΗΣΗ
Οι έλεγχοι υποθέσεων και τα Δ.Ε. που διατυπώθηκαν παραπάνω, βασίζονται στην υπόθεση της κανονικότητας των yi . Παρά ταύτα, ακόμα και μεγάλες αποκλίσεις από την υπόθεση της κανονικότητας δεν επηρεάζουν
τα συμπεράσματα (2.35), (2.36) και το Θεώρημα 2.3, αρκεί το μέγεθος του δείγματος να είναι ικανοποιητικά
μεγάλο. Τέλος, οι τιμές της κατανομής t που χρησιμοποιούνται στη στατιστική συμπερασματολογία μπορούν
να αντικατασταθούν από τις αντίστοιχες τιμές της τυπικής κανονικής κατανομής, όταν το μέγεθος του δείγματος είναι αρκετά μεγάλο (n > 29).
2.8.2.2 Διάστημα εμπιστοσύνης για τη συνάρτηση παλινδρόμησης
Στην ανάλυση παλινδρόμησης πολλές φορές μας ενδιαφέρει η εκτίμηση της μέσης τιμής της Y για κάποια
συγκεκριμένη τιμή της X. Έστω xh η συγκεκριμένη αυτή τιμή η οποία μπορεί να είναι μία από τις τιμές της
X στο δείγμα, μπορεί όμως να είναι και μία τιμή πέρα από το εύρος των τιμών αυτής. Στην τελευταία αυτή
περίπτωση χρειάζεται ιδιαίτερη προσοχή γιατί εάν η τιμή xh απέχει υπερβολικά από τις τιμές του δείγματος,
μπορεί το μοντέλο παλινδρόμησης να μην είναι πλέον ικανοποιητικό. Η ζητούμενη μέση τιμή της Yh = yh
για X = xh δίνεται από τη σχέση:
E(yh ) = β0 + β1 xh ,
(2.39)
ενώ η αντίστοιχη εκτιμήτριά της από τη σχέση:
ŷh = β̂0 + β̂1 xh .
(2.40)
Θεώρημα 2.4. Έστω το μοντέλο:
yi = β0 + β1 xi + ϵi ,
i = 1, ..., n.
(2.41)
Η κατανομή της Ŷh = ŷh είναι:
ŷh ∼ N E(yh ), σ
2
1
(xh − x̄)2
+ Pn
2
n
i=1 (xi − x̄)
!!
.
(2.42)
Απόδειξη Θεωρήματος 2.4. Από την Πρόταση 2.2 γνωρίζουμε ότι οι ΕΕΤ β̂0 και β̂1 , εκφράζονται ως γραμμικοί συνδυασμοί των yi . Από τη μορφή της σχέσης (2.40) φαίνεται ότι και το ŷh μπορεί να γραφτεί ως γραμμικός
συνδυασμός των yi , οπότε ακολουθεί την ίδια κατανομή με τα yi , δηλαδή την κανονική κατανομή.
Επιπλέον:
E (ŷh ) = E β̂0 + β̂1 xh = β0 + β1 xh = E(Yh ).
(2.43)
Τέλος, χρησιμοποιώντας τον ορισμό του β̂0 , την Πρόταση 2.3 και το Θεώρημα 2.2 έχουμε:
V ar (ŷh ) = V ar ȳ + β̂1 (xh − x̄) = V ar (ȳ) + (xh − x̄)2 V ar β̂1
=
σ2
σ2
2
+ Pn
2 (xh − x̄)
n
(x
−
x̄)
i
i=1
!
=σ
2
1
(xh − x̄)2
+ Pn
2 .
n
(x
−
x̄)
i
i=1
(2.44)
ΓΡΑΜΜΙΚΑ ΜΟΝΤΕΛΑ ΚΑΙ ΣΧΕΔΙΑΣΜΟΣ & ΑΝΑΛΥΣΗ ΠΕΙΡΑΜΑΤΩΝ ΜΕ ΕΦΑΡΜΟΓΕΣ ΣΕ R ΚΑΙ MINITAB
31
Αντικαθιστώντας στην (2.44) το σ 2 με την αμερόληπτη εκτιμήτρια σ̂ 2 = M SE, προκύπτει η εκτιμήτρια
της V ar (ŷh ):
!
(xh − x̄)2
1
\
+ Pn
V ar (ŷh ) = M SE
(2.45)
2 .
n
i=1 (xi − x̄)
Θεώρημα 2.5. Έστω το μοντέλο (2.4) και η εκτιμήτρια ŷh . Τότε:
ŷh − E(yh )
t(ŷh ) = q
∼ tn−2 .
V\
ar (ŷh )
(2.46)
Με βάση το Θεώρημα 2.5, ένα 100(1 − α)% Δ.Ε. για τη E(yh ) είναι το ακόλουθο:
r
ŷh ± tn−2,a/2 V \
ar (ŷh ).
(2.47)
2.8.2.3 Διάστημα εμπιστοσύνης για την πρόβλεψη νέων παρατηρήσεων
Έστω το πρόβλημα της πρόβλεψης μίας νέας παρατήρησης y που αντιστοιχεί σε μία τιμή xh της X. Ως γνωστόν, η μέση τιμή της κατανομής της Yh = yh για την τιμή X = xh , μπορεί να αντικατασταθεί από την
ποσότητα ŷh . Το ŷh αποτελεί όχι μόνο εκτιμήτρια της μέσης τιμής αλλά (λόγω ελλείψεως άλλης) και εκτιμήτρια κάθε νέας παρατήρησης που αντιστοιχεί στην xh . Η κατασκευή ενός διαστήματος στην περίπτωση
αυτή, είναι ιδιαίτερα πολύπλοκη και ουσιαστικά διαφέρει από την κατασκευή διαστημάτων εμπιστοσύνης,
όπως αυτή μας είναι γνωστή. Αυτό οφείλεται στο γεγονός ότι η ποσότητα που μας ενδιαφέρει δεν είναι μία
άγνωστη παράμετρος αλλά είναι η τιμή που μπορεί να πάρει μία τυχαία μεταβλητή. Έτσι λοιπόν, ο Ερευνητής
θα πρέπει να λάβει υπόψη του τόσο την απόκλιση που οφείλεται στη θέση της ίδιας της κατανομής της y, όσο
και την απόκλιση των τιμών της ίδιας της κατανομής.
Παρακάτω, δίνεται (χωρίς απόδειξη) ο τύπος του 100(1−α)% Διαστήματος Πρόβλεψης (Δ.Π., Prediction
Interval) για μία νέα παρατήρηση yh που αντιστοιχεί σε μία τιμή xh της x:
r
ŷh ± tn−2,a/2 V \
ar (ŷh∗ ),
όπου V \
ar (ŷh∗ ) = M SE 1 +
1
n
+
2
Pn(xh −x̄)
i=1
(xi −x̄)2
(2.48)
.
Υπάρχουν περιπτώσεις όπου είναι αναγκαίος ο προσδιορισμός ενός από κοινού χωρίου εμπιστοσύνης (confidence region) για τις παραμέτρους β0 και β1 του γραμμικού μοντέλου παλινδρόμησης. Το πιο κάτω θεώρημα,
το οποίο ισχύει και για γενικά μοντέλα παλινδρόμησης, δίνει ένα χωρίο εμπιστοσύνης το οποίο περιλαμβάνει
τους συντελεστές β0 και β1 με πιθανότητα 1 − α.
Θεώρημα 2.6. Έστω το γραμμικό μοντέλο παλινδρόμησης (2.2). Ένα 100(1 − α)% χωρίο εμπιστοσύνης για
τις παραμέτρους β0 και β1 είναι το:
n β̂0 − β0
2
+2
Pn
i=1 xi
β̂0 − β0
2σ̂ 2
β̂1 − β1 +
Pn
2
i=1 xi
β̂1 − β1
2
≤ F2,n−2;α/2
(2.49)
ενώ το όριο του χωρίου αυτού δίνεται από τον ίδιο τύπο με ισότητα αντί για ανισότητα.
Για τον προσδιορισμό του ορίου του χωρίου εμπιστοσύνης, δίνονται τιμές είτε στο β0 είτε στο β1 και προσδιορίζονται οι τιμές της άλλης παραμέτρου.
Επίσης, είναι εφικτή η κατασκευή Δ.Ε. που έχουν μαζί (από κοινού) επίπεδο εμπιστοσύνης 1 − α (ή αντίστοιχα από κοινού, σφάλμα ίσο με α). Τα διαστήματα αυτά είναι γνωστά ως από κοινού Δ.Ε. Bonferroni
32
ΑΠΛΗ ΓΡΑΜΜΙΚΗ ΠΑΛΙΝΔΡΟΜΗΣΗ
(Bonferroni joint confidence intervals). Έστω ότι είναι επιθυμητή η κατασκευή m διαστημάτων εμπιστοσύνης για m παραμέτρους με επίπεδο εμπιστοσύνης τουλάχιστον 1 − α. Τα διαστήματα αυτά κατασκευάζονται
α
με βάση τα γνωστά «απλά» Δ.Ε., με τη διαφορά ότι το σφάλμα του καθενός ισούται με m
.
Για το γραμμικό μοντέλο παλινδρόμησης από τον τύπο (2.38) τα από κοινού Δ.Ε. Bonferroni για τα β0 καιβ1 ,
δηλαδή για m = 2, είναι:
β̂i ± tn−2;α/4 se β̂i , i = 0, 1.
(2.50)
Άσκηση Αυτοαξιολόγησης
Για τη μελέτη ενός απλού γραμμικού μοντέλου παλινδρόμησης, αξιοποιώντας το ίδιο
ακριβώς σύνολο δεδομένων, ο Ερευνητής Α κατέληξε στο συμπέρασμα ότι η κλίση της
ευθείας είναι μηδέν, ενώ ο Ερευνητής Β ότι είναι διάφορη του μηδενός. Πώς μπορεί να
συμβαίνει αυτό; Εξηγήστε.
2.9 Εφαρμογές στην R
1. Έστω τα ζεύγη παρατηρήσεων του Πίνακα 2.8.
Πίνακας 2.8: Τιμές 11 ζευγών παρατηρήσεων (xi , yi )
#
X
Y
6
0
8
1
−5
1
7
1
9
2
−4
5
8
2
13
3
−3
4
9
3
14
4
−2
7
10
4
13
5
−1
10
11
5
18
Θεωρώντας το μοντέλο:
yi = β0 + β1 xi + ϵi ,
i = 1, ..., 11,
i. Ποιοι οι ΕΕΤ των β0 και β1 και ποια η εκτιμήτρια συνάρτηση παλινδρόμησης;
ii. Να δοθεί η τιμή της αμερόληπτης εκτιμήτριας της διασποράς των σφαλμάτων.
iii. Να βρεθούν οι διασπορές των εκτιμώμενων συντελεστών παλινδρόμησης β̂0 και β̂1 , καθώς και
η μεταξύ τους συνδιασπορά.
iv. Να εφαρμοστεί ο έλεγχος:
H0 : β1 = 1.5 vs
H1 : β1 ̸= 1.5.
(α = 5%)
v. Να γίνει το διάγραμμα διασποράς προσαρμόζοντας παράλληλα την εκτιμώμενη ευθεία παλινδρόμησης του ερωτήματος (i).
ΓΡΑΜΜΙΚΑ ΜΟΝΤΕΛΑ ΚΑΙ ΣΧΕΔΙΑΣΜΟΣ & ΑΝΑΛΥΣΗ ΠΕΙΡΑΜΑΤΩΝ ΜΕ ΕΦΑΡΜΟΓΕΣ ΣΕ R ΚΑΙ MINITAB
33
vi. Να υπολογιστεί ένα 95% Δ.Ε. για τη μέση τιμή της εξαρτημένης μεταβλητής Y0 , εάν X =
x0 = 8.
Ȫ
Λύση
Για την εισαγωγή των δεδομένων στην R, θα πρέπει να γίνει χρήση της εντολής read_xlsx
[readxl].
Εισαγωγή δεδομένων & δημιουργία μεταβλητών
library(readxl) #Φόρτωση πακέτου readxl
data <‐ read_xlsx('ch2ex1.xlsx') #Εισαγωγή δεδομένων από αρχείο τύπου
.xlsx
#Εξαγωγή των X και Y μέσα από τη μεταβλητή data
X <‐ data$X
Y <‐ data$Y
i. Για την εύρεση της εκτιμήτριας συνάρτησης παλινδρόμησης, θα γίνει χρήση της εντολής lm
[stats]. Όσον αφορά τα χαρακτηριστικά του μοντέλου (εκτιμήσεις συντελεστών, τυπικά σφάλματα, κτλ.), αυτά προκύπτουν με χρήση της εντολής summary [base].
Δημιουργία απλού γραμμικού μοντέλου & συντελεστές
slm <‐ lm(Y ~ X) #Δημιουργία απλού γραμμικού μοντέλου
summary(slm) #Εξαγωγή χαρακτηριστικών μοντέλου (εκτιμήσεις
συντελεστών, p‐values κτλ.)
> summary(slm)
Call:
lm(formula = Y ~ X)
Coefficients:
Estimate Std. Error t value Pr(>|t|)
(Intercept)
9.273
0.463
20.02 9.0e‐09
X
1.436
0.146
9.81 4.2e‐06
Residual standard error: 1.54 on 9 degrees of freedom
Multiple R‐squared: 0.914,
Adjusted R‐squared: 0.905
F‐statistic: 96.2 on 1 and 9 DF, p‐value: 4.21e‐06
Από τη στήλη “Estimate” προκύπτει ότι το εκτιμώμενο μοντέλο είναι το ακόλουθο:
ŷi = 9.273 + 1.436xi ,
i = 1, ..., 11.
ii. Στη μεταβλητή slm περιέχεται όλη η πληροφορία που αφορά το εκτιμώμενο μοντέλο παλινδρόμησης. Άρα, εφαρμόζοντας την εντολή anova [stats] στη μεταβλητή slm, προκύπτει ο
Πίνακας ANOVA.
Πίνακας ANOVA
ANOVA <‐ anova(slm) #Δημιουργία πίνακα ANOVA
ANOVA
34
ΑΠΛΗ ΓΡΑΜΜΙΚΗ ΠΑΛΙΝΔΡΟΜΗΣΗ
> ANOVA
Analysis of Variance Table
Response: Y
Df Sum Sq Mean Sq F value Pr(>F)
X
1 226.9
226.9
96.2 4.2e‐06
Residuals 9
21.2
2.4
Η αμερόληπτη εκτιμήτρια της διασποράς (MSE)βρίσκεται στη γραμμή “ Residuals” και τη
στήλη “Mean Sq”. Άρα M SE = 2.4.
iii. Εφαρμόζοντας την εντολή vcov [stats] στη μεταβλητή slm, θα προκύψει ο πίνακας διασποράς-συνδιασποράς.
Διακυμάνσεις - συνδιακυμάνσεις συντελεστών
var.covar.coeffs <‐ vcov(slm) #Δημιουργία πίνακα
διασποράς‐συνδιασποράς των β̂i , i = 0, 1
var.covar.coeffs
> var.covar.coeffs
(Intercept)
X
(Intercept) 2.1451e‐01 ‐5.7445e‐18
X
‐5.7445e‐18 2.1451e‐02
Είναι προφανές ότι τα στοιχεία της κύριας διαγωνίου του παραπάνω πίνακα, αποτελούν τις διασπορές των β̂0 και β̂1 , αντίστοιχα, ενώ τα στοιχεία εκτός διαγωνίου αποτελούν τις συνδιασπορές.
Έτσι:
• V ar β̂0 = 0.21451.
• V ar β̂1 = 0.021451.
• Cov β̂0 , β̂1 = −5.7445e−18 ≃ 0.
iv. Για τον έλεγχο της H0 : β1 = 1.5, θα πρέπει να κατασκευαστεί η κατάλληλη ΣΣΕ:
t β̂1 =
με κρίσιμη περιοχή t β̂1
β̂1 − 1.5
s.e. β̂1
H0
∼ tn−2 ,
> tn−2;α/2 .
Για τη ΣΣΕ θα πρέπει να γίνει εξαγωγή του συντελεστή β̂1 μέσα από τη μεταβλητή slm, με
χρήση της εντολής slm$coefficients[2]. Όσο για την εύρεση του t9;0.025 , αυτό θα γίνει
μέσω της εντολής qt [stats].
Έλεγχος υπόθεσης β1 =1.5
t.beta1.hat <‐ (slm$coefficients[2] ‐ 1.5) /
ΓΡΑΜΜΙΚΑ ΜΟΝΤΕΛΑ ΚΑΙ ΣΧΕΔΙΑΣΜΟΣ & ΑΝΑΛΥΣΗ ΠΕΙΡΑΜΑΤΩΝ ΜΕ ΕΦΑΡΜΟΓΕΣ ΣΕ R ΚΑΙ MINITAB
35
sqrt(var.covar.coeffs[2,2]) #Δημιουργία σ.σ.ε.
t.beta1.hat
qt(.975, slm$df.residual) #Υπολογισμός t9;0.025
> t.beta1.hat
X
‐0.43449
> qt(.975, slm$df.residual)
2.2622
Αφού,
t β̂1 = 0.43449 < 2.2622 = t9;0.025 ,
δεν απορρίπτεται η H0 , και άρα β1 = 1.5 (α = 5%).
v. Για τη δημιουργία του διαγράμματος διασποράς, γίνεται χρήση των εντολών plot, par και
arrows, ενώ για την προσαρμογή της εκτιμώμενης ευθείας παλινδρόμησης, γίνεται χρήση της
εντολής abline. Όλες οι προαναφερθείσες εντολές περιέχονται στο πακέτο [graphics].
Δημιουργία διαγράμματος διασποράς & προσαρμογή εκτιμώμενης ευθείας παλινδρόμησης
plot(
X,
Y,
col = "red3",
lwd = 4,
pch = 19,
xlab = "X",
ylab = "Y",
main = "Y vs X",
bty = "L",
cex.lab = 1.1,
cex.axis = 1.1
) #Δημιουργία διαγράμματος διασποράς μεταξύ x και y
abline(slm) #Προσαρμογή ευθείας παλινδρόμησης
u <‐ par("usr")
arrows(u[1], u[3], u[2], u[3], code = 2, xpd = TRUE)
arrows(u[1], u[3], u[1], u[4], code = 2, xpd = TRUE)
36
ΑΠΛΗ ΓΡΑΜΜΙΚΗ ΠΑΛΙΝΔΡΟΜΗΣΗ
Σχήμα 2.8: Διάγραμμα διασποράς μεταξύ X και Y με προσαρμογή της εκτιμώμενης ευθείας παλινδρόμησης
vi. Γενικά, το διάστημα εμπιστοσύνης που αφορά την E(Yh ) προκύπτει έπειτα από κατάλληλη χρήση
της εντολής predict [stats]. Θα πρέπει να δοθεί ιδιαίτερη προσοχή στα ορίσματα της εντολής, καθώς:
• το όρισμα newdata δέχεται μεταβλητές αυστηρώς σε data.frame μορφή,
• για να προκύψει το Δ.Ε. πρέπει στο όρισμα interval να γραφεί το confidence.
Κατασκευή 95% Δ.E. για την E(Y0 ) όταν X0 = x0 = 8
X.h <‐ data.frame(X = 8) #Ορισμός Xh
predict(slm,
newdata = X.h,
interval = 'confidence',
level = .95) #Kατασκευή 95% Δ.Ε. της E (Xh )
> predict(slm,
+
newdata = X.h,
+
interval = 'confidence ',
+
level = .95)
fit
lwr
upr
1 20.764 17.914 23.614
Ένα 95% Δ.Ε. για την E(Y0 ), όταν x0 = 8, είναι το ακόλουθο:
[17.914, 23.614] .
2. Τα αποτελέσματα που παρουσιάζονται στον Πίνακα 2.9 αντιπροσωπεύουν 6 μετρήσεις (σε διαφορετικές μέρες την καθεμία) της ημερήσιας δόσης εφεδρίνης (X) (σε γραμμάρια) και τον αριθμό των
καρδιακών παλμών (Y ) (σε λεπτά) ενός ασθενούς.
ΓΡΑΜΜΙΚΑ ΜΟΝΤΕΛΑ ΚΑΙ ΣΧΕΔΙΑΣΜΟΣ & ΑΝΑΛΥΣΗ ΠΕΙΡΑΜΑΤΩΝ ΜΕ ΕΦΑΡΜΟΓΕΣ ΣΕ R ΚΑΙ MINITAB
37
Πίνακας 2.9: Τιμές 6 ζευγών παρατηρήσεων (xi , yi )
#
X
Y
1
1
52
2
2
70
3
3
78
4
4
89
5
5
100
6
6
115
i. Να προσαρμοστεί κατάλληλο μοντέλο παλινδρόμησης και να ερμηνευτούν οι τιμές των παραμέτρων.
ii. Να ελεγχθεί η στατιστική σημαντικότητα του μοντέλου (α = 2%).
iii. Ποιο το ποσοστό της μεταβλητότητας της Y που επεξηγείται από την παλινδρόμηση; Ποιος ο
βαθμός γραμμικής συσχέτισης μεταξύ των X και Y ;
iv. Να εφαρμοστεί ο έλεγχος:
H0 : βi = 0
vs
H1 : βi ̸= 0,
i = 0, 1.
(α = 2%)
v. Να υπολογιστεί και να ερμηνευτεί ένα 98% Δ.Ε. για τον συντελεστή β1 .
vi. Να υπολογιστεί ένα 98% Δ.Π. για την εξαρτημένη μεταβλητή Y0 , εάν X0 = x0 = 7. Στη
συνέχεια, να κατασκευαστεί το διάγραμμα του ζητούμενου Δ.Π.
Ȫ
Λύση
Αρχικά εισάγουμε τα δεδομένα στην R και κωδικοποιούμε καταλλήλως τις μεταβλητές.
Εισαγωγή δεδομένων & δημιουργία μεταβλητών
library(readxl)
data<‐read_xlsx('ch2ex2.xlsx')
X <‐ data$X
Y <‐ data$Y
i. Υπάρχουν περιπτώσεις, όπως στο εν λόγω ερώτημα, που μας ενδιαφέρει η εξαγωγή των συντελεστών παλινδρόμησης, χωρίς καμία επιπλέον πληροφορία. Κάτι τέτοιο καθίσταται εφικτό με
χρήση της εντολής slm$coefficients.
Δημιουργία απλού γραμμικού μοντέλου & εξαγωγή συντελεστών
slm <‐ lm(Y ~ X)
coeffs <‐ slm$coefficients
coeffs
38
ΑΠΛΗ ΓΡΑΜΜΙΚΗ ΠΑΛΙΝΔΡΟΜΗΣΗ
> coeffs
(Intercept)
42.400
X
11.886
Το ζητούμενο εκτιμώμενο μοντέλο δίνεται από τη σχέση:
ŷi = 42.4 + 11.886xi ,
i = 1, ..., 6.
Ερμηνεία συντελεστών παλινδρόμησης:
• β̂0 : Οι μέσοι καρδιακοί παλμοί/λεπτό ενός ασθενούς θα είναι 42.4, εάν δεν του χορηγηθεί
η ημερήσια δόση εφεδρίνης (δηλαδή για xi = 0).
• β̂1 : Οι μέσοι καρδιακοί παλμοί/λεπτό ενός ασθενούς θα αυξηθούν κατά 11.886, εάν η ημερήσια δόση εφεδρίνης αυξηθεί κατά 1 γραμμάριο (δηλαδή 54.286 για xi = 1, 66.172 για
xi = 2, κτλ.).
ii. Η εντολή summary παρέχει μία πληθώρα πληροφοριών σχετικά με το εξεταζόμενο μοντέλο. Ανάμεσα σε αυτές βρίσκεται και το ποσοστό της μεταβλητότητας της y που επεξηγείται από την
παλινδρόμηση (R2 ).
Εύρεση συντελεστή προσδιορισμού R2
summary(slm)
> summary(slm)
Call:
lm(formula = Y ~ X)
Coefficients:
Estimate Std. Error t value Pr(>|t|)
(Intercept)
42.400
2.363
17.9 5.7e‐05
X
11.886
0.607
19.6 4.0e‐05
Residual standard error: 2.54 on 4 degrees of freedom
Multiple R‐squared: 0.99,
Adjusted R‐squared: 0.987
F‐statistic: 384 on 1 and 4 DF, p‐value: 4.01e‐05
Η τιμή του R2 δίνεται από το “Multiple R‐squared”, και άρα το ποσοστό της μεταβλητότητας των μέσων καρδιακών παλμών/λεπτό που επεξηγείται από την παλινδρόμηση, είναι 98.97%.
Όσο για τον συντελεστή γραμμικής συσχέτισης, αυτός ισούται με τη ρίζα του συντελεστή προσδιορισμού με πρόσημο όμοιο με αυτό του β̂1 (βλ. (2.32)). Έτσι, προκύπτει ότι:
r=
√
0.99 = 0.995.
iii. Θέλουμε να εφαρμόσουμε τον έλεγχο:
H0 : β1 = 0
vs
H1 : β1 ̸= 0.
Ως γνωστόν, ο έλεγχος του παραπάνω ισχυρισμού, ο οποίος αφορά τη στατιστική σημαντικότητα του απλού γραμμικού μοντέλου παλινδρόμησης, διενεργείται μέσω του F − test που δίνεται από τον πίνακα ANOVA (βλ. Πρόταση 2.5).
ΓΡΑΜΜΙΚΑ ΜΟΝΤΕΛΑ ΚΑΙ ΣΧΕΔΙΑΣΜΟΣ & ΑΝΑΛΥΣΗ ΠΕΙΡΑΜΑΤΩΝ ΜΕ ΕΦΑΡΜΟΓΕΣ ΣΕ R ΚΑΙ MINITAB
39
Πίνακας ANOVA
ANOVA <‐ anova(slm)
ANOVA
> ANOVA
Analysis of Variance Table
Response: Y
Df Sum Sq Mean Sq F value Pr(>F)
X
1
2472
2472
384 4e‐05
Residuals 4
26
6
Εφόσον η p-value (“Pr(>F)”) = 4−05 ≃ 0 του F − test είναι (πολύ) μικρότερη του επιπέδου
σημαντικότητας α = 2%, η H0 απορρίπτεται, και άρα το μοντέλο είναι στατιστικά σημαντικό.
iv. Η υπόθεση που ζητείται να ελεγχθεί στο ερώτημα αυτό, αφορά τη στατιστική σημαντικότητα
του κάθε συντελεστή παλινδρόμησης βi , i = 0, 1, ξεχωριστά. Για τη διενέργεια του ελέγχου
αυτού, θα γίνει χρήση του t − test.
Από τα αποτελέσματα του πίνακα στο ερώτημα ii, η p-value (“Pr(>|t|)”) του t − test για τα
β0 και β1 (5.7e−05 ≃ 0 και 4e−05 ≃ 0, αντίστοιχα), είναι μικρότερη του επιπέδου σημαντικότητας α = 2%, με αποτέλεσμα η H0 να απορρίπτεται και άρα οι συντελεστές παλινδρόμησης
β0 και β1 να είναι στατιστικά σημαντικοί.
v. Η εφαρμογή της εντολής confint [stats] πάνω στη μεταβλητή slm, θα δώσει το ζητούμενο
98% Δ.Ε. για τον συντελεστή β1 .
Κατασκευή 98% Δ.Ε. για το β1
confint(slm, level = .98)
> confint(slm, parm = c(2), level = .98)
1 %
99 %
X
9.6122 14.159
Ένα 98% Δ.Ε. για το β1 είναι το ακόλουθο:
[9.6122, 14.159] .
Υπάρχει 98% βεβαιότητα ότι η πραγματική τιμή του συντελεστή β1 κυμαίνεται από 9.6122 έως
14.159.
vi. Όπως και στο ερώτημα vi της προηγούμενης εφαρμογής, έτσι και εδώ για τον υπολογισμό του
98% Δ.Π. για το Y0 θα γίνει χρήση της εντολής predict. Η μόνη ουσιαστική διαφοροποίηση
έγκειται στο όρισμα interval όπου πλέον θα πρέπει να γραφεί το prediction (βλ. (2.48)).
Κατασκευή 98% Δ.Π. για το Y0 όταν X0 = 7
X.h <‐ data.frame(X = 7)
predict(slm,
40
ΑΠΛΗ ΓΡΑΜΜΙΚΗ ΠΑΛΙΝΔΡΟΜΗΣΗ
newdata = X.h,
interval = 'prediction',
level = .98)
> predict(slm,
+
newdata = X.h,
+
interval = 'prediction ',
+
level = .98)
fit
lwr
upr
1 125.6 112.61 138.59
Ένα 98% Δ.Π. για το y0 , όταν x0 = 7 είναι το ακόλουθο:
[112.61, 138.59] .
Για την κατασκευή του διαγράμματος του 98% Δ.Π. θα γίνει χρήση των εντολών plot, points,
polygon, abline και lines, οι οποίες διατίθενται μέσω του πακέτου [graphics].
Διάγραμμα 98% Δ.Π. για το Y0 όταν X0 = 7
mygrey <‐ rgb(.2, .2, .2, alpha = .1, maxColorValue = 1) #Δημιουργία
διάφανου γκρι
n <‐ NROW(Y) #Ορισμός μεγέθους δείγματος
MSE <‐ ANOVA$`Mean Sq`[2] #Εξαγωγή M SE από πίνακα ANOVA
se.Y.h.hat <‐ sqrt(MSE * (1 + (1s/ n) + (X.h$X ‐ mean(X)) ^ 2 / sum((X
2
(x
−x̄)
1
∗
h
‐ mean(X)) ^ 2))) #se (ŷh ) =
M SE 1 + n + Pn (x −x̄)2
i=1
i
X.new <‐ c(X, X.h$X) #Προσθήκη της xh = 7 στις αρχικές 6 τιμές της X
Y.h.hat <‐ coeffs[1] + coeffs[2] * X.new #Υπολογισμός των
ŷi , i = 1, ..., 6 με προσθήκη της τιμής του ŷh∗ στην τελευταία θέση
upper.bound <‐ Y.h.hat + qt(.99, n ‐ 2) * se.Y.h.hat #Υπολογισμός άνω
ορίου 98% Δ.Π.
lower.bound <‐ Y.h.hat ‐ qt(.99, n ‐ 2) * se.Y.h.hat #Υπολογισμός κάτω
ορίου 98% Δ.Π.
plot(
X,
Y,
col = "red3",
lwd = 4,
pch = 19,
xlab = "Ημερήσια δόση εφεδρίνης (γραμμάρια)",
ylab = "Αριθμός καρδιακών παλμών (λεπτό)",
main = " 98% Διάστημα πρόβλεψης για το y0 όταν x0=7",
bty = "L",
cex.lab = 1.1,
ΓΡΑΜΜΙΚΑ ΜΟΝΤΕΛΑ ΚΑΙ ΣΧΕΔΙΑΣΜΟΣ & ΑΝΑΛΥΣΗ ΠΕΙΡΑΜΑΤΩΝ ΜΕ ΕΦΑΡΜΟΓΕΣ ΣΕ R ΚΑΙ MINITAB
cex.axis = 1.1,
ylim = c(min(lower.bound), max(upper.bound)),
xlim = c(min(X.new), max(X.new))
)
points(
X = X.h$X,
Y = Y.h.hat[X.h$X],
col = '#2F5C9D',
lwd = 4,
pch = 19
) #Προσθήκη ŷh∗ πάνω στο διάγραμμα διασποράς
abline(slm, lwd = 2)
polygon(
c(rev(X.new), X.new),
c(
rev(lower.bound),
upper.bound),
col = mygrey,
border = NA
) #Δημιουργία γκρι σκιαγράφησης 98% Δ.Π.
lines(upper.bound,
col = '#2F5C9D',
lty = 2,
lwd = 2) #Δημιουργία μπλέ διακεκομμένης άνω ορίου 98% Δ.Π.
lines(lower.bound,
col = '#2F5C9D',
lty = 2,
lwd = 2) #Δημιουργία μπλέ διακεκομμένης κάτω ορίου 98% Δ.Π.
legend(
"topleft",
legend = c("Παρατηρήσεις", "Πρόβλεψη"),
col = c("red3", "#2F5C9D"),
bty = "n",
lwd = 2,
pt.cex = 2,
cex = 1.2,
pch = c(20, 20),
lty = c(NA, NA),
text.col = "black",
horiz = F
)
u <‐ par("usr")
arrows(u[1], u[3], u[2], u[3], code = 2, xpd = TRUE)
arrows(u[1], u[3], u[1], u[4], code = 2, xpd = TRUE)
41
42
ΑΠΛΗ ΓΡΑΜΜΙΚΗ ΠΑΛΙΝΔΡΟΜΗΣΗ
Σχήμα 2.9: 98% Δ.Π. για το Y0 όταν x0 = 7
2.10 Άλυτες ασκήσεις
1. Έστω το μοντέλο:
yi = β0∗ + β1 (xi − x̄) + ϵi ,
όπου β0∗ = β0 + β1 x̄.
Να προσδιοριστούν οι ΕΕΤ του μοντέλου.
−x̄
2. Να αποδειχτεί ότι η ποσότητα ki = Pn xi(x
ικανοποιεί τις εξής ιδιότητες:
−x̄)2
i.
ii.
iii.
i
i=1
Pn
i=1
ki = 0,
i=1
ki xi = 1,
i=1
ki2 =
Pn
Pn
Pn
i=1 (xi
− x̄)−2 .
3. Να αποδειχτεί το Θεώρημα 2.3.
Υπόδειξη: Η απόδειξη βασίζεται στον ορισμό της κατανομής Student t η οποία προκύπτει ως το πηλίκο δύο
ανεξάρτητων τυχαίων μεταβλητών με αυτήν στον αριθμητή να αφορά μία τυποποιημένη κανονική τ.μ. και αυτή
στον παρονομαστή μία χ2 τ.μ.
4. Να αποδειχτεί το Θεώρημα 2.5.
5. Να αποδειχτεί ότι:
β̂0 =
n X
1
i=1
n
− ki x̄ yi ,
−x̄
όπου ki = Pn xi(x
2.
i −x̄)
i=1
6. Να δειχτεί ότι:
n
X
i=1
(yi − ŷi ) =
2
n
X
i=1
(yi − ȳ) −
2
(
Pn
i=1 (xi − x̄)(yi −
Pn
2
i=1 (xi − x̄)
ȳ))2
= Syy −
Sxy
.
Sxx
ΓΡΑΜΜΙΚΑ ΜΟΝΤΕΛΑ ΚΑΙ ΣΧΕΔΙΑΣΜΟΣ & ΑΝΑΛΥΣΗ ΠΕΙΡΑΜΑΤΩΝ ΜΕ ΕΦΑΡΜΟΓΕΣ ΣΕ R ΚΑΙ MINITAB
43
7. Έστω το γραμμικό μοντέλο παλινδρόμησης:
yi = β0 + ϵi .
Να υπολογιστεί ο ΕΕΤ του β0 και να δειχτεί ότι είναι αμερόληπτος.
8. Έστω το μοντέλο παλινδρόμησης:
yi = β1 xi + ϵi .
i. Να βρεθεί ο ΕΕΤ του β1 .
i.i.d.
ii. Έστω ότι ϵi ∼ N (0, σ 2 ), με σ 2 > 0 άγνωστο. Να 
δοθείη συνάρτηση πιθανοφάνειας για ένα
β1
 
τυχαίο δείγμα μεγέθους n, και να βρεθεί ο ΕΜΠ του  .
σ2
iii. Να δειχτεί ότι ο ΕΜΠ που βρέθηκε στο ερώτημα ii είναι αμερόληπτος.
9. Για το γραμμικό μοντέλο παλινδρόμησης:
ŷi = 14.4 + 0.975xi ,
βρέθηκε ο κάτωθι Πίνακας ANOVA από τον οποίο λείπουν έξι τιμές.
Πίνακας 2.10: Ημιτελής Πίνακας ANOVA Άσκησης 9
Πηγή
Μεταβλητότητας
Βαθμοί
Ελευθερίας
Άθροισμα
Τετραγώνων
Άθροισμα
F
Τετραγώνων
4772451.7
Παλινδρόμηση
50871.9
Σφάλμα
Ολική
Μέσο
17
–
–
–
i. Να συμπληρωθεί ο Πίνακας ANOVA.
ii. Να ελεγχθεί η στατιστική σημαντικότητα της παλινδρόμησης (α = 5%).
iii. Να ελεγχθεί η στατιστική σημαντικότητα του συντελεστή β1 με βάση:
α. την t-ελεγχοσυνάρτηση,
β. το διάστημα εμπιστοσύνης,
σε α = 5%.
iv. Να ελεγχθεί η υπόθεση H0 : β1 = 1 (α = 5%).
v. Να υπολογιστεί η V\
ar(β̂1 ).
10. Ο Πίνακας 2.11 δίνει το κόστος λειτουργίας Y (σε $) και τον αριθμό των ετών λειτουργίας X, 10
ομοειδών μηχανών:
44
ΑΠΛΗ ΓΡΑΜΜΙΚΗ ΠΑΛΙΝΔΡΟΜΗΣΗ
Πίνακας 2.11: Τιμές 10 ζευγών παρατηρήσεων (xi , yi )
#
X
Y
1
4
148
2
2
128
3
3
133
4
5
154
5
2
118
6
3
145
7
4
143
8
5
159
9
4
142
10
3
127
i. Να προσδιοριστεί η εκτιμήτρια συνάρτηση παλινδρόμησης και να εκτιμηθούν οι τυπικές αποκλίσεις των εκτιμητών των αντίστοιχων συντελεστών.
ii. Να εκτιμηθεί το κόστος λειτουργίας μίας μηχανής που εργάζεται 10 χρόνια.
11. Έστω τα δεδομένα του Πίνακα 2.12:
Πίνακας 2.12: Τιμές 10 ζευγών παρατηρήσεων (xi , yi )
#
X
Y
1
12
2
2
13
2
3
13
3
4
14
3
5
15
4
6
15
4
7
14
5
8
16
5
9
17
6
10
18
6
i. Να υπολογιστούν τα β̂0 και β̂1 , καθώς και οι εκτιμητές των διασπορών τους.
ii. Να υπολογιστεί τα 98% Δ.Ε. για τα β0 και β1 , αντίστοιχα.
iii. Να ελεγχθεί η στατιστική σημαντικότητα του συντελεστή β1 (α = 5%).
ΒΙΒΛΙΟΓΡΑΦΙΑ
[1] Βόντα, Φ., & Καραγρηγορίου, Α. (2012). Εφαρμοσμένη στατιστική ανάλυση & στοιχεία πιθανοτήτων.
Αθήνα: Εκδόσεις Παρασκήνιο.
[2] Δαμιανού, Χ., & Κούτρας, Μ. (1998). Εισαγωγή στη στατιστική, Μέρος ΙΙ. Αθήνα: Εκδόσεις Συμμετρία.
[3] Καλαματιανού, Α.Γ. (1997). Εφαρμοσμένη ανάλυση παλινδρόμησης. Αθήνα: Εκδόσεις Παπαζήσης.
[4] Καρώνη, Χ., & Οικονόμου, Π. (2017). Στατιστικά μοντέλα παλινδρόμησης: Με χρήση M initab και R
(2η έκδ.). Αθήνα: Συμεών.
[5] Κουτρουβέλης, Ι.Α. (2015). Εφαρμοσμένες πιθανότητες και στατιστική για μηχανικούς και θετικούς επιστήμονες. Αθήνα: Εκδόσεις Gotsis.
[6] Κουτρουβέλης, Ι.Α. (2000). Προηγμένα εργαλεία και μέθοδοι για τον έλεγχο της ποιότητας, Τόμος Β,
Σχεδιασμός και Ανάλυση Πειραμάτων. Πάτρα: Ελληνικό Ανοικτό Πανεπιστήμιο.
[7] Κολυβά-Μαχαίρα, Φ., & Μπόρα-Σέντα, Ε. (1995). Στατιστική, θεωρία και εφαρμογές. Θεσσαλονίκη:
Εκδόσεις Ζήτη.
[8] Κουνιάς, Σ., Κολυβά-Μαχαίρα, Φ., Μπαγιάτης, Γ., & Μπόρα-Σέντα, Ε. (1985). Εισαγωγή στη στατιστική. Θεσσαλονίκη: Εκτύπωση Γιαχούδη-Γιαπούλη Ο.Ε.
[9] Κούτρας, Μ.Β., & Ευαγγελάρας, Χ. (2010). Ανάλυση παλινδρόμησης, θεωρία και εφαρμογές. Αθήνα:
Εκδόσεις Σταμούλη Α. Ε.
[10] Μπόρα-Σέντα, Ε., & Μωυσιάδης, Χ. (1990). Εφαρμοσμένη στατιστική. Θεσσαλονίκη: Εκδόσεις Ζήτη.
[11] Ντζούφρας, Ι., & Καρλής, Δ. (2015). Εισαγωγή στον προγραμματισμό και στη στατιστική ανάλυση με R [Προπτυχιακό εγχειρίδιο]. Κάλλιπος, Ανοικτές Ακαδημαϊκές Εκδόσεις.
http://hdl.handle.net/11419/2601
[12] Παπαδόπουλος, Γ.Κ. (2015). Εισαγωγή στις πιθανότητες και τη στατιστική. Αθήνα: Εκδόσεις Gutenberg.
[13] Παπαϊωάννου, Τ., & Λουκάς, Σ. (2002). Εισαγωγή στη στατιστική. Αθήνα: Εκδόσεις Σταμούλη Α. Ε.
46
ΒΙΒΛΙΟΓΡΑΦΙΑ
[14] Φερεντίνος, Κ., Ζωγράφος, Κ., & Παπαϊωάννου, Τ. (2020). Εκτιμητική και έλεγχος υποθέσεων. Αθήνα:
Εκδόσεις Σταμούλη Α. Ε.
[15] Φουσκάκης, Δ. (2021). Ανάλυση δεδομένων με χρήση της R (2η έκδ.). Αθήνα: Εκδόσεις Τσότρας.
[16] Cochran, W.G. (1934). The Distribution of quadratic forms in a normal system, with applications
to the analysis of covariance. Mathematical Proceedings of the Cambridge Philosophical Society, 30(2),
178-191.
[17] Draper, R.D., & Smith, H. (1998). Applied regression analysis (3rd ed.). Wiley-Interscience.
[18] Field, A. (2021). Μία περιπέτεια στη στατιστική (Ε. Γάκη, Χ. Παρπούλα & Η. Σαντουρίδης, Επιμ.).
Αθήνα: Εκδόσεις Προπομπός.
[19] Field, A., Miles, J., & Field, Z. (2012). Discovering statistics using R (1st ed.). Sage Ltd.
[20] Galton, F. (1886). Regression towards mediocrity in hereditary stature. The Journal of the Anthropological Institute of Great Britain and Ireland, 15, 246-263.
[21] Gauss, C.F. (1821, 1823, 1826). Theoria combinationis observationum erroribus minimis obnoxiae. Parts 1, 2 and suppl. Werke, 4, 1-108.
ΚΕΦΑΛΑΙΟ 3
ΠΟΛΛΑΠΛΗ ΠΑΛΙΝΔΡΟΜΗΣΗ
Σύνοψη
Το παρόν κεφάλαιο παρουσιάζει το βασικό πρότυπο πολλαπλής παλινδρόμησης συμπεριλαμβανομένων της εκτίμησης και του ελέγχου υποθέσεων των εμπλεκόμενων παραμέτρων, των
προϋποθέσεων που πρέπει να πληρούνται για την αξιοποίησή του, και της εφαρμογής του, με τη
χρήση στατιστικών πακέτων.
Προαπαιτούμενη γνώση
Το κεφάλαιο προϋποθέτει τη γνώση και την κατανόηση των προηγούμενων κεφαλαίων.
Προσδοκώμενα μαθησιακά αποτελέσματα
Μετά τη μελέτη του παρόντος κεφαλαίου ο αναγνώστης αναμένεται να:
• ορίζει και να εφαρμόζει το πολλαπλό μοντέλο παλινδρόμησης, και να κατανοεί τις προϋποθέσεις
που πρέπει να πληρούνται για την εφαρμογή του,
• μπορεί να προβεί στην εκτίμηση των αναγκαίων παραμέτρων συμπεριλαμβανομένων της κατασκευής διαστημάτων εμπιστοσύνης και διεξαγωγής ελέγχων υποθέσεων,
• κατασκευάζει τον κατάλληλο πίνακα ανάλυσης διακύμανσης και να υπολογίζει τον προσαρμοσμένο συντελεστή προσδιορισμού,
• εφαρμόζει το πρότυπο πολλαπλής παλινδρόμησης με τη χρήση στατιστικών πακέτων.
Καραγρηγορίου, Α., & Καλλιγέρης, Ε. Ν. (�2023). «Γραμμικά Μοντέλα και Σχεδιασμός & Ανάλυση Πειραμάτων με Εφαρμογές
σε R και Minitab».
Αθήνα: Κάλλιπος, Ανοικτές Ακαδημαϊκές Εκδόσεις. http://dx.doi.org/10.57713/kallipos-70
Creative Commons Αναφορά Δημιουργού - Μη Εμπορική Χρήση - Παρόμοια Διανομή 4.0
48
ΠΟΛΛΑΠΛΗ ΠΑΛΙΝΔΡΟΜΗΣΗ
3.1 Εισαγωγή
Στα Παραδείγματα 2.1, 2.3 και 2.4 είχε γίνει αναφορά σε περιπτώσεις όπου η μεταβλητή Y εξαρτόταν από
περισσότερες από μία ανεξάρτητες μεταβλητές. Η περιοχή της Στατιστικής που ασχολείται με τη μελέτη τέτοιων περιπτώσεων είναι η ανάλυση πολλαπλής παλινδρόμησης (multiple regression analysis). Η τεχνική
αυτή αποτελεί ένα από τα πιο διαδεδομένα στατιστικά εργαλεία. Συνήθως, ο μελετητής επιθυμεί να διερευνήσει ποιες και πόσες μεταβλητές από ένα σύνολο πιθανών ανεξάρτητων μεταβλητών, επηρεάζουν την εξαρτημένη μεταβλητή Y . Το πρόβλημα αυτό είναι ένα από τα δυσκολότερα της Στατιστικής και σχεδόν πάντα
απαιτεί τη χρήση υπολογιστικών πακέτων, όπως είναι η R, το Minitab και το SPSS. Στο κεφάλαιο αυτό θα συζητηθούν διάφορα πολλαπλά μοντέλα (πρότυπα) παλινδρόμησης, γενικεύοντας τη θεωρία που αναπτύχθηκε
προηγουμένως για την περίπτωση της απλής γραμμικής παλινδρόμησης.
3.2 Πολλαπλό γραμμικό μοντέλο και προϋποθέσεις
Όταν δύο ανεξάρτητες μεταβλητές X1 και X2 επηρεάζουν την εξαρτημένη μεταβλητή Y , το πρότυπο:
y = β0 + β1 x1 + β2 x2 + ϵ,
(3.1)
ονομάζεται πολλαπλό γραμμικό μοντέλο παλινδρόμησης πρώτης τάξης δύο ανεξάρτητων μεταβλητών, όπου
yi οι τιμές της εξαρτημένης μεταβλητής Y , x1 και x2 οι τιμές των ανεξάρτητων μεταβλητών X1 και X2 , β0 ,
β1 και β2 οι συντελεστές παλινδρόμησης και ϵi τα σφάλματα με E (ϵi ) = 0 και V ar (ϵi ) = σ 2 .
Στην περίπτωση αυτή, η συνάρτηση παλινδρόμησης είναι:
E(Y ) = β0 + β1 x1 + β2 x2 ,
(3.2)
η οποία συχνά αναφέρεται και ως επιφάνεια παλινδρόμησης, αφού η γραφική της παράσταση είναι ένα επίπεδο
(βλ. Σχήμα 3.1). Τα σφάλματα, όπως και στην περίπτωση της απλής γραμμικής παλινδρόμησης, αντιπροσωπεύουν την κάθετη απόσταση της παρατήρησης από τη συνάρτηση παλινδρόμησης:
ϵ = y − E (Y ) .
(3.3)
Η παράμετρος β0 αντιπροσωπεύει το σημείο όπου το επίπεδο (3.2) τέμνει τον Y −άξονα (όταν δηλαδή x1 =
0 και x2 = 0). Το β1 αντιπροσωπεύει τη μεταβολή της μέσης τιμής της Y , για κάθε μοναδιαία αύξηση της
X1 , όταν η X2 διατηρείται σταθερή. Ανάλογη είναι και η ερμηνεία της παραμέτρου β2 . Όταν η επίδραση της
μίας ανεξάρτητης μεταβλητής πάνω στη μέση τιμή της Y δεν εξαρτάται από την τιμή της άλλης, λέμε ότι οι
δύο ανεξάρτητες μεταβλητές έχουν προσθετικές επιδράσεις (additive effects) ή ότι δεν αλληλεπιδρούν πάνω
στη μέση τιμή της Y . Στην περίπτωση αυτή, τα β1 και β2 ονομάζονται συντελεστές μερικής παλινδρόμησης
(partial regression coefficients).
ΓΡΑΜΜΙΚΑ ΜΟΝΤΕΛΑ ΚΑΙ ΣΧΕΔΙΑΣΜΟΣ & ΑΝΑΛΥΣΗ ΠΕΙΡΑΜΑΤΩΝ ΜΕ ΕΦΑΡΜΟΓΕΣ ΣΕ R ΚΑΙ MINITAB
49
Σχήμα 3.1: Πολλαπλό μοντέλο παλινδρόμησης με 2 ανεξάρτητες μεταβλητές
Γενικεύοντας, και θεωρώντας ότι τα σφάλματα ακολουθούν την κανονική κατανομή, ορίζουμε το γενικό γραμμικό μοντέλο παλινδρόμησης (general linear regression model) τάξης p (p ≤ n), όπου p το πλήθος των
συντελεστών παλινδρόμησης ως εξής:
yi = β0 + β1 xi1 + β2 xi2 + ... + βp−1 xip−1 + ϵi ,
i = 1, ..., n,
(3.4)
όπου yi οι τιμές της εξαρτημένης μεταβλητής Y , xi1 , xi2 , ..., xip−1 οι τιμές των ανεξάρτητων μεταβλητών
X1 , X2 , ..., Xp−1 , β0 , β1 , ..., βp−1 οι συντελεστές παλινδρόμησης και ϵi ανεξάρτητες τυχαίες μεταβλητές.
Όπως στην περίπτωση του απλού γραμμικού μοντέλου, έτσι και στο πολλαπλό, θα πρέπει: (1) μεταξύ της
εξαρτημένης μεταβλητής Y και της κάθε επεξηγηματικής μεταβλητής X να υφίσταται ισχυρή γραμμική
σχέση και (2) τα σφάλματα ϵi να είναι μεταξύ τους ασυσχέτιστα (ανά δύο) και να προέρχονται από κανονική κατανομή με μέση τιμή 0 και σταθερή διασπορά σ 2 .
Η συνάρτηση παλινδρόμησης για το μοντέλο (3.4) είναι:
E (Yi ) = β0 + β1 xi1 + β2 xi2 + ... + βp−1 xip−1 .
(3.5)
Είναι προφανές ότι τα Yi , εξαρτώμενα από τα ϵi , είναι ανεξάρτητες τυχαίες μεταβλητές από κανονική κατανομή
με:
E (Yi ) =
p−1
X
βk xik , xi0 ≡ 1, ∀i
και V ar (Yi ) = σ 2 .
(3.6)
k=0
Με τη χρήση πινάκων και διανυσμάτων, το μοντέλο (3.4) γράφεται ως εξής:







ϵ1
β0
1 x11 · · · x1p−1
y1
  


 
1 x21 · · · x2p−1   β1   ϵ2 
 y2 

  
 .  = .
..
.. 
...
.
 .  +  . 
 . 
.
 . 
.
.   ..   .. 
yn
ϵn
1 xn1 · · · xnp−1 βp−1
(3.7)
50
ΠΟΛΛΑΠΛΗ ΠΑΛΙΝΔΡΟΜΗΣΗ
⇔ y∼ = X β∼ + ∼ϵ ,
n×1
όπου:
n×p
p×1

!
ϵ ∼ Nn
∼
0∼ , σ 2 In
n×1
n×1
(3.8)
n×1
και

y∼ ∼ Nn  X β∼ , σ 2 In  .
n×1
n×p
(3.9)
p×1
Κάτω από την ομπρέλα του γενικού μοντέλου (3.4), περιλαμβάνονται πολλές περιπτώσεις προτύπων παλινδρόμησης, όπως:
Α. Πολυωνυμικά μοντέλα παλινδρόμησης
Το μη γραμμικό μοντέλο:
yi = β0 + β1 xi + β2 x2i + ... + β3 x3i + ϵi ,
i = 1, ..., n,
(3.10)
είναι ειδική περίπτωση του μοντέλου (3.4), αφού θέτοντας xi1 = xi , xi2 = x2i και xi3 = x3i , προκύπτει το
(3.4) με p = 4.
Β. Μοντέλα μετασχηματισμών
Το μοντέλο:
log zi = β0 + β1 xi1 + β2 xi2 + β3 xi3 + ϵi ,
i = 1, ..., n,
(3.11)
αποτελεί ειδική περίπτωση του μοντέλου (3.4), αφού ο μετασχηματισμός yi = log zi οδηγεί στο (3.4) με
p = 4.
Γ. Μοντέλα με αλληλεπιδράσεις
Έστω το μοντέλο:
yi = β0 + β1 xi1 + β2 xi2 + β3 xi1 xi2 + ϵi ,
i = 1, ..., n.
(3.12)
Τέτοιου είδους μοντέλα χρησιμοποιούνται όταν οι ανεξάρτητες μεταβλητές αλληλεπιδρούν (interact) πάνω
στη μεταβλητή Y . Ο όρος β3 xi1 xi2 ονομάζεται όρος αλληλεπίδρασης (interaction term). Είναι σημαντικό
να τονιστεί ότι η σημασία των β1 και β2 δεν είναι η ίδια με αυτή που είχαν στο μοντέλο (3.1). Διατηρώντας
τη x2 σταθερή, η συνάρτηση παλινδρόμησης του μοντέλου (3.12) γράφεται στη μορφή:
E (Yi ) = (β0 + β2 xi2 ) + (β1 + β3 xi2 ) xi1 ,
(3.13)
έτσι ώστε η κλίση της συνάρτησης παλινδρόμησης, που θα αντιπροσωπεύει τη μεταβολή της μέσης τιμής της
Y για κάθε μοναδιαία αύξηση της x1 , όταν η x2 διατηρείται σταθερή, είναι:
β1 + β3 xi2 .
(3.14)
Ανάλογα, μία μοναδιαία αύξηση της x2 , όταν η x1 διατηρείται σταθερή, επιφέρει μεταβολή της μέσης τιμής
της Y ίση με:
β2 + β3 xi1 .
(3.15)
Παρ’ όλα αυτά, το μοντέλο (3.12) αποτελεί ειδική περίπτωση του μοντέλου (3.4), για xi3 = xi1 xi2 και
p = 4.
ΓΡΑΜΜΙΚΑ ΜΟΝΤΕΛΑ ΚΑΙ ΣΧΕΔΙΑΣΜΟΣ & ΑΝΑΛΥΣΗ ΠΕΙΡΑΜΑΤΩΝ ΜΕ ΕΦΑΡΜΟΓΕΣ ΣΕ R ΚΑΙ MINITAB
51
Δ. Μοντέλα συνδυασμών
Ακόμα και μοντέλα που συνδυάζουν όλες τις προηγούμενες περιπτώσεις, αποτελούν ειδικές μορφές του μοντέλου (3.4). Για παράδειγμα, το πολυωνυμικό μοντέλο με αλληλεπίδραση:
exp (zi ) = β0 + β1 xi1 + β2 x2i1 + β3 xi2 + β4 x2i2 + β5 xi1 xi2 + ϵi ,
i = 1, ..., n,
(3.16)
περιγράφεται από το γενικό μοντέλο (3.4) με exp (xi ) = yi , xi2 = x2i1 , xi3 = xi2 , xi4 = x2i2 , xi5 =
xi1 xi2 και p = 6.
3.3 Εκτιμητές ελαχίστων τετραγώνων
Για την εύρεση των εκτιμητών ελαχίστων τετραγώνων β̂∼ του β∼ , αρκεί η ελαχιστοποίηση της ακόλουθης ποσότητας:
min Q β∼ = min ∼ϵ′∼ϵ.
(3.17)
β∼
β∼
Άρα,
Q β∼ = ∼ϵ′∼ϵ = y∼ − Xβ∼
′ y∼ − Xβ∼ = y∼′ − β∼ ′ X′
y∼ − Xβ∼
y∼′ Xβ∼ =β∼ ′ X′ y∼
= y∼ y∼ − y∼ Xβ∼ − β∼ X y∼ + β∼ X Xβ∼ ==== y∼′ y∼ − 2β∼ ′ X′ y∼ + β∼ ′ X′ Xβ∼ .
′
′
′
′
′
′
Παραγωγίζοντας την ποσότητα Q β∼ ως προς β∼ , και θέτοντάς την ίση με το 0:
dQ β∼
= −2X′ y∼ + 2X′ Xβ∼ = 0
dβ∼
⇔ X′ Xβ∼ = X′ y∼.
(3.18)
Από τις εξισώσεις (3.18), οι οποίες καλούνται κανονικές (ή εκτιμητικές), και με την προϋπόθεση ότι det (X′ X) ̸=
0, προκύπτει ότι:
−1
β̂∼ = (X′ X) X′ y∼.
(3.19)
Το ίδιο ισχύει και για την εκτιμήτρια συνάρτηση παλινδρόμησης που ισούται με:
ŷ∼ = Xβ̂∼ .
(3.20)
ϵ̂ = y∼ − ŷ∼.
(3.21)
Τέλος, τα κατάλοιπα δίνονται από τη σχέση:
∼
Πρόταση 3.1. Για το πολλαπλό γραμμικό μοντέλο της (3.8), ο ΕΕΤ β̂∼ και τα σφάλματα ∼ϵ̂ είναι μεταξύ τους
ανεξάρτητα.
Απόδειξη Πρότασης 3.1. Έστω y∼ ∼ Nn Xβ∼ , σ 2 In .
h
−1
Cov β̂∼ , ∼ϵ̂ = Cov (X′ X)
X′ y∼, (In − H) y∼
i
52
ΠΟΛΛΑΠΛΗ ΠΑΛΙΝΔΡΟΜΗΣΗ
−1
= (X′ X)
(In −H) συμμετρικός
====
′
2
X′ Cov y∼, y∼ (In − H)′
= σ (X X)
−1
(X′ X)
−1
X′ V ar y∼ (In − H)
′
X (In − H)
X′ (In −H)=0
====
0.
Έως εδώ, έχουμε καταφέρει να δείξουμε ότι τα β̂∼ και ∼ϵ̂ είναι μεταξύ τους ασυσχέτιστα. Για την επίτευξη της ανεξαρτησίας, θα πρέπει να γίνει χρήση ενός μετέπειτα Θεωρήματος (Θεώρημα 3.3) από όπου θα ειπωθεί/αποδειχτεί
ότι οι ΕΕΤ β̂∼ ακολουθούν την κανονική κατανομή. Τελικώς, αφού οι β̂∼ και ∼ϵ̂ αποτελούν ασυσχέτιστες κανονικές
τυχαίες μεταβλητές, θα είναι μεταξύ τους και ανεξάρτητες.
Πρόταση 3.2. Η εκτιμήτρια β̂∼ είναι αμερόληπτη για την παράμετρο β∼ , δηλαδή:
E β̂∼ = β∼ ,
ενώ ο πίνακας διασποράς-συνδιασποράς του β̂∼ ισούται με:








V ar β̂0
Cov β̂0 , β̂1








· · · Cov β̂0 , β̂p−1
· · · Cov β̂1 , β̂p−1
V ar β̂∼ =
..
..
.
.
V ar β̂p−1
Cov β̂p−1 , β̂0 Cov β̂p−1 , β̂1 · · ·
Cov β̂1 , β̂0
..
.
−1
= σ 2 (X′ X)
V ar β̂1
..
.
.
(3.22)
Στην περίπτωση που στη σχέση (3.22) το σ 2 είναι άγνωστο, τότε η εκτιμήτρια του V ar β̂∼ ισούται με:
\
−1
V ar β̂∼ = M SE (X′ X) .
(3.23)
Απόδειξη Πρότασης 3.2.
h
−1
E β̂∼ = E (X′ X)
h
−1
V ar β̂∼ = V ar (X′ X)
i
−1
X′ y∼ = (X′ X)
i
−1
X′ y∼ = (X′ X)
X′ E y∼ = (X′ X)
h
XV ar y∼
−1
−1
(X′ X)
X′ Xβ∼ = β∼ .
i′
−1
X′ = σ 2 (X′ X)
.
3.4 Πίνακας ανάλυσης διακύμανσης (ANOVA)
Έστω ότι θέλουμε να εφαρμόσουμε τον έλεγχο:
H0 : β1 = β2 = ... = βp−1 = 0
vs
H1 :
Τουλάχιστον ένα από τα βi ,
i = 1, ..., p − 1, διαφορετικό του 0,
(3.24)
ΓΡΑΜΜΙΚΑ ΜΟΝΤΕΛΑ ΚΑΙ ΣΧΕΔΙΑΣΜΟΣ & ΑΝΑΛΥΣΗ ΠΕΙΡΑΜΑΤΩΝ ΜΕ ΕΦΑΡΜΟΓΕΣ ΣΕ R ΚΑΙ MINITAB
53
ο οποίος αποτελεί γενίκευση εκείνου της Ενότητας 2.6 και εξετάζει αν όλα τα βi (πλην του σταθερού όρου β0 )
ισούνται ή όχι, με το μηδέν. Αν όλα είναι μηδέν, τότε η διερευνώμενη σχέση μεταξύ Y και Xi , i = 1, ..., p, δεν
υφίσταται. Αντίθετα, αν έστω και ένας συντελεστής είναι διάφορος του μηδενός, τότε υφίσταται (τουλάχιστον
σε έναν βαθμό) σχέση μεταξύ Y και Xi , i = 1, ..., p .
Χρησιμοποιώντας τώρα τα στοιχεία της Ενότητας 2.6 και τις σχέσεις (2.28) και (2.29) που δίνουν τα αθροίσματα SST O, SSR, SSE, και τα μέσα αθροίσματα τετραγώνων M SR και M SE, ο έλεγχος (3.24) μπορεί
να διενεργηθεί μέσω του πιο κάτω πίνακα ANOVA.
Πίνακας 3.1: Πίνακας ANOVA Πολλαπλής Γραμμικής Παλινδρόμησης
Μέσο
Πηγή
Μεταβλητότητας
Βαθμοί
Ελευθερίας
Άθροισμα
Τετραγώνων
Παλινδρόμηση
p−1
SSR =
β̂ X′ y − nȲ 2
M SR =
SSR
p−1
SSE =
′
y ′ y − β̂ X′ y
M SE =
SSE
n−p
∼
Σφάλμα
n−p
n−1
Τετραγώνων
M SR H0
∼
M SE
Fp−1,n−p
∼
∼ ∼
Ολική
F
Άθροισμα
∼
–
∼
SST O =
y ′ y − nȲ 2
–
–
∼ ∼
Η H0 απορρίπτεται εάν F > Fp−1,n−p;α . Ουσιαστικά, απόρριψη της H0 συνεπάγεται μη στατιστική σημαντικότητα του υπό εξέταση μοντέλου στο δοθέν επίπεδο σημαντικότητας α.
Παρατηρούμε ότι αν στον παραπάνω Πίνακα ANOVA θέσουμε p = 2, τότε προκύπτει ο Πίνακας ANOVA
(Πίνακας 2.4) της απλής γραμμικής παλινδρόμησης.
Θεώρημα 3.1. Όταν η μηδενική υπόθεση του ελέγχου (3.24) ισχύει, η κατανομή της ελεγχοσυνάρτησης F =
M SR
είναι η Fp−1,n−p .
M SE
Πρόταση 3.3. Έστω το πολλαπλό γραμμικό μοντέλο παλινδρόμησης:
y∼ = X β∼ + ∼ϵ ,
(3.25)
E (M SE) = σ 2 .
(3.26)
n×p
n×1
τάξης p και ∼ϵ ∼ (0∼, σ 2 In ). Τότε:
p×1
n×1
Απόδειξη Πρότασης 3.3.
h
−1
ϵ̂ = y∼ − ŷ∼ = y∼ − Xβ̂∼ = y∼ − X (X′ X)
∼
i
h
−1
X′ y∼ = In − X (X′ X)
i
X′ y∼
= (In − H) y∼.
h
SSE = ϵ̂∼′∼ϵ̂ = (In − H) y∼
= y∼′ (In − H) y∼.
i′ h
i
(In − H) y∼ = y∼′ (In − H)′ (In − H) y∼
54
ΠΟΛΛΑΠΛΗ ΠΑΛΙΝΔΡΟΜΗΣΗ
h
i
′
E (SSE) = E y∼′ (In − H) y∼ = tr (In − H) σ 2 + Xβ∼ (In − H) Xβ∼
= σ 2 tr (In − H) + β∼ ′ X′ (In − H) Xβ∼
(In −H)X=0
====
σ 2 [tr (In ) − tr (H)]
= σ 2 (n − p) .
Επομένως:
E (SSE) = σ 2 (n − p) ⇔ E (M SE) = σ 2 .
Αξίζει να παρατηρήσουμε ότι οι β.ε. του SSE είναι n − p, αφού από τον τύπο του, όπως αυτός αποτυπώνεται
από τον Πίνακα ANOVA (Πίνακας 3.1), εμπλέκονται p συντελεστές παλινδρόμησης που χρήζουν εκτίμησης.
3.5 Το θεώρημα Gauss-Markov
Θεώρημα 3.2. Έστω το πολλαπλό γραμμικό μοντέλο της (3.25). Τότε ο ΕΕΤ β̂∼ είναι BLUE του β∼ .
∗
Απόδειξη Θεωρήματος 3.2. Έστω β̂∼ ένας άλλος γραμμικός αμερόληπτος εκτιμητής του β∼ τέτοιος ώστε:
h
∗
β̂∼ = (X′ X)
−1
i
X′ + C y∼,
όπου C ένας kxn μη-μηδενικός πίνακας.
− Γραμμικότητα
∗
Ο β̂∼ είναι γραμμικός εκτιμητής εκ κατασκευής.
− Αμεροληψία
Θέλουμε να δείξουμε ότι:
∗
E β̂∼
= β∼ .
Άρα:
∗
E β̂∼
=E
h
h
−1
(X′ X)
−1
= (X′ X)
i h
−1
X′ + C y∼ = (X′ X)
i
−1
X′ + C Xβ∼ = (X′ X)
= β∼ + CXβ∼ = (Ip + CX) β∼ .
∗
Για να είναι ο β̂∼ αμερόληπτος εκτιμητής του β∼ , θα πρέπει CX = 0.
− Ελάχιστη Διασπορά
Θέλουμε να δείξουμε ότι:
∗
V ar β̂∼
≤ V ar β∼ .
i
X′ + C E y∼
X′ Xβ∼ + CXβ∼
ΓΡΑΜΜΙΚΑ ΜΟΝΤΕΛΑ ΚΑΙ ΣΧΕΔΙΑΣΜΟΣ & ΑΝΑΛΥΣΗ ΠΕΙΡΑΜΑΤΩΝ ΜΕ ΕΦΑΡΜΟΓΕΣ ΣΕ R ΚΑΙ MINITAB
55
Έτσι:
∗
V ar β̂∼
= V ar
h
h
(X′ X)
i X′ + C y∼
i
h
−1
X′ + C V ar y∼
−1
X′ + C σ 2 X (X′ X)
= (X′ X)
h
−1
= (X′ X)
h
i
−1
= σ 2 (X′ X)
−1
−1
−1
σ 2 (X′ X)
====
−1
−1
X′ + C
+ C′
+ (X′ X)
−1
i′
i
X′ C′
+ CC′ ]
h
X′ C′ =CX=0
h
X′ X (X′ X)
+ CX (X′ X)
(X′ X)
i
−1
+ CC′ = σ 2 (X′ X)
+ σ 2 CC′ .
Από την Πρόταση 3.2 γνωρίζουμε ότι:
V ar β̂∼ = σ 2 (X′ X)
Επομένως:
∗
V ar β̂∼
−1
.
= V ar β̂∼ + σ 2 CC′ > V ar β̂∼ .
Θεώρημα 3.3. Αν y∼ ακολουθεί τη n-διάσταση κανονική κατανομή Nn Xβ∼ , σ 2 In , όπου X είναι ένας nxp
πίνακας τάξης p (p ≤ n), τότε:
1. β̂∼ ∼ Np β∼ , σ 2 (X′ X)−1 ,
2.
β̂∼ −β∼
′
X′ X
β̂∼ −β∼
σ2
∼ χ2p ,
3. Ο ΕΕΤ του β∼ , β̂∼ και το SSE είναι μεταξύ τους ανεξάρτητα,
4.
SSE
σ2
∼ χ2n−p .
Απόδειξη Θεωρήματος 3.3.
(3.19):
1. Ο εκτιμητής β̂∼ αποτελεί γραμμικό συνδυασμό του y∼, καθώς από τη σχέση
−1
β̂∼ = (X′ X)
X′ y∼ = Ky∼,
όπου K = (X′ X)−1 X′ .
Εφόσον ο πίνακας K είναι πλήρους βαθμίδας, ισχύει ότι:
h
−1
rank (K) = rank (KK′ ) = rank (X′ X)
h
−1
= rank (X′ X)
i
= p.
−1
X′ X (X′ X)
i
56
ΠΟΛΛΑΠΛΗ ΠΑΛΙΝΔΡΟΜΗΣΗ
Επιπλέον, αφού y∼ ∼ Nn Xβ∼ , σ 2 In τότε:
β̂∼ = Ky∼ ∼ Np KXβ∼ , Kσ 2 K′
ως γραμμικός συνδυασμός ανεξάρτητων κανονικών τ.μ.:
• KX = (X′ X)−1 X′ Xβ∼ = β∼ .
• Kσ 2 K′ = σ 2 (X′ X)−1 X′ X (X′ X)−1 = σ 2 (X′ X)−1 .
Τελικά,
β̂∼ ∼ Np β∼ , σ 2 (X′ X)
−1
.
2. Εφαρμόζοντας τυποποίηση στο (1) του Θεωρήματος 3.3 και στη συνέχεια υψώνοντας στο τετράγωνο,
έχουμε:


β̂∼ − β∼ (X′ X)1/2
σ
2
Τετραγωνική Μορφή

====
′
β̂∼ − β∼ X′ X β̂∼ − β∼
σ2
.
3. Γενικά, αν C ένας m × p πίνακας σταθερών, D ένας p × p συμμετρικός πίνακας σταθερών και η y∼ ∼
Np µ
, Σ , τότε οι ποσότητες Cy∼ και y∼′ Dy∼ είναι μεταξύ τους ανεξάρτητες αν και μόνο αν CΣD = 0.
∼
Επιπλέον, από την Απόδειξη Πρότασης 3.3 γνωρίζουμε ότι:
SSE = ∼ϵ̂′∼ϵ̂ = y∼′ (In − H) y∼.
Τέλος:
Θέτοντας:
−1
β̂∼ = (X′ X)
−1
C = (X′ X)
X′
X′ y∼.
και D = (In − H)
και υπό την προϋπόθεση ότι y∼ ∼ Nn Xβ∼ , σ 2 In , προκύπτει:
−1
CΣD = σ 2 (X′ X)
X′ (In − H) = 0.
(3.27)
Άρα, τα β̂∼ και SSE είναι ανεξάρτητα.
, σ 2 Ip ,
4. Γενικά, αν D ένας p × p συμμετρικός πίνακας σταθερών με rank (D) = r και y∼ ∼ Np µ
∼
τότε:
!
′
y∼′ Dy∼
µ
Dµ
2
∼
∼
∼ χr
,
(3.28)
σ2
2σ 2
αν και μόνο αν ο D είναι ταυτοδύναμος (δηλαδή D2 = D).
Επειδή ο In − H είναι και αυτός ταυτοδύναμος, έχουμε:
rank (In − H) = tr (In − H) = tr (In ) − tr (H) = n − p.
Άρα, από τη σχέση (3.28), και υπό την προϋπόθεση ότι y∼ ∼ Nn Xβ∼ , σ 2 In :
y∼′ (In − H) y∼
σ2

′

(In − H) Xβ∼ 
 Xβ
∼
∼ χ2n−p 
.
2σ 2
Επειδή όμως (In − H) X = 0, τελικά:
y∼′ (In − H) y∼
σ2
∼ χ2n−p .
ΓΡΑΜΜΙΚΑ ΜΟΝΤΕΛΑ ΚΑΙ ΣΧΕΔΙΑΣΜΟΣ & ΑΝΑΛΥΣΗ ΠΕΙΡΑΜΑΤΩΝ ΜΕ ΕΦΑΡΜΟΓΕΣ ΣΕ R ΚΑΙ MINITAB
57
3.6 Εκτιμήτριες μεγίστης πιθανοφάνειας
Έστω το πολλαπλό γραμμικό μοντέλο:
y∼ = X β∼ + ∼ϵ ,
n×p
n×1
n×1
p×1
με rank (X) = p.
Μπορεί η τεχνική των ελαχίστων τετραγώνων να μην προϋποθέτει την πρότερη γνώση της κατανομής των
σφαλμάτων, παρ’ όλα αυτά θα πρέπει να υπάρχει γνώση αυτής όταν πρόκειται για οποιουδήποτε τύπου στατιστική συμπερασματολογία (έλεγχος υποθέσεων, Δ.Ε., κλπ.). Ως εκ τούτου, υποθέτουμε ότι:
!
ϵ ∼ Nn
∼
nx1
2
0∼ , σ In
(3.29)
nx1
και κατ’ επέκταση:


y∼ ∼ Nn  X β∼ , σ 2 In  .
n×p
nx1
p×1
Βάσει της υπόθεσης (3.29), είναι εφικτή η εύρεση των εκτιμητών μεγίστης πιθανοφάνειας (ΕΜΠ) των β∼ και
σ 2 , αντίστοιχα.
Στοχεύουμε στη μεγιστοποίηση της πιθανοφάνειας:
L β∼ , σ
2
=
1
(2πσ 2 )n/2
e
−
1
′
2σ 2 ∼ ∼
(ϵ ϵ) = 2πσ 2
−n/2 − 1
2σ 2
e
h
y∼−Xβ∼
′ y∼−Xβ∼
i
.
Λογαριθμίζοντας την παραπάνω πιθανοφάνεια έχουμε:
log L β∼ , σ
2
′ 1 n
2
= − log 2πσ − 2 y∼ − Xβ∼ y∼ − Xβ∼ .
2
2σ
− Για τον ΕΜΠ του β∼
d log L β∼ , σ 2
dβ∼
′ d
n
1 2
=0
=
− log 2πσ − 2 y∼ − Xβ∼ y∼ − Xβ∼
dβ∼
2
2σ
⇔ −2X′ y∼ + 2X′ Xβ∼ = 0
−1
⇔ β̂∼ = (X′ X)
X′ y∼.
Άρα, ο ΕΜΠ και ο ΕΕΤ του β∼ ταυτίζονται.
− Για τον ΕΜΠ του σ 2
d log L β∼ , σ 2
dσ 2
′ 1 d
n
2
= 2 − log 2πσ − 2 y∼ − Xβ∼ y∼ − Xβ∼
=0
dσ
2
2σ
58
ΠΟΛΛΑΠΛΗ ΠΑΛΙΝΔΡΟΜΗΣΗ
′ n
1 2
⇔ − log 2σ + 2 y∼ − Xβ∼ y∼ − Xβ∼ = 0
2
2σ
⇔ σ̃ 2 =
y∼ − Xβ∼
′ y∼ − Xβ∼
n
=
SSE
.
n
O ΕΜΠ σ̃ 2 , σε αντίθεση με τον ΕΕΤ σ̂ 2 = M SE, δεν αποτελεί αμερόληπτη εκτίμηση του σ 2 .
3.7 Προσαρμοσμένος συντελεστής προσδιορισμού και συντελεστής μερικού προσδιορισμού
Όπως στην απλή, έτσι και στην πολλαπλή γραμμική παλινδρόμηση, μπορεί να γίνει χρήση του συντελεστή
προσδιορισμού R2 (2.31) για τον χαρακτηρισμό της καταλληλότητας του υπό εξέταση μοντέλου. Όμως, ο
εν λόγω συντελεστής έχει ένα σημαντικό μειονέκτημα. Όσο προστίθενται ανεξάρτητες μεταβλητές στο μοντέλο, είτε είναι στατιστικώς σημαντικές είτε όχι, η τιμή του R2 αυξάνεται. Για τον λόγο αυτό, στην περίπτωση
του πολλαπλού γραμμικού μοντέλου είθισται να γίνεται χρήση του προσαρμοσμένου (adjusted) συντελεστή
2
προσδιορισμού Radj
ο οποίος δίνεται από τη σχέση:
2
Radj
=1−
n−1
(1 − R2 ).
n−p−1
2
είναι εκ κατασκευής ανθεκτικός απέναντι στην προσθήκη
Όπως υπονοείται από την παραπάνω σχέση, ο Radj
μεταβλητών που δεν συνεισφέρουν σημαντικά στην αύξηση της επεξηγηματικής ικανότητας του μοντέλου.
Αυτό επιτυγχάνεται μέσω της στάθμισης του κλασικού R2 από το πλήθος p των ανεξάρτητων μεταβλητών.
Για περισσότερες πληροφορίες σχετικά με τον προσαρμοσμένο συντελεστή προσδιορισμού, ο αναγνώστης
παραπέμπεται στην Ενότητα 5.5.
Ο συντελεστής μερικού προσδιορισμού (coefficient of partial determination), σε αντίθεση με τον συντελεστή προσδιορισμού (2.31), αντιπροσωπεύει το ποσοστό της μείωσης της διακύμανσης της μεταβλητής Y
που επιτυγχάνεται με την εισδοχή μιας νέας ανεξάρτητης μεταβλητής X στο μοντέλο παλινδρόμησης, όταν
όλες οι άλλες βρίσκονται ήδη στο μοντέλο.
Για τον ορισμό θα χρησιμοποιηθεί το πρότυπο:
yi = β0 + β1 xi1 + β2 xi2 + β3 xi3 + ϵi ,
i = 1, ..., n.
Ο συντελεστής μερικού προσδιορισμού που αντιπροσωπεύει τη μείωση της διακύμανσης της Y που οφείλεται
στη μεταβλητή X3 , όταν οι μεταβλητές X1 και X2 βρίσκονται ήδη στο μοντέλο, ισούται με:
rY2 3.12 =
SSR (X3 |X1 , X2 )
.
SSE (X1 , X2 )
(3.30)
Ανάλογα, μπορούν να οριστούν οι παρακάτω συντελεστές μερικού προσδιορισμού:
rY2 1.23 =
SSR (X1 |X2 , X3 )
SSE (X2 , X3 )
(3.31)
rY2 2.13 =
SSR (X2 |X1 , X3 )
.
SSE (X1 , X3 )
(3.32)
και
ΓΡΑΜΜΙΚΑ ΜΟΝΤΕΛΑ ΚΑΙ ΣΧΕΔΙΑΣΜΟΣ & ΑΝΑΛΥΣΗ ΠΕΙΡΑΜΑΤΩΝ ΜΕ ΕΦΑΡΜΟΓΕΣ ΣΕ R ΚΑΙ MINITAB
59
Ο συντελεστής μερικού προσδιορισμού μεταξύ των Y και X2 , όταν η X1 βρίσκεται ήδη στο μοντέλο, ισούται
με:
SSR (X2 |X1 )
(3.33)
rY2 2.1 =
,
SSE (X1 )
ενώ εκείνος μεταξύ των Y και X1 , όταν η X2 βρίσκεται ήδη στο μοντέλο ισούται με:
rY2 1.2 =
SSR (X1 |X2 )
.
SSE (X2 )
(3.34)
Κατ’ αντιστοιχία με τον συντελεστή συσχέτισης, η προσημασμένη (signed) τετραγωνική ρίζα του συντελεστή
μερικού προσδιορισμού ονομάζεται συντελεστής μερικής συσχέτισης (coefficient of partial correlation).
3.8 Έλεγχος υποθέσεων, διαστήματα εμπιστοσύνης και πρόβλεψη
Θεώρημα 3.4. Για το μοντέλο (3.4) και την εκτιμήτρια β̂∼ που δίνεται από τη σχέση (3.19), προκύπτει:
t β̂i =
όπου se β̂i =
r
β̂i − βi∗
se β̂i
∼ tn−p ,
i = 0, 1, ..., p − 1,
(3.35)
\
\
V ar β̂i το διαγώνιο (i + 1, i + 1) στοιχείο του πίνακα V ar β̂∼ .
Με βάση το προηγούμενο Θεώρημα, ένα 100(1 − α)% Δ.Ε. για την παράμετρο βi είναι το:
β̂i ± tn−p,a/2 se β̂i
(3.36)
ενώ οι έλεγχοι υποθέσεων, αναφορικά με το βi , της μορφής:
≤
H0 : βi ≥ βi∗
=
>
H1 : βi < βi∗ , i = 0, 1, ..., p − 1,
̸=
vs
βασίζονται στην ελεγχοσυνάρτηση:
t β̂i =
β̂i − βi∗
se β̂i
H0
∼ tn−p ,
i = 0, 1, ..., p − 1,
(3.37)
όπου βi∗ είναι η οριακή τιμή του ελέγχου.
Στον Πίνακα 3.2 παρουσιάζεται η περιοχή (χωρίο) απόρριψης της H0 ανάλογα με τη μορφή της H1 , όπου
tn−p;α αποτελεί το 100(1 − α)% ποσοστημόριο της κατανομής t με n − p βαθμούς ελευθερίας. Οι β.ε. είναι
n − p για κάθε έλεγχο του Θεωρήματος 3.4, διότι χάνονται p το πλήθος β.ε. όταν το σ 2 εκτιμάται από το
M SE, αφού το τελευταίο εμπεριέχει τους p ΕΕΤ των β∼ .
Πίνακας 3.2: Χωρία απόρριψης της μηδενικής υπόθεσης για τους συντελεστές παλινδρόμησης
Μορφή H1
Απόρριψη H0
H1 : βi < βi∗
t(β̂i ) < −tn−p;α
H1 : βi > βi∗
t(β̂i ) > tn−p;α
H1 : βi ̸= βi∗
t(β̂i ) > tn−p;α/2
60
ΠΟΛΛΑΠΛΗ ΠΑΛΙΝΔΡΟΜΗΣΗ
Όσον αφορά τον έλεγχο στατιστικής σημαντικότητας του συντελεστή βi , αυτός ορίζεται ως:
H0 : βi = 0
vs
H1 : βi ̸= 0, i = 0, 1, ..., p − 1,
με ΣΣΕ τη σχέση (3.37), θέτοντας βi∗ = 0, και περιοχή απόρριψης της H0 την t(β̂i ) > tn−p;α/2 .
Γενικεύοντας τον τύπο (2.50) των από κοινού διαστημάτων εμπιστοσύνης Bonferroni:
β̂i ± tn−2,a/2m se β̂i ,
(3.38)
όπου m(≤ p) ο αριθμός των παραμέτρων για τις οποίες ζητείται η κατασκευή από κοινού διαστημάτων εμπιστοσύνης.
Αν στη σχέση (3.38) το m είναι μεγάλο, τότε τα προκύπτοντα διαστήματα θα είναι μεγάλου εύρους, καθιστώντας τις όποιες εκτιμήσεις πρακτικά ανούσιες. Ως εκ τούτου, η χρήση των 100 (1 − α) % από κοινού
Δ.Ε. Bonferroni συνιστάται στις περιπτώσεις όπου το m είναι σχετικά μικρό.
Όπως στην απλή, έτσι και στην πολλαπλή γραμμική παλινδρόμηση, είναι εφικτή η εκτίμηση της συνάρτησης
παλινδρόμησης για κάποια τιμή Xh = (Xh1 , Xh2 , ..., Xhp−1 ) των μεταβλητών X1 , X2 , ..., Xp−1 , όπως
και η εκτίμηση της Y για κάθε νέα παρατήρηση Xh . Τα αντίστοιχα διαστήματα εμπιστοσύνης και πρόβλεψης,
που αποτελούν γενίκευση των τύπων (2.47) και (2.48), είναι:
Ŷh ± tn−p,a/2 se Ŷh
και Ŷh ± tn−p,a/2 se Ŷh∗ ,
όπου:
• Ŷh = Xh′ β̂∼ ,
\
• V ar Ŷh = M SE Xh′ (X′ X)−1 Xh και
\
• V ar Ŷh∗ = M SE 1 + Xh′ (X′ X)−1 Xh .
Άσκηση Αυτοαξιολόγησης
Αν στη μελέτη ενός πολλαπλού γραμμικού μοντέλου παλινδρόμησης έχει θεωρηθεί ως
επίπεδο σημαντικότητας το α = 5%, και για μία ανεξάρτητη μεταβλητή η p-value που
προέκυψε είναι 6%, ποια θα ήταν η «ασφαλέστερη» απόφαση ως προς την απόρριψη ή μη
της υπόθεσης στατιστικής σημαντικότητάς της;
3.9 Εφαρμογές στην R
1. Θεωρώντας το μοντέλο:
yi = β0 + β1 xi1 + β2 xi2 + ϵi ,
και τα δεδομένα του Πίνακα 3.3:
i = 1, ..., 6,
(3.39)
ΓΡΑΜΜΙΚΑ ΜΟΝΤΕΛΑ ΚΑΙ ΣΧΕΔΙΑΣΜΟΣ & ΑΝΑΛΥΣΗ ΠΕΙΡΑΜΑΤΩΝ ΜΕ ΕΦΑΡΜΟΓΕΣ ΣΕ R ΚΑΙ MINITAB
61
Πίνακας 3.3: Τιμές 6 παρατηρήσεων (xi1 , xi2 , yi )
#
X1
X2
Y
1
7
33
42
2
4
41
33
3
16
7
75
4
3
49
28
5
21
5
91
6
8
31
55
i. Να κατασκευαστεί το τριδιάστατο διάγραμμα διασποράς (σκεδασμογράφημα) μεταξύ των μεταβλητών X1 , X2 και Y .
ii. Να υπολογιστούν τα β̂∼ , ∼ϵ̂, SSE, SSR και V ar β̂∼ .
iii. Να εκτιμηθεί η τιμή Ŷh , όταν X1 = 10 και X2 = 30.
iv. Να υπολογιστεί το V ar Ŷh , όταν X1 = 10 και X2 = 30.
Ȫ
Λύση
Ξεκινάμε με τη συνήθη εισαγωγή των δεδομένων στην R.
Εισαγωγή δεδομένων & δημιουργία μεταβλητών
library(readxl)
data <‐ read_xlsx('ch3ex1.xlsx')
X1 <‐ data$X1
X2 <‐ data$X2
Y <‐ data$Y
i. Είναι διαθέσιμη μία πληθώρα πακέτων για την κατασκευή τριδιάστατων διαγραμμάτων διασποράς στην R (π.χ. [scatterplot3d], [rgl], [Rcmdr], [plotly], [plot3D]). Εμείς θα κάνουμε
χρήση του πακέτου [plotly] και συγκεκριμένα της εντολής που παρέχεται μέσω αυτού, plot_ly.
Κατασκευή τριδιάστατου διαγράμματος διασποράς
library(plotly) #Φόρτωση πακέτου plotly
fig <‐ plot_ly(
data,
x = ~ X1,
y = ~ Y,
z = ~ X2,
marker = list(
color = ~ Y,
colorscale = c('#FFE1A1', '#683531'),
62
ΠΟΛΛΑΠΛΗ ΠΑΛΙΝΔΡΟΜΗΣΗ
showscale = TRUE
)
)
fig <‐ fig %>% add_markers()
fig <‐ fig %>% layout(
scene = list(
xaxis = list(title = 'X1'),
yaxis = list(title = 'Y'),
zaxis = list(title = 'X2')
),
annotations = list(
x = 1,
y = 0.5,
text = 'Y',
xref = 'paper',
yref = 'paper',
showarrow = FALSE
)
)
fig
Για την εμφάνιση του (διαδραστικού) σχήματος, όπως αυτό προκύπτει από την εκτέλεση του
παραπάνω κώδικα, πατήστε εδώ.
ii. Εισάγουμε στη μεταβλητή multlm το πολλαπλό γραμμικό μοντέλο παλινδρόμησης και έπειτα
εξάγουμε από αυτή τους συντελεστές μέσω της εντολής multlm$coefficients.
Δημιουργία πολλαπλού γραμμικού μοντέλου & εξαγωγή συντελεστών
multlm <‐ lm(Y ~ X1 + X2)
multlm$coefficients
> multlm$coefficients
(Intercept)
X1
33.93210
2.78476
X2
‐0.26442




β̂
33.9321
 0




β̂∼ = β̂1  =  2.78476  .
−0.26442
β̂2
Ο υπολογισμός του V ar β̂∼ θα γίνει μέσω της εφαρμογής της εντολής vcov [stats] πάνω
στη μεταβλητή multlm.
Εύρεση πίνακα διασποράς-συνδιασποράς των β̂
∼
var.covar.coeffs <‐ vcov(multlm)
var.covar.coeffs
> var.covar.coeffs
(Intercept)
X1
X2
ΓΡΑΜΜΙΚΑ ΜΟΝΤΕΛΑ ΚΑΙ ΣΧΕΔΙΑΣΜΟΣ & ΑΝΑΛΥΣΗ ΠΕΙΡΑΜΑΤΩΝ ΜΕ ΕΦΑΡΜΟΓΕΣ ΣΕ R ΚΑΙ MINITAB
(Intercept)
X1
X2
63
715.471 ‐34.15892 ‐13.59494
‐34.159
1.66167
0.64407
‐13.595
0.64407
0.26247


\
\
\
V
ar
β̂
Cov
β̂
,
β̂
Cov
β̂
,
β̂
0
0
1
0
2 



\


\
\
\
V ar β̂∼ = Cov β̂1 , β̂0
V ar β̂1
Cov β̂1 , β̂2 




\
\
\
Cov β̂2 , β̂0 Cov β̂2 , β̂1
V ar β̂2


715.471 −34.159 −13.595

= −34.159 1.66167 0.64407 
.
−13.595 0.64407 0.26247
Για τα SSE και SSR, χρειάζεται να γίνει άθροιση των επιμέρους SSEs, αφού η εντολή anova
δίνει το SSE για καθεμία από τις ανεξάρτητες μεταβλητές του μοντέλου.
Εύρεση SSR & SSE
ANOVA <‐ anova(multlm)
ANOVA
SSE <‐ sum(ANOVA$`Sum Sq`[1:2]) #Άθροισμα 2 πρώτων στοιχείων στήλης
Sum Sq πίνακα ANOVA
SSE
> ANOVA
Analysis of Variance Table
Response: Y
Df Sum Sq Mean Sq F value Pr(>F)
X1
1
3004
3004 145.20 0.0012
X2
1
6
6
0.27 0.6414
Residuals 3
62
21
> sum(ANOVA$ `Sum Sq`[1:2])
[1] 3010
SSR = 3004 + 6 = 3010
και SSE = 62.
iii. Στο ερώτημα αυτό καλούμαστε να υπολογίσουμε την ποσότητα:
Ŷh = Xh′ β̂∼ .
Επειδή πρόκειται για πολλαπλασιασμό μεταξύ πινάκων/διανυσμάτων, θέλει ιδιαίτερη προσοχή
αφού πρέπει να γίνει χρήση του συμβόλου %*% αντί του *.
Δημιουργία Xh και υπολογισμός Ŷh
X.h <‐ c(1, 10, 30)
Y.h.hat <‐ t(X.h) %*% multlm$coefficients
Y.h.hat
64
ΠΟΛΛΑΠΛΗ ΠΑΛΙΝΔΡΟΜΗΣΗ
> Y.h.hat
[,1]
[1,] 53.847
Ŷh = 53.847.
iv. Ο συνδυασμός των αποτελεσμάτων στα ερωτήματα (ii) και (iii), θα οδηγήσουν στο ζητούμενο.
Για τον υπολογισμό του Xh′ θα γίνει χρήση της εντολής t [base] πάνω στη μεταβλητή X.h.
\
Υπολογισμός Var Ŷh
MSE <‐ ANOVA$`Mean Sq`[3]
var.Y.h.hat <‐ MSE * (t(X.h) %*% var.covar.coeffs
!
\
′ \
%*% X.h) #V ar Ŷh = M SE Xh V ar β̂ Xh
∼
var.Y.h.hat
> var.Y.h.hat
[,1]
[1,] 112.24
\
V ar Ŷh = 112.24.
2. Στον Πίνακα 3.4 δίνονται οι τιμές των μεταβλητών:
Y = Μηνιαία Ποσότητα Ατμού μιας Μηχανής (kg/h),
X1 = Αριθμός Ημερών που η Μηχανή Εργάστηκε ανά Μήνα,
X2 = Μέση Μηνιαία Θερμοκρασία σε βαθμούς Fahrenheit.
ΓΡΑΜΜΙΚΑ ΜΟΝΤΕΛΑ ΚΑΙ ΣΧΕΔΙΑΣΜΟΣ & ΑΝΑΛΥΣΗ ΠΕΙΡΑΜΑΤΩΝ ΜΕ ΕΦΑΡΜΟΓΕΣ ΣΕ R ΚΑΙ MINITAB
65
Πίνακας 3.4: Τιμές 25 παρατηρήσεων (xi1 , xi2 , yi )
#
X1
X2
Y
1
20
35.3
10.98
14
19
39.1
9.57
2
20
29.7
11.13
15
23
46.8
10.94
3
23
30.8
12.51
16
20
48.5
9.58
4
20
58.8
8.40
17
22
59.3
10.09
5
21
61.4
9.27
18
22
70
8.11
6
22
71.3
8.73
19
11
70
6.83
7
11
74.4
6.36
20
23
74.5
8.88
8
23
76.7
8.50
21
20
72.1
7.68
9
21
70.7
7.82
22
21
58.1
8.47
10
20
57.5
9.14
23
20
44.6
8.86
11
20
46.4
8.24
24
20
33.4
10.36
12
21
28.9
12.19
25
22
28.6
11.08
13
21
28.1
11.88
i. Να προσαρμοστεί κατάλληλο μοντέλο γραμμικής παλινδρόμησης και να ερμηνευτούν οι τιμές
των συντελεστών.
ii. Να εξεταστεί η στατιστική σημαντικότητα του προσαρμοσμένου μοντέλου βάσει της ΣΣΕ (α =
1%).
iii. Ποιο το ποσοστό της μεταβλητότητας της Y που επεξηγείται από την παλινδρόμηση;
iv. Να εξεταστεί η στατιστική σημαντικότητα των συντελεστών βi , i = 0, 1, 2, βάσει των 99%
Δ.Ε.
v. Να υπολογιστούν τα 99% Δ.Ε. Bonferroni των β1 και β2 , αντίστοιχα.
vi. Να υπολογιστεί ένα 99% Δ.Π. για την Yh , όταν Xh1 = 15 και Xh2 = 41.
Ȫ
Λύση
Εισαγωγή δεδομένων & δημιουργία μεταβλητών
library(readxl)
data <‐ read_xlsx('ch3ex1.xlsx')
X1 <‐ data$X1
X2 <‐ data$X2
Y <‐ data$Y
66
ΠΟΛΛΑΠΛΗ ΠΑΛΙΝΔΡΟΜΗΣΗ
i. Προσαρμόζουμε καταλλήλως το ζητούμενο πολλαπλό γραμμικό μοντέλο παλινδρόμησης.
Δημιουργία πολλαπλού γραμμικού μοντέλου & εξαγωγή συντελεστών
multlm <‐ lm(Y ~ X1 + X2)
summary(multlm)
> summary(multlm)
Call:
lm(formula = Y ~ X1 + X2)
Coefficients:
Estimate Std. Error t value Pr(>|t|)
(Intercept)
9.1269
1.1028
8.28 3.3e‐08
X1
0.2028
0.0458
4.43 0.00021
X2
‐0.0724
0.0080
‐9.05 7.2e‐09
Residual standard error: 0.662 on 22 degrees of freedom
Multiple R‐squared: 0.849,
Adjusted R‐squared: 0.835
F‐statistic: 61.9 on 2 and 22 DF, p‐value: 9.23e‐10
Το εκτιμώμενο μοντέλο δίνεται από τη σχέση:
ŷi = 0.1269 + 0.2028xi1 − 0.0724xi2 ,
i = 1, ..., 25.
Ερμηνεία συντελεστών παλινδρόμησης:
• β̂0 : Η μέση εκτιμώμενη μηνιαία ποσότητα ατμού μιας μηχανής, ανέρχεται στα 0.1269 kg/h,
εάν ο αριθμός των ημερών που η μηχανή εργάστηκε ανά μήνα είναι 0 και ταυτόχρονα η μέση
μηνιαία θερμοκρασία είναι 0o F.
• β̂1 : Η μέση εκτιμώμενη μηνιαία ποσότητα ατμού μιας μηχανής θα αυξηθεί κατά 0.2028
kg/h, εάν ο αριθμός των ημερών που η μηχανή εργάστηκε ανά μήνα αυξηθεί κατά μία ημέρα
και παράλληλα η μέση μηνιαία θερμοκρασία παραμείνει σταθερή.
• β̂2 : Η μέση εκτιμώμενη μηνιαία ποσότητα ατμού μιας μηχανής θα μειωθεί κατά 0.0724
kg/h, εάν η μέση μηνιαία θερμοκρασία αυξηθεί κατά 1o F και παράλληλα ο αριθμός των
ημερών που η μηχανή εργάστηκε ανά μήνα παραμείνει σταθερός.
ii. Στο ερώτημα αυτό, καλούμαστε να εφαρμόσουμε έλεγχο σημαντικότητας της παλινδρόμησης
(του μοντέλου) βάσει της F ΣΣΕ.
H0 : β1 = β2 = 0
vs
H1 : Τουλάχιστον ένα από τα βi , i = 1, 2, διάφορο του 0.
Για τον λόγο αυτό, θα πρέπει να βρεθεί ο πίνακας ANOVA. Τέλος, για τη διενέργεια του ελέγχου,
θα πρέπει να υπολογιστεί και το αντίστοιχο F -ποσοστιαίο σημείο (qf [stats]).
Εύρεση πίνακα ANOVA
ANOVA <‐ anova(multlm)
ANOVA
ΓΡΑΜΜΙΚΑ ΜΟΝΤΕΛΑ ΚΑΙ ΣΧΕΔΙΑΣΜΟΣ & ΑΝΑΛΥΣΗ ΠΕΙΡΑΜΑΤΩΝ ΜΕ ΕΦΑΡΜΟΓΕΣ ΣΕ R ΚΑΙ MINITAB
67
F.value <‐ sum(ANOVA$`F value`[1:2])
F.value
df1 <‐ sum(ANOVA$Df[1:2]) #p‐1
df2 <‐ ANOVA$Df[3] #n‐p
qf(.99, df1 , df2) #Υπολογισμός F2,22;0.01
> ANOVA
Analysis of Variance Table
Response: Y
Df Sum Sq Mean Sq F value Pr(>F)
X1
1
18.3
18.3
41.9 1.6e‐06
X2
1
35.8
35.8
81.9 7.2e‐09
Residuals 22
9.6
0.4
> F.value
[1] 123.81
> qf(.99, df1 , df2)
[1] 5.719
Η τιμή της F ΣΣΕ προκύπτει από την άθροιση των στοιχείων της στήλης «F value». Τελικά,
αφού:
F = 41.9 + 81.9 = 123.81 > 5.719 = F2,22;0.01 ,
απορρίπτεται η H0 και άρα η παλινδρόμηση είναι στατιστικά σημαντική (α = 1%).
iii. Από το ερώτημα (ii), προκύπτει ότι το:
R2 =
SSR
18.3 + 35.8
=
= 0.849 = 84.9%
SST O
18.3 + 35.8 + 9.6
της μεταβλητότητας της Y επεξηγείται από την παλινδρόμηση (το μοντέλο, δηλαδή τις μεταβλητές X1 και X2 ).
iv. Θέλουμε να εφαρμόσουμε τον έλεγχο:
H0 : βi = 0
vs
H1 : βi ̸= 0, i = 0, 1, 2.
Κατασκευή 99% Δ.Ε. για τα βi , i = 0, 1, 2
confint(multlm, level = .99)
> confint(multlm, level = .99)
0.5 %
99.5 %
(Intercept) 6.018359 12.235412
X1
0.073808 0.331823
X2
‐0.094941 ‐0.049845
Ακολουθούν τα 99% Δ.Ε. για τα βi i = 0, 1, 2:
68
ΠΟΛΛΑΠΛΗ ΠΑΛΙΝΔΡΟΜΗΣΗ
• για το β0 :
[6.018359, 12.235412],
• για το β1 :
[0.073808, 0.331823],
• για το β2 :
[−0.094941, −0.049845].
Παρατηρούμε ότι σε κανένα από τα παραπάνω Δ.Ε. δεν εμπεριέχεται η υπό εξέταση τιμή (0).
Άρα, η H0 απορρίπτεται και έτσι τα βi , i = 0, 1, 2 είναι στατιστικά σημαντικά (α = 1%).
v. Τα 100(1 − α)% Δ.Ε. Bonferroni υπολογίζονται όπως και τα κλασικά Δ.Ε. μέσω της εντολής
α
confint. Η μόνη διαφορά έγκειται στο όρισμα level όπου θα πρέπει να τεθεί ίσο με 1‐ m
α
όχι 1‐ 2m
. Για τη συγκεκριμένη εφαρμογή το m ισούται με 2.
και
Κατασκευή 99% από κοινού Δ.Ε. Bonferroni για τα β1 & β2
confint(multlm, parm = c(2, 3), level = (1 ‐ 0.01 / 2))#Η παράμετρος
parm=c(2,3) εξαναγκάζει την εντολή confint να εμφανίσει μόνο τα
Δ.Ε. που αφορούν τις παραμέτρους 2 και 3 του υπό εξέταση μοντέλου
> confint(multlm, parm = c(2, 3), level = (1 ‐ 0.01 / 2))
0.25 %
99.75 %
X1 0.060074 0.345557
X2 ‐0.097342 ‐0.047444
Τα 99% από κοινού Δ.Ε. Bonferroni για τα βi , i = 1, 2 είναι τα εξής:
• για το β1 :
[0.060074, 0.345557],
• για το β2 :
[−0.097342, −0.047444].
vi. Ακολουθεί ο κώδικας υλοποίησης του εν λόγω ερωτήματος.
Κατασκευή 99% Δ.Π. για το Yh όταν Xh1 = 15 & Xh2 = 41
X.h <‐ data.frame(X1 = 15, X2 = 41)
predict(multlm,
newdata = X.h,
interval = 'prediction',
level = .99)
> predict(multlm,
+
newdata = X.h,
+
interval = 'prediction ',
+
level = .99)
fit
lwr
upr
1 9.201 7.1477 11.254
Ένα 99% Δ.Π. για το Yh , όταν Xh1 = 15 και Xh2 = 41, είναι το ακόλουθο:
[7.1477, 11.254].
ΓΡΑΜΜΙΚΑ ΜΟΝΤΕΛΑ ΚΑΙ ΣΧΕΔΙΑΣΜΟΣ & ΑΝΑΛΥΣΗ ΠΕΙΡΑΜΑΤΩΝ ΜΕ ΕΦΑΡΜΟΓΕΣ ΣΕ R ΚΑΙ MINITAB
69
3.10 Άλυτες ασκήσεις
1. Έστω το γραμμικό μοντέλο παλινδρόμησης y∼ = X β∼ + ∼ϵ και η αντίστοιχη εκτιμήτρια συνάρn×1
n×p
n×1
p×1
τηση παλινδρόμησης ŷ∼ = X β̂∼ .
n×p
n×1
p×1
Να δειχτεί ότι:
i.
ii.
iii.
Pn
i=1 ϵ̂i
Pn
= 0,
i=1 ϵ̂i xij
Pn
i=1 ϵ̂i ŷi
= 0, j = 1, ..., p − 1,
= 0.
2. Με τη βοήθεια κατάλληλου/ων μετασχηματισμού/ών, να γραφεί καθένα από τα παρακάτω μοντέλα
στη μορφή (3.4):
i. yi = β0 exp (β1 xi1 + ϵi ),
ii. yi = [1 + exp (β1 xi1 + ϵi )]−1 και
iii. yi = β0 + β1 xi1 + β2 log10 xi2 + β3 x2i1 + ϵi .
3. Να αποδειχτεί το Θεώρημα 3.1.
4. Έστω το μοντέλο:
yi = β0 exp (β1 xi1 + β2 xi2 + ϵi ) ,
i = 1, ..., n,
i.i.d
όπου ϵi ∼ (0, σ 2 ).
i. Να προσδιοριστούν οι ΕΕΤ των παραμέτρων β1 και β2 .
i.i.d
ii. Αν ϵi ∼ N (0, σ 2 ), να δοθεί η συνάρτηση πιθανοφάνειας και να βρεθούν οι ΕΜΠ των β1 και
β2 , αντίστοιχα.
5. Έστω τα δεδομένα του Πίνακα 3.5:
Πίνακας 3.5: Τιμές 11 παρατηρήσεων (xi1 , xi2 , yi )
#
X1
X2
Y
1
1
8
6
7
5
0
2
2
4
2
8
8
10
−12
−4
3
9
−8
1
9
2
4
10
4
11
−10
0
10
7
−2
−3
5
3
6
5
11
6
−4
5
6
8
−6
3
Θεωρώντας το μοντέλο:
yi = β0 + β1 xi1 + β2 xi2 + ϵi ,
και κάνοντας χρήση της R:
i = 1, ..., 11,
70
ΠΟΛΛΑΠΛΗ ΠΑΛΙΝΔΡΟΜΗΣΗ
i. Να υπολογιστούν οι ΕΕΤ του μοντέλου.
ii. Να εξεταστεί η στατιστική σημαντικότητα της παλινδρόμησης (α = 5%).
iii. Ποιο το ποσοστό της μεταβλητότητας της εξαρτημένης μεταβλητής Y που επεξηγείται από την
παλινδρόμηση;
iv. Να υπολογιστούν οι διασπορές των β̂1 και β̂2 .
v. Να εκτιμηθεί η διασπορά μιας νέας παρατήρησης Yh για την οποία X1 = 3 και X2 = 5.
Δίνεται ότι:


4.3705 −0.8495 −0.4086

0.0822 
X′ X = −0.8495 0.169
.
−0.4086 0.0822
0.0422
6. Έστω τα δεδομένα του Πίνακα 3.6:
Πίνακας 3.6: Τιμές 8 παρατηρήσεων (xi1 , xi2 , yi )
Αν
P8
i=1
P8
i=1
#
X1
X2
Y
1
38
47.5
66
2
41
21.3
43
3
34
36.5
36
4
35
18
23
yi2 = 8911.76,
P8
xi2 yi = 6954.7 και
i=1
x2i1 = 9488,
P8
i=1
5
31
29.5
22
6
34
14.2
14
7
29
21
32
8
32
10
7.6
P8
i=1
x2i1 = 5979.08,
P8
i=1
xi1 yi = 8049.2,
xi1 xi2 = 6875.6, τότε:
i. Να υπολογιστούν οι ΕΕΤ του μοντέλου:
yi = β0 + β1 xi1 + β2 xi2 + ϵi ,
i = 1, ..., 8.
ii. Να υπολογιστεί ο πίνακας ANOVA και να διενεργηθεί ο έλεγχος σημαντικότητας της παλινδρόμησης (α = 5%).
iii. Ποιο το ποσοστό της μεταβλητότητας της εξαρτημένης μεταβλητής Y που επεξηγείται από την
παλινδρόμηση;
7. Σώμα ρίχνεται κατακόρυφα και διανύει σε χρόνο t απόσταση Y με E(Yt ) = β1 t + β2 t2 . Τα δεδομένα
δίνονται στον Πίνακα 3.7:
Πίνακας 3.7: Τιμές 5 ζευγών παρατηρήσεων (t, yi )
#
t
Y
1
1
6
2
1.5
14
3
2
21
4
2.5
33
5
3
48
ΓΡΑΜΜΙΚΑ ΜΟΝΤΕΛΑ ΚΑΙ ΣΧΕΔΙΑΣΜΟΣ & ΑΝΑΛΥΣΗ ΠΕΙΡΑΜΑΤΩΝ ΜΕ ΕΦΑΡΜΟΓΕΣ ΣΕ R ΚΑΙ MINITAB
71
i. Να προσδιοριστούν οι ΕΕΤ των παραμέτρων β1 και β2 .
ii. Να ελεγχθεί η υπόθεση H1 : β1 ̸= 0 (α = 5%).
8. Έστω τα δεδομένα του Πίνακα 3.8:
Πίνακας 3.8: Τιμές 16 παρατηρήσεων (xi1 , xi2 , yi )
#
X1
X2
Y
1
4
2
64
2
4
4
73
3
4
2
61
4
4
4
76
5
6
2
72
6
6
4
80
7
6
2
71
8
6
4
83
13
10
2
88
9
8
2
83
14
10
4
95
10
8
4
89
15
10
2
94
11
8
2
86
16
10
4
100
12
8
4
93
και το μοντέλο:
yi = β0 + β1 xi1 + β2 xi2 + ϵi ,
i = 1, ..., 16.
Κάνοντας χρήση της R:
i. να γίνει το τριδιάστατο διάγραμμα διασποράς (σκεδασμογράφημα),
ii. να προσαρμόσετε κατάλληλο μοντέλο παλινδρόμησης και να ερμηνεύσετε τις τιμές των παραμέτρων,
iii. να ελεγχθεί η στατιστική σημαντικότητα του μοντέλου (α = 5%),
iv. να υπολογιστούν τα 95% Δ.Ε. Bonferroni των β1 και β2 , αντίστοιχα.
72
ΠΟΛΛΑΠΛΗ ΠΑΛΙΝΔΡΟΜΗΣΗ
ΒΙΒΛΙΟΓΡΑΦΙΑ
[1] Βόντα, Φ., & Καραγρηγορίου, Α. (2012). Εφαρμοσμένη στατιστική ανάλυση & στοιχεία πιθανοτήτων.
Αθήνα: Εκδόσεις Παρασκήνιο.
[2] Δαμιανού, Χ., & Κούτρας, Μ. (1998). Εισαγωγή στη στατιστική, Μέρος ΙΙ. Αθήνα: Εκδόσεις Συμμετρία.
[3] Καλαματιανού, Α.Γ. (1997). Εφαρμοσμένη ανάλυση παλινδρόμησης. Αθήνα: Εκδόσεις Παπαζήσης.
[4] Καρώνη, Χ., & Οικονόμου, Π. (2017). Στατιστικά μοντέλα παλινδρόμησης: Με χρήση Minitab και R
(2η έκδ.). Αθήνα: Συμεών.
[5] Κουτρουβέλης, Ι.Α. (2015). Εφαρμοσμένες πιθανότητες και στατιστική για μηχανικούς και θετικούς επιστήμονες. Αθήνα: Εκδόσεις Gotsis.
[6] Κουτρουβέλης, Ι.Α. (2000). Προηγμένα εργαλεία και μέθοδοι για τον έλεγχο της ποιότητας, Τόμος Β,
Σχεδιασμός και Ανάλυση Πειραμάτων. Πάτρα: Ελληνικό Ανοικτό Πανεπιστήμιο.
[7] Κολυβά-Μαχαίρα, Φ., & Μπόρα-Σέντα, Ε. (1995). Στατιστική, θεωρία και εφαρμογές. Θεσσαλονίκη:
Εκδόσεις Ζήτη.
[8] Κουνιάς, Σ., Κολυβά-Μαχαίρα, Φ., Μπαγιάτης, Γ., & Μπόρα-Σέντα, Ε. (1985). Εισαγωγή στη στατιστική. Θεσσαλονίκη: Εκτύπωση Γιαχούδη-Γιαπούλη Ο.Ε.
[9] Κούτρας, Μ.Β., & Ευαγγελάρας, Χ. (2010). Ανάλυση παλινδρόμησης, θεωρία και εφαρμογές. Αθήνα:
Εκδόσεις Σταμούλη Α. Ε.
[10] Μπόρα-Σέντα, Ε., & Μωυσιάδης, Χ. (1990). Εφαρμοσμένη στατιστική, Θεσσαλονίκη: Εκδόσεις Ζήτη.
[11] Ντζούφρας, Ι., & Καρλής, Δ. (2015). Εισαγωγή στον προγραμματισμό και στη στατιστική ανάλυση με R [Προπτυχιακό εγχειρίδιο]. Κάλλιπος, Ανοικτές Ακαδημαϊκές Εκδόσεις.
http://hdl.handle.net/11419/2601
[12] Παπαδόπουλος, Γ.Κ. (2015). Εισαγωγή στις πιθανότητες και τη στατιστική. Αθήνα: Εκδόσεις Gutenberg.
[13] Παπαϊωάννου, Τ., & Λουκάς, Σ. (2002). Εισαγωγή στη στατιστική. Αθήνα: Εκδόσεις Σταμούλη Α. Ε.
74
ΒΙΒΛΙΟΓΡΑΦΙΑ
[14] Φερεντίνος, Κ., Ζωγράφος, Κ., & Παπαϊωάννου, Τ. (2020). Εκτιμητική και έλεγχος υποθέσεων. Αθήνα:
Εκδόσεις Σταμούλη Α. Ε.
[15] Φουσκάκης, Δ. (2021). Ανάλυση δεδομένων με χρήση της R (2η έκδ.). Αθήνα: Εκδόσεις Τσότρας.
[16] Draper, R.D., & Smith, H. (1998). Applied regression analysis (3rd ed.). Wiley-Interscience.
[17] Field, A. (2021). Μία περιπέτεια στη στατιστική (Ε. Γάκη, Χ. Παρπούλα & Η. Σαντουρίδης, Επιμ.).
Αθήνα: Εκδόσεις Προπομπός.
[18] Field, A., Miles, J., & Field, Z. (2012). Discovering statistics using R (1st ed.). Sage Ltd.
ΚΕΦΑΛΑΙΟ 4
ΔΙΑΓΝΩΣΤΙΚΟΙ ΕΛΕΓΧΟΙ ΠΡΟΫΠΟΘΕΣΕΩΝ
ΓΡΑΜΜΙΚΟΥ ΜΟΝΤΕΛΟΥ ΠΑΛΙΝΔΡΟΜΗΣΗΣ
Σύνοψη
Το παρόν κεφάλαιο παρουσιάζει τη διερεύνηση των προϋποθέσεων για την εφαρμογή του προτύπου παλινδρόμησης, μέσω της ανάλυσης καταλοίπων, αξιοποιώντας τόσο γραφικές όσο και
στατιστικές μεθόδους και τεχνικές.
Προαπαιτούμενη γνώση
Το κεφάλαιο προϋποθέτει τη γνώση και την κατανόηση των προηγουμένων κεφαλαίων.
Προσδοκώμενα μαθησιακά αποτελέσματα
Μετά τη μελέτη του παρόντος κεφαλαίου ο αναγνώστης αναμένεται να:
• διερευνά την καταλληλότητα του μοντέλου παλινδρόμησης μέσω της ανάλυσης καταλοίπων,
• διερευνά τις προϋποθέσεις των προτύπων παλινδρόμησης, με γραφικές και στατιστικές τεχνικές
και μεθόδους,
• δύναται να επιλέγει κατάλληλους μετασχηματισμούς για την αντιμετώπιση παραβίασης των
προϋποθέσεων του προτύπου παλινδρόμησης,
• διεκπεραιώνει την ανάλυση καταλοίπων με τη χρήση στατιστικών πακέτων.
Καραγρηγορίου, Α., & Καλλιγέρης, Ε. Ν. (�2023). «Γραμμικά Μοντέλα και Σχεδιασμός & Ανάλυση Πειραμάτων με Εφαρμογές
σε R και Minitab».
Αθήνα: Κάλλιπος, Ανοικτές Ακαδημαϊκές Εκδόσεις. http://dx.doi.org/10.57713/kallipos-70
Creative Commons Αναφορά Δημιουργού - Μη Εμπορική Χρήση - Παρόμοια Διανομή 4.0
76
ΔΙΑΓΝΩΣΤΙΚΟΙ ΕΛΕΓΧΟΙ ΠΡΟΫΠΟΘΕΣΕΩΝ ΓΡΑΜΜΙΚΟΥ ΜΟΝΤΕΛΟΥ ΠΑΛΙΝΔΡΟΜΗΣΗΣ
4.1 Εισαγωγή
Όταν ένα μοντέλο παλινδρόμησης επιλέγεται για την περιγραφή κάποιου φαινομένου, συνήθως δεν είναι γνωστό από πριν αν αυτό είναι το καταλληλότερο. Όπως φαίνεται από τον ορισμό του γραμμικού μοντέλου παλινδρόμησης (2.2), θα πρέπει κάποιες προϋποθέσεις να ικανοποιούνται ώστε αυτό να θεωρείται κατάλληλο:
1. Η γραμμική σχέση μεταξύ των μεταβλητών X και Y είναι ισχυρή.
2. Η διακύμανση της Y είναι σταθερή (ανεξάρτητη) για διάφορες τιμές της μεταβλητής X.
3. Τα σφάλματα είναι ανά δύο μεταξύ τους ανεξάρτητα.
4. Τα σφάλματα ακολουθούν την κανονική κατανομή.
Είναι πολύ σημαντικό, προτού γίνει η ανάλυση των δεδομένων και εξαχθούν τα οποιαδήποτε συμπεράσματα,
να διερευνηθεί η καταλληλότητα του μοντέλου που έχει επιλεγεί. Για τον σκοπό αυτό, μπορούν να χρησιμοποιηθούν διάφοροι στατιστικοί έλεγχοι, καθώς και διάφορες γραφικές μέθοδοι οι οποίες βασίζονται σε γραφικές
παραστάσεις των υπολοίπων ϵ̂i . Η μεθοδολογία των γραφικών αυτών μεθόδων είναι γνωστή ως ανάλυση των
καταλοίπων (residual analysis). Τα κατάλοιπα ϵ̂i = yi − ŷi μπορούν να θεωρηθούν σαν τα παρατηρηθέντα
σφάλματα, σε αντιδιαστολή με τα άγνωστα (πραγματικά) σφάλματα ϵi = Yi − (Yi ). Άρα, αν το μοντέλο
είναι κατάλληλο, τότε τα ϵ̂i θα πρέπει να αντανακλούν τις ιδιότητες των ϵi . Για τη μέση τιμή και τη διασπορά
των υπολοίπων, γνωρίζουμε ήδη ότι (Θεώρημα 2.2 και σχέση (2.27)):
Pn
Pn
i=1 ϵ̂i
n
και M SE =
2
i=1 ϵ̂i
n−2
.
(4.1)
Στην ανάλυση καταλοίπων γίνεται συχνά χρήση των τυποποιημένων καταλοίπων (standardized residuals),
που είναι της μορφής:
ϵ̂i
SRi =
.
(4.2)
se (ϵ̂i )
Θα πρέπει εδώ να αναφερθεί ότι τα κατάλοιπα (όπως και τα τυποποιημένα κατάλοιπα) είναι εξαρτημένες τυχαίες μεταβλητές.
Οι γραφικές μέθοδοι που περιγράφονται στο κεφάλαιο αυτό, δεν εφαρμόζονται μόνο στην περίπτωση των
γραμμικών μοντέλων παλινδρόμησης, αλλά σε όλα τα είδη στατιστικών μοντέλων.
4.2 Μη γραμμικότητα και μετασχηματισμοί
Το σκεδασμογράφημα αποτελεί μία πρώτη μέθοδο ελέγχου της γραμμικότητας μεταξύ των μεταβλητών X και
Y . Η γραφική όμως παράσταση, που βοηθά σημαντικά στη διερεύνηση της γραμμικότητας, είναι αυτή των
υπολοίπων ϵ̂i ως προς τις αντίστοιχες τιμές Xi της ανεξάρτητης μεταβλητής. Για να θεωρείται ικανοποιητικό
το γραμμικό μοντέλο παλινδρόμησης, θα πρέπει τα σημεία της γραφικής αυτής παράστασης να σχηματίζουν
ένα οριζόντιο πλαίσιο γύρω από το μηδέν (Σχήμα 4.1(α)). Αν πάλι τα σημεία αυτά αποκλίνουν από το μηδέν
με έναν συστηματικό τρόπο, τότε το γραμμικό μοντέλο δεν θεωρείται κατάλληλο. Στο Σχήμα 4.1(β) παρουσιάζεται μία περίπτωση όπου τα υπόλοιπα για μικρές τιμές του X, είναι αρνητικά, στη συνέχεια γίνονται θετικά και καταλήγουν για μεγάλες τιμές X, πάλι αρνητικά. Μία τέτοιου είδους μορφή οδηγεί στο συμπέρασμα
ότι θα πρέπει να χρησιμοποιηθεί ένα μη γραμμικό μοντέλο.
Για την αντιμετώπιση του προβλήματος της μη γραμμικότητας, μπορούν να χρησιμοποιηθούν πιο πολύπλοκα
μοντέλα, όπως το πολυωνυμικό:
yi = β0 + β1 xi + β2 x2i + ϵi
(4.3)
ΓΡΑΜΜΙΚΑ ΜΟΝΤΕΛΑ ΚΑΙ ΣΧΕΔΙΑΣΜΟΣ & ΑΝΑΛΥΣΗ ΠΕΙΡΑΜΑΤΩΝ ΜΕ ΕΦΑΡΜΟΓΕΣ ΣΕ R ΚΑΙ MINITAB
ή το εκθετικό:
yi = β0 β1γxi +ϵi
77
(4.4)
ή μπορεί να γίνει κάποιος μετασχηματισμός δεδομένων.
(α)
(β)
Σχήμα 4.1: Γραφική διερεύνηση γραμμικότητας
Επιπλέον, συχνά απλοί μετασχηματισμοί είτε της μεταβλητής X, είτε της Y , είτε και των δύο, βοηθούν ώστε
μία μη γραμμική σχέση μεταξύ των X και Y να μετατραπεί σε γραμμική. Οι πιο συνήθεις μετασχηματισμοί
είναι:
√
Y ′ = Y , Y ′ = logY και Y ′ = Y −1 .
(4.5)
Είθισται μετά από έναν τέτοιο μετασχηματισμό, τα «νέα» ζεύγη τιμών (Xi , Yi′ ) να μπορούν να προσαρμοστούν σε ένα γραμμικό μοντέλο παλινδρόμησης.
Οι εκτιμήτριες των συντελεστών παλινδρόμησης του μοντέλου:
yi′ = β0 + β1 xi + ϵi ,
(4.6)
υπολογίζονται από τους συνήθεις τύπους (2.6) με yi′ και ȳi′ , αντί για yi και ȳi .
4.3 Έλεγχος κανονικότητας των σφαλμάτων
Υπάρχουν ποικίλες τεχνικές για τον έλεγχο: (1) της κανονικότητας των σφαλμάτων, όπως ο Πίνακας Συχνοτήτων (Frequency Table), το Probability-Probability Διάγραμμα Πιθανότητας (P-P Plot), το QuantileQuantile Διάγραμμα Πιθανότητας (Q-Q Plot) και το Ιστόγραμμα (Histogram), οι οποίες εφαρμόζονται στα
κατάλοιπα ή (συνηθέστερα) στα τυποποιημένα κατάλοιπα SRi και (2) του κατά πόσο το 68% (95%) περίπου των τυποποιημένων καταλοίπων βρίσκεται στο διάστημα [−1, 1]([−2, 2]). Στο πλαίσιο ενός Κανονικού
Διαγράμματος Πιθανότητας (Normal Probability Plot), μπορεί να χρησιμοποιηθεί ακόμα και ο δειγματικός
συντελεστής συσχετίσεως r (2.33) για τον έλεγχο της κανονικότητας. Συγκεκριμένα, αν το r είναι τουλάχιστον 90%, μπορεί να θεωρηθεί ότι ικανοποιείται η υπόθεση της κανονικότητας.
Εκτός όμως των προαναφερθεισών γραφικών τεχνικών ελέγχου της κανονικότητας, υπάρχουν και στατιστικοί
έλεγχοι, συχνά αναφερόμενοι ως έλεγχοι καλής προσαρμογής, οι οποίοι στοχεύουν στην εύρεση της (άγνωστης)
κατανομής από την οποία προήλθε το υπό εξέταση τυχαίο δείγμα.
78
ΔΙΑΓΝΩΣΤΙΚΟΙ ΕΛΕΓΧΟΙ ΠΡΟΫΠΟΘΕΣΕΩΝ ΓΡΑΜΜΙΚΟΥ ΜΟΝΤΕΛΟΥ ΠΑΛΙΝΔΡΟΜΗΣΗΣ
4.3.1 Ο έλεγχος Kolmogorov-Smirnov για ένα δείγμα
Ο έλεγχος των Kolmogorov-Smirnov (K-S) [13], χρησιμοποιείται κατά κόρον τόσο στην Ανάλυση Παλινδρόμησης όσο και στην Ανάλυση Διακύμανσης για τη διερεύνηση της υπόθεσης της κανονικότητας των σφαλμάτων.
Ορισμός 4.1. Έστω X1 , ..., Xn τυχαίο δείγμα. Η εμπειρική συνάρτηση κατανομής ορίζεται ως:
Pn
i=1 I{Xi ≤x}
Sn (x) =
n
x ∈ R.
,
Η εμπειρική συνάρτηση κατανομής (empirical distribution function) αποτελεί έναν χρήσιμο εκτιμητή της
άγνωστης κατανομής, έστω Fn (x), των παρατηρήσεων Xi , i = 1, ..., n, καθώς:
Pn
i=1 I{Xi ≤x}
Yi =I{Xi ≤x}
Pn
Yi
→ E (Y1 ) = 0 · P (Y1 = 0)
n→+∞
n
n
+ 1 · P (Y1 = 1) = P (Y1 = 1) = P (X1 ≤ x) = F (x) , ∀x.
Sn (x) =
====
i=1
Έστω ότι θέλουμε να εφαρμόσουμε τον έλεγχο:
H0 : Fn (x) = Fn∗ (x)
vs H1 : Fn (x) ̸= Fn∗ (x) .
Ορισμός 4.2. Ο έλεγχος K-S ορίζεται ως η μέγιστη (κάθετη) απόσταση (Dn ) μεταξύ της εμπειρικής συνάρτησης
κατανομής (Sn (x)) και της υπό εξέταση κατανομής (Fn∗ (x)):
Dn = sup |Sn (x) − Fn∗ (x)| .
(4.7)
x∈R
Σε αυτό το σημείο, ίσως αναλογιστεί κανείς ότι το κριτήριο αυτό έχει ένα σοβαρό μειονέκτημα: η κατανομή
της Dn θα πρέπει να εξαρτάται από την Fn∗ (x) και επομένως, θα πρέπει να βρούμε την κατανομή της Dn
για κάθε διαφορετική κατανομή Fn∗ (x). Κάτι τέτοιο όμως δεν ισχύει, αφού η κατανομή της στατιστικής συνάρτησης Dn δεν εξαρτάται από την Fn∗ (x), γεγονός που μας δίνει τη δυνατότητα να χρησιμοποιήσουμε το
κριτήριο αυτό οποιαδήποτε και αν είναι η κατανομή από την οποία προέρχεται το δείγμα (υπό την H0 ).
Πράγματι, έστω ότι αναζητούμε μία απλούστερη έκφραση της τ.μ. Dn ώστε να υπολογίζεται εύκολα από το
τυχαίο δείγμα X1 , ..., Xn αλλά και ταυτόχρονα η εξάρτησή της από τα Xi να είναι περισσότερο ευδιάκριτη.
Έστω x(1) , ..., x(n) οι διατεταγμένες τιμές των X1 , ..., Xn με x(1) < ... < x(n) . Η εμπειρική συνάρτηση
κατανομής θα έχει την ακόλουθη μορφή:



0,




1

,


n
x < x(1)
x(1) ≤ x < x(2)
2
Sn (x) = n , x(2) ≤ x < x(3) .


..



.



1,
(4.8)
x(n) ≤ x
h
Παρατηρούμε ότι η (4.8) είναι σταθερή στα διαστήματα x(i−1) , x(i) ενώ παρουσιάζει άλματα ύψους n1
στα σημεία x(1) , ..., x(n) . Εφόσον η Fn∗ είναι αύξουσα συνάρτηση, η μέγιστη τιμή της Sn (x) − Fn∗ (x) θα
λαμβάνεται πάνω σε κάποιο από τα σημεία x(1) , ..., x(n) , δηλαδή:
Dn+ = sup {Sn (x) − Fn∗ (x)} = max
x∈R
i=1,...,n
n
Sn x(i) − Fn∗ x(i)
o
ΓΡΑΜΜΙΚΑ ΜΟΝΤΕΛΑ ΚΑΙ ΣΧΕΔΙΑΣΜΟΣ & ΑΝΑΛΥΣΗ ΠΕΙΡΑΜΑΤΩΝ ΜΕ ΕΦΑΡΜΟΓΕΣ ΣΕ R ΚΑΙ MINITAB
= max
i=1,...,n
i
− Fn∗ x(i) ≥ 0.
n
Όμοια, για τη μέγιστη τιμή της Fn∗ (x) − Sn (x):
Dn− = sup {Fn∗ (x) − Sn (x)} = max
(4.9)
= max
i=1,...,n
Fn∗
x(i)
i−1
−
n
Άρα, βάσει των (4.9) και (4.10):
n
i=1,...,n
x∈R
79
Fn∗ x(i) − Sn x−
(i)
≥ 0.
o
(4.10)
n
Dn = sup {|Sn (x) − Fn∗ (x)|} = max Dn+ , Dn−
o
x∈R
= max
i=1,...,n
i
i−1
− Fn∗ x(i) , Fn∗ x(i) −
n
n
≥ 0.
Παρατηρούμε λοιπόν ότι Fn∗ (xi ) ∼ U (0, 1), και ως εκ τούτου οι τ.μ. Fn∗ x(i) , μπορεί να θεωρηθεί ότι
αποτελούν ένα διατεταγμένο δείγμα από την ομοιόμορφη κατανομή στο (0, 1). Συνεπώς, οποιαδήποτε και
αν είναι η Fn∗ , η Dn δεν επηρεάζεται από αυτή.
i.i.d.
Παραπάνω, εξετάστηκε ο έλεγχος της υπόθεσης H0 : Fn (x) = Fn∗ (x), όπου η Fn∗ (x) ήταν πλήρως
καθορισμένη. Όμως, συνηθέστερη είναι η περίπτωση όπου η οικογένεια στην οποία ανήκει η Fn∗ (x) είναι
γνωστή και οι αντίστοιχες παράμετροι θ άγνωστες (π.χ. κανονική με άγνωστα µ, σ 2 ). Στην περίπτωση αυτή,
συνήθως εκτιμούμε τις παραμέτρους θ από τα δεδομένα και χρησιμοποιούμε την ίδια στατιστική συνάρτηση:
Dn θ̂ = sup
n
x∈R
Sn (x) − Fn∗ x; θ̂
o
.
(4.11)
Η H0 απορρίπτεται εάν Dn > Dn (α), όπου Dn (α) τιμή που προκύπτει από ειδικό πίνακα ποσοστιαίων
σημείων (βλ. Πίνακα Β.10).
Όπως ίσως έχει γίνει ήδη αντιληπτό, για να μπορέσει να εφαρμοστεί ο έλεγχος K-S, η υπό εξέταση κατανομή
θα πρέπει να είναι πλήρως ορισμένη, υπό την έννοια ότι οι άγνωστες παράμετροι θ θα πρέπει να αντικατασταθούν από τις αντίστοιχες εκτιμήσεις τους θ̂.
4.3.1.1 Ο έλεγχος Κανονικότητας του Lilliefors
Ο Lilliefors[10] πρότεινε μία τροποποίηση του K-S ελέγχου για τη διερεύνηση του εάν οι τιμές ενός δείγματος προέρχονται από έναν κανονικά κατανεμημένο πληθυσμό.
Έστω X1 , ..., Xn τυχαίο δείγμα από N (µ, σ 2 ). Εφαρμόζοντας τυποποίηση στα Xi = P
xi , i = 1, ..., n,
n
x
2
i=1 i
και
αντικαθιστώντας
τα
µ
και
σ
με
τις
αντίστοιχες
αμερόληπτες
εκτιμήσεις
τους
x̄
=
και s2 =
n
P
n
(x −x̄)
i=1 i
n−1
έχουμε:
xi − x̄
∼ N (0, 1) .
s
Θέλουμε να διερευνήσουμε την ακόλουθη υπόθεση:
zi =
H0 : Fn (z) = Φ(z) vs
H1 : Fn (z) ̸= Φ(z),
80
ΔΙΑΓΝΩΣΤΙΚΟΙ ΕΛΕΓΧΟΙ ΠΡΟΫΠΟΘΕΣΕΩΝ ΓΡΑΜΜΙΚΟΥ ΜΟΝΤΕΛΟΥ ΠΑΛΙΝΔΡΟΜΗΣΗΣ
όπου Φ η αθροιστική συνάρτηση κατανομής της τυποποιημένης κανονικής κατανομής.
Η ΣΣΕ κατά Lilliefors ορίζεται ως:
Ln = sup {|Sn (z) − Φ (z)|} .
z∈R
Και σε αυτή την περίπτωση η H0 απορρίπτεται, εάν Ln > Ln (α), όπου η τιμή Ln (α) προκύπτει από ειδικό
πίνακα ποσοστιαίων σημείων.
Βήματα υλοποίησης ελέγχου κανονικότητας K-S/Lilliefors για τα ϵ̂i
1. Υπολογίζουμε τα κατάλοιπα ϵ̂i και τα κατατάσσουμε σε κλάσεις.
2. Για κάθε κλάση, υπολογίζουμε τις συχνότητες, τις αθροιστικές συχνότητες, καθώς και τις αθροιστικές
σχετικές συχνότητες.
3. Υπολογίζουμε τις τυποποιημένες κανονικές τιμές SRi που αντιστοιχούν στα ανώτατα όρια κάθε κλάσης, και κατ’ επέκταση τις αντίστοιχες πιθανότητες F (SRi ).
4. Τέλος, υπολογίζουμε το Dn /Ln και ελέγχουμε αν η προκύπτουσα τιμή βρίσκεται εντός της κρίσιμης
περιοχής ή όχι.
4.3.2 Ο έλεγχος Anderson-Darling για ένα δείγμα
Ένας ακόμη δημοφιλής έλεγχος καλής προσαρμογής ενός τυχαίου δείγματος σε μία συνεχή θεωρητική κατανομή, είναι αυτός των Anderson-Darling (A-D) [5].
Έστω ο έλεγχος:
H0 : Fn (x) = Fn∗ (x)
Η ΣΣΕ κατά A-D ορίζεται ως:
vs
H1 : Fn (x) ̸= Fn∗ (x) .
(4.12)
A2 = − (n + S) ,
όπου:
• S=
1
n
Pn
i=1
[(2i − 1) (log F (xi ) + log (1 − F (xn+1−i )))] και
• F η αθροιστική συνάρτηση κατανομής.
Η κρίσιμη περιοχή του ελέγχου της (4.12) είναι η ακόλουθη:
!
b1
b0
A > cα = α 1 + + 2 ,
n
n
2
όπου τα α, b0 και b1 δίνονται από ειδικό πίνακα.
Βήματα υλοποίησης ελέγχου κανονικότητας A-D για τα ϵ̂i
1. Υπολογίζουμε τα κατάλοιπα ϵ̂i και τα διατάσσουμε κατά αύξουσα σειρά.
2. Εφαρμόζουμε τυποποίηση στα ϵ̂(i) ώστε να προκύψουν
οι τυποποιημένες
κανονικές
τιμές SR(i) . Βάσει
αυτών, δίνονται οι αντίστοιχες πιθανότητες F SR(i) και F SR(n+1−i) .
3. Υπολογίζουμε τις τιμές log F SR(i) , log 1 − F SR(n+1−i)
και S.
4. Τέλος, υπολογίζουμε το A2 και ελέγχουμε αν η προκύπτουσα τιμή βρίσκεται εντός της κρίσιμης περιοχής ή όχι.
ΓΡΑΜΜΙΚΑ ΜΟΝΤΕΛΑ ΚΑΙ ΣΧΕΔΙΑΣΜΟΣ & ΑΝΑΛΥΣΗ ΠΕΙΡΑΜΑΤΩΝ ΜΕ ΕΦΑΡΜΟΓΕΣ ΣΕ R ΚΑΙ MINITAB
81
4.3.3 Ο έλεγχος Shapiro-Wilk για ένα δείγμα
Ο τελευταίος έλεγχος καλής προσαρμογής που θα αναλυθεί στο κεφάλαιο αυτό, είναι αυτός των Shapiro-Wilk
(S-W) [12], ο οποίος σε αντίθεση με τους ελέγχους K-S και A-D, αφορά αποκλειστικά τον έλεγχο της κανονικότητας των τιμών του τυχαίου δείγματος.
Ο έλεγχος ενδιαφέροντος είναι ο ακόλουθος:
H0 :
Η κατανομή των υπό εξέταση
δεδομένων είναι η κανονική.
vs
H1 :
Η κατανομή των υπό εξέταση
δεδομένων δεν είναι η κανονική.
(4.13)
Η ΣΣΕ της (4.13) υπολογίζεται ως εξής:
hP
n
W =
i=1 αi ϵ̂(n+1−i) − ϵ̂(i)
Pn
i=1
2
ϵ̂(i) − ϵ̂¯
i2
,
όπου:
• (α1 , ..., αn ) =
m′ V −1
,m
(m′ V −1 V −1 m)1/2
= (m1 , ..., mn )′ ,
με mi οι αναμενόμενες των διατεταγμένων παρατηρήσεων και V ο πίνακας συνδιακύμανσής τους. Θα πρέπει
να σημειωθεί ότι οι τιμές (α1 , ..., αn ) επιλέγονται με βάση το μέγεθος του δείγματος μέσω του S-W πίνακα
συντελεστών.
Βήματα υλοποίησης ελέγχου κανονικότητας S-W για τα ϵ̂
1. Υπολογίζουμε τα κατάλοιπα ϵ̂i και τα διατάσσουμε κατά αύξουσα σειρά.
2. Υπολογίζουμε τις διαφορές των διατεταγμένων καταλοίπων ϵ̂(n+1−i) − ϵ̂(i) .
3. Τέλος, υπολογίζουμε το W και βάσει αυτού την p-value. Το τελευταίο, το συγκρίνουμε με το αντίστοιχο επίπεδο σημαντικότητας α, ώστε να αποφανθούμε υπέρ ή κατά της H0 .
4.3.4 Ακραίες τιμές
Μικρές αποκλίσεις από την υπόθεση της κανονικότητας των σφαλμάτων δεν θεωρούνται γενικά ανησυχητικές. Παρόλα αυτά, είναι αρκετά σύνηθες κάποια παρατήρηση Yi να είναι αρκετά απομακρυσμένη από τις
υπόλοιπες. Κάτι τέτοιο μπορεί να φανεί καθαρά από τη γραφική παράσταση των SRi ως προς X (ή των ϵ̂i ως
προς X). Η τιμή Yi που αντιστοιχεί στο απομακρυσμένο αυτό σημείο ονομάζεται ακραία τιμή (outlier) και
δηλώνει ότι η παρατήρηση αυτή δεν «μοιάζει» με τις υπόλοιπες. Η πρώτη εκτίμηση είναι ότι η ακραία τιμή
οφείλεται σε κάποιο σφάλμα μέτρησης, και συνεπώς θα πρέπει να αγνοηθεί. Γενικά όμως, δεν συστήνεται η
απομάκρυνση μιας ακραίας τιμής από τα δεδομένα, εκτός εάν έχει εξακριβωθεί ότι οφείλεται σε υπολογιστικό
λάθος, λάθος αντιγραφής ή κακή λειτουργία του οργάνου μέτρησης. Αν όμως όλα αυτά δεν αληθεύουν ή δεν
μπορούν να επιβεβαιωθούν, τότε η ακραία τιμή μπορεί να προσφέρει σημαντικές πληροφορίες για το υπό μελέτη φαινόμενο που οι άλλες παρατηρήσεις δεν μπορούν να προσφέρουν, αφού θεωρούνται «φυσιολογικές».
4.4 Έλεγχος ανεξαρτησίας των σφαλμάτων
Η έλλειψη ανεξαρτησίας συνήθως παρουσιάζεται σε οικονομικές εφαρμογές όπου οι παρατηρήσεις συλλέγονται σε τακτά χρονικά διαστήματα. Για τον έλεγχο ανεξαρτησίας απαιτείται η γραφική παράσταση των ϵ̂i με
82
ΔΙΑΓΝΩΣΤΙΚΟΙ ΕΛΕΓΧΟΙ ΠΡΟΫΠΟΘΕΣΕΩΝ ΓΡΑΜΜΙΚΟΥ ΜΟΝΤΕΛΟΥ ΠΑΛΙΝΔΡΟΜΗΣΗΣ
τον χρόνο t, έστω και αν αυτός δεν συμπεριλαμβάνεται στο μοντέλο. Όταν τα σφάλματα είναι ανεξάρτητα
παρουσιάζουν μία λίγο-πολύ τυχαία διασπορά γύρω από το μηδέν (Σχήμα 4.2(α)).
(α)
(β)
Σχήμα 4.2: Γραφική διερεύνηση ανεξαρτησίας
Στο Σχήμα 4.2(β) παρουσιάζεται μία περίπτωση όπου στα πρώτα στάδια της μελέτης (για μικρές τιμές του
t) τα υπόλοιπα είναι αρνητικά, ενώ σε επόμενα στάδια (για μεγάλες τιμές του t) είναι θετικά. Μία γραφική
παράστασης αυτής της μορφής δηλώνει την ύπαρξη γραμμικής επίδρασης του χρόνου, οπότε θα πρέπει ο όρος
β2 t να συμπεριληφθεί στο μοντέλο.
4.5 Έλεγχος ομοσκεδαστικότητας των σφαλμάτων
Η γραφική παράσταση των ϵ̂i ως προς τις τιμές xi της μεταβλητής X μπορεί να χρησιμοποιηθεί για τη διερεύνηση της σταθερότητας της διασποράς. Για να ικανοποιείται η υπόθεση αυτή, η μορφή της γραφικής παράστασης θα πρέπει να είναι αυτή που παρουσιάζεται στο Σχήμα 4.1(α). Σε πολλές εφαρμογές στη Διοικητική
Επιστήμη, στα Οικονομικά και στις Βιολογικές Επιστήμες η υπόθεση της σταθερής διασποράς δεν ικανοποιείται. Στις περιπτώσεις αυτές η πιο συνήθης μορφή της γραφικής παράστασης των ϵ̂i ως προς τα xi , είναι
αυτή του Σχήματος 4.3 όπου η διασπορά αυξάνεται με το X.
Εάν το μοντέλο που έχει επιλεγεί είναι είτε μη γραμμικό είτε ένα πολλαπλό μοντέλο παλινδρόμησης, μπορεί να χρησιμοποιηθεί για τον έλεγχο της σταθερής διασποράς η γραφική παράσταση των ϵ̂i με τα ŷi ή των
SRi με τα xi . Η μελέτη των παραστάσεων αυτών είναι ίδια με αυτή των παραστάσεων μεταξύ ϵ̂i και xi .
ΓΡΑΜΜΙΚΑ ΜΟΝΤΕΛΑ ΚΑΙ ΣΧΕΔΙΑΣΜΟΣ & ΑΝΑΛΥΣΗ ΠΕΙΡΑΜΑΤΩΝ ΜΕ ΕΦΑΡΜΟΓΕΣ ΣΕ R ΚΑΙ MINITAB
83
Σχήμα 4.3: Γραφική διερεύνηση ομοσκεδαστικότητας
Η ιδιότητα της σταθερής διασποράς αναφέρεται με τον όρο ομοσκεδαστικότητα (homoskedasticity) και είναι
απαραίτητη προϋπόθεση για τη χρήση της μεθόδου ελαχίστων τετραγώνων. Η περίπτωση της μη σταθερής
διασποράς αναφέρεται με τον όρο ετεροσκεδαστικότητα
(heteroskedasticity) και αντιμετωπίζεται συνήθως
√
με έναν μετασχηματισμό της μορφής Y ′ = Y .
4.6
F έλεγχος έλλειψης καλής προσαρμογής
Ο F έλεγχος έλλειψης καλής προσαρμογής (Lack-of-Fit) που θα διατυπωθεί στην ενότητα αυτή, είναι ένας
έλεγχος από αυτούς που χρησιμοποιούνται για τον έλεγχο της καταλληλότητας του μοντέλου. Ο έλεγχος
αυτός, που μπορεί να χρησιμοποιηθεί για οποιαδήποτε μοντέλα, απαιτεί επαναληπτικές παρατηρήσεις (replicates) για μία ή περισσότερες τιμές της ανεξάρτητης μεταβλητής X.
Έστω X = xj , j = 1, ..., c, η j-τιμή της μεταβλητής X για την οποία γίνονται οι μετρήσεις. Έστω επίσης yij η i-τιμή της μεταβλητής Y , όταν X = xj , i = 1, ..., nj . Τέλος, έστω ȳj η δειγματική μέση τιμή των
yij , i = 1, ..., nj , όταν X = xj , δηλαδή:
Pnj
ȳj =
i=1
yij
nj
.
(4.14)
Όπως είναι φανερό, ο συνολικός αριθμός παρατηρήσεων είναι:
n=
c
X
nj .
(4.15)
j=1
Το άθροισμα των τετραγωνικών αποκλίσεων των παρατηρήσεων yij από τη δειγματική μέση τιμή ȳj όταν
X = xj , ισούται με:
nj
X
(yij − ȳj )2 .
(4.16)
i=1
Αθροίζοντας τα πιο πάνω αθροίσματα για όλες τις τιμές xj , προκύπτει η ποσότητα:
SSP E =
nj
c X
X
(yij − ȳj )2 ,
(4.17)
j=1 i=1
η οποία αντιπροσωπεύει το άθροισμα τετραγώνων του καθαρού σφάλματος (Sum of Squares of Pure Error).
84
ΔΙΑΓΝΩΣΤΙΚΟΙ ΕΛΕΓΧΟΙ ΠΡΟΫΠΟΘΕΣΕΩΝ ΓΡΑΜΜΙΚΟΥ ΜΟΝΤΕΛΟΥ ΠΑΛΙΝΔΡΟΜΗΣΗΣ
Αφού οι βαθμοί ελευθερίας που αντιστοιχούν στην (4.16) είναι nj − 1, οι συνολικοί βαθμοί που αντιστοιχούν
στην ποσότητα SSP E είναι:
c
X
(nj − 1) = n − c.
(4.18)
j=1
Θα πρέπει να σημειωθεί ότι αν για κάποια τιμή X = xm υπάρχει μόνο μία τιμή της Y , Y1m , τότε Y1m = Ȳm ,
και κατά συνέπεια, η παρατήρηση αυτή δεν συνεισφέρει στο SSP E.
Με τη βοήθεια των σχέσεων (4.17) και (4.18) το μέσο τετράγωνο καθαρού σφάλματος δίνεται από τον τύπο:
M SP E =
SSP E
.
n−c
(4.19)
Θεώρημα 4.1. Έστω ένα γραμμικό μοντέλο παλινδρόμησης και ένα σύνολο δεδομένων με επαναληπτικές μετρήσεις. Τότε, το άθροισμα των τετραγωνικών σφαλμάτων δίνεται από τον τύπο:
SSE = SSP E + SSLF,
(4.20)
P
όπου SSLF = cj=1 nj (ȳj − ŷj )2 , ŷj η εκτιμώμενη τιμή όταν X = xj , ενώ τα yj και SSP E δίνονται από
τις σχέσεις (4.14) και (4.17).
Απόδειξη Θεωρήματος 4.1. Ως γνωστόν, το άθροισμα τετραγώνων των σφαλμάτων δίνεται από τον τύπο:
SSE =
nj
c X
X
(yij − ŷj )2 .
(4.21)
j=1 i=1
Προσθαφαιρώντας τον όρο ȳj :
SSE =
nj
c X
X
[(yij − ȳj ) + (ȳj − ŷj )]2
j=1 i=1
=
nj
c X
X
(yij − ȳj )2 + 2
nj
c X
X
(yij − ȳj )2 +
j=1 i=1
αφού
Pnj
i=1
(yij − ȳj ) (yij − ŷj ) +
j=1 i=1
j=1 i=1
=
nj
c X
X
c
X
nj
c X
X
(yij − ŷj )2
j=1 i=1
nj (Yij − ŷj )2 ,
j=1
(yij − ȳj ) = 0.
Ο όρος SSLF ονομάζεται Άθροισμα Τετραγώνων λόγω Έλλειψης Προσαρμογής (Sum of Squares due to
Lack-of-Fit) και οι βαθμοί ελευθερίας του είναι:
c − p = (β.ε. SSE − β.ε. SSP E),
(4.22)
όπου p ο αριθμός των συντελεστών παλινδρόμησης.
Το αντίστοιχο μέσο τετράγωνο λόγω έλλειψης προσαρμογής δίνεται από τη σχέση:
M SLF =
SSLF
.
c−p
(4.23)
ΓΡΑΜΜΙΚΑ ΜΟΝΤΕΛΑ ΚΑΙ ΣΧΕΔΙΑΣΜΟΣ & ΑΝΑΛΥΣΗ ΠΕΙΡΑΜΑΤΩΝ ΜΕ ΕΦΑΡΜΟΓΕΣ ΣΕ R ΚΑΙ MINITAB
85
Πόρισμα 4.1. Για την περίπτωση του γραμμικού μοντέλου παλινδρόμησης έχουμε:
Pc
E (M SP E) = σ
2
και E (M SLF ) = σ
j=1
2
nj [E (Yj ) − (β0 + β1 xj )]2
c−2
(4.24)
όπου E (Yj ) η μέση τιμή της μεταβλητής Y όταν X = xj .
Είναι φανερό από το προηγούμενο πόρισμα ότι, αν το μοντέλο που έχει χρησιμοποιηθεί είναι πράγματι γραμμικό, τότε:
E (Yj ) ≡ β0 + β1x j,
E (M SE) ≡ E (M SP E)
και E (M SLF ) = 0.
Σε αντίθετη περίπτωση:
E (M SLF ) > E (M SP E) .
Κατά συνέπεια, μία κατάλληλη ελεγχοσυνάρτηση για τον έλεγχο έλλειψης προσαρμογής είναι η:
F =
M SLF
.
M SP E
Έστω ο έλεγχος:
H0 : E (Y ) = β0 + β1 X (γραμμικότητα) vs H1 : E (Y ) ̸= β0 + β1 X (μη γραμμικότητα)
Η στατιστική συνάρτηση ελέγχου ορίζεται ως:
F =
M SLF H0
∼ Fc−2,n−c ,
M SP E
(4.25)
με κρίσιμη περιοχή F > Fc−2,n−c,α .
Εάν η H0 γίνει αποδεκτή, για την εκτίμηση του σ 2 εγκαταλείπουμε το M SP E και επανερχόμαστε στο
M SE.
Παράδειγμα 4.1. Έντεκα υποκαταστήματα μιας τράπεζας προσφέρουν στους υποψήφιους πελάτες τους τη δυνατότητα να ανοίξουν τραπεζικούς λογαριασμούς με προκαθορισμένο ελάχιστο ποσό κατάθεσης (διαφορετικό για
κάθε υποκατάστημα), με αντάλλαγμα κάποιο δώρο. Στον Πίνακα 4.1 δίνονται οι τιμές των μεταβλητών X (Ελάχιστο
Ποσό Κατάθεσης) και Y (Αριθμός Νέων Λογαριασμών). Να ελεγχΘεί η καταλληλότητα του γραμμικού μοντέλου
παλινδρόμησης (α = 1%).
Πίνακας 4.1: Τιμές 11 ζευγών παρατηρήσεων (xi , yi )
#
X
Y
1
125
160
7
75
42
2
100
112
8
175
124
3
200
124
9
125
150
4
75
28
10
200
104
5
150
152
11
100
136
6
175
156
86
ΔΙΑΓΝΩΣΤΙΚΟΙ ΕΛΕΓΧΟΙ ΠΡΟΫΠΟΘΕΣΕΩΝ ΓΡΑΜΜΙΚΟΥ ΜΟΝΤΕΛΟΥ ΠΑΛΙΝΔΡΟΜΗΣΗΣ
Λύση
Είναι εύκολο να δειχτεί ότι η συνάρτηση παλινδρόμησης ισούται με:
Ŷi = 50.7225 + 0.4867Xi .
Γράφοντας τα δεδομένα στη μορφή του Πίνακα 4.2:
Πίνακας 4.2: Τιμές 10 ζευγών παρατηρήσεων (xi , yi )
#
X1 = 75
X2 = 100
X3 = 125
X4 = 150
X5 = 175
X6 = 200
1
28
112
160
152
156
124
2
42
136
150
−
124
104
Ȳj
35
124
155
152
140
114
έχουμε c = 6, nj = 3, j = 1, ..., 6, SSP E = 1148 και SSLF = 13593.6. Έτσι, ο προκύπτων πίνακας
ANOVA είναι ο ακόλουθος:
Πίνακας 4.3: Πίνακας ANOVA
Πηγή
Μεταβλητότητας
Βαθμοί
Ελευθερίας
SS
MS
Παλινδρόμηση
1
SSR = 5141.4
5141.4
Σφάλμα
9
SSE = 14741.6
1638
Έλλειψη Προσαρμογής
4
SSLF = 13593.6
3398.4
Καθαρό Σφάλμα
5
SSP E = 1148
229.6
Ολική
10
SST O = 19883
−
Άρα, η ελεγχοσυνάρτηση (4.25) ισούται με:
F = 14.8 > F4,5,0.01 = 11.4,
και άρα, απορρίπτεται η H0 .
Στο Σχήμα 4.4 αποτυπώνονται οι όροι που συνθέτουν το υπόλοιπο (κατάλοιπο) της πρώτης παρατήρησης, ϵ̂1 =
160 − 112 = 48.
ΓΡΑΜΜΙΚΑ ΜΟΝΤΕΛΑ ΚΑΙ ΣΧΕΔΙΑΣΜΟΣ & ΑΝΑΛΥΣΗ ΠΕΙΡΑΜΑΤΩΝ ΜΕ ΕΦΑΡΜΟΓΕΣ ΣΕ R ΚΑΙ MINITAB
87
Σχήμα 4.4: Συνιστώσες σφάλματος - Απλό γραμμικό μοντέλο
4.7 Box-Cox μετασχηματισμοί
Είναι σύνηθες φαινόμενο τουλάχιστον μία από τις υποθέσεις της παλινδρόμησης (γραμμικότητα, κανονικότητα, κλπ.) να μην πληρείται. Σε τέτοιες περιπτώσεις, συνηθίζεται να πραγματοποιείται ο μετασχηματισμός
των δεδομένων, με σκοπό την εξομάλυνση (ή ακόμα και την εξάλειψη) των αποκλίσεων από τις υποθέσεις. Η
οικογένεια μετασχηματισμών των Box − Cox [6] αποτελεί μία από τις δημοφιλέστερες τεχνικές μετασχηματισμού δεδομένων:
 λ
 yi −1 ,
εάν λ ̸= 0
(λ)
yi =  λ
,
(4.26)
log(yi ), εάν λ = 0
όπου yi οι τιμές της εξαρτημένης μεταβλητής Y και λ ρυθμιστική παράμετρος η οποία συνήθως κυμαίνεται
στο διάστημα [−5, 5]. Ως λ επιλέγεται εκείνη η τιμή για την οποία το μέσο τετραγωνικό σφάλμα γίνεται
ελάχιστο (ή δίνει την καλύτερη προσέγγιση της καμπάνας της κανονικής κατανομής ή μεγιστοποιεί την (log) πιθανοφάνεια). Ανάλογα με την τιμή του, προκύπτει και ένας διαφορετικός μετασχηματισμός (βλ. Πίνακα
4.4).
Πίνακας 4.4: Συνήθεις μετασχηματισμοί Box − Cox
Τιμή λ
Μετασχηματισμός
−2
1/yi2
−1
1/yi
√
1/ yi
−0.5
0
0.5
log(yi )
√
yi
1
yi
2
yi2
88
ΔΙΑΓΝΩΣΤΙΚΟΙ ΕΛΕΓΧΟΙ ΠΡΟΫΠΟΘΕΣΕΩΝ ΓΡΑΜΜΙΚΟΥ ΜΟΝΤΕΛΟΥ ΠΑΛΙΝΔΡΟΜΗΣΗΣ
Είναι προφανές ότι στην περίπτωση όπου λ = 0, εάν υπάρχουν μηδενικές παρατηρήσεις yi , ο μετασχηματισμός log(yi ) δεν μπορεί να εφαρμοστεί σε αυτές. Γενικά, ο πιο πάνω μετασχηματισμός απαιτεί οι παρατηρήσεις να είναι θετικές, κάτι που υποχρέωσε τους Box & Cox να προτείνουν έναν δεύτερο μετασχηματισμό που
μπορεί να χρησιμοποιηθεί για y ∈ R:
(λ)
yi
=

 (yi +λ2 )λ1 −1 ,
εάν λ1 =
̸ 0
,
εάν λ1 = 0
i + λ2 ),
λ
log(y
(4.27)
′
όπου λ = (λ1 , λ2 ) και yi + λ2 > 0. Η τιμή του λ2 επιλέγεται από τον Ερευνητή κατά τέτοιο τρόπο ώστε
όταν προστεθεί σε καθεμία μία παρατήρηση yi , η νέα παρατήρηση yi + λ2 να είναι θετική για κάθε i.
Ένα σύνηθες φαινόμενο που παρατηρείται στην πράξη είναι να υφίσταται κάποιου είδους συναρτησιακή σχέση
μεταξύ τυπικής απόκλισης (σ) και μέσης τιμής (µ). Μία τέτοια συνάρτηση είναι η πολυωνυμική, δηλαδή:
σ = aµb
ή ισοδύναμα:
log(σ) = log(a) + b log(µ),
που αξιοποιώντας τις αντίστοιχες δειγματικές ποσότητες παίρνει τη μορφή:
√
M SE = log(a) + b log(ȳ).
log
Παρατηρούμε ότι η πιο πάνω εξίσωση αντιπροσωπεύει μία παλινδρόμηση και εάν η εκτιμήτρια b̂ του συντελεστή b είναι τέτοια που να μην μπορεί να απορριφθεί η υπόθεση H0 : b = 0, τότε υφίσταται η πιο συναρτησιακή
σχέση.
4.8 Επηρεάζουσες παρατηρήσεις
Είναι συχνό φαινόμενο η προσθήκη (αφαίρεση) δύο ή περισσότερων παρατηρήσεων από το δείγμα, να οδηγεί σε σημαντικές αλλαγές, όσον αφορά την τιμή των συντελεστών του μοντέλου παλινδρόμησης. Τέτοιου
είδους παρατηρήσεις ονομάζονται επηρεάζουσες. Γενικά, η ύπαρξη επηρεαζουσών παρατηρήσεων θεωρείται
ανεπιθύμητη, καθώς θέλουμε ένα μοντέλο παλινδρόμησης που να μην εξαρτάται από τις τιμές ενός μικρού
αριθμού παρατηρήσεων, αλλά όλες οι παρατηρήσεις να συνεισφέρουν, όσο γίνεται, το ίδιο στον υπολογισμό
των συντελεστών.
Συνήθεις τεχνικές ανίχνευσης επηρεαζουσών παρατηρήσεων
Η έννοια της μόχλευσης (leverage) βασίζεται στον πιο κάτω ορισμό:
hij =
1 (xi − x̄) (xj − x̄)
+ Pn
2 .
n
i=1 (xi − x̄)
(4.28)
Θέτοντας i = j, οδηγούμαστε στην ποσότητα:
hii =
(xi − x̄)2
1
+ Pn
2
n
i=1 (xi − x̄)
(4.29)
από όπου διαπιστώνεται ότι αν η παρατήρηση xi ταυτίζεται με τον δειγματικό μέσο ή έστω είναι πολύ κοντά
σε αυτόν, τότε hii = 1/n. Όσο όμως η παρατήρηση xi απομακρύνεται από τον δειγματικό μέσο, τόσο αυξάνεται η τιμή της μόχλευσης hii . Η ποσότητα hii αντιπροσωπεύει τον βαθμό επηρεασμού ή επίδρασης στην
ΓΡΑΜΜΙΚΑ ΜΟΝΤΕΛΑ ΚΑΙ ΣΧΕΔΙΑΣΜΟΣ & ΑΝΑΛΥΣΗ ΠΕΙΡΑΜΑΤΩΝ ΜΕ ΕΦΑΡΜΟΓΕΣ ΣΕ R ΚΑΙ MINITAB
89
παλινδρόμηση της παρατήρησης xi .
Ιδιότητες μόχλευσης
1. ϵ̂i = yi − ŷi = β0 + β1 xi + ϵi − ȳ − β̂1 x̄ + β̂1 xi ,
2. ȳ = β0 + β1 x̄ + ϵ̄,
3. ŷi − ȳ = β1 (xi − x̄) + (ϵi − ϵ̄).
Έτσι ώστε:
Pn
j=1
β̂1 =
(xj − x̄) (yj − ȳ)
Pn
i=1
(xi − x̄)
2
Pn
= β1 + Pj=1
n
i=1
ϵ̂i = β1 − β̂1 (xi − x̄) + (ϵi − ϵ̄) = ϵi −
"
n
X
j=1
⇒ ϵ̂i = ϵi −
n
X
(xj − x̄) ϵj
(xi − x̄)2
#
(xj − x̄) (yj − ȳ) 1
ϵj
Pn
2 +
n
i=1 (xi − x̄)
hij ϵj
(4.30)
j=1
και:

V ar (ŷi ) = V ar 
n X
1
j=1
=
n X
1
j=1
n
n
− kj x̄ yj +

kj yj xi 
i=1
2
+ kj (xi − x̄)
n
X

σ2 = 
n
X

1
kj2 (xi − x̄)2  σ 2
+
n j=1
= hii σ 2 < σ 2 .
Συμπερασματικά, όσο πιο κοντά είναι η xi στις υπόλοιπες x, τόσο πιο μικρή είναι η μεταβλητότητα της εκτίμησης ŷi , δηλαδή της εκτιμώμενης τιμής της yi που αντιστοιχεί στο συγκεκριμένο xi . Και αντίστροφα, όσο
πιο μακριά είναι η xi από τις υπόλοιπες x, τόσο πιο μεγάλη η μεταβλητότητα της εκτίμησης.
2
Η ελάχιστη μεταβλητότητα είναι σn . Γενικά,
n
1X
p
hii = .
n i=1
n
(4.31)
Είναι προφανές ότι στην περίπτωση της απλής γραμμικής παλινδρόμησης, η σχέση (4.31) ισούται με n2 .
Οι παρακάτω πρόσθετες ιδιότητες μπορούν εύκολα να επιβεβαιωθούν:
•
P
j̸=i
• h2ii ≤
•
Pn
i=1
hij = 1 − hii ,
Pn
j=1
h2ij = hii ,
hii = p.
90
ΔΙΑΓΝΩΣΤΙΚΟΙ ΕΛΕΓΧΟΙ ΠΡΟΫΠΟΘΕΣΕΩΝ ΓΡΑΜΜΙΚΟΥ ΜΟΝΤΕΛΟΥ ΠΑΛΙΝΔΡΟΜΗΣΗΣ
Τιμές του hii μεγαλύτερες από το διπλάσιο της τιμής p/n, υποδηλώνουν ότι η αντίστοιχη i-παρατήρηση είναι
επηρεάζουσα (επηρεάζει σημαντικά την παλινδρόμηση).
Εναλλακτικά της μόχλευσης μπορεί να γίνει χρήση της απόστασης Cook ή των διαφορών των εκτιμητών παλινδρόμησης με ή χωρίς μία συγκεκριμένη κάθε φορά παρατήρηση (DfBeta(s)). Για τη μελέτη των επηρεαζουσών τιμών συχνά γίνεται χρήση τόσο των κλασικών:
ϵ̂i = yi − ŷi ≡ ϵi −
n
X
ϵj hij .
j=1
όσο και των τυποποιημένων SRi ή studentized (SRi∗ ) καταλοίπων. Τα τελευταία ορίζονται ως:
ϵ̂i
SRi∗ = √
.
σ̂ 1 − hii
(4.32)
Στη σχέση (4.32), εάν το μέγεθος του δείγματος τείνει στο άπειρο (n → +∞), τότε η τιμή του hii θα
πλησιάζει το μηδέν. Σε αυτή την περίπτωση, τα προκύπτοντα κατάλοιπα:
SRisemi =
ϵ̂i
,
σ̂
καλούνται ημι-studentized (semi-studentized residuals).
Άσκηση Αυτοαξιολόγησης
Εξηγήστε τη διαφορά μεταξύ των εννοιών σφάλμα (ή διαταρακτικός όρος) και κατάλοιπο.
4.9 Συνέπειες παραβίασης προϋποθέσεων παλινδρόμησης
Αποτελεί σύνηθες φαινόμενο τουλάχιστον μία από τις βασικές προϋποθέσεις της παλινδρόμησης (γραμμικότητα,
κανονικότητα, ομοσκεδαστικότητα, ανεξαρτησία) να μην πληρείται. Η παραβίασή τους ενδέχεται να έχει σοβαρές συνέπειες, αν και στις περισσότερες περιπτώσεις μπορεί να υπάρχει τρόπος αντιμετώπισης (ή έστω
περιορισμού) του προβλήματος. Στην ενότητα αυτή, γίνεται σύντομη αναφορά στις κύριες συνέπειες και σε
κάποιες τεχνικές αντιμετώπισης των παραβιάσεων.
Παραβίαση γραμμικότητας
Αν παραβιάζεται η υπόθεση της γραμμικότητας, τότε ο Ερευνητής μπορεί να εξετάσει αν υπάρχει κατάλληλος
μετασχηματισμός μέσω του οποίου μία μη γραμμική σχέση να μπορεί να αναχθεί σε γραμμική (βλ. Ενότητα
4.2). Αν αυτό δεν επιτευχθεί, τότε η μελέτη και προσαρμογή μη γραμμικών προτύπων, όπως π.χ. αυτών του
Κεφαλαίου 11, αποτελεί μονόδρομο.
Η χρήση ενός γραμμικού μοντέλου για τη μελέτη μίας μη γραμμικής σχέσης οδηγεί σε λανθασμένη ερμηνεία
των (εκτιμητών των) παραμέτρων, λανθασμένες προβλέψεις και λανθασμένες εκτιμήσεις κυρίως των τυπικών
σφαλμάτων με αντίκτυπο στους ελέγχους υποθέσεων και στα διαστήματα εμπιστοσύνης.
Παραβίαση ομοσκεδαστικότητας και ανεξαρτησίας
Αν δεν ικανοποιείται είτε η υπόθεση της ομοσκεδαστικότητας είτε η υπόθεση της ανεξαρτησίας είτε και οι
δύο, τότε μεταξύ των επιλογών του Ερευνητή, είναι:
ΓΡΑΜΜΙΚΑ ΜΟΝΤΕΛΑ ΚΑΙ ΣΧΕΔΙΑΣΜΟΣ & ΑΝΑΛΥΣΗ ΠΕΙΡΑΜΑΤΩΝ ΜΕ ΕΦΑΡΜΟΓΕΣ ΣΕ R ΚΑΙ MINITAB
91
1. η αξιοποίηση γενικευμένων ή σταθμισμένων εκτιμητών ελαχίστων τετραγώνων (βλ. Ενότητα 6.3),
2. η προσθήκη πρόσθετων όρων/μεταβλητών στο πρότυπο (βλ. Ενότητα 4.4),
3. ένας κατάλληλος μετασχηματισμός της μεταβλητής απόκρισης (π.χ. η τετραγωνική ρίζα ή ο αντίστροφος όταν η μεταβλητή απόκρισης παίρνει μεγάλες τιμές ή ο λογάριθμος όταν η μεταβλητή απόκρισης
παίρνει τιμές κοντά στο μηδέν - βλ. Ενότητα 4.5).
Η κύρια συνέπεια της ετεροσκεδαστικότητας και της (αυτο)συσχέτισης είναι η εσφαλμένη εκτίμηση (συνήθως
υποεκτίμηση, μεροληψία ή/και ασυνέπεια) της διασποράς και του τυπικού σφάλματος των εκτιμητών των
παραμέτρων του προτύπου, με αποτέλεσμα τους μη αξιόπιστους ελέγχους υποθέσεων και τα μη αξιόπιστα
διαστήματα εμπιστοσύνης. Σημειώνεται ότι οι εκτιμητές των συντελεστών του προτύπου είναι αμερόληπτοι,
αλλά στην περίπτωση της αυτοσυσχέτισης ενδέχεται να είναι ασυνεπείς. Για περισσότερες λεπτομέρειες ο αναγνώστης παραπέμπεται στους Chaterjee & Hadi [7] και Rawlings [11].
Παραβίαση κανονικότητας
Μικρές αποκλίσεις από την υπόθεση της κανονικότητας των καταλοίπων γενικά, δεν θεωρούνται προβληματικές. Για την περίπτωση μεγάλων αποκλίσεων, ο Ερευνητής συνήθως καταφεύγει σε έναν μετασχηματισμό
των τιμών της μεταβλητής απόκρισης. Η μορφή του ιστογράμματος των καταλοίπων συχνά αποτελεί χρήσιμο εργαλείο αφού μπορεί να υποδείξει κάποιον κατάλληλο μετασχηματισμό. Ενδεικτικά αναφέρουμε ότι οι
μετασχηματισμοί του λογαρίθμου και της ρίζας εξυπηρετούν τις περιπτώσεις όπου το ιστόγραμμα παρουσιάζει λοξότητα. Εναλλακτικά, είναι διαθέσιμος ο μετασχηματισμός των Box-Cox[6] (βλ. Ενότητα 4.7).
Οι κύριες συνέπειες της παραβίασης της κανονικότητας περιλαμβάνουν ελέγχους υποθέσεων που δεν είναι
αξιόπιστοι και διαστήματα εμπιστοσύνης που δεν είναι έγκυρα. Στην περίπτωση που το μέγεθος του δείγματος είναι ικανοποιητικά μεγάλο αν και προσεγγιστικά (λόγω του ΚΟΘ) ισχύει η κανονικότητα, αναμένεται
οι p-values να είναι προσεγγιστικές και άρα μη ακριβείς.
Πολυσυγγραμμικότητα
Κλείνοντας θα αναφερθούμε στην περίπτωση της ενδοσυσχέτισης ή πολυσυγγραμμικότητας, δηλαδή της
ύπαρξης εξάρτησης μεταξύ των εμπλεκόμενων (ανεξάρτητων) μεταβλητών. Το φαινόμενο αυτό συχνά δεν
επιτρέπει την εύρεση εκτιμητριών, αλλά ακόμα και αν αυτό είναι εφικτό, οι διασπορές τους λαμβάνουν υπερβολικά μεγάλες τιμές. Η πολυσυγγραμμικότητα μπορεί να αντιμετωπιστεί με μία σειρά τεχνικών όπως είναι
η ανάλυση κύριων συνιστωσών και η τεχνική της ραχοειδούς παλινδρόμησης (βλ. Ενότητες 6.4 και 6.5).
4.10 Εφαρμογές στην R
1. Έστω τα δεδομένα της Εφαρμογής 2, Ενότητα 2.9.
i. Να εφαρμοστούν κατάλληλοι έλεγχοι κανονικότητας, ανεξαρτησίας και ομοσκεδαστικότητας
των σφαλμάτων (α = 5%).
ii. Να κατασκευαστεί κατάλληλο πρόγραμμα (κώδικας) το οποίο να ανιχνεύει την ύπαρξη ή μη
επηρεαζουσών παρατηρήσεων.
- Εάν υπάρχουν, να τυπώνεται το μήνυμα:
“Η παρατήρηση X [θέση παρατήρησης] είναι επηρεάζουσα.”
- Εάν δεν υπάρχουν, να τυπώνεται το μήνυμα:
“Δεν βρέθηκαν επηρεάζουσες παρατηρήσεις.”
92
ΔΙΑΓΝΩΣΤΙΚΟΙ ΕΛΕΓΧΟΙ ΠΡΟΫΠΟΘΕΣΕΩΝ ΓΡΑΜΜΙΚΟΥ ΜΟΝΤΕΛΟΥ ΠΑΛΙΝΔΡΟΜΗΣΗΣ
Ȫ
Λύση
i. Αφού εισαχθούν τα δεδομένα και προσαρμοστεί το απλό γραμμικό μοντέλο, γίνεται εξαγωγή των
καταλοίπων.
Εξαγωγή καταλοίπων από το προσαρμοσμένο μοντέλο slm
res.slm <‐ slm$residuals
-Κανονικότητα
Θέλουμε να εφαρμόσουμε τον ακόλουθο έλεγχο:
H0 :
Η κατανομή των σφαλμάτων του
μοντέλου είναι κανονική.
vs
H1 :
Η κατανομή των σφαλμάτων του
μοντέλου δεν είναι κανονική.
Ο παραπάνω έλεγχος θα εφαρμοστεί στα κατάλοιπα μέσω των τεχνικών Kolmogorov-Smirnov
(ks.test [stats]) και Shapiro-Wilk (shapiro.test [stats]). Σε περίπτωση που επιθυμούμε την εφαρμογή του ελέγχου Anderson-Darling, τότε θα πρέπει να γίνει χρήση της εντολής
ad.test [nortest]. Στο εν λόγω παράδειγμα, δεν γίνεται εφαρμογή του τελευταίου, αφού για
να λειτουργήσει θα πρέπει να διαθέτουμε τουλάχιστον 7 παρατηρήσεις.
Εφαρμογή K − S & S − W tests
ks.test(res.slm, "pnorm") #Με το όρισμα "pnorm" ζητάμε από την εντολή
ks.test να διενεργήσει έλεγχο κανονικότητας. Αν μας ενδιέφερε π.χ.
ο έλεγχος της Γάμμα κατανομής, τότε ως όρισμα θα έπρεπε να μπει το
"pgamma"
shapiro.test(res.slm)
> ks.test(res.slm, "pnorm")
One‐sample Kolmogorov ‐Smirnov test
data: res.slm
D = 0.327, p‐value = 0.45
alternative hypothesis: two‐sided
> shapiro.test(res.slm)
Shapiro ‐Wilk normality test
data: res.slm
W = 0.925, p‐value = 0.55
Τόσο στο K − S test όσο και στο S − W , η τιμή της p-value είναι (πολύ) μεγαλύτερη του
επιλεγμένου επιπέδου σημαντικότητας α = 5% με αποτέλεσμα να μην μπορεί να απορριφθεί η
υπόθεση ότι η κατανομή των σφαλμάτων του μοντέλου είναι η κανονική.
-Ανεξαρτησία
ΓΡΑΜΜΙΚΑ ΜΟΝΤΕΛΑ ΚΑΙ ΣΧΕΔΙΑΣΜΟΣ & ΑΝΑΛΥΣΗ ΠΕΙΡΑΜΑΤΩΝ ΜΕ ΕΦΑΡΜΟΓΕΣ ΣΕ R ΚΑΙ MINITAB
93
Θέλουμε να εφαρμόσουμε τον έλεγχο:
H0 : Ανεξαρτησία σφαλμάτων vs
H1 : Εξάρτηση σφαλμάτων.
Για τον έλεγχο της ανεξαρτησίας των σφαλμάτων θα κατασκευαστεί το διάγραμμα διασποράς
μεταξύ του χρόνου t, t ∈ {1, ..., 6}, και των καταλοίπων ϵ̂i , i = 1, ..., 6.
Κατασκευή διαγράμματος διασποράς μεταξύ t και ϵ̂i
plot(
res.slm,
col = "red3",
lwd = 4,
pch = 19,
xlab = "t",
ylab = "Κατάλοιπα",
main = "Κατάλοιπα vs t",
bty = "L",
cex.lab = 1.1,
cex.axis = 1.1,
ylim = c(‐6, 6)
)
abline(h = 0, lwd = 2)
u <‐ par("usr")
arrows(u[1], u[3], u[2], u[3], code = 2, xpd = TRUE)
arrows(u[1], u[3], u[1], u[4], code = 2, xpd = TRUE)
Σχήμα 4.5: Γραφική διερεύνηση ανεξαρτησίας
Από το Σχήμα 4.5 παρατηρούμε ότι καθώς ο χρόνος αυξάνεται, οι τιμές των καταλοίπων κινούνται τυχαία γύρω από το μηδέν. Βάσει αυτού, δεν απορρίπτουμε την H0 και άρα τα σφάλματα
94
ΔΙΑΓΝΩΣΤΙΚΟΙ ΕΛΕΓΧΟΙ ΠΡΟΫΠΟΘΕΣΕΩΝ ΓΡΑΜΜΙΚΟΥ ΜΟΝΤΕΛΟΥ ΠΑΛΙΝΔΡΟΜΗΣΗΣ
είναι μεταξύ τους ανεξάρτητα.
-Ομοσκεδαστικότητα
Θέλουμε να εφαρμόσουμε τον έλεγχο:
H0 : Ομοσκεδαστικότητα σφαλμάτων
vs
H1 : Ετεροσκεδαστικότητα σφαλμάτων.
Για τον έλεγχο της ομοσκεδαστικότητας των σφαλμάτων θα κατασκευαστεί το διάγραμμα διασποράς μεταξύ των studentized καταλοίπων ϵ̂∗i και των εκτιμώμενων τιμών Ŷi , i = 1, ..., 6.
Για τον υπολογισμό των ϵ̂∗i θα γίνει χρήση της εντολής studres [MASS] πάνω στη μεταβλητή
slm. Όσο για τα Ŷi , θα πρέπει να εξαχθούν μέσα από τη μεταβλητή slm, με χρήση της εντολής
slm$fitted.values.
Υπολογισμός ϵ̂∗i & Ŷi
library(MASS)
stud.res.slm <‐ studres(slm)
Y.hat <‐ slm$fitted.values
Σειρά έχει το διάγραμμα διασποράς μεταξύ των Ŷi και ϵ̂∗i .
Δημιουργία διαγράμματος διασποράς μεταξύ των Ŷi & ϵ̂∗i
plot(
Y.hat,
stud.res.slm,
col = "red3",
lwd = 4,
pch = 19,
xlab = "Εκτιμώμενες τιμές",
ylab = "Studentized κατάλοιπα",
main = "Studentized κατάλοιπα vs Εκτιμώμενες τιμές",
bty = "L",
cex.lab = 1.1,
cex.axis = 1.1
)
abline(h = 1.4,
lty = 2,
lwd = 2,
col = "#2F5C9D"
)#Άνω διακεκομμένη
abline(
h = ‐2.4,
lty = 2,
lwd = 2,
col = "#2F5C9D"
) #Κάτω διακεκομμένη
symbols(
66.171,
3.542160,
ΓΡΑΜΜΙΚΑ ΜΟΝΤΕΛΑ ΚΑΙ ΣΧΕΔΙΑΣΜΟΣ & ΑΝΑΛΥΣΗ ΠΕΙΡΑΜΑΤΩΝ ΜΕ ΕΦΑΡΜΟΓΕΣ ΣΕ R ΚΑΙ MINITAB
95
circles = 1.6,
add = T,
inches = F,
fg = "#2F5C9D",
lwd = 2
) #Κύκλος γύρω από το ακραίο κατάλοιπο
arrows(72,
2.8,
67.3,
3.35,
code = 2,
xpd = TRUE,
lwd = 2) #Βέλος που δείχνει τον παραπάνω κύκλο
u <‐ par("usr")
arrows(u[1], u[3], u[2], u[3], code = 2, xpd = TRUE)
arrows(u[1], u[3], u[1], u[4], code = 2, xpd = TRUE)
Σχήμα 4.6: Γραφική διερεύνηση ομοσκεδαστικότητας
Από το Σχήμα 4.6 παρατηρούμε ότι κατά μήκος των εκτιμώμενων τιμών, οι αποστάσεις των
καταλοίπων παραμένουν (σχεδόν) σταθερές. Αυτό καθίσταται περαιτέρω εμφανές από το ότι η
πλειονότητα των καταλοίπων μπορεί να περιοριστεί εντός δύο παράλληλων ευθειών. Βασιζόμενοι στα προαναφερθέντα, αποδεχόμαστε την H0 , και άρα υποθέτουμε ότι μεταξύ των σφαλμάτων
υπάρχει ομοσκεδαστικότητα.
Προσοχή! Υπάρχει ένα κατάλοιπο το οποίο φαίνεται να αποκλίνει σημαντικά, συγκριτικά με
τα υπόλοιπα. Το γεγονός αυτό χρήζει ιδιαίτερης προσοχής, αφού μπορεί να δημιουργήσει πρόβλημα μη σταθερής διασποράς (ετεροσκεδαστικότητας).
96
ΔΙΑΓΝΩΣΤΙΚΟΙ ΕΛΕΓΧΟΙ ΠΡΟΫΠΟΘΕΣΕΩΝ ΓΡΑΜΜΙΚΟΥ ΜΟΝΤΕΛΟΥ ΠΑΛΙΝΔΡΟΜΗΣΗΣ
ii. Για την αντιμετώπιση αυτού το ερωτήματος χρειαζόμαστε:
• μία μεταβλητή η οποία να περιέχει τα διαγώνια στοιχεία του πίνακα H,
• μία μεταβλητή η οποία να περιέχει την τιμή της ποσότητας ποσότητα 2p
,
n
• μία μεταβλητή «ελέγχου» του εάν υπάρχουν ή όχι επηρεάζουσες παρατηρήσεις.
Τέλος, για την εκτύπωση του εκάστοτε μηνύματος θα γίνει χρήση της εντολής cat [base]
(εναλλακτικά print [base]), ενώ για την εύρεση της θέσης που βρίσκεται η επηρεάζουσα παρατήρηση, της εντολής match [base].
Κώδικας ανίχνευσης επηρεαζουσών παρατηρήσεων
hii <‐ lm.influence(slm)$hat #Διαγώνια στοιχεία πίνακα H
threshold <‐ (2 * sum(hii)) / NROW(hii) # 2p
n
check <‐ 0 #Μεταβλητή η οποία εάν στο τέλος του κώδικα παραμείνει 0
τότε δεν υπάρχουν επηρεάζουσες παρατηρήσεις
for (i in 1:NROW(hii)) {
if (hii[i] > threshold) {
cat("Η παρατήρηση X[",
match(hii[i], hii),
"] είναι επηρεάζουσα.\n\n",
sep = "") #Η ποσότητα "\n" χρησιμοποιείται για την αλλαγή γραμμής
σε μία πρόταση
check <‐ 1
}
}
if (check == 0) {
cat("Δεν βρέθηκαν επηρεάζουσες παρατηρήσεις.\n")
}
Βάσει των παραπάνω, προκύπτει ότι στο δείγμα δεν υπάρχουν επηρεάζουσες παρατηρήσεις.
Σχόλιο: Για τον έλεγχο της ορθής λειτουργίας του κώδικα που παρουσιάστηκε στο εν λόγω ερώτημα, θέτουμε ως όρισμα στη μεταβλητή threshold την ποσότητα sum(hii) / NROW(hii)
(δλδ., h/n) και επαναλαμβάνουμε τη διαδικασία.
2. Έστω τα δεδομένα του Πίνακα 4.5.
Πίνακας 4.5: Τιμές 9 παρατηρήσεων (xi1 , xi2 , yi )
#
X1
X2
Y
1
7.909
0.00135803
1022
6
7.791
0.364067
281
2
6.983
0.0122243
1141
7
8.217
0.190094
346
3
7.8
0.103029
640
8
8.49
0.0921516
406
4
7.655
0.190094
257
9
8.668
0.184614
347
5
7.48
0.27709
269
ΓΡΑΜΜΙΚΑ ΜΟΝΤΕΛΑ ΚΑΙ ΣΧΕΔΙΑΣΜΟΣ & ΑΝΑΛΥΣΗ ΠΕΙΡΑΜΑΤΩΝ ΜΕ ΕΦΑΡΜΟΓΕΣ ΣΕ R ΚΑΙ MINITAB
97
Έπειτα από προσαρμογή κατάλληλου πολλαπλού γραμμικού μοντέλου παλινδρόμησης, προέκυψε ότι η υπόθεση της κανονικότητας των σφαλμάτων δεν πληρείται (να επαληθευτεί). Αφού
εφαρμοστεί κατάλληλος Box-Cox μετασχηματισμός στις τιμές της εξαρτημένης μεταβλητής Y ,
να εξεταστεί εάν το πρόβλημα της μη-κανονικότητας των σφαλμάτων διορθώθηκε (α = 1%).
Ȫ
Λύση
Εισάγουμε τα δεδομένα και δημιουργούμε το πολλαπλό γραμμικό μοντέλο παλινδρόμησης το
οποίο θα χρειαστούμε στη συνέχεια για την εύρεση του κατάλληλου Box-Cox μετασχηματισμού.
Εισαγωγή δεδομένων και δημιουργία πολλαπλού γραμμικού μοντέλου παλινδρόμησης
library(readxl)
data <‐ read_xlsx('ch4ex2.xlsx')
X1 <‐ data$X1
X2 <‐ data$X2
Y <‐ data$Y
multlm <‐ lm(Y ~ X1 + X2)
Το προκύπτον μοντέλο είναι το εξής:
ŷi = 2817 − 246xi1 − 2256xi2 ,
i = 1, ..., 9.
Η εφαρμογή του μετασχηματισμού της σχέσης (4.26) προϋποθέτει την εύρεση του κατάλληλου λ. Για τον σκοπό αυτό θα γίνει χρήση της εντολής boxcox [MASS] στο πολλαπλό γραμμικό
μοντέλο multlm.
Εύρεση κατάλληλου λ και εφαρμογή Box-Cox μετασχηματισμού
library(MASS)
bc <‐ boxcox(multlm)
lambda <‐ bc$x[which.max(bc$y)] #Εύρεση της τιμής του λ η οποία
μεγιστοποιεί την πιθανοφάνεια
lambda
if (lambda == 0) {
y.lambda <‐ log(Y)
} else {
y.lambda <‐ (Y ^ lambda ‐ 1) / lambda
}
> lambda
[1] ‐0.58586
Αφού η τιμή του λ είναι διάφορη του μηδενός, ο μετασχηματισμός που εφαρμόστηκε είναι ο
ακόλουθος:
yi−0.58586 − 1
(−0.58586)
, i = 1, ..., 9.
yi
=
−0.58586
98
ΔΙΑΓΝΩΣΤΙΚΟΙ ΕΛΕΓΧΟΙ ΠΡΟΫΠΟΘΕΣΕΩΝ ΓΡΑΜΜΙΚΟΥ ΜΟΝΤΕΛΟΥ ΠΑΛΙΝΔΡΟΜΗΣΗΣ
Στο Σχήμα 4.7 απεικονίζεται η συμπεριφορά της log - πιθανοφάνειας με βάση διάφορες τιμές
του λ. Όπως παρατηρούμε, η τιμή του λ που μεγιστοποιεί τη log - πιθανοφάνεια είναι η προαναφερθείσα, −0.58586.
Σχήμα 4.7: Συμπεριφορά log - πιθανοφάνειας για διάφορες τιμές του λ
Τέλος, δημιουργούμε το νέο πολλαπλό γραμμικό μοντέλο που βασίζεται στις μετασχηματισμένες
τιμές και εφαρμόζουμε το K − S test για τον έλεγχο της κανονικότητας των σφαλμάτων.
(−0.58586)
Δημιουργία πολλαπλού γραμμικού μοντέλου βάσει των μετασχηματισμένων τιμών Yi
κανονικότητας των σφαλμάτων
και έλεγχος
multlm.bc <‐ lm(y.lambda ~ X1 + X2)
ks.test(multlm.bc$residuals, "pnorm")
> ks.test(multlm.bc$residuals , "pnorm")
One‐sample Kolmogorov ‐Smirnov test
data: multlm.bc$residuals
D = 0.496, p‐value = 0.014
alternative hypothesis: two‐sided
Το νέο πολλαπλό γραμμικό μοντέλο έχει ως εξής:
(−0.58586)
yi
= 1.71479 − 0.00523xi1 − 0.1065xi2 ,
i = 1, ..., 9.
Όσον αφορά τον έλεγχο της κανονικότητας των σφαλμάτων, φαίνεται ότι (οριακά) πληρείται,
αφού η p-value (0.014) του ελέγχου είναι μεγαλύτερη του α = 1%.
ΓΡΑΜΜΙΚΑ ΜΟΝΤΕΛΑ ΚΑΙ ΣΧΕΔΙΑΣΜΟΣ & ΑΝΑΛΥΣΗ ΠΕΙΡΑΜΑΤΩΝ ΜΕ ΕΦΑΡΜΟΓΕΣ ΣΕ R ΚΑΙ MINITAB
99
4.11 Άλυτες ασκήσεις
1. Να αποδειχτεί το Πόρισμα 4.1.
2. Έστω το εκθετικό μοντέλο παλινδρόμησης:
yi = β0 exp(β1 xi +ϵi ) , 1, ..., n.
i. Να προσδιοριστεί η εκτιμήτρια συνάρτηση παλινδρόμησης:
ŷi = β̂0 exp(β̂1 xi ) .
ii. Αφού εφαρμοστεί κατάλληλος μετασχηματισμός, ώστε το παραπάνω μοντέλο να μετατραπεί σε
γραμμικό, να βρεθούν οι γενικοί τύποι των ΕΕΤ του νέου μοντέλου.
3. Να αποδειχτεί ότι:
SSLF =
c
X
nj (ȳj − ŷj )2 .
j=1
4. Να δειχτεί ότι:
E (M SP E) = σ 2 .
5. Έστω τα δεδομένα του Πίνακα 4.6, όπου X = Ηλικία και Y = Διαστολική Πίεση.
Πίνακας 4.6: Τιμές 8 ζευγών παρατηρήσεων (xi , yi )
#
X
Y
1
5
63
2
8
67
3
11
74
4
7
64
5
13
75
6
12
69
7
12
90
8
6
60
Κάνοντας χρήση της R:
i. Να προσαρμόσετε κατάλληλο μοντέλο παλινδρόμησης και να ερμηνεύσετε τις τιμές των παραμέτρων.
ii. Να γίνει η γραφική παράσταση των ϵ̂i και xi . Ποια συμπεράσματα προκύπτουν;
iii. Να επαναληφθούν τα ερωτήματα (i) και (ii), αφού γίνει παράλειψη του ζεύγους παρατηρήσεων
(x7 , y7 ). Ποια συμπεράσματα προκύπτουν αναφορικά με το εν λόγω ζεύγος;
iv. Να υπολογιστεί ένα 99% διάστημα πρόβλεψης για μία νέα παρατήρηση y0 που αντιστοιχεί στην
τιμή x0 = 12. Βρίσκεται η παρατήρηση y0 στο Δ.Π.; Ποια συμπεράσματα προκύπτουν;
6. Έστω τα δεδομένα του Πίνακα 4.7, όπου X = # των μηχανών που επισκευάστηκαν από τον iκατασκευαστή, και Y = ο συνολικός χρόνος (σε λεπτά) επισκευής.
100
ΔΙΑΓΝΩΣΤΙΚΟΙ ΕΛΕΓΧΟΙ ΠΡΟΫΠΟΘΕΣΕΩΝ ΓΡΑΜΜΙΚΟΥ ΜΟΝΤΕΛΟΥ ΠΑΛΙΝΔΡΟΜΗΣΗΣ
Πίνακας 4.7: Τιμές 18 ζευγών παρατηρήσεων (xi , yi )
P
#
X
Y
1
7
97
2
6
86
3
5
78
4
1
10
5
5
75
6
4
62
7
7
101
13
2
25
8
3
39
14
5
71
9
4
53
15
7
105
10
2
33
16
1
17
11
8
118
17
4
49
12
5
65
18
5
68
P
2
18
Αν i=1
= (yi − ȳ)2 = 16504, 18
i=1 = (xi − x̄) = 74.5,
1098,
SSR = 16182.6 και SSE = 321.4:
P18
i=1
= (yi − ȳ) (xi − x̄) =
i. Να προσδιοριστούν τα SSP E και SSLF και να κατασκευαστεί ο πίνακας ANOVA.
ii. Να γίνει ο έλεγχος έλλειψης προσαρμογής (α = 1%).
iii. Να προσδιοριστεί (προσεγγιστικά) η p-value του ελέγχου του ερωτήματος (ii).
ΒΙΒΛΙΟΓΡΑΦΙΑ
[1] Καλαματιανού, Α.Γ. (1997). Εφαρμοσμένη ανάλυση παλινδρόμησης. Αθήνα: Εκδόσεις Παπαζήσης.
[2] Καρώνη, Χ., & Οικονόμου, Π. (2017). Στατιστικά μοντέλα παλινδρόμησης: Με χρήση M initab και R
(2η έκδ.). Αθήνα: Συμεών.
[3] Κούτρας Μ.Β., & Ευαγγελάρας, Χ. (2010). Ανάλυση παλινδρόμησης, θεωρία και εφαρμογές. Αθήνα: Εκδόσεις Σταμούλη Α. Ε.
[4] Μπόρα-Σέντα, Ε., & Μωυσιάδης, Χ. (1990). Εφαρμοσμένη στατιστική, Θεσσαλονίκη: Εκδόσεις Ζήτη.
[5] Anderson, T.W., & Darling, D.A. (1954). A test of goodness-of-fit. Journal of the American Statistical
Association, 49, 765-769.
[6] Box, G.E.P., & Cox, D.R. (1964). An analysis of transformations. Journal of the Royal Statistical Society, Series B, 26(2), 211-252.
[7] Chatterjee S., & Hadi, A.S. (2012). Regression analysis by example (5th ed.). J. Wiley and Sons.
[8] Draper, R.D., & Smith, H. (1998). Applied regression analysis (3rd ed.). Wiley-Interscience.
[9] Field, A., Miles, J., & Field, Z. (2012). Discovering statistics using R (1st Edition). Sage Ltd.
[10] Lilliefors, H.W. (1967). On the Kolmogorov-Smirnov test for normality with mean and variance
unknown. Journal of the American Statistical Association, 62(318), 399-402.
[11] Rawlings, J.O., Pantula, S.G., & Dickey, D. A. (2001). Applied regression analysis: A research tool (2nd
ed.). Springer.
[12] Shapiro, S.S., & Wilk, M.B. (1965). An analysis of variance test for normality (complete samples).
Biometrika, 52(3-4), 591-611.
[13] Smirnov, N.V. (1939). Estimate of deviation between empirical distribution functions in two independent samples. (Russian). Moscow University Mathematics Bulletin, 2(2), 3-16.
102
ΒΙΒΛΙΟΓΡΑΦΙΑ
ΚΕΦΑΛΑΙΟ 5
ΚΡΙΤΗΡΙΑ ΑΞΙΟΛΟΓΗΣΗΣ ΜΟΝΤΕΛΩΝ
Σύνοψη
Το παρόν κεφάλαιο παρουσιάζει τα δημοφιλέστερα κριτήρια επιλογής μοντέλων και τον τρόπο
αξιοποίησής τους, με σκοπό την επιλογή του καταλληλότερου (ιδανικότερου) προτύπου παλινδρόμησης.
Προαπαιτούμενη γνώση
Το κεφάλαιο προϋποθέτει τη γνώση και την κατανόηση των προηγουμένων κεφαλαίων.
Προσδοκώμενα μαθησιακά αποτελέσματα
Μετά τη μελέτη του παρόντος κεφαλαίου ο αναγνώστης αναμένεται να:
• αναγνωρίζει και να κατανοεί τον βασικό μηχανισμό λειτουργίας κλασικών κριτηρίων για την
επιλογή μοντέλων,
• εφαρμόζει τις κατάλληλες τεχνικές για την επιλογή του καταλληλότερου (ιδανικού) προτύπου,
• εφαρμόζει τα κριτήρια επιλογής μοντέλων με τη χρήση στατιστικών πακέτων.
Καραγρηγορίου, Α., & Καλλιγέρης, Ε. Ν. (�2023). «Γραμμικά Μοντέλα και Σχεδιασμός & Ανάλυση Πειραμάτων με Εφαρμογές
σε R και Minitab».
Αθήνα: Κάλλιπος, Ανοικτές Ακαδημαϊκές Εκδόσεις. http://dx.doi.org/10.57713/kallipos-70
Creative Commons Αναφορά Δημιουργού - Μη Εμπορική Χρήση - Παρόμοια Διανομή 4.0
104
ΚΡΙΤΗΡΙΑ ΑΞΙΟΛΟΓΗΣΗΣ ΜΟΝΤΕΛΩΝ
5.1 Εισαγωγή
Το κεφάλαιο αυτό αποσκοπεί σε μία περιορισμένης έκτασης αναφορά σε μία από τις πιο ενδιαφέρουσες περιοχές της Στατιστικής Επιστήμης, την Επιλογή Μοντέλων.
Στα περισσότερα επιστημονικά πεδία δεν υπάρχουν προκαθορισμένα μοντέλα που θα μπορούσαν να χρησιμοποιηθούν για την περιγραφή ενός φαινομένου. Στις περιπτώσεις αυτές, ο μελετητής υποχρεούται να ακολουθήσει μία σωστή στρατηγική για την κατασκευή του μοντέλου (model building strategy) ενδιαφέροντος. Συνήθως, συγκεντρώνεται ένας μεγάλος αριθμός ανεξάρτητων μεταβλητών οι οποίες πιθανολογείται ότι έχουν
θέση στο υπό κατασκευή μοντέλο. Στη συνέχεια, κάποιες από αυτές απομακρύνονται από το σύνολο των πιθανών ανεξάρτητων μεταβλητών είτε διότι τελικά δεν είναι στατιστικά σημαντικές είτε διότι οι μετρήσεις τους
εμπεριέχουν υπερβολικά σφάλματα, είτε διότι δεν είναι δυνατό να μετρηθούν. Παρόλα αυτά, ο αριθμός των
μεταβλητών που απομένουν συνεχίζει να είναι αρκετά μεγάλος, γεγονός που δεν είναι ιδιαίτερα επιθυμητό.
Ο μελετητής επιδιώκει πάντοτε την κατασκευή ενός ικανοποιητικού μοντέλου με περιορισμένο αριθμό ανεξάρτητων μεταβλητών, δηλαδή ενός μοντέλου που να είναι ευέλικτο και ταυτόχρονα κατανοητό. Για τον λόγο
αυτό, στο επόμενο στάδιο της κατασκευής, επιδιώκεται η επιλογή περιορισμένου αριθμού ιδανικών ανεξάρτητων μεταβλητών. Η επιλογή ενός τέτοιου υποσυνόλου μεταβλητών εξαρτάται πάντοτε από τους σκοπούς
της μελέτης, με αποτέλεσμα να μην υπάρχει μοναδικό υποσύνολο μεταβλητών που να χαρακτηρίζεται ως το
καταλληλότερο. Ένα μοντέλο που κατασκευάζεται για την περιγραφή ενός προβλήματος, μπορεί να διαφέρει
από ένα μοντέλο, για το ίδιο φαινόμενο, που κατασκευάζεται για σκοπούς πρόβλεψης.
Στην ενότητα αυτή, τα κριτήρια επιλογής που θα διατυπωθούν ερευνούν όλα τα δυνατά μοντέλα παλινδρόμησης που μπορεί να προκύψουν με βάση τις υπάρχουσες μεταβλητές και επιλέγουν το καταλληλότερο. Επειδή
τα κριτήρια επιλογής έχουν διαφορετική (στατιστική) βάση και έχουν προταθεί για να εξυπηρετήσουν διαφορετικούς σκοπούς, τα μοντέλα στα οποία καταλήγουν, τις περισσότερες φορές, είναι διαφορετικά.
Έστω ότι το σύνολο όλων των υποψήφιων ανεξάρτητων μεταβλητών X είναι P − 1. Επίσης, υποθέτουμε
ότι όλα τα μοντέλα παλινδρόμησης περιλαμβάνουν τον συντελεστή β0 , έτσι ώστε το μοντέλο που περιλαμβάνει όλες τις μεταβλητές να έχει συνολικά P συντελεστές, ενώ εκείνο που δεν περιλαμβάνει καμία να έχει έναν
συντελεστή (το β0 ).
Ο αριθμός των X σε ένα υποσύνολο μεταβλητών συμβολίζεται με p − 1, ενώ το αντίστοιχο μοντέλο περιλαμβάνει p συντελεστές. Στόχος του Ερευνητή είναι η μελέτη όλων των πιθανών μοντέλων, δηλαδή για
όλα τα δυνατά p, και η επιλογή του καταλληλότερου.
Τέλος, είναι επιθυμητό το μέγεθος των παρατηρήσεων να είναι ικανοποιητικά μεγαλύτερο από P (n > P ).
5.2 Κριτήριο Rp2
Το κριτήριο Rp2 υπολογίζει τον συντελεστή προσδιορισμού ο οποίος προκύπτει από τη σχέση:
SSRp
SSEp
=1−
,
(5.1)
SST O
SST O
για καθένα από τα πιθανά μοντέλα παλινδρόμησης με p συντελεστές και θεωρητικά, επιλέγεται εκείνο για
το οποίο το κριτήριο μεγιστοποιείται. Ως γνωστόν, η εισδοχή μίας νέας μεταβλητής στο μοντέλο αυξάνει το
SSR και κατά συνέπεια, την τιμή του κριτηρίου, με αποτέλεσμα το κριτήριο να λαμβάνει τη μέγιστη τιμή του,
όταν όλες οι P − 1 μεταβλητές εισαχθούν στο μοντέλο. Στην πράξη, ο μελετητής επιλέγει ως καταλληλότερο
μοντέλο, το «σημείο» εκείνο, δηλαδή εκείνο το p, όπου η προσθήκη μίας ή περισσότερων νέων μεταβλητών
οδηγεί σε αμελητέα αύξηση του Rp2 .
Rp2 =
ΓΡΑΜΜΙΚΑ ΜΟΝΤΕΛΑ ΚΑΙ ΣΧΕΔΙΑΣΜΟΣ & ΑΝΑΛΥΣΗ ΠΕΙΡΑΜΑΤΩΝ ΜΕ ΕΦΑΡΜΟΓΕΣ ΣΕ R ΚΑΙ MINITAB
105
5.3 Κριτήρια F P Ep και AICp
Τα κριτήρια F P E και AIC προτάθηκαν από τον Akaike [5, 6] και δίνονται από τους τύπους:
(n + p)M SEp
F P Ep ≡ Jp =
=
n
και
!
n+p
SSEp
×
n−p
n
AICp = −2 log L̂ + 2p,
(5.2)
(5.3)
όπου n το μέγεθος του δείγματος και L̂ η εκτιμώμενη πιθανοφάνεια του μοντέλου που περιλαμβάνει p συντελεστές. Και στις δύο προαναφερθείσες περιπτώσεις, επιλέγεται εκείνο το μοντέλο, δηλαδή εκείνο το p, που
ελαχιστοποιεί το κριτήριο. Αξίζει να σημειωθεί ότι ο δεύτερος όρος στο κριτήριο AIC, αυξάνεται όσο αυξάνεται η τιμή του p και υπ΄ αυτή την έννοια, αντιπροσωπεύει μία «ποινή» για την περίπτωση μοντέλων
μεγάλης διάστασης (δηλαδή με μεγάλο αριθμό ανεξάρτητων μεταβλητών).
5.4 Κριτήριο BICp
To κριτήριο BIC (εναλλακτικά SIC) προτάθηκε από τον Schwarz το 1978 [14] με στόχο την αποφυγή
του φαινομένου της υπερπροσαρμογής του εκάστοτε μοντέλου στα υπό εξέταση δεδομένα. Η φιλοσοφία του
κριτηρίου βασίζεται σε εκείνη του AIC και η κύρια διαφορά τους έγκειται στην προσέγγιση της «ποινής»
στο μοντέλο:
BICp = −2 log L̂ + p log (n) .
(5.4)
Το μοντέλο που επιλέγεται είναι αυτό που έχει τη μικρότερη τιμή BICp .
Άσκηση Αυτοαξιολόγησης
Να προσδιοριστεί η απλοποιημένη μορφή των κριτηρίων AIC και BIC, στην περίπτωση
που ο Ερευνητής έχει στη διάθεσή του ένα δείγμα μεγέθους n από την κανονική κατανομή,
με μέση τιμή µ και διασπορά σ 2 όπου και τα δύο είναι άγνωστα και πρέπει να εκτιμηθούν
από τα διαθέσιμα δεδομένα.
5.5 Εναλλακτικά κριτήρια αξιολόγησης
2
5.5.1 Κριτήριο M SEp ή Radj,p
Επειδή ο συντελεστής προσδιορισμού είναι μία μη φθίνουσα συνάρτηση του p, και επιπλέον δε, λαμβάνει
υπόψη του τον αριθμό των συντελεστών στο μοντέλο, έχει προταθεί ως εναλλακτικό κριτήριο επιλογής, ο
προσαρμοσμένος συντελεστής προσδιορισμού (adjusted coefficient of determination):
2
Radj,p
n−1
=1−
n−p
!
SSEp
M SEp
=1−
.
SST O
SST O/ (n − 1)
(5.5)
2
. Από τη σχέση (5.5) είναι φανερό
Το μοντέλο που επιλέγεται είναι αυτό που μεγιστοποιεί το κριτήριο Radj,p
2
ότι η μεγιστοποίηση του Radj,p ισοδυναμεί με ελαχιστοποίησή του μέσω αθροίσματος σφαλμάτων M SEp .
Έτσι, το κριτήριο:
SSEp
M SEp =
.
(5.6)
n−p
2
αποτελεί ένα ακόμα κριτήριο επιλογής, το οποίο όμως είναι ουσιαστικά ισοδύναμο με το Radj,p
.
106
ΚΡΙΤΗΡΙΑ ΑΞΙΟΛΟΓΗΣΗΣ ΜΟΝΤΕΛΩΝ
5.5.2 Κριτήριο Cp
Έστω M SE (X1 , ..., XP −1 ) το μέσο άθροισμα σφαλμάτων του μοντέλου που περιλαμβάνει και τις P − 1
πιθανές ανεξάρτητες μεταβλητές. Το κριτήριο Cp , προτάθηκε το 1964 από τον Mallows [10] και δίνεται από
τον τύπο:
SSEp
Cp ≡
+ 2p − n
(5.7)
M SE (X1 , ..., XP −1 )
και το μοντέλο που τελικά επιλέγεται είναι εκείνο για το οποίο η πιο πάνω ποσότητα ελαχιστοποιείται.
Πέρα από τα κριτήρια πληροφορίας που παρουσιάστηκαν στις προηγούμενες υποενότητες, υπάρχουν πολλά
ακόμα τα οποία έχουν προταθεί τα τελευταία σαράντα χρόνια. Από το 1980 και μετά, έχουν γίνει αρκετές μελέτες αναφορικά με τις ασυμπτωτικές ιδιότητες διαφόρων κριτηρίων επιλογής, όπως είναι η συνέπεια (consistency) και η ασυμπτωτική αποδοτικότητα (asymptotic efficiency). O ενδιαφερόμενος αναγνώστης μπορεί
να ανατρέξει στις πηγές [13] - [11] για περισσότερες πληροφορίες.
Άσκηση Αυτοαξιολόγησης
Να εξεταστεί αν και υπό ποιες προϋποθέσεις ο συντελεστής προσδορισμού Rp2 ταυτίζεται με
2
τον προσαρμοσμένο συντελεστή προσδιορισμού Radj,p
.
5.6 Εφαρμογές στην R
1. Έστω τα δεδομένα της Εφαρμογής 1 του Κεφαλαίου 3 και τα μοντέλα:
yi = β0 + β1 xi1 + ϵi
και
yi∗ = β0∗ + β1∗ xi2 + ϵ∗i ,
όπου:
Y = Μηνιαία Ποσότητα Ατμού μίας Μηχανής (kg/h),
X1 = Αριθμός Ημερών που η Μηχανή Εργάστηκε ανά Μήνα,
X2 = Μέση Μηνιαία Θερμοκρασία σε βαθμούς Fahrenheit.
i. Για καθένα από τα εξεταζόμενα μοντέλα, να βρεθούν οι εκτιμήσεις των συντελεστών παλινδρόμησης, καθώς και να ελεγχθεί η στατιστική σημαντικότητα των μοντέλων (α = 5%).
ii. Για καθένα από τα εξεταζόμενα μοντέλα, να βρεθούν οι εκτιμήσεις των συντελεστών παλινδρόμησης, καθώς και να ελεγχθεί η στατιστική σημαντικότητα των μοντέλων (α = 5%).
ii. Να υπολογιστούν τα AIC και BIC, και στη συνέχεια να επιλεχθεί το καταλληλότερο μοντέλο.
Ȫ
Λύση
ΓΡΑΜΜΙΚΑ ΜΟΝΤΕΛΑ ΚΑΙ ΣΧΕΔΙΑΣΜΟΣ & ΑΝΑΛΥΣΗ ΠΕΙΡΑΜΑΤΩΝ ΜΕ ΕΦΑΡΜΟΓΕΣ ΣΕ R ΚΑΙ MINITAB
107
Εισαγωγή δεδομένων & δημιουργία μεταβλητών
library(readxl)
data <‐ read_xlsx('ch3ex1.xlsx')
X1 <‐ data$X1
X2 <‐ data$X2
Y <‐ data$Y
i. Προσαρμόζουμε καταλλήλως τα δύο γραμμικά μοντέλα παλινδρόμησης και ελέγχουμε τη στατιστική σημαντικότητα του καθενός.
Δημιουργία πρώτου απλού γραμμικού μοντέλου & εξαγωγή συντελεστών
slm.1 <‐ lm(Y ~ X1)
summary(slm.1)
> summary(slm.1)
Call:
lm(formula = Y ~ X1)
Coefficients:
Estimate Std. Error t value Pr(>|t|)
(Intercept)
20.236
3.038
6.66 0.00264
X1
3.434
0.257
13.33 0.00018
Residual standard error: 4.11 on 4 degrees of freedom
Multiple R‐squared: 0.978,
Adjusted R‐squared: 0.972
F‐statistic: 178 on 1 and 4 DF, p‐value: 0.000183
Η μορφή του πρώτου εκτιμώμενου μοντέλου είναι η ακόλουθη:
ŷi = 20.236 + 3.434xi1 .
Με βάση την τιμή του p‐value (≃ 0 < 5% = α) του F ελέγχου, το πρώτο μοντέλο παλινδρόμησης είναι στατιστικά σημαντικό.
Δημιουργία δεύτερου απλού γραμμικού μοντέλου & εξαγωγή συντελεστών
slm.2 <‐ lm(Y ~ X2)
summary(slm.2)
> summary(slm.2)
Call:
lm(formula = Y ~ X2)
Coefficients:
Estimate Std. Error t value Pr(>|t|)
(Intercept)
91.179
5.042
18.08 5.5e‐05
X2
‐1.344
0.157
‐8.57
0.001
Residual standard error: 6.3 on 4 degrees of freedom
Multiple R‐squared: 0.948,
Adjusted R‐squared: 0.935
F‐statistic: 73.5 on 1 and 4 DF, p‐value: 0.00102
108
ΚΡΙΤΗΡΙΑ ΑΞΙΟΛΟΓΗΣΗΣ ΜΟΝΤΕΛΩΝ
Η μορφή του δεύτερου εκτιμώμενου μοντέλου είναι η ακόλουθη:
ŷi∗ = 91.179 − 1.344xi2
Με βάση την τιμή του p‐value (≃ 0.001 < 5% = α) του F ελέγχου, το δεύτερο μοντέλο
παλινδρόμησης είναι και αυτό στατιστικά σημαντικό.
ii. Στο προηγούμενο ερώτημα, και τα δύο εξεταζόμενα μοντέλα βρέθηκαν στατιστικά σημαντικά.
Το ερώτημα που τίθεται πλέον είναι «Ποιο από τα δύο μοντέλα προσεγγίζει με μεγαλύτερη ακρίβεια το υπό εξέταση πρόβλημα;» Στο ερώτημα αυτό, καλούμαστε να επιλέξουμε το καταλληλότερο μοντέλο βάσει των κριτηρίων πληροφορίας AIC και BIC (και όχι μέσω του R2 ). Για
τον σκοπό αυτό, θα γίνει χρήση των εντολών AIC και BIC (και τα δύο προσφέρονται μέσω του
πακέτου [stats]) πάνω στα μοντέλα slm.1 και slm.2.
Τιμές AIC και BIC των δύο υπό εξέταση μοντέλων
AIC(slm.1, slm.2)
BIC(slm.1, slm.2)
Από τον Πίνακα 5.1 παρατηρούμε ότι το δεύτερο μοντέλο εμφανίζει τιμές, τόσο για το AIC όσο
και για το BIC, ελαφρώς χαμηλότερες από αυτές του πρώτου.
Πίνακας 5.1: Τιμές AIC και BIC μοντέλων slm.1 και slm.2
Μοντέλο
AIC
BIC
slm.1
37.557
42.676
slm.2
36.932
42.052
Βάσει των παραπάνω, το επιλεγόμενο μοντέλο, τόσο σε όρους AIC όσο και σε όρους BIC, είναι
εκείνο που θεωρεί ως ανεξάρτητη μεταβλητή τη μέση μηνιαία θερμοκρασία (slm.2).
ΒΙΒΛΙΟΓΡΑΦΙΑ
[1] Καλαματιανού, Α.Γ. (1997). Εφαρμοσμένη ανάλυση παλινδρόμησης. Αθήνα: Εκδόσεις Παπαζήσης.
[2] Καρώνη, Χ., & Οικονόμου, Π. (2017). Στατιστικά μοντέλα παλινδρόμησης: Με χρήση M initab και R
(2η έκδ.). Αθήνα: Συμεών.
[3] Κούτρας Μ.Β., & Ευαγγελάρας, Χ. (2010). Ανάλυση παλινδρόμησης, θεωρία και εφαρμογές. Αθήνα: Εκδόσεις Σταμούλη Α. Ε.
[4] Μπόρα-Σέντα, Ε., & Μωυσιάδης, Χ. (1990). Εφαρμοσμένη στατιστική, Θεσσαλονίκη: Εκδόσεις Ζήτη.
[5] Akaike, H. (1974). A new look at the statistical model identification. IEEE Transactions on Automatic
Control, 19, 716-723.
[6] Akaike, H. (1969). Fitting autoregressive models for prediction. Annals of the Institute of Statistical
Mathematics, 21, 243-247.
[7] Draper, R.D., & Smith, H. (1998). Applied regression analysis (3rd ed.). Wiley-Interscience.
[8] Field, A., Miles, J., & Field, Z. (2012). Discovering statistics using R (1st ed.). Sage Ltd.
[9] Konishi, S., & Kitagawa, G. (1996). Generalised information criteria in model selection. Biometrika,
83, 875-890.
[10] Mallows, C.L. (1964). Choosing variables in a linear regression: a graphical aid. Manhattan, Kansas:
Presented at the Central Regional Meeting of the Institute of Mathematical Statistics.
[11] Mantalos, P., Mattheou, K., & Karagrigoriou, A. (2010). Forecasting ARMA models: a comparative
study of information criteria focusing on MDIC. Journal of Statistical Computation and Simulation,
80(1), 61-73.
[12] Mattheou, K., Lee, S., & Karagrigoriou, A. (2009). A model selection criterion based on the BHHJ
measure of divergence. Journal of Statistical Planning and Inference, 139(2), 228-235.
[13] Sakamoto, Y., Ishiguro, M., & Kitagawa, G. (1986). Akaike information criterion statistics. Dordrecht:
D. Reidel.
[14] Schwarz, G.E. (1978). Estimating the dimension of a model. Annals of Statistics, 6(2), 461-464.
ΚΕΦΑΛΑΙΟ 6
ΕΙΔΙΚΑ ΘΕΜΑΤΑ ΠΑΛΙΝΔΡΟΜΗΣΗΣ
Σύνοψη
Το παρόν κεφάλαιο παρουσιάζει ειδικά θέματα στην ανάλυση παλινδρόμησης όπως την πολυσυγγραμμικότητα, την αξιοποίηση κατηγορικών μεταβλητών και τη συνεισφορά μεταβλητών σε
μοντέλα όπου προϋπάρχουν άλλες μεταβλητές.
Προαπαιτούμενη γνώση
Το κεφάλαιο προϋποθέτει τη γνώση και την κατανόηση των προηγουμένων κεφαλαίων.
Προσδοκώμενα μαθησιακά αποτελέσματα
Μετά τη μελέτη του παρόντος κεφαλαίου ο αναγνώστης αναμένεται να:
• κατανοεί το πρόβλημα της πολυσυγγραμμικότητας και τον αντίκτυπο που έχει στην ανάλυση
παλινδρόμησης,
• εφαρμόζει κατάλληλες μεθόδους για τη μερική τουλάχιστον αντιμετώπιση του φαινομένου της
πολυσυγγραμμικότητας,
• αξιολογεί τη συνεισφορά νέων συμμεταβλητών όταν αυτές υπεισέρχονται σε μοντέλα όπου προϋπάρχουν άλλες μεταβλητές,
• διαχειρίζεται και να αξιοποιεί κατηγορικές μεταβλητές με τη χρήση ψευδομεταβλητών.
Καραγρηγορίου, Α., & Καλλιγέρης, Ε. Ν. (�2023). «Γραμμικά Μοντέλα και Σχεδιασμός & Ανάλυση Πειραμάτων με Εφαρμογές
σε R και Minitab».
Αθήνα: Κάλλιπος, Ανοικτές Ακαδημαϊκές Εκδόσεις. http://dx.doi.org/10.57713/kallipos-70
Creative Commons Αναφορά Δημιουργού - Μη Εμπορική Χρήση - Παρόμοια Διανομή 4.0
112
ΕΙΔΙΚΑ ΘΕΜΑΤΑ ΠΑΛΙΝΔΡΟΜΗΣΗΣ
6.1 Έξτρα (ή διαδοχικά) αθροίσματα τετραγώνων
Ένα έξτρα (ή διαδοχικό) άθροισμα τετραγώνων μετρά τη μείωση (ή την αύξηση) του αθροίσματος τετραγωνικών σφαλμάτων SSE (αθροίσματος τετραγώνων λόγω παλινδρόμησης SSR) όταν μία επιπλέον μεταβλητή X υπεισέρχεται στο μοντέλο παλινδρόμησης. Τα έξτρα αθροίσματα τετραγώνων (extra (or sequential)
sum of squares) επιτρέπουν τη μελέτη ελέγχων αναφορικά με κάποιους μόνο από τους συντελεστές παλινδρόμησης. Για τις ανάγκες του κεφαλαίου αυτού, απαιτείται κάποια διαφοροποίηση στους συμβολισμούς των
αθροισμάτων τετραγώνων. Συγκεκριμένα, το άθροισμα τετραγώνων λόγω παλινδρόμησης ενός μοντέλου με
k ανεξάρτητες μεταβλητές X1 , ..., Xk , θα συμβολίζεται με SSR (X1 , ..., Xk ), ενώ το αντίστοιχο άθροισμα
τετραγωνικών σφαλμάτων με SSE (X1 , ..., Xk ). Για την καλύτερη κατανόηση των έξτρα αθροισμάτων τετραγώνων, ο ορισμός τους θα δοθεί μέσω του Παραδείγματος 6.1 το οποίο βασίζεται στα δεδομένα του Hubert
Woods και συνεργατών, όπως αυτά δημοσιεύτηκαν το 1932 στο περιοδικό Industrial and Engineering Chemistry [14, 7].
Παράδειγμα 6.1. Τα δεδομένα που δίνονται στον Πίνακα 6.1 αποτελούνται από τέσσερις ανεξάρτητες μεταβλητές X1 , X2 , X3 και X4 , και την εξαρτημένη μεταβλητή Y . Οι ανεξάρτητες μεταβλητές αντιπροσωπεύουν την
ποσότητα τεσσάρων χημικών ενώσεων (tricalcium aluminate, tricalcium silicate, tetracalcium alumino ferrite
και dicalcium silicate) που περιλαμβάνονται στη σύνθεση του τσιμέντου του Portland, ΗΠΑ, ενώ η εξαρτημένη
μεταβλητή αντιπροσωπεύει την αναπτυσσόμενη θερμότητα σε ένα γραμμάριο τσιμέντου.
Πίνακας 6.1: Τιμές 13 παρατηρήσεων (xi1 , xi2 , xi3 , xi4 , yi )
#
X1
X2
X3
X4
Y
1
7
26
6
60
78.5
8
1
31
22
44
72.5
2
1
29
15
52
74.3
9
2
54
18
22
93.1
3
11
56
8
20
104.3
10
21
47
4
26
115.9
4
11
31
8
47
87.6
11
1
40
23
34
83.8
5
7
52
6
33
95.9
12
11
66
9
12
113.3
6
11
55
9
22
109.2
13
10
68
8
12
109.4
7
3
71
17
6
102.7
Για την εξαρτημένη μεταβλητή προκύπτει ότι ȳ = 95.4 και SST O =
Πίνακας 6.2 δίνει τις τιμές των SSR και SSE που αφορούν τα μοντέλα:
Α. yi = β0 + β1 x1i + ϵi
Β. yi = β0 + β2 x2i + ϵi
Γ. yi = β0 + β1 x1i + β2 x2i + ϵi
Δ. yi = β0 + β1 x1i + β2 x2i + β3 x3i + ϵi
Ε. yi = β0 + β1 x1i + β2 x2i + β3 x3i + β4 x4i + ϵi
P13
i=1
(yi − ȳ)2 = 2705.12. Ο
ΓΡΑΜΜΙΚΑ ΜΟΝΤΕΛΑ ΚΑΙ ΣΧΕΔΙΑΣΜΟΣ & ΑΝΑΛΥΣΗ ΠΕΙΡΑΜΑΤΩΝ ΜΕ ΕΦΑΡΜΟΓΕΣ ΣΕ R ΚΑΙ MINITAB
113
Πίνακας 6.2: Τιμές SSR και SSE μοντέλων Α έως Ε
Μοντέλο
Ανεξάρτητες
Μεταβλητές
SSR
SSE
Α
X1
1446.11
1259.01
Β
X2
1801
904.12
Γ
X1 , X 2
2647.66
57.46
Δ
X1 , X 2 , X 3
2657.44
47.68
Ε
X1 , X 2 , X 3 , X 4
2657.77
47.35
Από τον Πίνακα 6.2 φαίνεται ότι SSR (X1 , X2 ) = 2647.66 και SSR (X1 ) = 1446.11. Η διαφορά των
δύο αυτών ποσοτήτων ονομάζεται έξτρα άθροισμα τετραγώνων:
SSR (X2 |X1 ) = SSR (X1 , X2 ) − SSR (X1 ) = SSE (X1 ) − SSE (X1 , X2 ) .
(6.1)
Με βάση τη σχέση (6.1) και τα αποτελέσματα του Πίνακα 6.2, SSR (X2 |X1 ) = 1201.55. Η μείωση που
παρατηρείται στο άθροισμα των τετραγωνικών σφαλμάτων ή αντίστοιχα η αύξηση του αθροίσματος τετραγώνων
λόγω παλινδρόμησης, οφείλεται στο γεγονός ότι η μεταβλητή X2 υπεισέρχεται στο μοντέλο στο οποίο ήδη υπάρχει
η μεταβλητή X1 . Ο συμβολισμός SSR (X2 |X1 ) αντανακλά αυτήν ακριβώς την επιπλέον (έξτρα) μείωση του
αθροίσματος των τετραγωνικών σφαλμάτων εξαιτίας της X2 , δεδομένου ότι η X1 υπάρχει ήδη στο μοντέλο.
Αξίζει να παρατηρηθεί ότι το έξτρα άθροισμα τετραγώνων SSR (X1 |X2 ) είναι μικρότερο από το SSR (X2 |X1 ).
Αυτό οφείλεται στο γεγονός ότι η X2 μπορεί να δικαιολογήσει από μόνη της ένα μεγαλύτερο ποσοστό της συνολικής διακύμανσης, από ότι η X1 .
Η εισδοχή μίας τρίτης μεταβλητής X3 στο μοντέλο όπου ήδη υπάρχουν οι μεταβλητές X1 και X2 , οδηγεί στο
ακόλουθο έξτρα άθροισμα τετραγώνων:
SSR (X3 |X1 , X2 ) = SSR (X1 , X2 , X3 ) − SSR (X1 , X2 ) .
(6.2)
Επίσης, είναι εφικτός ο προσδιορισμός έξτρα αθροισμάτων τετραγώνων, εξαιτίας της εισδοχής περισσότερων
της μίας, νέων ανεξάρτητων μεταβλητών. Για παράδειγμα, η εισδοχή των μεταβλητών X3 και X4 στο μοντέλο όπου ήδη υπάρχουν οι μεταβλητές X1 και X2 , οδηγεί σε αύξηση του αθροίσματος τετραγώνων λόγω
παλινδρόμησης ίση με:
SSR (X3 , X4 |X1 , X2 ) = SSR (X1 , X2 , X3 , X4 ) − SSR (X1 , X2 )
= SSE (X1 , X2 ) − SSE (X1 , X2 , X3 , X4 ) .
(6.3)
Από το παραπάνω παράδειγμα είναι φανερό ότι το άθροισμα τετραγώνων λόγω παλινδρόμησης μπορεί να
διασπαστεί σε επιμέρους αθροίσματα τετραγώνων που το καθένα αποτελεί ένα έξτρα άθροισμα τετραγώνων.
Το άθροισμα τετραγώνων λόγω παλινδρόμησης ενός μοντέλου με δύο ανεξάρτητες μεταβλητές X1 και X2 ,
μπορεί να διασπαστεί κατά δύο τρόπους:
SSR (X1 , X2 ) = SSR (X1 ) + SSR (X2 |X1 )
και
SSR (X1 , X2 ) = SSR (X2 ) + SSR (X1 |X2 ) .
114
ΕΙΔΙΚΑ ΘΕΜΑΤΑ ΠΑΛΙΝΔΡΟΜΗΣΗΣ
Γενικά, για ένα μοντέλο με k ανεξάρτητες μεταβλητές, η ποσότητα SSR (X1 , ..., Xk ) μπορεί να διασπαστεί
σε έξτρα αθροίσματα τετραγώνων κατά k! διαφορετικούς τρόπους.
Οι βαθμοί ελευθερίας, που αντιστοιχούν σε ένα έξτρα άθροισμα τετραγώνων, ισούνται με τον αριθμό των
ανεξάρτητων μεταβλητών στις οποίες οφείλεται αυτή η έξτρα μείωση στο άθροισμα των τετραγωνικών σφαλμάτων.
Παράδειγμα 6.2. Για τα δεδομένα του Παραδείγματος 6.1 ο Πίνακας ANOVA με διάσπαση του SSR είναι ο
ακόλουθος:
Πίνακας 6.3: Πίνακας ANOVA − Έξτρα αθροίσματα τετραγώνων
Πηγή
Μεταβλητότητας
Βαθμοί
Ελευθερίας
Άθροισμα
Τετραγώνων
Μέσο
Άθροισμα
Τετραγώνων
Παλινδρόμηση
X1
X2 |X1
X3 |X1 , X2
X4 |X1 , X2 , X3
4
1
1
1
1
SSR (X1 , X2 , X3 , X4 ) = 2657.77
SSR (X1 ) = 1446.11
SSR (X2 |X1 ) = 1201.78
SSR (X3 |X1 , X2 ) = 9.78
SSR (X4 |X1 , X2 , X3 ) = 0.33
664.44
1446.11
1201.55
9.78
0.33
Σφάλμα
8
SSE (X1 , X2 , X3 , X4 ) = 47.35
5.92
Ολική
12
SST O = 2705.12
−
Τα μέσα αθροίσματα τετραγώνων (MS) που αντιστοιχούν στα έξτρα αθροίσματα τετραγώνων ορίζονται με τον
συνήθη τρόπο. Για παράδειγμα, στον παραπάνω Πίνακα ANOVA:
M SR (X3 |X1 , X2 ) =
SSR (X3 |X1 , X2 )
= 9.78.
1
(6.4)
6.2 Έλεγχοι υποθέσεων
Θεώρημα 6.1. Έστω το γενικό γραμμικό μοντέλο παλινδρόμησης:
yi = β0 + β1 xi1 + β2 xi2 + ... + βp−1 xip−1 + ϵi ,
i = 1, ..., n,
(6.5)
Η ελεγχοσυνάρτηση για τον έλεγχο:
H0 :
β1 = β2 ... = βq = 0,
1≤q ≤p−1
vs
H1 :
Τουλάχιστον ένα από τα βi ,
i = 1, ..., q, διαφορετικό του 0,
(6.6)
δίνεται από τη σχέση:
F =
=
SSR (X1 , ..., Xq |Xq+1 , ..., Xp−1 ) /q
SSE (X1 , ..., Xp−1 ) /(n − p)
M SR (X1 , ..., Xq |Xq+1 , ..., Xp−1 )
.
M SE (X1 , ..., Xp−1 )
(6.7)
115
ΓΡΑΜΜΙΚΑ ΜΟΝΤΕΛΑ ΚΑΙ ΣΧΕΔΙΑΣΜΟΣ & ΑΝΑΛΥΣΗ ΠΕΙΡΑΜΑΤΩΝ ΜΕ ΕΦΑΡΜΟΓΕΣ ΣΕ R ΚΑΙ MINITAB
Απόδειξη Θεωρήματος 6.1. Έστω ότι p = 2 και q = 1. Στην περίπτωση αυτή, το μοντέλο (6.5) γίνεται:
yi = β0 + β1 xi + ϵi ,
i = 1, ..., n,
και η υπόθεση (6.6) μετατρέπεται σε:
H0 : β1 = 0
vs
H1 : β1 ̸= 0.
(6.8)
Για τον έλεγχο αυτό είναι γνωστό ότι η κατάλληλη ελεγχοσυνάρτηση είναι η:
F =
SSR/1
(SST O − SSE)/1
M SR
=
=
.
M SE
SSE/(n − 2)
SSE/(n − 2)
(6.9)
Είναι φανερό ότι η υπόθεση (6.8) είναι ισοδύναμη με την:
H0 : yi = β0 + ϵi
vs
H1 : yi = β0 + β1 xi + ϵi .
Για το μοντέλο της μηδενικής υπόθεσης, η εκτιμήτρια ελαχίστων τετραγώνων είναι ο ȳ (Κεφάλαιο 2, Άσκηση
7). Κατά συνέπεια, το άθροισμα τετραγωνικών σφαλμάτων του μοντέλου της H0 , που ονομάζεται περιορισμένο
μοντέλο (reduced model), είναι:
SSE (.) =
n X
i=1
yi − β̂0
2
=
n
X
(yi − ȳ)2 ≡ SST O,
i=1
όπου το SSE (.) δηλώνει ότι δεν υπάρχουν ανεξάρτητες μεταβλητές στο μοντέλο.
Από την άλλη πλευρά, το SSE του πλήρους μοντέλου (full model) της H1 είναι:
SSE (X1 ) ≡ SSE,
(6.10)
με αποτέλεσμα ο αριθμητής της (6.9) να γράφεται στη μορφή:
SST O − SSE
SSE (.) − SSE (X1 )
SSR
=
=
,
1
1
1
(6.11)
όπου οι βαθμοί ελευθερίας αντιπροσωπεύουν τον αριθμό των ανεξάρτητων μεταβλητών που περιλαμβάνονται στο
πλήρες μοντέλο, αλλά όχι στο περιορισμένο.
Λαμβάνοντας υπόψη τις σχέσεις (6.1), (6.10) και (6.11), η ελεγχοσυνάρτηση (6.9) παίρνει τη μορφή:
F =
M SR (X1 |.)
SSR (X1 |.) /1
=
,
SSE (X1 ) /(n − 2)
M SE (X1 )
(6.12)
από όπου φαίνεται ότι η ποσότητα SSR είναι το έξτρα άθροισμα τετραγώνων που αντιπροσωπεύει την αύξηση του
αθροίσματος τετραγώνων λόγω παλινδρόμησης, η οποία οφείλεται στην εισδοχή της επιπλέον μεταβλητής X1 στο
μοντέλο όπου δεν υπάρχει καμία ανεξάρτητη μεταβλητή.
Η γενίκευση του παραπάνω Θεωρήματος για το γενικό γραμμικό μοντέλο παλινδρόμησης, είναι αυτονόητη
και μπορεί να γίνει προς τρεις κατευθύνσεις:
Α Περίπτωση: Για τον έλεγχο του κατά πόσο ένας συγκεκριμένος συντελεστής παλινδρόμησης, έστω βk ,
ισούται με το μηδέν:
H0 : βk = 0 vs H1 : βk ̸= 0,
(6.13)
116
ΕΙΔΙΚΑ ΘΕΜΑΤΑ ΠΑΛΙΝΔΡΟΜΗΣΗΣ
με ελεγχοσυνάρτηση:
F =
=
SSR (Xk |X1 , ..., Xk−1 , ..., Xp−1 ) /1
SSE (X1 , ..., Xp−1 ) /(n − p)
M SR (Xk |X1 , ..., Xk−1 , ..., Xp−1 )
.
M SE (X1 , ..., Xp−1 )
(6.14)
Β Περίπτωση: Για τον έλεγχο του κατά πόσο οι συντελεστές παλινδρόμησης, από τον βq , q > 1 και μετά,
ισούνται με το μηδέν:
H0 : βq = ... = βp−1 = 0
vs H1 :
Τουλάχιστον ένα από τα βi της H0
i = q, ..., p − 1, διαφορετικό του 0,
(6.15)
με ελεγχοσυνάρτηση:
F =
=
SSR (Xq , ..., Xp−1 |X1 , ..., Xq−1 ) / (p − q)
SSE (X1 , ..., Xp−1 ) /(n − p)
M SR (Xq , ..., Xp−1 |X1 , ..., Xq−1 )
.
M SE (X1 , ..., Xp−1 )
(6.16)
Γ Περίπτωση: Για τον έλεγχο του κατά πόσο όλοι οι συντελεστές παλινδρόμησης ισούνται με το μηδέν (βλ.
σχέση (3.24)) :
H0 : β1 = ... = βp−1 = 0
vs H1 :
Τουλάχιστον ένα από ταβi ,
i = 1, ..., p − 1, διαφορετικό του 0,
(6.17)
με ελεγχοσυνάρτηση:
F =
=
SSR (X1 , ..., Xp−1 |.) / (p − 1)
SSE (X1 , ..., Xp−1 ) /(n − p)
M SR (X1 , ..., Xp−1 |.)
.
M SE (X1 , ..., Xp−1 )
(6.18)
Σημείωση: Για τον υπολογισμό έξτρα αθροισμάτων τετραγώνων της μορφής:
SSR (Xq , ..., Xr |X1 , ..., Xq−1 ), q < r ≤ p − 1, μπορεί να γίνει χρήση του τύπου:
SSR (Xq , ..., Xr |X1 , ..., Xq−1 ) =
r
X
SSR (Xj |X1 , ..., Xj−1 ) .
(6.19)
j=q
Παράδειγμα 6.3. Για τα δεδομένα του Παραδείγματος 6.1, και βάσει των αποτελεσμάτων του Παραδείγματος
6.2, να γίνει ο έλεγχος των ακόλουθων υποθέσεων, θεωρώντας ως μοντέλο το Ε (Πίνακας 6.2):
α) H0 : β4 = 0
vs
β) H0 : β3 = β4 = 0
H1 : β4 ̸= 0,
vs
H1 :
γ) H0 : β1 = β2 = β3 = β4 = 0
To πολύ ένα από τα βi ,
i = 3, 4, διαφορετικό του 0,
vs
H1 :
Τουλάχιστον ένα από τα βi ,
i = 1, ..., 4, διαφορετικό του 0.
ΓΡΑΜΜΙΚΑ ΜΟΝΤΕΛΑ ΚΑΙ ΣΧΕΔΙΑΣΜΟΣ & ΑΝΑΛΥΣΗ ΠΕΙΡΑΜΑΤΩΝ ΜΕ ΕΦΑΡΜΟΓΕΣ ΣΕ R ΚΑΙ MINITAB
117
Για τον έλεγχο (α), από τη σχέση (6.14), η κατάλληλη ελεγχοσυνάρτηση είναι η:
F =
SSR (X4 |X1 , X2 , X3 ) /1
SSE (X1 , ..., X4 ) /8
=
SSR (X1 , X2 , X3 , X4 ) − SSR (X1 , X2 , X3 )
M SE (X1 , ..., X4 )
=
2657.77 − 2657.44
= 0.0557.
5.92
Από τους F -πίνακες, προκύπτει F1,8;0.05 = 5.32 και άρα, η μηδενική υπόθεση δεν απορρίπτεται σε επίπεδο σημαντικότητας α = 5%.
Για τον έλεγχο (β), από τις σχέσεις (6.16) και (6.19), η κατάλληλη ελεγχοσυνάρτηση είναι η:
F =
SSR (X3 , X4 |X1 , X2 ) /(4 − 2)
SSE (X1 , ..., X4 ) /8
=
[SSR (X3 |X1 , X2 ) + SSR (X4 |X1 , X2 , X3 )] /2
M SE (X1 , ..., X4 )
=
(9.78 − 0.33) /2
= 0.854.
5.92
Από τους F -πίνακες, προκύπτει F2,8;0.05 = 4.46 και άρα, η μηδενική υπόθεση δεν απορρίπτεται σε επίπεδο σημαντικότητας α = 5%.
Για τον έλεγχο (γ), από τη σχέση (6.18) η κατάλληλη ελεγχοσυνάρτηση είναι η:
F =
SSR (X1 , X2 , X3 , X4 |.) /(5 − 1)
SSE (X1 , ..., X4 ) /8
=
SSR (X1 , X2 , X3 , X4 |.) /4
M SE (X1 , ..., X4 )
=
2657.77/4
= 112.23.
5.92
Από τους F -πίνακες, προκύπτει F4,8;0.05 = 3.84 και άρα, η μηδενική υπόθεση απορρίπτεται σε επίπεδο σημαντικότητα α = 5%.
6.3 Εκτιμητές σταθμισμένων ελαχίστων τετραγώνων
Όπως ειπώθηκε προηγουμένως, η περίπτωση της μη σταθερής διασποράς αναφέρεται με τον όρο ετεροσκεδαστικότητα. Όταν όλες οι υπόλοιπες συνθήκες της γραμμικής παλινδρόμησης ισχύουν, οι εκτιμήτριες που
προκύπτουν με τη μέθοδο των ελαχίστων τετραγώνων είναι μεν αμερόληπτες και συνεπείς, αλλά δεν έχουν
την ελάχιστη διασπορά. Η διακύμανση των εκτιμητριών είναι ιδιαίτερα μεγάλη, εξαιτίας του φαινομένου της
118
ΕΙΔΙΚΑ ΘΕΜΑΤΑ ΠΑΛΙΝΔΡΟΜΗΣΗΣ
ετεροσκεδαστικότητας. Για τον περιορισμό της διακύμανσης, χρησιμοποιείται μία εναλλακτική μέθοδος ελαχίστων τετραγώνων, με βάρη. Στόχος είναι η ελαχιστοποίηση της ποσότητας:
n
X
Qω =
ωi (yi − β0 − β1 xi )2 ,
(6.20)
i=1
όπου ωi είναι το βάρος της i-παρατήρησης. Συγκεκριμένα, αν σi2 η διασπορά της παρατήρησης i, το βάρος
ωi είναι ίσο με:
1
ωi = 2 ,
(6.21)
σi
ώστε οι παρατηρήσεις με μεγάλη διακύμανση να έχουν μικρότερο βάρος, ενώ εκείνες με μικρή διακύμανση να
έχουν μεγαλύτερο. Αν πάλι, η διακύμανση μεταβάλλεται με έναν συστηματικό τρόπο σε σχέση με τη μεταβλητή
X = xi , τότε δεν είναι (συνήθως) δύσκολο να προσδιοριστεί η σχέση αυτή. Αν για παράδειγμα, σi2 = x2i ,
τότε ωi = x12 . Οι εκτιμήτριες ελαχίστων τετραγώνων με βάρη για τους συντελεστές παλινδρόμησης, είναι οι
i
τιμές που ελαχιστοποιούν το κριτήριο Qω και δίνονται από τις σχέσεις:
Pn
β̂1 =
i=1
ωi xi yi −
Pn
2
i=1 ωi xi
Pn
i=1
ωi xi
Pn
Pn
i=1
−
Pn
2
ωx
( P
i=1 i i )
n
i=1
Pn
ωi yi
ω
i=1 i
και β̂0 =
i=1
Pn
ωi yi − β̂1
Pn
i=1 ωi
i=1
ωi xi
.
(6.22)
ωi
6.4 Πολυσυγγραμμικότητα
Στις περισσότερες εφαρμογές στη Διοικητική Επιστήμη, τα Οικονομικά και τις Κοινωνικοπολιτικές Επιστήμες, οι ανεξάρτητες μεταβλητές είναι συσχετισμένες είτε μεταξύ τους είτε με άλλες ανεξάρτητες μεταβλητές
που επιδρούν μεν στην εξαρτημένη μεταβλητή Y αλλά δεν περιλαμβάνονται στο μοντέλο παλινδρόμησης. Το
φαινόμενο της συσχέτισης μεταξύ των ανεξάρτητων μεταβλητών, αναφέρεται με τον όρο ενδοσυσχέτιση (intercorrelation) ή πολυσυγγραμμικότητα (multicollinearity), και συνήθως παρεμποδίζει τον μελετητή από
το να διερευνήσει διάφορα θέματα, όπως το πόσο στατιστικά σημαντική είναι η επίδραση μίας ανεξάρτητης
μεταβλητής σε σχέση με μία άλλη ή το κατά πόσο μία ανεξάρτητη μεταβλητή θα πρέπει να απομακρυνθεί από
ένα μοντέλο ως μη στατιστικά σημαντική. Είναι όμως γεγονός ότι οι εκτιμήτριες των συντελεστών παλινδρόμησης έχουν ιδιαίτερα μεγάλες διακυμάνσεις, με αποτέλεσμα ο μελετητής να οδηγείται σε όχι και τόσο ακριβή
συμπεράσματα αναφορικά με τις πραγματικές τιμές των συντελεστών παλινδρόμησης.
Για να διαπιστωθεί το μέγεθος της πολυσυγγραμμικότητας σε ένα σύνολο ανεξάρτητων μεταβλητών X1 , X2 , ..., Xp−1 ,
μπορεί να προσδιοριστεί ο πίνακας συσχέτισης (correlation matrix) των X:

rXX =
1
r12
..
.





r12
1
..
.
rp−11 rp−12

· · · r1p−1
· · · r2p−1 

.. 
...
,
. 
···
1
(6.23)
όπου rij είναι ο δειγματικός συντελεστής συσχέτισης με βάση τις n μετρήσεις των ανεξάρτητων μεταβλητών
Xi = (X1i = x1i , ..., Xni = xni ) και Xj = (X1j = x1j , ..., Xnj = xnj ), που δίνεται από τη σχέση (βλ.
σχέση (2.33) για τον συντελεστή μεταξύ X και Y ):
Pn
rij = qP
n
m=1
(xmi − x̄i ) (xmj − x̄j )
2
m=1 (Xmi − x̄i )
Pn
2
m=1 (xmj − x̄j )
.
(6.24)
Ο πίνακας συσχέτισης (6.23) είναι συμμετρικός, αφού rij = rji . Τιμές των rij κοντά στο μηδέν δηλώνουν
ότι οι μεταβλητές Xi και Xj είναι ασυσχέτιστες, ενώ κοντά στο 1 ή το −1 δηλώνουν ισχυρή συσχέτιση των
ΓΡΑΜΜΙΚΑ ΜΟΝΤΕΛΑ ΚΑΙ ΣΧΕΔΙΑΣΜΟΣ & ΑΝΑΛΥΣΗ ΠΕΙΡΑΜΑΤΩΝ ΜΕ ΕΦΑΡΜΟΓΕΣ ΣΕ R ΚΑΙ MINITAB
119
αντίστοιχων μεταβλητών. Πρέπει να τονιστεί ότι ακόμα και αν ο πίνακας (6.23) είναι ίσος με τον ταυτοτικό,
δεν σημαίνει απαραίτητα ότι δεν υφίσταται το φαινόμενο της πολυσυγγραμμικότητας, αφού κάποιες ανεξάρτητες μεταβλητές μπορεί να σχετίζονται όχι με μία, αλλά με ομάδες άλλων ανεξάρτητων μεταβλητών.
Θα πρέπει να τονιστεί ότι το πρόβλημα της πολυσυγγραμμικότητας δεν είναι δυνατόν να εξαλειφθεί πλήρως. Παρόλα αυτά, υπάρχουν διάφορες τεχνικές οι οποίες μπορούν να το περιορίσουν σε έναν ικανοποιητικό
βαθμό. Ανάμεσα σε αυτές βρίσκεται η ανάλυση κυρίων συνιστωσών (principal components analysis)[11],
όπου οι ανεξάρτητες μεταβλητές X1 , ..., Xp−1 μετασχηματίζονται σε νέες, έστω Z1 , ..., Zp−1 , οι οποίες είναι
μεταξύ τους ασυσχέτιστες και ορθογώνιες ανά δύο.
Μία ακόμα ευρέως χρησιμοποιούμενη τεχνική αντιμετώπισης της πολυσυγγραμμικότητας, είναι εκείνη της
ραχοειδούς παλινδρόμησης (ridge regression) [8]. Στην εν λόγω μέθοδο, στον ΕΕΤ β̂∼ , του β∼ , ο πίνακας
(X′ X)−1 αντικαθίσταται από τον πίνακα [(X′ X) + λIp ]−1 , με αποτέλεσμα οι εκτιμήσεις των συντελεστών
παλινδρόμησης β∼ να δίνονται από τη σχέση:
β̂∼
ridge
= [(X′ X) + λIp ]
−1
X′ y.
Το λ αποτελεί ρυθμιστική παράμετρο και επιλέγεται με τέτοιο τρόπο ώστε αφενός μεν το μέσο τετραγωνικό
σφάλμα των εκτιμητών β̂∼
να είναι μικρότερο από αυτό των β̂∼ , αφετέρου δε, ο βαθμός συσχέτισης μεταξύ
ridge
των ανεξάρτητων μεταβλητών Xi να είναι ο μικρότερος δυνατός. Για περισσότερες πληροφορίες ο αναγνώστης παραπέμπεται στις εργασίες [9] και [10].
6.5 Συντελεστής διόγκωσης της διακύμανσης (VIF)
Ανά τα χρόνια, έχει προταθεί μία πληθώρα τεχνικών για την ποσοτικοποίηση του βαθμού πολυσυγγραμμικότητας που συνοδεύει τις ανεξάρτητες μεταβλητές του υπό εξέταση μοντέλου [10, 13]. Ανάμεσά τους, ο
Συντελεστής Διόγκωσης της Διακύμανσης (VIF-Variance Inflation Factor), ο οποίος αποτελεί την πλέον
χρησιμοποιούμενη τεχνική και ορίζεται ως:
V IFj =
1
,
1 − Rj2
V IFj ≥ 1,
j = 1, ..., p − 1.
(6.25)
Για τον υπολογισμό του V IFj ακολουθούμε την εξής διαδικασία:
Βήμα 1: Επιλέγουμε την j-ανεξάρτητη μεταβλητή, έστω Xj , για την οποία θέλουμε να υπολογίσουμε
τον δείκτη V IFj και την αφαιρούμε από το υπό εξέταση μοντέλο.
Βήμα 2: Υπολογίζουμε το R2 = Rj2 του μοντέλου, το οποίο θεωρεί ως εξαρτημένη μεταβλητή την
Xj και ως ανεξάρτητες μεταβλητές τις υπόλοιπες Xi,i̸=j , i = 1, ..., n.
Βήμα 3: Υπολογίζουμε τη σχέση (6.25) και:
- Αν V IFj ≥ c, τότε η υπό εξέταση Xj μπορεί να δημιουργεί πρόβλημα πολυσυγγραμμικότητας.
- Αν V IFj < c, τότε η υπό εξέταση Xj δεν φαίνεται να δημιουργεί πρόβλημα πολυσυγγραμμικότητας.
Όσον αφορά την τιμή του c, αυτή συνήθως είναι μία εκ των 4, 5 ή 10, με την τελευταία να αποτελεί τη συνηθέστερη επιλογή. Είναι προφανές ότι όσο μικρότερη η τιμή του c τόσο πιο αυστηροί
είμαστε απέναντι στο εάν η j-ανεξάρτητη μεταβλητή μπορεί να δημιουργεί πρόβλημα πολυσυγγραμμικότητας.
120
ΕΙΔΙΚΑ ΘΕΜΑΤΑ ΠΑΛΙΝΔΡΟΜΗΣΗΣ
Μια ενδιαφέρουσα πληροφορία για το V IFj είναι ότι η προέλευσή του παραμένει...άγνωστη! Για περισσότερες πληροφορίες, ο ενδιαφερόμενος αναγνώστης παραπέμπεται στη βιβλιογραφική αναφορά [12].
6.6 Ψευδομεταβλητές
Στο γενικό γραμμικό μοντέλο (3.4), ενώ η εξαρτημένη μεταβλητή Y είναι απαραίτητο να λαμβάνει τιμές στο
R, δεν ισχύει το ίδιο και για τις ανεξάρτητες μεταβλητές Xi . Πολλές φορές, μπορεί μία (ή περισσότερες) από
τις Xi να είναι κατηγορικής (categorical) φύσεως (φύλο, θρήσκευμα, οικογενειακή κατάσταση, κλπ.). Σε τέτοιες περιπτώσεις για να μπορέσει να ελεγχθεί αν υπάρχουν ουσιαστικές (στατιστικά σημαντικές) διαφορές
ανάμεσα στις κατηγορίες των κατηγορικών μεταβλητών, απαιτείται η δημιουργία των λεγόμενων ψευδομεταβλητών (dummy variables). Από τις διάφορες οικογένειες ψευδομεταβλητών, θα αναλύσουμε αυτή των
δείκτριων μεταβλητών (indicator variables).
Έστω Ψ μία κατηγορική μεταβλητή με κατηγορίες. Οι δείκτριες μεταβλητές ορίζονται ως:
Ψd =

1,
εάν Ψ = d
,
0,
αλλιώς
d = 1, ..., I.
(6.26)
Βάσει της σχέσης (6.26), αν η xi λάβει την τιμή 1, τότε η παρατήρηση ανήκει στην d κατηγορία, ενώ αν λάP
βει την τιμή 0 δεν ανήκει στην d ομάδα. Είναι προφανές ότι Id=1 ψd = 1, γεγονός που καθιστά αδύνατη
την εισαγωγή και των I δείκτριων μεταβλητών στο εκάστοτε μοντέλο παλινδρόμησης, παρά μόνο των I − 1.
Αυτό συμβαίνει γιατί αν κανείς συμπεριλάβει και τις I-δείκτριες μεταβλητές μέσα στο μοντέλο, τότε θα βρεθεί αντιμέτωπος με το πρόβλημα της πολυσυγγραμμικότητας. Συγκεκριμένα, θα προκύψει det (X′ X′ ) = 0
που σημαίνει ότι ο πίνακας (X′ X) είναι ιδιάζων (μη αντιστρέψιμος) και άρα δεν είναι δυνατή η εύρεση των
ΕΕΤ, οι οποίοι, σύμφωνα με τη σχέση (3.19), απαιτούν τη χρήση του πίνακα (X′ X′ )−1 .
Έστω το απλό γραμμικό μοντέλο:
yi = β0 + β1 xi + γ1 ψd + ϵi ,
i = 1, ..., n.
(6.27)
Αν ψd = 1, τότε:
yi = (β0 + γ1 ) + β1 xi + ϵi ,
(6.28)
yi = β0 + β1 xi + ϵi .
(6.29)
ενώ αν ψd = 0, τότε:
Όπως γίνεται αντιληπτό από τις σχέσεις (6.28) και (6.29), η ψευδομεταβλητή επηρεάζει μόνο τον σταθερό
όρο του μοντέλου.
Όσον αφορά την ερμηνεία του συντελεστή παλινδρόμησης γ1 της σχέσης (6.27), χρειάζεται ιδιαίτερη προσοχή, καθώς εκφράζει τη διαφορά στην τιμή της Y μεταξύ ενός υποκειμένου που ανήκει στην d κατηγορία και
ενός που δεν ανήκει στην d κατηγορία, όταν X = 0.
Παράδειγμα 6.4. Έστω ότι μία εταιρεία επιθυμεί τη διερεύνηση του κατά πόσο το ύψος του μισθού (σε €) ενός εργαζομένου επηρεάζεται από την ηλικία (X) και το φύλο (Ψ). Το μοντέλο που περιγράφει το παραπάνω πρόβλημα
είναι το:
yi = β0 + β1 xi + γ1 ψd + ϵi , i = 1, ..., n,
όπου:

1,
εάν ο εργαζόμενος είναι άνδρας,
Ψd = ψd = 
0, εάν ο εργαζόμενος είναι γυναίκα.
(6.30)
ΓΡΑΜΜΙΚΑ ΜΟΝΤΕΛΑ ΚΑΙ ΣΧΕΔΙΑΣΜΟΣ & ΑΝΑΛΥΣΗ ΠΕΙΡΑΜΑΤΩΝ ΜΕ ΕΦΑΡΜΟΓΕΣ ΣΕ R ΚΑΙ MINITAB
121
Το αντίστοιχο εκτιμώμενο μοντέλο δίνεται από τη σχέση:
ŷi = β̂0 + β̂1 xi + γ̂1 ψd ,
i = 1, ..., n.
Ερμηνεία συντελεστή β̂1 : Ο μέσος μισθός ενός εργαζομένου θα μεταβληθεί κατά β̂1 € αν η ηλικία αυξηθεί κατά ένα
έτος, κρατώντας τη μεταβλητή φύλο σταθερή.
Ερμηνεία συντελεστή γ̂1 : Η διαφορά του μέσου μισθού ενός εργαζομένου ανέρχεται στα γ̂1 €, ανάλογα με το αν
είναι άνδρας ή γυναίκα. Δηλαδή, ενώ ο μέσος μισθός ενός άνδρα ηλικίας ω ανέρχεται κατά μέσο όρο στα (β̂0 +
γ̂1 ) + β̂1 ω ευρώ, o μισθός μίας γυναίκας ίδιας ηλικίας ανέρχεται κατά μέσο όρο στα (β̂0 + β̂1 ω)€. Θα πρέπει να
σημειωθεί ότι αυτή η διαφορά της τάξης των γ̂1 € δεν είναι απαραίτητα υπέρ του άνδρα, καθώς αν γ̂1 < 0, τότε
μία γυναίκα ηλικίας ω θα έχει κατά μέσο όρο περισσότερες απολαβές από έναν άνδρα ίδιας ηλικίας.
Τέλος, είναι προφανές ότι εάν η σχέση (6.30) οριστεί ανάποδα, τότε οι τιμές των εκτιμητριών για τα β0 , β1 και γ1 ,
θα είναι διαφορετικές από τις β̂0 , β̂1 και γ̂1 .
6.7 Εφαρμογή στην R
1. Έστω τα δεδομένα του Πίνακα 6.1. Θεωρώντας το μοντέλο:
yi = β0 + β1 x1i + β2 x2i + β3 x3i + β4 x4i + ϵi ,
i = 1, ..., 13 :
i. Να υπολογιστούν οι πίνακες συσχέτισης και μερικής συσχέτισης.
ii. Να εφαρμοστεί ο έλεγχος: H0 : β3 = β4 = 0
vs
H1 :
Τουλάχιστον ένα από τα βi ,
,
i = 3, 4, διαφορετικό του 0,
σε επίπεδο σημαντικότητας α = 5%.
Ȫ
Λύση
Εισαγωγή δεδομένων & δημιουργία μεταβλητών
library(readxl)
data <‐ read_xlsx('ch6ex1.xlsx')
X1 <‐ data$X1
X2 <‐ data$X2
X3 <‐ data$X3
X4 <‐ data$X4
Y <‐ data$Y
i. Για την εύρεση του πίνακα συσχετίσεων μεταξύ των επεξηγηματικών μεταβλητών X1 , X2 , X3 , X4
και της εξαρτημένης μεταβλητής Y , θα γίνει χρήση της εντολής cor [stats]. Εκτός του συντελεστή γραμμικής συσχέτισης κατά Pearson, υπάρχουν και άλλες τεχνικές εύρεσης συσχέτισης,
όπως αυτές των Spearman και Kendall. Για τον λόγο αυτό, θα πρέπει να σιγουρευτούμε ότι στο
όρισμα method έχουμε εισάγει την τεχνική "pearson".
122
ΕΙΔΙΚΑ ΘΕΜΑΤΑ ΠΑΛΙΝΔΡΟΜΗΣΗΣ
Δημιουργία πίνακα γραμμικών συσχετίσεων κατά Pearson
cor.matrix <‐ cor(cbind(X1, X2, X3, X4, Y), method = "pearson")
cor.matrix
> cor.matrix
X1
X2
X3
X4
Y
X1 1.00000 0.22858 ‐0.824134 ‐0.245445 0.73072
X2 0.22858 1.00000 ‐0.139242 ‐0.972955 0.81625
X3 ‐0.82413 ‐0.13924 1.000000 0.029537 ‐0.53467
X4 ‐0.24545 ‐0.97295 0.029537 1.000000 ‐0.82131
Y
0.73072 0.81625 ‐0.534671 ‐0.821305 1.00000
Όσον αφορά τις μερικές συσχετίσεις, αυτές θα εξαχθούν με εφαρμογή της εντολής pcor [ppcor]
πάνω στη μεταβλητή data (η οποία και περιέχει όλες τις μεταβλητές ενδιαφέροντος).
Δημιουργία πίνακα μερικών γραμμικών συσχετίσεων
library(ppcor)
partial.cor.matrix <‐ pcor(data)
partial.cor.matrix
> partial.cor.matrix
$estimate
X1
X2
X3
X4
Y
X1 1.00000 ‐0.88647 ‐0.821393 ‐0.726037 0.592933
X2 ‐0.88647 1.00000 ‐0.944294 ‐0.948480 0.241809
X3 ‐0.82139 ‐0.94429 1.000000 ‐0.958903 0.047686
X4 ‐0.72604 ‐0.94848 ‐0.958903 1.000000 ‐0.071648
Y
0.59293 0.24181 0.047686 ‐0.071648 1.000000
Θα πρέπει να σημειωθεί ότι σε αντίθεση με την εντολή cor, η pcor δίνει τη δυνατότητα εκτύπωσης και των p - values για τους σχετικούς ελέγχους στατιστικής σημαντικότητας για καθεμία
από τις μερικές συσχετίσεις.
ii. Στο ερώτημα αυτό, καλούμαστε να εξετάσουμε εάν οι συντελεστές παλινδρόμησης β3 και β4 αξίζει να συμπεριληφθούν μέσα στο μοντέλο. Λόγω του ότι η R δεν προσφέρει άμεσο τρόπο εφαρμογής του ελέγχου, θα πρέπει να κατασκευαστεί σχετικός κώδικας. Θέλουμε να υπολογίσουμε
την τιμή της ελεγχοσυνάρτησης:
F =
[SSR (X1 , X2 , X3 , X4 ) − SSR (X1 , X2 )] /2
.
M SE (X1 , X2 , X3 , X4 )
Για τον υπολογισμό της ποσότητας στον αριθμητή, χρειαζόμαστε:
• Την τιμή του SSR που αφορά το πλήρες (full) μοντέλο (SSR (X1 , X2 , X3 , X4 )), η
οποία θα εξαχθεί μέσω της εντολής anova.
• Την τιμή του SSR που αφορά το περιορισμένο (reduced) μοντέλο, δηλαδή το μοντέλο
κάτω από τη μηδενική υπόθεση (SSR (X1 , X2 )). Χρειαζόμαστε, λοιπόν, τα έξτρα αθροίσματα τετραγώνων τα οποία όμως δεν διατίθενται μέσω της εντολής anova. Αντ’ αυτού, θα
πρέπει να γίνει χρήση της εντολής Anova [car] πάνω στο πλήρες μοντέλο (multlm.full).
Όσο για τον παρονομαστή, αυτός θα υπολογιστεί μέσω της εντολής anova.
ΓΡΑΜΜΙΚΑ ΜΟΝΤΕΛΑ ΚΑΙ ΣΧΕΔΙΑΣΜΟΣ & ΑΝΑΛΥΣΗ ΠΕΙΡΑΜΑΤΩΝ ΜΕ ΕΦΑΡΜΟΓΕΣ ΣΕ R ΚΑΙ MINITAB
123
Δημιουργία πρώτου απλού γραμμικού μοντέλου & εξαγωγή συντελεστών
multlm.full <‐ lm(Y ~ X1 + X2 + X3 + X4)
SSR.full <‐ sum(anova(multlm.full)$`Sum Sq`[1:4]) #
SSR (X1 , X2 , X3 , X4 )
library(car)
seq.ANOVA <‐ Anova(multlm.full, type = "II") # Εύρεση έξτρα
αθροισμάτων τετραγώνων
seq.ANOVA
> seq.ANOVA
Anova Table (Type II tests)
Response: Y
Sum Sq Df F value Pr(>F)
X1
26.0 1
4.34 0.071
X2
3.0 1
0.50 0.501
X3
0.1 1
0.02 0.896
X4
0.2 1
0.04 0.844
Residuals
47.9 8
Η ποσότητα SSR (X1 , X2 ) θα προκύψει αθροίζοντας τα δύο πρώτα στοιχεία της στήλης ``Sum
Sq'' του παραπάνω πίνακα.
Δημιουργία πρώτου απλού γραμμικού μοντέλου & εξαγωγή συντελεστών
SSR.reduced <‐ sum(seq.ANOVA$`Sum Sq`[1:2]) # SSR (X1 , X2 )
MSE.full <‐ anova(multlm.full)$`Mean Sq`[5] # M SE (X1 , X2 , X3 , X4 )
F <‐ ((SSR.full ‐ SSR.reduced) / 2) / MSE.full
F
qf(.95, 2, 8)
> F
[1] 220.54
> qf(.95, 2, 8)
[1] 4.459
Αφού,
F = 220.54 > 4.459 = F2,8;0.05 ,
απορρίπτεται η μηδενική υπόθεση σε επίπεδο σημαντικότητας α = 5%, και άρα, οι συντελεστές
παλινδρόμησης β3 και β4 είναι στατιστικά σημαντικοί.
124
ΕΙΔΙΚΑ ΘΕΜΑΤΑ ΠΑΛΙΝΔΡΟΜΗΣΗΣ
6.8 Άλυτες ασκήσεις
1. Να δειχτεί ότι:
SSR (X1 , X2 , X3 , X4 ) = SSR (X1 ) + SSR (X2 , X3 |X1 ) + SSR (X4 |X1 , X2 , X3 ) .
2. Έστω ένα πολλαπλό μοντέλο παλινδρόμησης με 5 ανεξάρτητες μεταβλητές. Να δοθούν οι τύποι των
ελεγχοσυναρτήσεων για τους ακόλουθους ελέγχους:
i. β5 = 0 και
ii. β2 = β4 = 0.
3. Να δειχτεί ότι:
rY2 2.1 =
(rY 2 − r12 rY 1 )2
,
2
(1 − r12
) (1 − rY2 1 )
όπου rY i , i = 1, 2 ο συντελεστής συσχέτισης των Y και Xi .
4. Βάσει των δεδομένων του Πίνακα 3.6, να δοθεί ο πίνακας ANOVA με διάσπαση του SSR σε έξτρα
αθροίσματα τετραγώνων.
5. Έστω τα δεδομένα του Πίνακα 3.3:
i. Να δοθεί ο Πίνακας ANOVA με διάσπαση του SSR σε έξτρα αθροίσματα τετραγώνων.
ii. Αφού προσδιοριστεί η ποσότητα SSR (X1 |X2 ), να γίνει ο έλεγχος:
H0 : β1 = 0
vs
H1 : β1 ̸= 0,
με τη βοήθεια των έξτρα αθροισμάτων τετραγώνων (α = 5%).
6. Να δειχθεί ότι:
SSR (Xq , ..., Xr |X1 , ..., Xq−1 ) =
r
X
SSR (Xj |X1 , ..., Xj−1 ) ,
q < r ≤ p − 1.
j=q
7. Να επιβεβαιωθεί ότι οι τύποι της (6.22) αποτελούν τις τιμές που ελαχιστοποιούν το κριτήριο Qω και
να δοθούν οι κανονικές εξισώσεις.
8. Σε ένα ετεροσκεδαστικό μοντέλο ισχύει ότι σ 2 = kXi όπου k γνωστή σταθερά. Να χρησιμοποιηθεί
η μέθοδος ελαχίστων τετραγώνων με βάρη για τον προσδιορισμό των κανονικών εξισώσεων και των
τύπων β̂0 και β̂1 του γραμμικού μοντέλου παλινδρόμησης.
9. Έστω:
Pn
x̄ω =
ω i xi
n
i=1
Pn
και ȳω =
ωi yi
.
n
i=1
Να εκφραστεί το β̂1 , όπως αυτό δίνεται στη σχέση (6.22), ως συνάρτηση των αποκλίσεων xi − x̄ω
και yi − ȳω .
ΓΡΑΜΜΙΚΑ ΜΟΝΤΕΛΑ ΚΑΙ ΣΧΕΔΙΑΣΜΟΣ & ΑΝΑΛΥΣΗ ΠΕΙΡΑΜΑΤΩΝ ΜΕ ΕΦΑΡΜΟΓΕΣ ΣΕ R ΚΑΙ MINITAB
125
10. Έστω τα δεδομένα του Πίνακα 6.4:
Πίνακας 6.4: Τιμές 12 ζευγών παρατηρήσεων (xi , yi )
#
X
Y
1
16
77
2
14
70
3
22
85
4
10
350
5
14
62
6
17
70
7
10
52
8
13
63
9
19
88
10
12
57
11
18
81
12
11
54
Να βρεθούν τα β̂0 και β̂1 του γραμμικού μοντέλου με τη μέθοδο ελαχίστων τετραγώνων, με ωi = 1
και ωi = kx1 2 . Στη συνέχεια, να συγκριθούν οι διασπορές των εκτιμητριών στις δύο περιπτώσεις.
i
126
ΕΙΔΙΚΑ ΘΕΜΑΤΑ ΠΑΛΙΝΔΡΟΜΗΣΗΣ
ΒΙΒΛΙΟΓΡΑΦΙΑ
[1] Καλαματιανού, Α.Γ. (1997). Εφαρμοσμένη ανάλυση παλινδρόμησης. Αθήνα: Εκδόσεις Παπαζήσης.
[2] Καρώνη, Χ., & Οικονόμου, Π. (2017). Στατιστικά μοντέλα παλινδρόμησης: Με χρήση M initab και R
(2η έκδ.). Αθήνα: Συμεών.
[3] Κούτρας Μ. Β., & Ευαγγελάρας, Χ. (2010). Ανάλυση παλινδρόμησης, θεωρία και εφαρμογές. Αθήνα:
Εκδόσεις Σταμούλη Α. Ε.
[4] Μπόρα-Σέντα, Ε., & Μωυσιάδης, Χ. (1990). Εφαρμοσμένη στατιστική. Θεσσαλονίκη: Εκδόσεις Ζήτη.
[5] Draper, R. D., & Smith, H. (1998). Applied regression analysis (3rd ed.). Wiley-Interscience.
[6] Field, A., Miles, J., & Field, Z. (2012). Discovering statistics using R (1st ed.). Sage Ltd.
[7] Hald, A. (1952). Statistical theory with engineering applications. New York: Wiley.
[8] Hoerl, A.E., & Kennard, R.W. (1970). Ridge regression: biased estimation for nonorthogonal problems. Technometrics, 12(1), 55-67.
[9] Lindner, T., Puck, J., & Verbeke, A. (2020). Misconceptions about multicollinearity in international
business research: Identification, consequences, and remedies. Journal of International Business Studies, 51, 283-298.
[10] Ntotsis, K., Karagrigoriou, A., & Artemiou, A. (2021). Interdependency pattern recognition in
econometrics: A penalized regularizationa Antidote. Econometrics, 9, 44.
[11] Pearson, K.F.R.S. LIII. (1901). On lines and planes of closest fit to systems of points in space. The
London, Edinburgh, and Dublin Philosophical Magazine and Journal of Science, 2(11), 559-72.
[12] Snee, R. (1981). Who invented the variance inflation factor? Snee Associates.
[13] Theil, H. (1971). Principles of econometrics. New York: John Wiley & Sons.
[14] Woods, H., Steinour, H.H., & Starke, H.R. (1932). Effect of composition of portland cement on
heat evolved during hardening. Industrial Engineering and Chemistry, 24, 1207-1214.
128
ΒΙΒΛΙΟΓΡΑΦΙΑ
ΚΕΦΑΛΑΙΟ 7
ΑΝΑΛΥΣΗ ΔΙΑΚΥΜΑΝΣΗΣ ΚΑΤΑ ΕΝΑΝ ΠΑΡΑΓΟΝΤΑ
Σύνοψη
Το παρόν κεφάλαιο παρουσιάζει το βασικό πρότυπο διακύμανσης με έναν παράγοντα ενδιαφέροντος και μελετά τις επιδράσεις των επιπέδων του σε μία διεργασία ή μεταβλητή απόκρισης.
Προαπαιτούμενη γνώση
Το κεφάλαιο προϋποθέτει τη γνώση και την κατανόηση βασικών εννοιών στατιστικής συμπερασματολογίας, με έμφαση στους ελέγχους για τη σύγκριση των μέσων δύο κανονικών πληθυσμών.
Προσδοκώμενα μαθησιακά αποτελέσματα
Μετά τη μελέτη του παρόντος κεφαλαίου ο αναγνώστης αναμένεται να:
• αναγνωρίζει πειράματα με έναν παράγοντα ενδιαφέροντος και να χρησιμοποιεί τεχνικές σχεδιασμού πειραμάτων και ειδικότερα της μονοπαραγοντικής ανάλυσης διακύμανσης, προκειμένου
να εξετάζει την επίδραση των επιπέδων του, στη μεταβλητή απόκρισης,
• εντοπίζει το επίπεδο ή τα επίπεδα του παράγοντα ενδιαφέροντος που διαφέρουν σημαντικά από
τα υπόλοιπα, μέσω πολλαπλών συγκρίσεων,
• εξετάζει μέσω της ανάλυσης καταλοίπων, την ικανοποίηση ή μη των προϋποθέσεων για τη
χρήση και την εφαρμογή των σχετικών προτύπων,
• εφαρμόζει τη μονοπαραγοντική ανάλυση διακύμανσης με τη χρήση στατιστικών πακέτων.
Καραγρηγορίου, Α., & Καλλιγέρης, Ε. Ν. (�2023). «Γραμμικά Μοντέλα και Σχεδιασμός & Ανάλυση Πειραμάτων με Εφαρμογές
σε R και Minitab».
Αθήνα: Κάλλιπος, Ανοικτές Ακαδημαϊκές Εκδόσεις. http://dx.doi.org/10.57713/kallipos-70
Creative Commons Αναφορά Δημιουργού - Μη Εμπορική Χρήση - Παρόμοια Διανομή 4.0
130
ΑΝΑΛΥΣΗ ΔΙΑΚΥΜΑΝΣΗΣ ΚΑΤΑ ΕΝΑΝ ΠΑΡΑΓΟΝΤΑ
7.1 Εισαγωγή
Στα προηγούμενα Κεφάλαια τόσο η εξαρτημένη όσο και οι ανεξάρτητες μεταβλητές ήταν ποσοτικές. Στην
παρούσα ενότητα θα ασχοληθούμε με τυχαία πειράματα, όπου η μεν εξαρτημένη μεταβλητή είναι ποσοτική, οι
δε ανεξάρτητες μεταβλητές, που ενδεχομένως σχετίζονται και επηρεάζουν την εξαρτημένη μεταβλητή, είναι
ποιοτικές. Σημειώνεται ότι και οι ποσοτικές (συνεχείς) μεταβλητές μπορούν να αντιμετωπιστούν ως ποιοτικές
με κατάλληλη κατηγοριοποίηση. Παραδείγματα τέτοιων τυχαίων πειραμάτων συναντάμε συχνά σε διάφορους
κλάδους.
Παράδειγμα 7.1. Ένα από τα βασικά προβλήματα στον χώρο του Marketing είναι η αποτελεσματικότητα της
διαφήμισης και της τιμής ενός προϊόντος στις πωλήσεις που αντιπροσωπεύουν τη μεταβλητή απόκρισης Y . Οι δύο
μεταβλητές “τιμή” και “διαφήμιση” αποτελούν τους παράγοντες που απαιτείται να μελετηθούν είτε ξεχωριστά ο
καθένας είτε συνδυαστικά και οι δύο μαζί. Στην πρώτη περίπτωση, θα μπορούσε για παράδειγμα να εξεταστεί το
πρόβλημα π.χ. σε 3 διαφορετικά επίπεδα τιμών ενώ στη δεύτερη π.χ. σε 2 επίπεδα διαφήμισης (π.χ. 1 = διαφήμιση
στην τηλεόραση και 2 = διαφήμιση στο διαδίκτυο). Ο Ερευνητής θα μπορούσε να καταγράψει τις πωλήσεις σε
καθεμία από κάποιες περιοχές ή περιφέρειες είτε για τα 3 επίπεδα μόνο του πρώτου παράγοντα είτε για τα 2 επίπεδα μόνο του δεύτερου είτε για τους 6 συνδυασμούς που προκύπτουν από τα επίπεδα των δύο παραγόντων. Το
πρόβλημα μπορεί να γίνει ακόμα πιο πολύπλοκο αν μαζί με τους δύο παράγοντες κριθεί αναγκαία η διερεύνηση της
αλληλεπίδρασής τους στις πωλήσεις.
Παράδειγμα 7.2. Ένα από τα προβλήματα στον χώρο της Γεωργίας είναι η σύγκριση διαφόρων ποικιλιών κάποιου
είδους. Το πρόβλημα αντιμετωπίζεται με τον κατακερματισμό ενός τεμαχίου γης και την κατανομή των ποικιλιών
στα διάφορα τμήματα που προκύπτουν. Ανά ποικιλία και τμήμα γης (παράγοντες A και B) γίνεται η καταγραφή
της παραγωγής (μεταβλητή απόκρισης Y ) και εξάγονται τα συγκριτικά αποτελέσματα. Σημειώνεται ότι η παραγωγή ανά τμήμα και ποικιλία μπορεί να διαφέρει ακόμα και αν δεν παρατηρούνται διαφορές μεταξύ των ποικιλιών,
γιατί μπορεί να υπεισέρχονται στην παραγωγή και άλλοι παράγοντες που δεν έχουν περιληφθεί στη μελέτη, όπως
για παράδειγμα η εγγύτητα των τμημάτων γης σε νερό.
Παράδειγμα 7.3. Ένα από τα προβλήματα στον χώρο της Βιομηχανίας είναι η σύγκριση των προϊόντων που παράγουν διαφορετικές γραμμές παραγωγής ή/και διαφορετικοί χειριστές που αντιπροσωπεύουν δύο παράγοντες
ενδιαφέροντος A και B. Για τη μελέτη του προβλήματος θα μπορούσε ο Ερευνητής στο τέλος κάθε βάρδιας να επιλέξει ένα ή περισσότερα προϊόντα ανά γραμμή παραγωγής και να συγκρίνει την αξιοπιστία των προϊόντων ως προς
τις προβλεπόμενες προδιαγραφές (μεταβλητή απόκρισης Y ). Σημειώνεται ότι οι παρατηρήσεις ενδέχεται να διαφέρουν ακόμα και αν δεν διαφέρουν ως προς τις γραμμές παραγωγής, αφού θα μπορούσαν να παρεμβαίνουν άλλες
μεταβλητές που δεν έχουν περιληφθεί στη μελέτη. Τέτοιες μεταβλητές είναι συχνά οι κλιματολογικές (θερμοκρασία
και υγρασία), οι μηχανολογικές (συντήρηση και παλαιότητα μηχανών παραγωγής) κ.ά. Το πρόβλημα μπορεί να
γίνει πολυπλοκότερο αν εκτός από τις διαφορετικές γραμμές παραγωγής, ο Ερευνητής κρίνει ότι πρέπει να μελετηθούν και οι διαφορές στην παραγωγή που οφείλονται στους διαφορετικούς χειριστές ή ακόμα περισσότερο και
αυτές που οφείλονται στην αλληλεπίδραση μεταξύ γραμμών παραγωγής και χειριστών.
Και στα τρία προηγούμενα παραδείγματα ο Ερευνητής έχει στη διάθεσή του έναν αριθμό καταστάσεων ή
επιπέδων ή σταθμών (levels) για τουλάχιστον μία ανεξάρτητη μεταβλητή (παράγοντας, factor) που πρέπει
να μελετηθούν ως προς την επίδρασή τους στην εξαρτημένη μεταβλητή ή μεταβλητή απόκρισης (response,
yield) Y . Στόχος της μελέτης είναι η σύγκριση της απόδοσης των επιπέδων του ενός παράγοντα ή του συνδυασμού των επιπέδων των εμπλεκόμενων παραγόντων στη μεταβλητή απόκρισης Y, με βάση μία ή περισσότερες μετρήσεις ή παρατηρήσεις. Στους στόχους της μελέτης περιλαμβάνεται επίσης και η βελτίωση μιας
διεργασίας δοκιμάζοντας τιμές ελεγχόμενων μεταβλητών (παραγόντων) και βλέποντας την επίδρασή τους
στη μεταβλητή απόκρισης, με σκοπό τον εντοπισμό κατάλληλων τιμών που οδηγούν σε βελτιστοποίηση της
διεργασίας.
H τεχνική, η οποία χρησιμοποιείται για την ανάλυση τέτοιων πειραμάτων, είναι γνωστή με το όνομα Ανάλυση
ΓΡΑΜΜΙΚΑ ΜΟΝΤΕΛΑ ΚΑΙ ΣΧΕΔΙΑΣΜΟΣ & ΑΝΑΛΥΣΗ ΠΕΙΡΑΜΑΤΩΝ ΜΕ ΕΦΑΡΜΟΓΕΣ ΣΕ R ΚΑΙ MINITAB
131
Διακύμανσης (Analysis of Variance). Παρότι τέτοιου είδους προβλήματα είναι δυνατόν να αντιμετωπιστούν
με τις μεθόδους της πολλαπλής γραμμικής παλινδρόμησης με κατάλληλο πίνακα σχεδιασμού, συστήνεται η
χρήση της Ανάλυσης Διακύμανσης γιατί με τον τρόπο αυτό ερμηνεύεται καλύτερα η συνεισφορά του καθενός
από τους εμπλεκόμενους στο πείραμα παράγοντες.
Η περίπτωση της μελέτης των επιπέδων ενός μόνο παράγοντα ή του συνδυασμού των επιπέδων δύο παραγόντων, είναι στις περισσότερες περιπτώσεις εύκολο από πλευράς πειραματισμού να επιτευχθεί με την ανάλυση
διακύμανσης. Το πρόβλημα μπορεί όμως να γίνει ιδιαίτερα απαιτητικό ως προς τον πειραματισμό, αν είτε ο
αριθμός των επιπέδων είτε ο αριθμός των παραγόντων είναι αρκετά μεγάλος. Αν, για παράδειγμα, η μελέτη
αφορά 5 παράγοντες και ο καθένας έχει 2 διαφορετικά επίπεδα, τότε απαιτούνται 32 συνδυασμοί για την εκτέλεση του λεγόμενου Πλήρους Παραγοντικού Πειράματος, και αν για τον κάθε συνδυασμό επιθυμούμε 2 ή
3 επαναλήψεις, τότε ο Ερευνητής θα πρέπει να εκτελέσει 64 ή 96 πειράματα. Επιπρόσθετη πολυπλοκότητα
επιφέρει η διερεύνηση αλληλεπιδράσεων μεταξύ των εμπλεκόμενων παραγόντων. Τα προβλήματα αυτά αντιμετωπίζονται επιτυχώς με τη χρήση κατάλληλων πειραματικών σχεδιασμών που βασίζονται σε ένα κατάλληλα
επιλεγμένο υποσύνολο όλων των δυνατών συνδυασμών, περιορίζοντας πολύ και τον χρόνο και το κόστος του
πειράματος. Ιδιαίτερα χρήσιμες επιλογές, όταν δεν έχουμε πόρους για να εκτελέσουμε πλήρη παραγοντικά
πειράματα, αποτελούν τα Κλασματικά Παραγοντικά Πειράματα τα οποία βασίζονται στις μισές ή στο ένα
τέταρτο των συνδυασμών που θα απαιτούσε το Πλήρες Παραγοντικό Πείραμα.
Σημειώνεται ότι η ανάλυση διακύμανσης κατά έναν παράγοντα, η οποία αναφέρεται και ως Πλήρως Τυχαιοποιημένος Σχεδιασμός ή Πλήρως Τυχαιοποιημένο Σχέδιο (Completely Randomized Design), αποτελεί τη γενικευμένη μορφή της μεθόδου των ανεξάρτητων δειγμάτων για τη σύγκριση 2 πληθυσμών και ειδικότερα των
μέσων των 2 πληθυσμών. Στον σχεδιασμό αυτό εκτελούνται k μετρήσεις για καθένα από τα επίπεδα του υπό
εξέταση παράγοντα που πρόκειται να συγκριθούν.
Επίσης, αν η ανάλυση αφορά έναν παράγοντα και η μελέτη γίνεται σε ομάδες ή μεταβλητές πλαισίου (Blocks),
έχουμε τον Τυχαιοποιημένο Τμηματικό Σχεδιασμό ή Σχέδιο Τυχαιοποιημένων Πλήρων Ομάδων (Randomized
Block Design) ο οποίος αποτελεί τη γενίκευση για k πληθυσμούς, της δειγματοληψίας σε ζεύγη για τη
σύγκριση 2 πληθυσμών. Για το Παράδειγμα 7.3, η μελέτη θα μπορούσε να γίνει σε 3 διαφορετικά αντιδραστήρια που έχει διαθέσιμα η Βιομηχανία και μπορούν να παίξουν τον ρόλο των ομάδων, το ένα πεπαλαιωμένης
τεχνολογίας χωρίς να έχει συντηρηθεί τον τελευταίο χρόνο, το άλλο παλαιό μεν αλλά το οποίο έχει μόλις συντηρηθεί, ενώ το τρίτο είναι το νεώτερο, ως αντιδραστήριο τελευταίας τεχνολογίας.
7.2 Πλήρως Τυχαιοποιημένο Σχέδιο
Ο Πλήρως ή Απόλυτα Τυχαιοποιημένος Σχεδιασμός ή Πείραμα Πλήρους Τυχαιοποίησης (Completely Randomized Design) όπως αναφέρθηκε προηγουμένως, αποτελεί τη γενικευμένη μορφή της μεθόδου των ανεξάρτητων δειγμάτων για τη σύγκριση 2 πληθυσμών. Στην περίπτωση αυτή, ο Ερευνητής ενδιαφέρεται να μελετήσει τις διαφορές μεταξύ των k διαφορετικών επιπέδων μιας (συνήθως) ποιοτικής μεταβλητής (παράγοντας),
κάθε ένα από τα οποία μπορεί να θεωρηθεί, για σκοπούς στατιστικής ανάλυσης, ως ένας πληθυσμός ώστε
το πρόβλημα να μπορεί να θεωρηθεί ως πρόβλημα σύγκρισης μεταξύ k πληθυσμών, k ≥ 2. Η σύγκριση
βασίζεται αποκλειστικά στις μέσες τιμές των k πληθυσμών, δηλαδή στις μέσες τιμές που αντιστοιχούν στα
k διαφορετικά επίπεδα του εμπλεκόμενου παράγοντα. Με άλλα λόγια, το συγκεκριμένο πρόβλημα υποθέτει
(απαιτεί) ότι οι k πληθυσμοί είναι ίδιοι ως προς τα λοιπά χαρακτηριστικά τους (ίδια κατανομή, ίδια διασπορά
κλπ.) και έτσι το μόνο που μένει να διερευνηθεί είναι κατά πόσον έχουν και την ίδια μέση τιμή.
Στο σχέδιο αυτό επιλέγονται k ανεξάρτητα δείγματα, ένα από καθέναν από τους k πληθυσμούς που πρόκειται
να συγκριθούν. Αυτό είναι δυνατόν εφόσον οι πληθυσμοί είναι προκαθορισμένοι. Αν για παράδειγμα ζητείται
132
ΑΝΑΛΥΣΗ ΔΙΑΚΥΜΑΝΣΗΣ ΚΑΤΑ ΕΝΑΝ ΠΑΡΑΓΟΝΤΑ
να μελετηθεί (και να συγκριθεί) η κατανάλωση ρεύματος κατοικιών με βάση 4 πληθυσμούς που αντιστοιχούν σε κατασκευές με 4 διαφορετικά πάχη (με cm) μόνωσης τοιχίων, τότε για ένα τέτοιο πρόβλημα, πρέπει να επιλεχτεί τυχαία αριθμός κατοικιών που εμπίπτουν (εκ κατασκευής) σε καθεμία από τις 4 κατηγορίες
(πληθυσμούς).
Πέρα από την πιο πάνω περίπτωση, υπάρχει ακόμα μία όπου η ανάθεση κάθε πειραματικής μονάδας σε έναν
πληθυσμό γίνεται με τρόπο τυχαίο. Έστω για παράδειγμα ότι ζητείται να συγκριθεί:
1. η μέση ποσότητα αλάτων στο νερό όταν εφαρμόζονται 4 διαφορετικές τεχνικές προσδιορισμού σε n
δείγματα νερού όπου ο Ερευνητής έχει τη δυνατότητα να αναθέσει με τρόπο τυχαίο την τεχνική (από
τις 4 διαθέσιμες) που θα χρησιμοποιηθεί για κάθε μέτρηση ή
2. η επίδραση 4 διαφορετικών επιπέδων (σταθμών) θερμοκρασίας στο αποτέλεσμα μιας χημικής αντίδρασης, όταν το πείραμα επαναλαμβάνεται n = 24 φορές με 6 επαναλήψεις ανά θερμοκρασία με
την κάθε αντίδραση να εκτελείται επιλέγοντας κάθε φορά, τυχαία, μία από τις 4 διαθέσιμες θερμοκρασίες, ώστε να έχουμε k = 4 ανεξάρτητα δείγματα (ένα για κάθε θερμοκρασία) με το καθένα να έχει
ni = 6, i = 1, 2, 3, 4 μετρήσεις.
Γενικά, έστω ότι απαιτείται τυχαίο δείγμα μεγέθους n. Η διαδικασία εκτέλεσης του πειράματος είναι η εξής:
η θεραπεία 1 (πληθυσμός 1) εφαρμόζεται σε n1 δειγματικές μονάδες, η θεραπεία 2 (πληθυσμός 2) σε n2
μονάδες,..., η θεραπεία k (πληθυσμός k) σε nk μονάδες. Στον Απόλυτα Τυχαιοποιημένο Σχεδιασμό, οι n1
δειγματικές μονάδες επιλέγονται τυχαία από το συνολικό δείγμα, οι n2 δειγματικές μονάδες επιλέγονται τυχαία από τις εναπομείνασες n − n1 μονάδες και συνεχίζοντας με τον ίδιο τρόπο η θεραπεία k εφαρμόζεται
στις τελευταίες εναπομείνασες δειγματικές μονάδες n − (n1 + n2 + ... + nk−1 ) = nk . Η τελευταία αυτή
σχέση δίνει τη συνθήκη που συνδέει όλα τα δειγματικά μεγέθη:
n = n1 + n2 + ... + nk−1 + nk .
Η ίδια σχέση ισχύει και στην κλασική περίπτωση όπου οι πληθυσμοί είναι προκαθορισμένοι.
Είναι φανερό ότι αν k = 2, τότε ο ανωτέρω σχεδιασμός ταυτίζεται με τη μέθοδο δύο ανεξάρτητων δειγμάτων για τη σύγκριση δύο πληθυσμών A και B. Έστω ότι Yij = yij είναι η j παρατήρηση της θεραπείας
i, i = 1, 2, ..., k και j = 1, 2, ..., ni . Ο Πίνακας 7.1 παρουσιάζει τα δεδομένα, τις μέσες τιμές και τα αθροίσματα τετραγώνων των k πληθυσμών του Απόλυτα Τυχαιοποιημένου Σχεδιασμού.
Πίνακας 7.1: Πίνακας Δεδομένων - Πλήρως Τυχαιοποιημένο Σχέδιο
Θεραπεία - Πληθυσμός
Παρατηρήσεις
Μέσος
1
y11 , y12 , ..., y1n1
ȳ1
2
..
.
y21 , y22 , ..., y2n2
..
.
ȳ2
..
.
k
yk1 , yk2 , ..., yknk
ȳk
Άθροισμα Τετραγώνων
Pn1
j=1
Pn2
j=1
Pnk
j=1
(y1j − ȳ1 )2
(y2j − ȳ2 )2
..
.
(y1j − ȳk )2
Ο δειγματικός ολικός μέσος δίνεται από τον τύπο:
Pk
ȳ.. =
Pni
j=1
i=1
n
yij
Pk
=
ni ȳi.
,
n
i=1
(7.1)
ΓΡΑΜΜΙΚΑ ΜΟΝΤΕΛΑ ΚΑΙ ΣΧΕΔΙΑΣΜΟΣ & ΑΝΑΛΥΣΗ ΠΕΙΡΑΜΑΤΩΝ ΜΕ ΕΦΑΡΜΟΓΕΣ ΣΕ R ΚΑΙ MINITAB
όπου:
Pni
ȳi. =
j=1
133
yij
.
(7.2)
ni
Ο ολικός μέσος ȳ.. αντιπροσωπεύει τον δειγματικό μέσο όλων των παρατηρήσεων ανεξάρτητα από τον πληθυσμό στον οποίο ανήκουν.
Η προφανής ταυτότητα:
συνεπάγεται ότι:
yij = ȳ.. + (ȳi. − ȳ.. ) + (yij − ȳi. ) ,
yij − ȳ.. = (ȳi. − ȳ.. ) + (yij − ȳi. ) .
(7.3)
H πιο πάνω σχέση δείχνει ότι η απόκλιση της κάθε παρατήρησης yij από τον ολικό μέσο ȳ.. οφείλεται εν μέρει
στην απόκλιση του μέσου ȳi του πληθυσμού i από τον ολικό μέσο ȳ.. και εν μέρει στην απόκλιση της ίδιας της
παρατήρησης yij από τον μέσο του πληθυσμού από τον οποίο προέρχεται αυτή η παρατήρηση.
Τετραγωνίζοντας και τα δύο μέρη της σχέσης (7.3) και αθροίζοντας ως προς i και j, έχουμε:
ni
k X
X
i=1 j=1
(yij − ȳ.. )2 =
k
X
ni (ȳi. − ȳ.. )2 +
i=1
ni
k X
X
(yij − ȳi. )2 ,
(7.4)
i=1 j=1
όπου το διπλάσιο γινόμενο ισούται, όπως εύκολα μπορεί να δειχθεί, με το μηδέν.
Ορισμός 7.1. Για τον Απόλυτα Τυχαιοποιημένο Σχεδιασμό ορίζουμε τις εξής ποσότητες:
SST O =
ni
k X
X
(yij − ȳ.. )2
i=1 j=1
SST =
ni
k X
X
(yij − ȳi. )2
i=1 j=1
SSE =
k
X
ni (ȳi. − ȳ.. )2
i=1
όπου:
• SST O: ολική (total) μεταβλητότητα ή ολικό άθροισμα τετραγώνων,
• SST : μεταβλητότητα που οφείλεται (δηλαδή που μπορεί να δικαιολογηθεί) στις διαφορές μεταξύ των πληθυσμών/θεραπειών ή άθροισμα τετραγώνων των θεραπειών (treatments, T) και
• SSE: μεταβλητότητα που δεν μπορεί να δικαιολογηθεί από τις διαφορές των πληθυσμών, και άρα ως μη
εξηγήσιμη, οφείλεται στα σφάλματα (errors) και αναφέρεται ως άθροισμα τετραγώνων των σφαλμάτων ή
τετραγωνικών σφαλμάτων.
Χρησιμοποιώντας τον Ορισμό 7.1 η (7.4) μπορεί να γραφεί ως εξής:
SST O = SST + SSE.
Ορισμός 7.2.
1. Οι β.ε. του SST O είναι:
k
X
i=1
ni − 1 = n − 1
134
ΑΝΑΛΥΣΗ ΔΙΑΚΥΜΑΝΣΗΣ ΚΑΤΑ ΕΝΑΝ ΠΑΡΑΓΟΝΤΑ
2. Οι β.ε. του SST είναι:
k−1
3. Οι β.ε. του SSE είναι:
k
X
ni − k = n − k
i=1
Οι παραπάνω β.ε. συνδέονται με τη σχέση:
β.ε. SST O = β.ε. SST + β.ε. SSE ⇒
n − 1 = (n − k) + (k − 1)
Ορισμός 7.3.
1. Το μέσο άθροισμα τετραγώνων των θεραπειών είναι:
M ST =
SST
.
k−1
2. Το μέσο άθροισμα τετραγώνων των σφαλμάτων είναι:
M SE =
SSE
.
n−k
Ο συνοπτικός Πίνακας της Ανάλυσης Διακύμανσης (ANOVA) δίνεται παρακάτω:
Πίνακας 7.2: Πίνακας ANOVA
Μέσο
Πηγή
Μεταβλητότητας
Βαθμοί
Ελευθερίας
Άθροισμα
Τετραγώνων
Θεραπείες - Πληθυσμοί
k−1
SST
M ST =
SST
k−1
Σφάλμα
n−k
SSE
M SE =
SSE
n−k
Ολική
n−1
SST O
Άθροισμα
Τετραγώνων
−
7.3 Γραφική ανάλυση μέσων
Πριν προχωρήσουμε στη στατιστική ανάλυση με βάση τον Πίνακα Ανάλυσης Διασποράς, μπορούμε με γραφικό τρόπο να έχουμε μια πρώτη οπτική εικόνα, όσον αφορά τη σύγκριση των μέσων των k πληθυσμών. Δύο
πολύ απλές γραφικές παραστάσεις είναι το διάγραμμα κουκκίδων και το θηκόγραμμα. Το διάγραμμα κουκκίδων είναι ένα X - Y επίπεδο, με τον άξονα των X να αντιστοιχεί στα επίπεδα του παράγοντα (δηλαδή στους
πληθυσμούς) και με τον άξονα των Y να αντιστοιχεί στις τιμές της μεταβλητής απόκρισης (ανά πληθυσμό).
Το διάγραμμα επιτρέπει στον Ερευνητή να έχει μια πρώτη αρκετά σαφή εικόνα για το αν οι μέσοι φαίνεται να
είναι ίσοι ή όχι. Το κλασικό θηκόγραμμα της Περιγραφικής Στατιστικής αποτυπώνει μια παρεμφερή εικόνα
με αυτή του διαγράμματος κουκκίδων.
ΓΡΑΜΜΙΚΑ ΜΟΝΤΕΛΑ ΚΑΙ ΣΧΕΔΙΑΣΜΟΣ & ΑΝΑΛΥΣΗ ΠΕΙΡΑΜΑΤΩΝ ΜΕ ΕΦΑΡΜΟΓΕΣ ΣΕ R ΚΑΙ MINITAB
135
Παράδειγμα 7.4. Έστω 4 γραμμές παραγωγής για τις οποίες χρειάζεται να ερευνηθεί κατά πόσον παράγουν στην
τιμή στόχο (βάρος σε gr) που έχει τεθεί για τα παραγόμενα προϊόντα. Τυχαίο δείγμα 6 προϊόντων επιλέγεται από
κάθε γραμμή παραγωγής και κάθε προϊόν ζυγίζεται. Τα δεδομένα φαίνονται στον Πίνακα 7.3.
Πίνακας 7.3: Παράδειγμα Σύγκρισης 4 γραμμών παραγωγής - Βασική Γραφική Ανάλυση Μέσων
Α
Β
Γ
Δ
2
1
5
2
1
3
4
3
3
2
4
5
1
3
4
5
1
4
3
4
2
4
2
5
Σχήμα 7.1: ANOVA Πρότυπο - Αντοχή
Το γράφημα των κουκκίδων αποτυπώνει ανάγλυφα την όποια σχέση των δειγμάτων και κατ’ επέκταση των
αντίστοιχων πληθυσμών, όσον αφορά τη σύγκριση των μέσων τιμών που έχουμε επιλέξει να καταγραφούν
(συνδεδεμένοι με μια καμπύλη) με τις τιμές (μετρήσεις) που έχουν παρατηρηθεί. Η εικόνα αυτή, αν και σε
κάποιο βαθμό είναι ασαφής, προϊδεάζει τον Ερευνητή για το εάν η όποια διαφορά που αποτυπώνεται στο γράφημα θα μπορούσε να είναι στατιστικώς σημαντική ή όχι.
Η γραφική ανάλυση είναι δυνατόν να εμπλουτιστεί με την Ανάλυση των Μέσων, η οποία αν και δεν δίνει τον
βαθμό της στατιστικής σημαντικότητας για τη σύγκριση των μέσων, δίνει το λεγόμενο Διάγραμμα Ανάλυσης
Μέσων (Analysis of Means Diagram), όπου (δηλαδή μεταξύ ποιων πληθυσμών) εντοπίζεται η όποια διαφορά μεταξύ των μέσων. Η μέθοδος βασίζεται στον υπολογισμό των δειγματικών μέσων των υπό εξέταση
επιπέδων του παράγοντα ενδιαφέροντος και τη σύγκρισή τους σε σχέση με τον δειγματικό μέσο όλων των
παρατηρήσεων ανεξαρτήτως επιπέδου (πληθυσμού), καθώς και των δειγματικών τυπικών αποκλίσεων ανά
επίπεδο. Έστω:
136
ΑΝΑΛΥΣΗ ΔΙΑΚΥΜΑΝΣΗΣ ΚΑΤΑ ΕΝΑΝ ΠΑΡΑΓΟΝΤΑ
• ένας παράγοντας k επιπέδων/σταθμών,
• ȳ.. ο δειγματικός (ολικός) μέσος όλων των μετρήσεων ανεξαρτήτως επιπέδου,
• ȳi. ο δειγματικός μέσος των μετρήσεων του επιπέδου i,
• s2i η δειγματική διασπορά των μετρήσεων του επιπέδου i,
• s2p ο μέσος όρος των s2i , i = 1, ..., k: s2p = k −1
Pk
i=1
s2i .
Το διάγραμμα ανάλυσης μέσων αποτελείται από μία κεντρική γραμμή (Central Line, CL) και 2 όρια απόφασης, το άνω όριο απόφασης (upper decision limit, UDL) και το κάτω όριο απόφασης (lower decision limit,
LDL), τα οποία ορίζονται ως εξής:
• CL = ȳ..
q
• U DL = ȳ.. + hk,k(n−1);α
• LDL = ȳ.. − hk,k(n−1);α
q
k−1
nk
k−1
nk
όπου hk,k(n−1);α αντιπροσωπεύει το 100(1 − α)% ποσοστημόριο της στατιστικής συνάρτησης h που έχει
πινακοποιηθεί από τον Nelson ([24]) και η οποία δίνεται από τον τύπο:
h=
maxi |ȳi. − ȳ.. |
q
sp
k−1
nk
.
Το διάγραμμα ανάλυσης μέσων για το προηγούμενο παράδειγμα δίνεται από το παρακάτω Σχήμα (για α =
5%):
Σχήμα 7.2: ANOVA Πρότυπο - Αντοχή
7.4 Μονοπαραγοντική ανάλυση διακύμανσης
Οι δύο βασικές υποθέσεις στον Απόλυτα Τυχαιοποιημένο Σχεδιασμό είναι:
137
ΓΡΑΜΜΙΚΑ ΜΟΝΤΕΛΑ ΚΑΙ ΣΧΕΔΙΑΣΜΟΣ & ΑΝΑΛΥΣΗ ΠΕΙΡΑΜΑΤΩΝ ΜΕ ΕΦΑΡΜΟΓΕΣ ΣΕ R ΚΑΙ MINITAB
1. Οι παρατηρήσεις που προέρχονται από τον πληθυσμό (θεραπεία) i αποτελούν τυχαίο δείγμα από μία
κανονική κατανομή με μέσο µi και κοινή διασπορά σ 2 , δηλαδή N (µi , σ 2 ) , i = 1, 2, ..., k. Εναλλακτικά, μπορούμε να θεωρήσουμε έναν παράγοντα A με k επίπεδα.
2. Τα δείγματα είναι ανεξάρτητα.
Βάσει των ανωτέρω υποθέσεων, το μοντέλο για τη σύγκριση k πληθυσμών/θεραπειών είναι:
yij = µi + ϵij
= µ + αi + ϵij ,
i = 1, ..., k,
j = 1, ..., ni ,
(7.5)
i.i.d.
όπου µ ο ολικός μέσος, µi ο μέσος του i πληθυσμού, αi η επίδραση του i επιπέδου του παράγοντα και ϵij ∼
N (0, σ 2 ). Από τον τύπο του προτύπου είναι προφανές ότι:
αi + µ = µi ⇔ αi = µi − µ.
Η εναλλακτική γραφή του προτύπου με τη βοήθεια των παραμέτρων (επιδράσεων) αi , επιτρέπει να γίνουν
ευκολότερα κατανοητές και να περιγραφούν αποτελεσματικότερα οι επιδράσεις στις περιπτώσεις προτύπων
σταθερών και τυχαίων επιδράσεων.
7.4.1 Πρότυπο σταθερών επιδράσεων
Στην περίπτωση των σταθερών επιδράσεων, οι παράμετροι α1 , ..., αk είναι καθορισμένοι πραγματικοί αριθP
μοί, έτσι ώστε j nj αj = 0 είναι μια προϋπόθεση που επιτρέπει να υπολογίζονται μονοσήμαντα οι τιμές των
µ, α1 , ..., αk . Στην περίπτωση αυτή, και με βάση τα δεδομένα του προτύπου, ισχύει ότι:
E (Yij ) = E (µ + αi ) = µ + αi
& V ar (Yij ) = σ 2 .
7.4.1.1 Εκτίμηση και έλεγχος υποθέσεων
Eίναι εύκολο να διαπιστωθεί ότι οι δειγματικοί μέσοι, που ορίστηκαν στην προηγούμενη ενότητα, αποτελούν
ιδανικούς εκτιμητές των αντίστοιχων παραμέτρων. Έτσι, η εκτιμήτρια του ολικού μέσου µ είναι ο αντίστοιχος
δειγματικός ολικός μέσος:
1X
yij = ȳ.. ,
µ̂ =
n i,j
η εκτιμήτρια της μέσης τιμής µi , του πληθυσμού i, είναι ο αντίστοιχος δειγματικός μέσος του επιπέδου i:
µ̂i =
1 X
yij = ȳi. ,
ni j
ενώ η εκτιμήτρια της επίδρασης αi είναι:
α̂i = µ̂i − µ̂ = ȳi. − ȳ.. = ȳi.
Τέλος, η δειγματική διασπορά όλων των μετρήσεων (χωρίς δηλαδή να λαμβάνεται υπόψη ο πληθυσμός στον
οποίο ανήκει η μέτρηση) αποτελεί κατάλληλη εκτιμήτρια της διασποράς σ 2 :
σ̂ 2 = s2 =
1 X
(yij − ȳ.. )2 ≡ M SE
n − k i,j
όπου η διαίρεση έχει γίνει με την ποσότητα n − k, ώστε ο εκτιμητής που προκύπτει να έχει κάποιες καλές
θεωρητικές ιδιότητες (π.χ. αμεροληψία), που βέβαια έχει περιορισμένη σημασία όταν η τιμή του k είναι σημαντικά μικρότερη από το n.
138
ΑΝΑΛΥΣΗ ΔΙΑΚΥΜΑΝΣΗΣ ΚΑΤΑ ΕΝΑΝ ΠΑΡΑΓΟΝΤΑ
Έχοντας τους εκτιμητές των εμπλεκόμενων παραμέτρων, έχουμε τη δυνατότητα να εκτιμήσουμε (προβλέψουμε)
την οποιαδήποτε τιμή j της μεταβλητής απόκρισης για το επίπεδο i, με τρόπο προφανή:
ŷij = µ̂ + α̂i = µ̂i = ȳi. .
Η πιο πάνω ποσότητα ŷij αποτελεί εκτίμηση της yij , έτσι ώστε τα κατάλοιπα (residuals), δηλαδή οι αποστάσεις/αποκλίσεις μεταξύ παρατηρούμενων και εκτιμώμενων τιμών, να ορίζονται ως:
ϵ̂ij = yij − ŷij = yij − ȳi.
(7.6)
Η μηδενική (και η αντίστοιχη εναλλακτική) υπόθεση της μη ύπαρξης διαφοράς μεταξύ των μέσων των k
πληθυσμών, μπορεί να διατυπωθεί ως εξής:
H0 : µ1 = µ2 = ... = µk ≡ µ vs H1 : Όχι όλα τα µi , i = 1, ..., k, ίσα,
όπου µ ο ολικός μέσος, που κάτω από τη μηδενική υπόθεση αντιπροσωπεύει την κοινή μέση τιμή για όλα τα
επίπεδα, δηλαδή για όλους τους πληθυσμούς. Εναλλακτικά, η υπόθεση μπορεί να οριστεί με τη βοήθεια των
παραμέτρων αi που αντιπροσωπεύουν την επίδραση των επιπέδων i = 1, ..., k:
H0 : α1 = α2 = ... = αk = 0
vs H1 : Όχι όλα τα αi , i = 1, ..., k, ίσα με 0.
Γενικεύοντας το Θεώρημα Cochran (Πρόταση 2.5), η ελεγχοσυνάρτηση για τον έλεγχο της πιο πάνω H0
είναι η ακόλουθη:
SST
M ST
k−1 H0
F =
= SSE
∼ Fk−1,n−k ,
M SE
n−k
ενώ το χωρίο απόρριψης της H0 είναι το εξής:
F > Fk−1,n−k;α ,
όπου Fk−1,n−k;α το 100(1 − α)% ποσοστημόριο της κατανομής F με k − 1 και n − k βαθμούς ελευθερίας.
Ο Πίνακας Ανάλυσης Διασποράς της προηγούμενης ενότητας συμπληρώνεται και παίρνει τελικά τη μορφή:
Πίνακας 7.4: Πίνακας ANOVA
Μέσο
Πηγή
Μεταβλητότητας
Βαθμοί
Ελευθερίας
Άθροισμα
Τετραγώνων
Θεραπείες - Πληθυσμοί
k−1
SST
M ST
Σφάλμα
n−k
SSE
M SE
–
Ολική
n−1
SST O
–
–
F
Άθροισμα
Τετραγώνων
M ST H0
∼
M SE
Fk−1,n−k
Από τα παραπάνω είναι προφανές ότι αν η μηδενική υπόθεση είναι αληθής, τότε το πρότυπο παίρνει τη μορφή:
yij = µ + ϵij
για κάθε επίπεδο i, που σημαίνει ότι δεν υπάρχει διαφοροποίηση μεταξύ των πληθυσμών, και άρα η συνολική
μεταβλητότητα των δεδομένων αποδίδεται αποκλειστικά σε τυχαία σφάλματα, και άρα οι πληθυσμοί δεν διαφέρουν μεταξύ τους. Αντίθετα, όταν η μηδενική υπόθεση δεν είναι αληθής, τότε κάποιες τουλάχιστον από τις
επιδράσεις αi δεν είναι μηδέν (κάποιες μπορεί να είναι, αλλά δεν είναι όλες) και όλοι οι πληθυσμοί δεν είναι
ίσοι.
ΓΡΑΜΜΙΚΑ ΜΟΝΤΕΛΑ ΚΑΙ ΣΧΕΔΙΑΣΜΟΣ & ΑΝΑΛΥΣΗ ΠΕΙΡΑΜΑΤΩΝ ΜΕ ΕΦΑΡΜΟΓΕΣ ΣΕ R ΚΑΙ MINITAB
139
Παράδειγμα 7.5. Ο πιο κάτω πίνακας αφορά τα δεδομένα του Παραδείγματος 7.4, όπου έχουν συμπληρωθεί στην
τελευταία γραμμή οι σχετικοί εκτιμητές, όπου µ̂A = ȳ1. = 10/6 = 1.677, µ̂B = ȳ2. = 17/6 = 2.833,
µ̂Γ = ȳ3. = 22/6 = 3.667, µ̂∆ = ȳ4. = 24/6 = 4.000 οι εκτιμητές των μέσων των τεσσάρων πληθυσμών
(γραμμών παραγωγής) Α, Β, Γ και Δ. Τέλος, αθροίζοντας όλες τις μετρήσεις και διαιρώντας με το σύνολο των
μετρήσεων, έχουμε την εκτιμήτρια του ολικού μέσου µ: µ̂ = ȳ.. = 73/24. Ο Πίνακας ANOVA με τη χρήση του
Minitab δίνεται στη συνέχεια (Πίνακας 7.6).
Πίνακας 7.5: Παράδειγμα - Δεδομένα σύγκρισης 4 γραμμών παραγωγής
Α
Β
Γ
Δ
2
1
5
2
1
3
4
3
3
2
4
5
1
3
4
5
1
4
3
4
2
4
2
5
10/6
17/6
22/6
24/6
Πίνακας 7.6: Πίνακας ANOVA - Δεδομένα σύγκρισης 4 γραμμών παραγωγής
Μέσο
Πηγή
Μεταβλητότητας
Βαθμοί
Ελευθερίας
Άθροισμα
Τετραγώνων
Θεραπείες - Πληθυσμοί
k−1=3
SST = 19.46
M ST = 6.486
Σφάλμα
n − k = 20
SSE = 23.5
M SE = 1.175
–
Ολική
n − 1 = 23
SST O = 42.96
–
–
F
Άθροισμα
Τετραγώνων
M ST
M SE
= 5.52
Είναι εύκολο να διαπιστωθεί ότι η p-value για τον έλεγχο:
H0 : α1 = α2 = ... = αk = 0
vs
H1 : Όχι όλα τα αi , i = 1, ..., k, ίσα με 0
που προκύπτει από την κατανομή F , με k − 1 = 3 και n − k = 20 β.ε., ισούται με 0.006. Με βάση αυτή την
τιμή, διαπιστώνεται ότι η μηδενική υπόθεση δεν γίνεται δεκτή (στα συνήθη επίπεδα εμπιστοσύνης 1%, 5% και
10%) και άρα οι μέσες τιμές στις τέσσερις γραμμές παραγωγής δεν είναι (όλες) ίσες. Γνωρίζοντας ήδη τους εκτιμητές των μέσων τιμών, βλέπουμε ότι οι γραμμές Α και Β έχουν σημαντικά χαμηλότερες τιμές (1.667 και 2.833)
από ότι οι γραμμές Γ και Δ (3.667 και 4). Λαμβάνοντας υπόψη τις τιμές αυτές, καθώς και ότι ο έλεγχος έδειξε
ότι δεν είναι όλοι οι μέσοι ίσοι, μπορούμε να υποθέσουμε ότι η γραμμή Α πρέπει να διαφέρει από τις άλλες, ενώ
οι γραμμές Γ και Δ φαίνονται να είναι αρκετά κοντά και ενδέχεται η παρατηρούμενη διαφορά τους να μην είναι
αρκετή ώστε να θεωρηθεί ως στατιστικώς σημαντική (σε αυτήν την περίπτωση ο Ερευνητής θα πρέπει να δεχτεί
ότι οι πραγματικές και άγνωστες τιμές των μέσων των γραμμών Γ και Δ, είναι ίσες). Στην περίπτωση που γίνεται
δεκτή η εναλλακτική υπόθεση, ο Ερευνητής μπορεί (και ενδείκνυται) να προχωρήσει σε Πολλαπλές Συγκρίσεις,
τις οποίες θα δούμε στη συνέχεια.
140
ΑΝΑΛΥΣΗ ΔΙΑΚΥΜΑΝΣΗΣ ΚΑΤΑ ΕΝΑΝ ΠΑΡΑΓΟΝΤΑ
Επίσης, θα πρέπει να σημειωθεί ότι η εκτιμήτρια της διασποράς σ 2 του προτύπου υπολογίζεται στον Πίνακα
ANOVA και ισούται με σ̂ 2 = M SE = 1.175 (η αμεροληψία έχει δειχθεί στην Πρόταση 2.6). Όσον αφορά
τη συνολική μεταβλητότητα του προβλήματος που ανέρχεται σε SST O = 42.96 μονάδες, διαπιστώνεται ότι η
μεταβλητότητα που παραμένει ανερμήνευτη είναι ίση με SSE = 23.5 μονάδες, που θεωρείται αρκετά μεγάλη
(αντιστοιχεί σε 50%+ της SST O). Ένα ενδεχόμενο που θα μπορούσε να ερευνήσει ο υπεύθυνος ποιότητας της
επιχείρησης, είναι πέρα από τη γραμμή παραγωγής, να υπάρχουν κι άλλοι παράγοντες που να παίζουν ρόλο (και άρα
να μπορούν να δικαιολογήσουν κάποιο ποσοστό από αυτή την ανερμήνευτη μεταβλητότητα), όπως η απασχόληση
διαφορετικών χειριστών στις 4 γραμμές παραγωγής, ο βαθμός παλαιότητας (π.χ. έτος κατασκευής και εφαρμοζόμενη τεχνολογία) και η συντηρησιμότητα των 4 μηχανών, οι διαφορετικές κλιματολογικές συνθήκες λειτουργίας
(θερμοκρασία και επίπεδο υγρασίας) ή ακόμα και η χρήση διαφορετικών πρώτων υλών στις 4 γραμμές.
Κλείνοντας αυτή την ενότητα, θα αναφερθούμε στο Kruskal-Wallis test, το οποίο χρησιμοποιείται όταν δεν
ικανοποιείται η πρώτη από τις βασικές υποθέσεις του Απόλυτα Τυχαιοποιημένου Σχεδιασμού, δηλαδή αυτή
της κανονικότητας. Στις περιπτώσεις που δεν είναι γνωστό ή δεν μπορεί να επιβεβαιωθεί ότι οι παρατηρήσεις
ακολουθούν κανονική κατανομή, μπορεί να χρησιμοποιηθεί ένας μη παραμετρικός έλεγχος, το Kruskal-Wallis
test για τον έλεγχο της ισότητας των μέσων. Η ελεγχοσυνάρτηση του ελέγχου είναι η:
k
X
12
Ri2
K −W =
− 3 (n + 1) ,
n (n + 1) i=1 ni
i = 1, ..., k,
(7.7)
όπου Ri = άθροισμα των τάξεων των παρατηρήσεων του i πληθυσμού.
Το χωρίο απόρριψης της υπόθεσης της ισότητας των μέσων, με βάση την ελεγχοσυνάρτηση στην (7.7), είναι
το εξής:
K − W ≥ χ2k−1;α ,
όπου χ2k−1;α το 100(1 − α)% ποσοστημόριο της χ2 κατανομής με k − 1 βαθμούς ελευθερίας (β.ε.). Η
μέθοδος Kruskal-Wallis αναπτύσσεται διεξοδικά στο Κεφάλαιο 10.
7.4.1.2 Διαστήματα εμπιστοσύνης
Εάν θέλουμε να κατασκευάσουμε ένα διάστημα εμπιστοσύνης για τη διαφορά των μέσων 2 από τους k πληθυσμούς, έστω i1 και i2 , μπορούμε να χρησιμοποιήσουμε τις πιο κάτω σχέσεις (από το Κεντρικό Οριακό Θεώρημα, ΚΟΘ) αναφορικά με τις τυχαίες μεταβλητές ȳi1 και ȳi2 που αντιπροσωπεύουν τους δειγματικούς
μέσους των ανεξάρτητων πληθυσμών i1 και i2 :
µ̂i1 = Ȳi1 . = ȳi1 . ∼ N µi1 , σ 2 /ni1
και
µ̂i2 = Ȳi2 . = ȳi2 . ∼ N µi2 , σ 2 /ni2 .
Κατά συνέπεια,
Z=
(ȳi1 . − ȳi2 . ) − (µi1 − µi2 )
q
∼ N (0, 1) .
σ n1i + n1i
1
(7.8)
2
Όμως, στην περίπτωση (η οποία είναι η συνηθέστερη) όπου το σ είναι άγνωστο, αντικαθίσταται στην (7.8)
αυτό, από τον (αμερόληπτο) εκτιμητή του (Πρόταση 2.6):
σ̂ = s =
√
s
M SE =
SSE
n−k
ΓΡΑΜΜΙΚΑ ΜΟΝΤΕΛΑ ΚΑΙ ΣΧΕΔΙΑΣΜΟΣ & ΑΝΑΛΥΣΗ ΠΕΙΡΑΜΑΤΩΝ ΜΕ ΕΦΑΡΜΟΓΕΣ ΣΕ R ΚΑΙ MINITAB
141
και έτσι η (7.8) μετατρέπεται σε:
T =
(ȳi1 . − ȳi2 . ) − (µi1 − µi2 )
q
∼ tn−k .
s n1i + n1i
1
(7.9)
2
Βασιζόμενοι στην (7.9) μπορούμε να προβούμε στη μελέτη υποθέσεων σχετικά με τη σύγκριση των δύο μέσων, δηλαδή για τη διαφορά µi1 − µi2 = δ με πιο κλασική τη μελέτη για δ = 0, δηλαδή της μηδενικής
υπόθεσης H0 : µi1 − µi2 = 0 κάτω από την οποία η (7.9) απλουστεύεται:
T =
(ȳi1 . − ȳi2 . ) − 0
q
∼ tn−k .
s n1i + n1i
1
2
Βασιζόμενοι στην (7.9), ένα 100(1 − α)% διάστημα εμπιστοσύνης για τη διαφορά των μέσων µi1 − µi2 ,
δίνεται από τον τύπο:
s
1
1
ȳi1 . − ȳi2 . ± tn−k;α/2 s
+
.
(7.10)
ni1 ni2
Τα πιο πάνω διαστήματα εμπιστοσύνης μπορούν να αξιοποιηθούν για τον έλεγχο της κλασικής υπόθεσης για
δ = 0, δηλαδή για να διερευνηθεί κατά πόσον οι μέσοι των δύο εμπλεκόμενων πληθυσμών (επιπέδων) είναι
ίσοι ή όχι:
H0 : µi1 − µi2 = δ = 0 ή H0 : µi1 = µi2 .
Συγκεκριμένα, αν για συγκεκριμένη τιμή του επιπέδου α, η τιμή μηδέν (0) περιλαμβάνεται στο αντίστοιχο
100(1 − α)% διάστημα εμπιστοσύνης, τότε οι δύο μέσοι είναι ίσοι, ενώ αν το μηδέν δεν περιλαμβάνεται τότε
οι μέσοι δεν είναι ίσοι για το συγκεκριμένο επίπεδο α.
Ο τύπος (7.10) ισχύει για οποιουσδήποτε δύο μέσους, οποιωνδήποτε δύο από τους k πληθυσμούς. Ας υποθέσουμε λοιπόν ότι έχουμε 3 πληθυσμούς, με μέσους µ1 , µ2 και µ3 , αντίστοιχα. Τότε, μπορούμε να κατασκευάσουμε 3 διαστήματα εμπιστοσύνης για τις διαφορές µ1 − µ2 , µ1 − µ3 και µ2 − µ3 , με το καθένα να
έχει σφάλμα α. Όμως, ενώ το καθένα από τα τρία αυτά διαστήματα θα έχει το επιθυμητό επίπεδο εμπιστοσύνης 100(1 − α)%, το σφάλμα και των τριών μαζί θα υπερβαίνει το σύνηθες α. Εάν επιθυμούμε το συνολικό
σφάλμα όλων των διαστημάτων να μην υπερβαίνει το α, μπορούμε να χρησιμοποιήσουμε τα «Πολλαπλά Διαστήματα Εμπιστοσύνης» ή τις «Πολλαπλές Συγκρίσεις».
Σημειώνεται ότι στην περίπτωση που ζητείται η κατασκευή ενός 100(1 − α)% διαστήματος εμπιστοσύνης
για τον μέσο ενός πληθυσμού, έστω του πληθυσμού i, αυτό δίνεται από τον τύπο:
s
ȳi. ± tn−k;α/2 s
1
.
ni
(7.11)
Αξίζει να τονιστεί ότι αν και το διάστημα αφορά αποκλειστικά τον μέσο του πληθυσμού i, η εκτιμήτρια της
διασποράς σ 2 βασίζεται στο σύνολο των δεδομένων, αφού για την κοινή διασπορά των πληθυσμών διατίθενται
πληροφορίες από όλες τις μετρήσεις, ανεξαρτήτως πληθυσμού.
Παράδειγμα 7.6. Να δοθεί ο πίνακας ANOVA, καθώς και να εφαρμοστεί ο έλεγχος (α = 5%) για τη σύγκριση
των μέσων τριών πληθυσμών/θεραπειών από τους οποίους τα παρακάτω δείγματα έχουνε επιλεχθεί τυχαία:
Πίνακας 7.7: Πίνακας Δεδομένων - 3 πληθυσμοί
Θεραπεία 1
19, 18, 21, 18
Θεραπεία 2
16, 11, 13, 14, 11
Θεραπεία 3
13, 16, 18, 11, 15, 11
142
ΑΝΑΛΥΣΗ ΔΙΑΚΥΜΑΝΣΗΣ ΚΑΤΑ ΕΝΑΝ ΠΑΡΑΓΟΝΤΑ
Λύση
Χρησιμοποιώντας τους τύπους του παρόντος κεφαλαίου έχουμε:
ȳ1. =
19+18+21+18
4
ȳ2. =
16+11+13+14+11
5
ȳ3. =
13+16+18+11+15+11
6
= 14,
ȳ.. =
n1 ȳ1. +n2 ȳ2. +n3 ȳ3.
15
ȳ1. +ȳ2. +ȳ3.
3
= 19,
= 13,
=
= 15.
Επιπλέον,
SST =
k
X
ni (ȳi. − ȳ.. )2 = n1 (ȳ1. − ȳ.. )2 + n2 (ȳ2. − ȳ.. )2 + n3 (ȳ3. − ȳ.. )2
i=1
= 4 (19 − 15)2 + 5 (13 − 15)2 + 6 (14 − 15)2 = 90,
και
SSE =
ni
k X
X
(yij − ȳi. ) =
2
i=1 j=1
n
4
X
(y1j − ȳ1. ) +
2
j=1
5
X
(y2j − ȳ2. ) +
2
j=1
= (19 − 19) + (18 − 19) + (21 − 19) + (18 − 19)
2
2
2
2
o
6
X
(y3j − ȳ3. )2
j=1
n
+ (16 − 13)2 + (11 − 13)2 + (13 − 13)2 + (14 − 13)2 + (11 − 13)2
o
n
o
+ (13 − 14)2 + (16 − 14)2 + (18 − 14)2 + (11 − 14)2 + (15 − 14)2 + (11 − 14)2 = 64.
Είναι γνωστό ότι:
SST O = SST + SSE = 90 + 64 = 154.
Βάσει των παραπάνω, μπορεί πλέον να κατασκευαστεί ο Πίνακας ANOVA με σκοπό την εφαρμογή του αντίστοιχου
F − test για τη σύγκριση των τριών μέσων.
H0 : µ1 = µ2 = µ3 ≡ µ
vs
H1 : Τουλάχιστον ένα από τα µi , i = 1, 2, 3, διαφορετικό.
Πίνακας 7.8: Πίνακας ANOVA - 3 πληθυσμοί
Μέσο
Πηγή
Μεταβλητότητας
Βαθμοί
Ελευθερίας
Άθροισμα
Τετραγώνων
Θεραπείες - Πληθυσμοί
k−1=2
SST = 90
M ST = 45
Σφάλμα
n − k = 12
SSE = 64
M SE = 5.33
–
Ολική
n − 1 = 14
SST O = 154
–
–
Αφού:
F
Άθροισμα
Τετραγώνων
M ST
M SE
= 8.438
F = 8.438 > 3.89 = F2,12;0.05 ,
απορρίπτεται η H0 σε επίπεδο σημαντικότητας α = 5%, και άρα οι μέσοι των τριών θεραπειών διαφέρουν.
ΓΡΑΜΜΙΚΑ ΜΟΝΤΕΛΑ ΚΑΙ ΣΧΕΔΙΑΣΜΟΣ & ΑΝΑΛΥΣΗ ΠΕΙΡΑΜΑΤΩΝ ΜΕ ΕΦΑΡΜΟΓΕΣ ΣΕ R ΚΑΙ MINITAB
143
7.4.2 Πρότυπο τυχαίων επιδράσεων
Η ανάγκη μελέτης τυχαίων επιδράσεων προκύπτει στις περιπτώσεις όπου, ενώ ο Ερευνητής έχει να μελετήσει
πληθώρα διαφορετικών επιπέδων (πληθυσμών), χρονικοί ή/και οικονομικοί περιορισμοί δεν του το επιτρέπουν. Στις περιπτώσεις αυτές είναι δυνατόν να μελετηθεί ένας περιορισμένος αριθμός επιπέδων (πληθυσμών)
τα οποία όμως απαιτείται να επιλεχτούν από την πληθώρα των διαθέσιμων επιπέδων με τυχαίο τρόπο. Στην περίπτωση αυτή, το πρόβλημα επιλύεται με την αξιοποίηση του προτύπου τυχαίων επιδράσεων. Αν και η επίλυση
του προβλήματος δεν διαφέρει από την επίλυση του προβλήματος των σταθερών επιδράσεων, ο μηχανισμός
του προβλήματος είναι τελείως διαφορετικός, αφού στις σταθερές επιδράσεις εξετάζεται η μέση τιμή (των επιπέδων), ενώ στις τυχαίες επιδράσεις εξετάζεται η μεταβλητότητα.
Η εναλλακτική γραφή του προτύπου, με τη βοήθεια των παραμέτρων (επιδράσεων) αi , επιτρέπει να γίνουν
ευκολότερα κατανοητές και να περιγραφούν αποτελεσματικότερα οι επιδράσεις στις περιπτώσεις σταθερού
και τυχαίου παράγοντα. Στην περίπτωση τυχαίων επιδράσεων του εμπλεκόμενου παράγοντα, το πρότυπο δίνεται και πάλι από τον τύπο:
yij = µ + αi + ϵij ,
i = 1, ..., k,
j = 1, ..., ni ,
(7.12)
όπου µ ο ολικός μέσος, αi η επίδραση του i επιπέδου του παράγοντα που αποτελεί τυχαία μεταβλητή, τέτοια
i.i.d.
ώστε αi ∼ N (0, σα2 ), ϵij ∼ N (0, σ 2 ) και αi και ϵi είναι ανεξάρτητες τυχαίες μεταβλητές. Με βάση τις
κατανομές των αi και ϵij , είναι προφανές ότι:
Yij ∼N µ, σ 2 + σα2
και άρα:
E (Yij ) = µ ∀i, j
& V ar (Yij ) = σ 2 + σα2 ,
όπου σ 2 και σα2 ονομάζονται συνιστώσες διασποράς.
Από τα προηγούμενα προκύπτει ότι αν σα2 = 0 τότε όλες οι θεραπείες είναι ίδιες και η διασπορά θα ισούται
μόνο με σ 2 , ενώ αν σα2 > 0 υπάρχει μεταβλητότητα μεταξύ των θεραπειών και η διασπορά θα είναι μεγαλύτερη από σ 2 . Έτσι, στην περίπτωση του προτύπου τυχαίων επιδράσεων, ο επιθυμητός έλεγχος για ίδιες ή μη
θεραπείες, είναι:
H0 : σα2 = 0 vs H1 : σα2 > 0.
(7.13)
Σημειώνεται ότι οι τύποι του μοντέλου σταθερών επιδράσεων για τα αθροίσματα τετραγώνων (SST , SSE),
τα μέσα τετραγωνικά αθροίσματα (M ST , M SE), την ολική μεταβλητότητα (SST O) και τους β.ε., εξακολουθούν να ισχύουν ως έχουν. Στη συγκεκριμένη περίπτωση, και για το μέσο τετραγωνικό άθροισμα M ST ,
ισχύει ότι [22]:
(7.14)
E (M ST ) = σ 2 + n0 σα2 ,
P
όπου n0 = (n (k − 1))−1 ∗ (n2 − n2i ). Λαμβάνοντας υπόψη τα πιο πάνω, και το γεγονός ότι το M SE
είναι (αμερόληπτος) εκτιμητής του σ 2 , δηλαδή E (M SE) = σ 2 (Πρόταση 2.6), αναμένεται ότι το κλάσμα:
F =
M ST
M SE
(7.15)
θα είναι κοντά στη μονάδα όταν η H0 ισχύει (αφού αριθμητής και παρονομαστής θα είναι και οι δύο, κοντά
στο σ 2 ), ενώ θα είναι μεγαλύτερο της μονάδας όταν η H1 ισχύει, οπότε το σα2 > 0 (και άρα ο αριθμητής
αναμένεται να είναι μεγαλύτερος από τον παρονομαστή). Συμπερασματικά, η μελέτη για την περίπτωση των
τυχαίων επιδράσεων ταυτίζεται με αυτή των σταθερών επιδράσεων και βασίζεται στον Πίνακα ANOVA που
δίνεται στη συνέχεια. Θα πρέπει να παρατηρηθεί ότι αν η μηδενική υπόθεση γίνει δεκτή και δηλαδή σα2 = 0,
144
ΑΝΑΛΥΣΗ ΔΙΑΚΥΜΑΝΣΗΣ ΚΑΤΑ ΕΝΑΝ ΠΑΡΑΓΟΝΤΑ
τότε τόσο η μέση τιμή όσο και η διασπορά του αi (για κάθε i) είναι μηδέν και κατά συνέπεια, το αi παύει να
αποτελεί τυχαία μεταβλητή και εκφυλίζεται σε μία και μοναδική τιμή, το μηδέν, με αποτέλεσμα να έχουμε:
yij = µ + ϵi
με σταθερή μέση τιμή (E (Yij ) = µ) και σταθερή διασπορά (V ar (Yij ) = σ 2 ), για όλα τα επίπεδα.
Για την εκτίμηση των συνιστωσών διασποράς, υπενθυμίζεται ότι η εκτιμήτρια του σ 2 είναι ίση με M SE και
δίνεται στον Πίνακα ANOVA. Όσο για την εκτιμήτρια του σα2 , αυτή μπορεί εύκολα να εξαχθεί από τη σχέση
(7.14):
M ST − M SE
M ST ∼ M SE + n0 σ̂α2 → σ̂α2 =
,
n0
όπου οι δειγματικές τιμές των M ST και M SE έχουν χρησιμοποιηθεί ως οι δειγματικές εκτιμήτριες που αντιστοιχούν στις ποσότητες E (M ST ) και E (M SE) ≡ σ 2 . Στην ακραία περίπτωση που η εκτιμήτρια του σα2
τύχει να είναι αρνητική (και άρα μη αποδεκτή), θεωρούμε ότι είναι μηδέν και θέτουμε σ̂α2 = 0. Ένα τέτοιο ενδεχόμενο υποδηλώνει είτε ότι η συγκεκριμένη μέθοδος εκτίμησης δεν είναι η ιδανικότερη είτε ότι το πρότυπο
που έχει χρησιμοποιηθεί δεν είναι το ενδεδειγμένο και θα πρέπει να διερευνηθεί από τον Ερευνητή κάποιο
εναλλακτικό πρότυπο. Αν και η μελέτη είναι ίδια είτε οι επιδράσεις είναι σταθερές είτε τυχαίες, ο μηχανισμός
με τον οποίο λειτουργούν οι δύο περιπτώσεις είναι διαφορετικός. Πράγματι, στην περίπτωση των σταθερών
επιδράσεων εξετάζουμε κατά πόσο οι μέσες τιμές των πληθυσμών (θεραπειών) είναι ίσες ή όχι (ενώ η μεταβλητότητα είναι σταθερή και ίση με σ 2 , μεταξύ των πληθυσμών), ενώ στην περίπτωση των τυχαίων επιδράσεων
ισχύει το αντίστροφο, δηλαδή οι μέσες τιμές είναι ίδιες μεταξύ των πληθυσμών αλλά αυτό που εξετάζεται είναι
αν η μεταβλητότητα είναι σταθερή (ίση με σ 2 ) ή όχι.
7.5 Μελέτη πολλαπλών συγκρίσεων
Όταν ο έλεγχος ισότητας των μέσων καταλήγει στο συμπέρασμα ότι οι μέσοι δεν είναι όλοι ίσοι, δηλαδή στην
περίπτωση που γίνεται δεκτή η εναλλακτική υπόθεση, ο Ερευνητής μπορεί (και ενδείκνυται) να προχωρήσει σε Πολλαπλές Συγκρίσεις, (Multiple Comparisons) όπου για όλες τις συγκρίσεις ανά δύο, το συνολικό
σφάλμα να μην υπερβαίνει ένα προκαθορισμένο επίπεδο α ή διαφορετικά το συνολικό επίπεδο εμπιστοσύνης
να μην είναι χαμηλότερο από έναν προκαθορισμένο συντελεστή εμπιστοσύνης 100(1 − α)%.
Αν και ο τύπος (7.10) ισχύει για οποιουσδήποτε δύο μέσους, οποιωνδήποτε δύο από τους k πληθυσμούς, η
εφαρμογή του για περισσότερες από μία συγκρίσεις δεν εξασφαλίζει το επιθυμητό επίπεδο σφάλματος. Πράγματι, ας υποθέσουμε ότι έχουμε τρεις πληθυσμούς, με μέσους µ1 , µ2 και µ3 , αντίστοιχα. Τότε μπορούμε να
κατασκευάσουμε τρία διαστήματα εμπιστοσύνης για τις διαφορές µ1 − µ2 , µ1 − µ3 και µ2 − µ3 με το
καθένα να έχει σφάλμα α. Όμως, ενώ το καθένα από τα τρία αυτά διαστήματα θα έχει επίπεδο εμπιστοσύνης
100(1−α)%, το σφάλμα και των τριών μαζί θα υπερβαίνει το σύνηθες α, ενώ το συνολικό επίπεδο εμπιστοσύνης θα υπολείπεται του επιθυμητού 100(1−α)%. Ο μόνος τρόπος για την επίτευξη του επιθυμητού επιπέδου
ταυτόχρονα για όλα τα διαστήματα, είναι η εφαρμογή της μεθόδου των Πολλαπλών Συγκρίσεων. Ουσιαστικά
πρόκειται για αποτελεσματικές μεθόδους εύρεσης ταυτόχρονων διαστημάτων οι οποίες αναγκαστικά οδηγούν
σε πλατύτερα διαστήματα αλλά εξασφαλίζουν συγκεκριμένο επίπεδο εμπιστοσύνης, ταυτόχρονα για όλα τα
διαστήματα. Στην ενότητα αυτή θα συζητηθούν τα διαστήματα Bonferroni, τα διαστήματα Tukey και τέλος,
τα διαστήματα Dunnett.
7.5.1 Διαστήματα Fisher LSD
Πριν παρουσιαστεί η μέθοδος Πολλαπλών Συγκρίσεων, θα αναφερθεί σύντομα η μέθοδος Least Significant
Difference (LSD) η οποία προτάθηκε από τον Fisher [20] και βασίζεται στα κλασικά διαστήματα εμπιστο-
ΓΡΑΜΜΙΚΑ ΜΟΝΤΕΛΑ ΚΑΙ ΣΧΕΔΙΑΣΜΟΣ & ΑΝΑΛΥΣΗ ΠΕΙΡΑΜΑΤΩΝ ΜΕ ΕΦΑΡΜΟΓΕΣ ΣΕ R ΚΑΙ MINITAB
145
σύνης (βλ. σχέση (7.10)). Έστω το δεξί μέρος της σχέσης (7.10):
s
LSD = tn−k;α/2 s
1
1
+
.
ni1 ni2
Η μέθοδος Fisher LSD βασίζεται στο γεγονός ότι αν το μηδέν ανήκει σε ένα διάστημα, τότε οι δύο εμπλεκόμενοι μέσοι δεν διαφέρουν, ενώ αν δεν ανήκει, τότε (για το συγκεκριμένο επίπεδο α) διαφέρουν. Για να
συμβαίνει το πρώτο (δηλαδή να ανήκει το μηδέν), θα πρέπει το αριστερό μέρος της σχέσης (7.10), δηλαδή η
διαφορά των δειγματικών μέσων, να είναι μικρότερο (κατά απόλυτη τιμή) από το δεξί (δηλαδή την ποσότητα
LSD πιο πάνω), ενώ αν είναι μεγαλύτερο (κατά απόλυτη τιμή) τότε οι συγκεκριμένοι δύο μέσοι είναι άνισοι (διαφέρουν). Ο Fisher πρότεινε τον καθορισμό της ποσότητας LSD που βασίζεται στην εκτίμηση της
διασποράς σ 2 , στα μεγέθη των δειγμάτων των δύο εμπλεκόμενων θεραπειών και στην κατανομή t με n − k
βαθμούς ελευθερίας. Στη συνέχεια, μπορεί να υπολογιστεί η απόλυτη τιμή (για τη σωστή σύγκριση) της
διαφοράς των δειγματικών μέσων οποιωνδήποτε δύο θεραπειών και να διαπιστωθεί οπτικά αν είναι ή όχι μεγαλύτερη από την αντίστοιχη ποσότητα LSD. Σημειώνεται ότι η ποσότητα LSD θα πρέπει να υπολογίζεται
κάθε φορά εφόσον τα μεγέθη των δειγμάτων διαφέρουν (η ποσότητα πριν τη ρίζα είναι κοινή για οποιαδήποτε σύγκριση δύο μέσων). Στην περίπτωση που όλα τα δείγματα έχουν ίδιο μέγεθος (n/k), η διαδικασία
απλοποιείται, αφού η τιμή του LSD είναι κοινή για όλες τις συγκρίσεις:
s
LSD = tn−k;α/2 s
2
.
n/k
7.5.2 Διαστήματα Bonferroni
Έστω ότι θέλουμε να κατασκευάσουμε m διαστήματα εμπιστοσύνης για τα οποία η πιθανότητα να είναι όλα
μαζί αληθή να είναι 1 − α (επίπεδο εμπιστοσύνης) ή διαφορετικά να έχουμε για m διαστήματα εμπιστοσύνης
ταυτόχρονο επίπεδο εμπιστοσύνης 100(1 − α)% . Για να επιτευχθεί αυτό, θα επιδιώξουμε καθένα διάστημα
να έχει σφάλμα ίσο με α/m, ώστε όλα μαζί (αθροιστικά) να έχουν σφάλμα α. Tα διαστήματα αυτά είναι
γνωστά ως διαστήματα Bonferroni. Το διάστημα εμπιστοσύνης για καθεμία από τις παραπάνω m συγκρίσεις/διαφορές, ανά δύο, θα είναι:
s
α s
ȳi1 . − ȳi2 . ± tn−k; 2m
1
1
+
,
ni1 ni2
i = 1, ..., k,
με i1 , i2 να είναι οι δείκτες των πληθυσμών/θεραπειών μίας εκ των m διαφορών.
7.5.3 Διαστήματα Tukey
Η μέθοδος Tukey προτάθηκε για την κατασκευή όλων των δυνατών συγκρίσεων των μέσων ανά δύο, δηλαδή
k(k − 1)/2 συγκρίσεων ανά δύο, με ταυτόχρονο επίπεδο εμπιστοσύνης 100(1 − α)%. Η τεχνική βασίζεται
στο τυποποιημένο εύρος qk,n−k , η κατανομή του οποίου έχει μελετηθεί από τον Tukey [26] ο οποίος έχει
προβεί και στην πινακοποίηση των ποσοστημορίων qk,n−k;α της σχετικής κατανομής για διαστήματα εμπιστοσύνης 90%, 95% και 99%, δηλαδή για τιμές του α ίσες με 0.1, 0.05 και 0.01.
Ο τύπος των ταυτόχρονων διαστημάτων Tukey δεν διαφέρει στη φιλοσοφία του από τον τύπο των κλασικών διαστημάτων, όπως δίνονται από τη σχέση (7.10). Έτσι, τα διαστήματα εμπιστοσύνης για τις διαφορές
µi1 − µi2 , με ταυτόχρονο επίπεδο εμπιστοσύνης για όλες τις k (k − 1) /2 διαφορές των μέσων ανά δύο,
τουλάχιστον ίσο προς 100(1 − α)%, δίνονται από τον τύπο:
s
qk,n−k;α
1
1
ȳi1 . − ȳi2 . ± √ s
+
.
ni1 ni2
2
(7.16)
146
ΑΝΑΛΥΣΗ ΔΙΑΚΥΜΑΝΣΗΣ ΚΑΤΑ ΕΝΑΝ ΠΑΡΑΓΟΝΤΑ
Στην ειδική περίπτωση όπου τα μεγέθη των δειγμάτων είναι όλα ίσα, δηλαδή ni = n/k, το ταυτόχρονο
επίπεδο εμπιστοσύνης είναι ακριβώς ίσο με 100(1 − α)%), ενώ ο τύπος απλοποιείται ως εξής:
s
ȳi1 . − ȳi2 . ± qk,n−k;α s
1
.
n/k
(7.17)
7.5.4 Διαστήματα Dunnett
Η μέθοδος Dunnett χρησιμοποιείται όταν ένας πληθυσμός (ή μια θεραπεία) θεωρείται ως ένα δοκιμασμένο
σύνολο, ως ένα gold standard που συνήθως αναφέρεται με τον όρο δοκιμασία ελέγχου (control), και ο Ερευνητής χρειάζεται να μελετήσει κατά πόσον οι λοιπές k − 1 θεραπείες είναι ισοδύναμες με τη δοκιμασία ελέγχου.
Συγκεκριμένα, τον Ερευνητή τον ενδιαφέρει να εντοπίσει μήπως υπάρχει κάποια θεραπεία (από τις υπόλοιπες
k − 1) που υπολείπεται της δοκιμασίας ελέγχου. Προφανώς, στην περίπτωση αυτή, δεν ενδιαφέρει η μελέτη
όλων των δυνατών διαφορών ανά δύο, αλλά μόνο των διαφορών της δοκιμασίας ελέγχου με καθεμία από τις
υπόλοιπες k − 1 θεραπείες. Άρα, η μελέτη επικεντρώνεται σε k − 1 συγκρίσεις και τα σχετικά διαστήματα
γνωστά ως διαστήματα Dunnett [16, 17] δίνονται από τον τύπο:
s
ȳj. − ȳ1. ± dk−1,n−k;α s
1
1
+ , j = 2, 3, ..., k,
nj n1
(7.18)
όπου για σκοπούς απλοποίησης η δοκιμασία ελέγχου θεωρείται ότι είναι η 1η θεραπεία και για αυτό όλες οι
υπόλοιπες θεραπείες για j = 2, 3, ..., k συγκρίνονται με την 1η θεραπεία. Ο Dunnett έχει πινακοποιήσει τα
ποσοστημόρια dk−1,n−k;α της κατανομής dk−1,n−k που βασίζονται στις τιμές των α, k και n − k.
Τα διαστήματα Dunnett μπορούν να χρησιμοποιηθούν για τη μελέτη των ελέγχων για τη σύγκριση του μέσου
της θεραπείας j = 2, 3, ..., k με τον μέσο µ1 της δοκιμασίας ελέγχου. Έτσι ο έλεγχος:
H0 : µj − µ1 = 0, j = 2, ..., k
γίνεται δεκτός (στο αντίστοιχο επίπεδο σημαντικότητας) αν η τιμή μηδέν (0) περιλαμβάνεται στο πιο πάνω
διάστημα, αλλιώς απορρίπτεται.
Η μέθοδος θα πρέπει να προτιμάται όταν υπάρχει η ανάγκη σύγκρισης με μια δοκιμασία ελέγχου, επειδή τα
διαστήματα που προκύπτουν είναι στενότερα και άρα προτιμότερα από τα αντίστοιχα της μεθόδου Tukey.
Παράδειγμα 7.7. Όσον αφορά τα 95% πολλαπλά διαστήματα εμπιστοσύνης για τις διαφορές µ1 − µ2 , µ1 − µ3 ,
µ2 − µ3 του παραδείγματος 7.6, αφού m = k = 3, n − k = 12 και α/2m = 0.05/6 = 0.00833, τότε
από τους πίνακες της κατανομής t (t12;0.00833 = 2.779) έχουμε τα εξής Bonferroni διαστήματα εμπιστοσύνης,
με συνολικό επίπεδο εμπιστοσύνης 95%:

s

s

s

1 1
+
µ1 − µ2 : 19 − 13 ± 2.779.2.31
4 5

1 1
µ1 − µ3 : 19 − 14 ± 2.779.2.31
+
4 6

1 1
µ2 − µ3 : 13 − 14 ± 2.779.2.31
+
.
5 6
Σημειώνεται ότι αν ο Ερευνητής είχε επιλέξει να κατασκευάσει διαστήματα που το καθένα θα είχε επίπεδο εμπιστοσύνης 95%, τότε το ποσοστιαίο σημείο της t κατανομής θα ήταν t12;0.05 = 1.782 αντί t12;0.05/3 = 2.779, και
ΓΡΑΜΜΙΚΑ ΜΟΝΤΕΛΑ ΚΑΙ ΣΧΕΔΙΑΣΜΟΣ & ΑΝΑΛΥΣΗ ΠΕΙΡΑΜΑΤΩΝ ΜΕ ΕΦΑΡΜΟΓΕΣ ΣΕ R ΚΑΙ MINITAB
147
θα οδηγούσε σε στενότερα διαστήματα που όμως δεν θα εξασφάλιζαν ταυτόχρονο επίπεδο εμπιστοσύνης τουλάχιστον ίσο με 95%. Τα συγκεκριμένα διαστήματα είναι αυτά που σχετίζονται με τη μέθοδο Fisher LSD. Πράγματι,
η ποσότητα LSD για τη σύγκριση π.χ. των θεραπειών 2 και 3 είναι:
s
s
2
1 1
LSD = tn−k;α/2 s
= 1.782.2.31
+ ,
n/k
5 6
ενώ η διαφορά των αντίστοιχων δειγματικών μέσων είναι µ̂2 − µ̂3 = 13 − 14 = −1, έτσι ώστε να είναι φανερό
ότι δεν παρατηρείται διαφορά μεταξύ των συγκεκριμένων θεραπειών. Από τη στιγμή όμως που έχει αποδειχτεί
ότι υπάρχει διαφορά μεταξύ των τριών θεραπειών, αυτή θα πρέπει αναγκαστικά να σχετίζεται με τη θεραπεία 1,
αφού οι διαφορές των δειγματικών μέσων μεταξύ της θεραπείας 1 και καθεμίας εκ των άλλων δύο θεραπειών είναι
µ̂1 − µ̂2 = 19 − 13 = 6 και µ̂1 − µ̂3 = 19 − 14 = 5. Ο Ερευνητής απαιτείται να το επιβεβαιώσει
υπολογίζοντας το αντίστοιχο LSD με μεγέθη δειγμάτων 4 και 5 (για τη σύγκριση των δύο πρώτων θεραπειών)
και 4 και 6 (για τη σύγκριση των θεραπειών 2 και 3), αντί των 5 και 6 που χρησιμοποιήθηκαν νωρίτερα για τον
υπολογισμό του LSD (για τη σύγκριση των θεραπειών 2 και 3).
Aπό την άλλη, αν ο Ερευνητής επιλέξει τα διαστήματα Tukey με ταυτόχρονο επίπεδο εμπιστοσύνης 95% (και για
τα τρία διαστήματα μαζί), τότε η μόνη διαφορά αφορά το ποσοστιαίο σημείο της εμπλεκόμενης κατανομής ώστε η
τιμή 2.779 (που αφορά την κατανομή t με n − k = 12 β.ε.) αντικαθίσταται από την τιμή q3,12;0.05 = 3.77 και
έτσι προκύπτουν τα πλατύτερα διαστήματα:

s

s

s

1 1
µ1 − µ2 : 19 − 13 ± 3.77.2.31
+
4 5

1 1
+
µ1 − µ3 : 19 − 14 ± 3.77.2.31
4 6

1 1
µ2 − µ3 : 13 − 14 ± 3.77.2.31
+
.
5 6
Τέλος, αν για σκοπούς εφαρμογής της μεθοδολογίας θεωρήσουμε ότι η δοκιμασία ελέγχου είναι η 3η , τότε τα δύο
διαστήματα Dunnett, δηλαδή µ1 − µ3 και µ2 − µ3 είναι:

s

s

1 1
µ1 − µ3 : 19 − 14 ± 2.50.2.31
+
4 6

1 1
µ2 − µ3 : 13 − 14 ± 2.50.2.31
+
,
5 6
από όπου είναι φανερή η συρρίκνωση των σχετικών διαστημάτων, αφού το ποσοστημόριο που καθορίζει το εύρος
του διαστήματος έχει μειωθεί από 3.77 για τα τρία διαστήματα Tukey, σε 2.779 για τα τρία διαστήματα Bonferroni,
και περαιτέρω σε 2.50 για τα δύο διαστήματα Dunnett.
7.6 Ανάλυση καταλοίπων
Σύμφωνα με τον ορισμό των προτύπων του παρόντος Κεφαλαίου, τα σφάλματα ϵij πρέπει να ικανοποιούν τις
εξής προϋποθέσεις:
• τα σφάλματα ακολουθούν την κανονική κατανομή,
148
ΑΝΑΛΥΣΗ ΔΙΑΚΥΜΑΝΣΗΣ ΚΑΤΑ ΕΝΑΝ ΠΑΡΑΓΟΝΤΑ
• τα σφάλματα έχουν σταθερή διασπορά (ομοσκεδαστικότητα),
• τα σφάλματα είναι ανεξάρτητα,
i.i.d.
δηλαδή ϵij ∼ N (0, σ 2 ) .
Για τη διερεύνηση των προϋποθέσεων για τα σφάλματα, βασιζόμαστε στα κατάλοιπα (residuals) τα οποία
ορίστηκαν νωρίτερα στη σχέση (7.6):
ϵ̂ij = yij − ŷij = yij − ȳi. .
(7.19)
Επειδή οι τιμές των καταλοίπων είναι εκτιμητές των αντίστοιχων τυχαίων σφαλμάτων ϵij του προτύπου μονοπαραγοντικής ανάλυσης διασποράς, μπορούν να χρησιμοποιηθούν στη θέση των (άγνωστων) σφαλμάτων
για τη διερεύνηση των τριών πιο πάνω προϋποθέσεων κανονικότητας, ανεξαρτησίας και ομοσκεδαστικότητας. Σημειώνεται ότι οι τρεις συγκεκριμένες προϋποθέσεις ταυτίζονται με εκείνες της Γραμμικής Παλινδρόμησης (Ενότητα 4.1).
Η μελέτη των προϋποθέσεων μπορεί να επιτευχθεί αφενός μεν με γραφικές μεθόδους, αφετέρου δε, με στατιστικές τεχνικές.
7.6.1 Γραφικές μέθοδοι ανάλυσης καταλοίπων
Τα γραφικά των καταλοίπων για τους ελέγχους κανονικότητας, ανεξαρτησίας και ομοσκεδαστικότητας είναι
τα ακόλουθα:
• Το κανονικό διάγραμμα πιθανότητας (normal probability plot) χρησιμοποιείται για τη διερεύνηση
της κανονικότητας, όπως ακριβώς και στην περίπτωση της γραμμικής παλινδρόμησης (Ενότητα 4.3).
Εάν τα σημεία βρίσκονται αρκετά κοντά στη διαγώνιο του κανονικού διαγράμματος, η κανονικότητα
γίνεται αποδεκτή. Σημειώνεται ότι μικρές αποκλίσεις από την κανονικότητα δεν επηρεάζουν σημαντικά τη μεθοδολογία της ανάλυσης διακύμανσης και δεν αλλοιώνουν τα γενικά συμπεράσματα της
μελέτης. Για τον ίδιο σκοπό, μπορεί να χρησιμοποιηθεί και ένας πίνακας συχνοτήτων ή ένα ιστόγραμμα
των καταλοίπων.
• Το διάγραμμα καταλοίπων ως προς τη χρονική ακολουθία (σειρά) των μετρήσεων, δηλαδή ως προς
τον χρόνο, χρησιμοποιείται για τη διερεύνηση της ανεξαρτησίας (βλέπε και στην Ενότητα 4.4 την αντίστοιχη διερεύνηση στην περίπτωση της γραμμικής παλινδρόμησης). Εάν η χρονική αλληλουχία των
μετρήσεων δεν έχει καταγραφεί, ο Ερευνητής μπορεί να θεωρήσει ότι αυτές έγιναν με βάση τη σειρά
καταχώρισης των μετρήσεων στο αρχείο δεδομένων (database). Εάν τα σημεία βρίσκονται εντός ενός
νοητού οριζοντίου πλαισίου, η ανεξαρτησία γίνεται δεκτή. Αν όμως για παράδειγμα, όσο αυξάνεται ο
χρόνος τα σημεία αποκλίνουν όλο και περισσότερο από τον άξονα των X, τότε η ανεξαρτησία παραβιάζεται.
• Η υπόθεση της σταθερής διασποράς (ομοσκεδαστικότητας) μπορεί να μελετηθεί με το διάγραμμα
κουκκίδων των καταλοίπων ως προς τις τιμές ȳi. , δηλαδή των εκτιμώμενων τιμών ŷij . Για να ισχύει
η υπόθεση της ομοσκεδαστικότητας θα πρέπει το εύρος των καταλοίπων για καθεμία από τις k τιμές
ȳi. , να είναι παρόμοιο. Εάν υπάρχει κάποιου είδους εξάρτηση, αυτό σημαίνει ότι δεν θα έχουμε την ίδια
διασπορά σε κάθε πληθυσμό (επίπεδο i). Αυτό πρακτικά σημαίνει ότι αν υπολογιστεί η δειγματική διασπορά σε κάθε επίπεδο ξεχωριστά, οι τιμές που θα προκύψουν θα παρουσιάζουν σημαντικές διαφορές,
σε τέτοιο βαθμό που δεν θα μπορούν οι αντίστοιχες θεωρητικές διασπορές να θεωρηθούν (στατιστικά)
ίσες. Στη γραμμική παλινδρόμηση (Ενότητα 4.5) είχε χρησιμοποιηθεί το διάγραμμα των καταλοίπων
με τα xi , τα οποία αποτελούσαν τις τιμές της ανεξάρτητης μεταβλητής X, κάτι που στην ανάλυση
διακύμανσης δεν συμβαίνει, διότι εδώ ο εμπλεκόμενος παράγοντας λαμβάνει k διακριτές τιμές που
αντιπροσωπεύουν τα επίπεδα του παράγοντα.
ΓΡΑΜΜΙΚΑ ΜΟΝΤΕΛΑ ΚΑΙ ΣΧΕΔΙΑΣΜΟΣ & ΑΝΑΛΥΣΗ ΠΕΙΡΑΜΑΤΩΝ ΜΕ ΕΦΑΡΜΟΓΕΣ ΣΕ R ΚΑΙ MINITAB
149
7.6.2 Στατιστικές μέθοδοι ανάλυσης καταλοίπων
Οι αντίστοιχες στατιστικές μέθοδοι για τη διερεύνηση των τριών προϋποθέσεων της μονοπαραγοντικής ανάλυσης διακύμανσης, είναι ο έλεγχος Anderson-Darling (A-D) ή ο έλεγχος Kolmogorov-Smirnov (K-S) ή
ακόμα και ο έλεγχος Shapiro-Wilk (S-W), για την κανονικότητα, ο απαραμετρικός έλεγχος των ροών (Runs
Test) για τον έλεγχο της ανεξαρτησίας και ο έλεγχος Bartlett ή ο έλεγχος Levene για τον έλεγχο της ομοσκεδαστικότητας.
7.6.2.1 Οι έλεγχοι A-D, K-S και S-W
Οι έλεγχοι Anderson-Darling, Kolmogorov-Smirnov και Shapiro-Wilk είναι παρόμοιοι έλεγχοι, με την έννοια ότι είναι και οι τρεις μη παραμετρικοί έλεγχοι, ενώ οι στατιστικές ελεγχοσυναρτήσεις τους βασίζονται
στην έννοια της απόστασης μεταξύ της εξεταζόμενης κατανομής (της κανονικής στην περίπτωση που εξετάζεται εδώ) και της κατανομής που φαίνεται να έχει παράξει τις συγκεκριμένες μετρήσεις/παρατηρήσεις. Η
κατανομή αυτή ονομάζεται Εμπειρική Συνάρτηση Κατανομής (Ορισμός 4.1) και μπορεί να θεωρηθεί ως μια
εκτίμηση της άγνωστης κατανομής των δεδομένων, ο υπολογισμός της οποίας γίνεται αξιοποιώντας τα διαθέσιμα δεδομένα. Αν η στατιστική ελεγχοσυνάρτηση, δηλαδή η απόσταση (όπως αυτή ορίζεται από τον έλεγχο
από τους πιο πάνω τρεις, που θα επιλέξει ο Ερευνητής) μεταξύ της εμπειρικής κατανομής (με βάση τα δεδομένα) και της εξεταζόμενης κατανομής (της κανονικής στην περίπτωσή μας) είναι πολύ μικρή, τότε η υπόθεση
της κανονικότητας γίνεται δεκτή, διαφορετικά απορρίπτεται. Άρα, τιμές της στατιστικής ελεγχοσυνάρτησης
κοντά στο μηδέν είναι υπέρ της κανονικότητας, κάτι που διαπιστώνεται από τη σχετική p-value του ελέγχου.
Οι λεπτομέρειες των συγκεκριμένων ελέγχων αναπτύσσονται στις Ενότητες 4.3.1-4.3.3.
7.6.2.2 Ο Wald-Wolfowitz έλεγχος των ροών
Για την παρουσίαση του ελέγχου των ροών, έστω δύο δείγματα n = 5 και m = 6 παρατηρήσεων αντίστοιχα
(συμβολικά, έστω x οι πρώτες παρατηρήσεις και y οι δεύτερες):
x : 1.2, 1.5, 0.8, 4.6, 2.4
y : 1.6, 1.8, 5.0, 2.5, 3.5, 0.5.
Για την κατανόηση του ελέγχου τοποθετούμε τις παρατηρήσεις και των δύο δειγμάτων σε αύξουσα σειρά,
χρησιμοποιώντας αντί των ίδιων των παρατηρήσεων, τα σύμβολα x για παρατηρήσεις από το πρώτο δείγμα
και y για παρατηρήσεις από το δεύτερο δείγμα:
y, x, x, x, y, y, x, y, y, x, y.
Η πιο πάνω αλληλουχία είναι προφανής, αφού π.χ. η “τιμή” y εμφανίζεται πρώτη και τελευταία, αφού η πιο μικρή (0.5) και η πιο μεγάλη τιμή (5.0) μεταξύ όλων των μετρήσεων τυγχάνει να προέρχονται από το 2ο δείγμα.
Ο έλεγχος εξετάζει κατά πόσο οι παρατηρήσεις είναι ή όχι τυχαίες, γιατί εάν είναι, τότε μπορούμε να δεχτούμε
την ανεξαρτησία (ή αλλιώς την τυχαιότητα). Για να είναι οι παρατηρήσεις τυχαίες (ανεξάρτητες) θα πρέπει
να μην υπάρχει κάποιο συγκεκριμένο μοτίβο στην εμφάνιση των x και y στην πιο πάνω αλληλουχία. Παραδείγματα μοτίβων που θα οδηγούσαν στο συμπέρασμα ότι δεν υπάρχει τυχαιότητα είναι η εμφάνιση πρώτα
όλων των x και μετά να ακολουθούν, όλα τα y:
x, x, x, x, x, y, y, y, y, y, y
ή ανάποδα να προηγούνται όλα τα y και να έπονται όλα τα x:
y, y, y, y, y, y, x, x, x, x, x
ή τέλος να εναλλάσσονται συνέχεια τα σύμβολα x και y, π.χ.:
y, x, y, x, y, x, y, x, y, x, y
150
ΑΝΑΛΥΣΗ ΔΙΑΚΥΜΑΝΣΗΣ ΚΑΤΑ ΕΝΑΝ ΠΑΡΑΓΟΝΤΑ
ή ανάποδα. Με άλλα λόγια ελάχιστες ή πάρα πολλές εναλλαγές (των συμβόλων) συνηγορούν υπέρ της εξάρτησης (μη τυχαιότητας). Οι εναλλαγές αυτές ονομάζονται ροές (runs) με το πλήθος τους να συμβολίζεται
με R και να λαμβάνει τιμές από 2 (π.χ. όταν προηγούνται όλα τα x και ακολουθούν όλα τα y) έως n + m,
δηλαδή το πλήθος όλων των παρατηρήσεων (όταν τα x και y εναλλάσσονται συνέχεια). Σημειώνεται ότι στο
πιο πάνω παράδειγμα, η ποσότητα R λαμβάνει στη συγκεκριμένη αλληλουχία που έχει προκύψει, την τιμή 7,
η οποία θα χαρακτηριζόταν ως μια “μεσαία” τιμή, αφού στο παράδειγμα οι δυνατές τιμές του R είναι από 2
έως n + m = 11.
Συμπερασματικά, μικρές ή μεγάλες τιμές του πλήθους R των ροών οδηγούν στην απόρριψη της τυχαιότητας
ενώ «μεσαίες» στην αποδοχή της. Ο έλεγχος αυτός έχει μελετηθεί από τους Wald και Wolfowitz [27] και
σχετικοί πίνακες δίνουν τις οριακές τιμές του ελέγχου, ενώ οι σχετικές p-values επιτρέπουν στον Ερευνητή
να πάρει την ενδεδειγμένη απόφαση όσον αφορά την τυχαιότητα (ανεξαρτησία) ή μη. Σημειώνεται ότι για
ικανοποιητικά μεγάλες τιμές των n και m, η τυποποιημένη κατανομή της τυχαίας μεταβλητής R (δηλαδή
όταν αφαιρεθεί η μέση της τιμή και γίνει διαίρεση με την τυπική της απόκλιση) περιγράφεται ικανοποιητικά
από την τυποποιημένη κανονική κατανομή. Η προσέγγιση θεωρείται ικανοποιητική αν οι τιμές των n και m
είναι τουλάχιστον 10 (Κεφάλαιο 15, [28]).
7.6.2.3 Οι έλεγχοι Bartlett και Levene για την ισότητα των διασπορών
Για τον έλεγχο των διασπορών ο Ερευνητής μπορεί να χρησιμοποιήσει είτε τον έλεγχο Bartlett [25] είτε τον
έλεγχο Levene ([14, 23]). Η επιλογή εξαρτάται από το κατά πόσο ισχύει η κανονικότητα ή όχι. Γενικά, ο
έλεγχος Levene είναι λιγότερο ευαίσθητος από ότι ο έλεγχος Bartlett σε αποκλίσεις από την κανονικότητα.
Αν λοιπόν ο Ερευνητής είναι βέβαιος ότι τα δεδομένα του προέρχονται από (ή έστω είναι πολύ κοντά στην)
κανονική κατανομή, τότε συστήνεται η χρήση του ελέγχου Bartlett. Διαφορετικά, αν δηλαδή έχει αμφιβολίες
για την κανονικότητα των δεδομένων, τότε συστήνεται η χρήση του ελέγχου Levene.
Για την περίπτωση Levene, η ομοσκεδαστικότητα μπορεί να δειχθεί όταν η μεταβλητότητα μέσα σε κάθε επίπεδο (πληθυσμό) είναι παρόμοια με τη μεταβλητότητα μεταξύ των πληθυσμών, με την πρώτη να υπολογίζεται
συγκρίνοντας τις μετρήσεις κάθε επιπέδου i (yij ) με τον μέσο του επιπέδου i (ȳi. ), και τη δεύτερη συγκρίνοντας τον μέσο κάθε επιπέδου i με τον ολικό μέσο (ȳ.. ). Αν το κλάσμα (η μία μεταβλητότητα προς την άλλη)
έχει μικρή τιμή (κοντά στη μονάδα), η υπόθεση της ομοσκεδαστικότητας γίνεται δεκτή, αλλιώς απορρίπτεται. Επειδή γίνεται σύγκριση (διαίρεση) διασπορών (μεταβλητότητας), η εμπλεκόμενη κατανομή είναι η F ,
ως το κλάσμα δύο (ανεξαρτήτων) χ2 κατανομών (τη μεταβλητότητα στον αριθμητή και τη μεταβλητότητα
στον παρονομαστή).
Για την περίπτωση Bartlett, η ομοσκεδαστικότητα μελετάται με παρόμοιο τρόπο, με τη διαφορά ότι συγκρίνεται η από κοινού μεταβλητότητα (που βασίζεται στον συνδυασμό των διασπορών των k πληθυσμών/επιπέδων)
με τις επιμέρους μεταβλητότητες στα επίπεδα 1, 2, ..., k. Σε αντίθεση με την προηγούμενη περίπτωση, η
χρήση του λογαρίθμου έχει ως αποτέλεσμα το κλάσμα (του προηγούμενου ελέγχου) να καταλήγει ως η διαφορά δύο λογαρίθμων (αριθμητή και παρονομαστή) έτσι ώστε, η εμπλεκόμενη κατανομή να είναι η διαφορά
(αντί του κλάσματος) δύο χ2 κατανομών που ακολουθεί επίσης τη χ2 κατανομή. Η ομοσκεδαστικότητα
ισχύει για μικρές τιμές (κοντά στο μηδέν), ενώ διαφορετικά απορρίπτεται.
Άσκηση Αυτοαξιολόγησης
Έστω παράγοντας ενδιαφέροντος με k επίπεδα. Να προσδιοριστεί ο συνολικός αριθμός των
πολλαπλών διαστημάτων Tukey και Dunnett που μπορούν να κατασκευαστούν.
ΓΡΑΜΜΙΚΑ ΜΟΝΤΕΛΑ ΚΑΙ ΣΧΕΔΙΑΣΜΟΣ & ΑΝΑΛΥΣΗ ΠΕΙΡΑΜΑΤΩΝ ΜΕ ΕΦΑΡΜΟΓΕΣ ΣΕ R ΚΑΙ MINITAB
151
7.7 Εφαρμογές στο Minitab και την R
1. Έστω η διαδικασία παραγωγής σωλήνων πίεσης για την οποία ο Ερευνητής επιθυμεί να αξιολογήσει την ενδεχόμενη επίδραση ενός πρόσθετου υλικού που αποτελεί πρώτη ύλη με συμμετοχή 5% στο
τελικό προϊόν. Για καθεμία από τις τέσσερις διαθέσιμες στην αγορά ποιότητες του πρόσθετου υλικού
(ποιότητα 1, 2, 3 και 4), επιλέχτηκαν 6 σωλήνες πίεσης από την παραγωγή και υπολογίστηκε το βάρος
τους σε kg/100m. Οι μετρήσεις ανά ποιότητα φαίνονται στον Πίνακα 7.9.
Πίνακας 7.9: Πίνακας Δεδομένων - Σωλήνες Πίεσης
Επίπεδο/Ποιότητα 1
169, 177, 177, 197, 187, 182
Επίπεδο/Ποιότητα 2
182, 157, 177, 177, 167, 193
Επίπεδο/Ποιότητα 3
172, 147, 155, 159, 152, 147
Επίπεδο/Ποιότητα 4
141, 145, 147, 127, 153, 159
i. Ζητείται να διερευνηθεί αν το μέσο βάρος διαφέρει ανάλογα με την ποιότητα και αν συμβαίνει
αυτό, να εντοπιστεί η ποιότητα εκείνη ή εκείνες που κάνουν τη διαφορά.
ii. Συστήνεται να γίνει ανάλυση καταλοίπων ώστε να διαπιστωθεί αν πληρούνται οι προϋποθέσεις
του προτύπου που θα χρησιμοποιηθεί.
iii. Επιπρόσθετα, ζητείται να γίνει και μια γραφικού τύπου ανάλυση ώστε να διαπιστωθεί αν η γραφική μέθοδος συμφωνεί με τη στατιστική.
iv. Τέλος, ζητείται να διαπιστωθεί πώς διαφοροποιείται το πρόβλημα, αν οι τέσσερις ποιότητες δεν
είναι οι μοναδικές που διατίθενται στην αγορά, αλλά αποτελούν τυχαίο δείγμα που έχει επιλεχτεί
από έναν μεγάλο αριθμό ποιοτήτων που υπάρχουν στο εμπόριο.
Ȫ
Λύση
i. Με βάση την εκφώνηση, το κατάλληλο πρότυπο είναι το πρότυπο σταθερών επιδράσεων που
δίνεται στη σχέση (7.5) και αφορά πείραμα πλήρους τυχαιοποίησης ενός παράγοντα. Υπενθυμίζεται ότι τα σφάλματα πρέπει να είναι ανεξάρτητες τυχαίες μεταβλητές με κανονική κατανομή
και σταθερή διασπορά:
ε ∼ N 0, σ 2 ,
ενώ οι παράμετροι του προτύπου που αντιπροσωπεύουν τις επιδράσεις των τεσσάρων επιπέδων
(ποιοτήτων) του παράγοντα ενδιαφέροντος (πρόσθετο υλικό, έστω A), ικανοποιούν τη σχέση:
4
X
αi = 0.
1
Για την εισαγωγή των δεδομένων στο Minitab χρησιμοποιούνται οι δύο πρώτες στήλες (C1 και
C2 ) στο κεντρικό παράθυρο του Minitab. Οι μετρήσεις καταχωρίζονται π.χ. στην πρώτη στήλη,
η μια κάτω από την άλλη, ενώ στη δεύτερη στήλη καταχωρίζεται η ποιότητα (π.χ. 1, 2, 3, 4) που
αντιστοιχεί στην κάθε μέτρηση. Έτσι, προκύπτει ένα σύνολο δεδομένων με 24 γραμμές και 2
στήλες. Τα ονόματα που δόθηκαν στις 2 ποσότητες/στήλες είναι Βάρος και Ποιότητα.
152
ΑΝΑΛΥΣΗ ΔΙΑΚΥΜΑΝΣΗΣ ΚΑΤΑ ΕΝΑΝ ΠΑΡΑΓΟΝΤΑ
Μια πρώτη υποτυπώδης βασική γραφική αποτύπωση των δεδομένων μπορεί να δώσει μια εικόνα
στον Ερευνητή για το τι θα πρέπει να περιμένει από την ανάλυση. Ένα τέτοιο γράφημα είναι το
θηκόγραμμα (Boxplot), το οποίο όμως συστήνεται αν υπάρχουν αρκετές διαθέσιμες παρατηρήσεις και σε οποιαδήποτε περίπτωση τουλάχιστον 6. Η αξιοποίηση του διαγράμματος ατομικής
τιμής (Individual Value Plot) μπορεί να γίνει ανεξάρτητα από τον αριθμό των παρατηρήσεων.
Για τον σχεδιασμό του τελευταίου, θα πρέπει να ακολουθηθεί η διαδρομή:
Graphs
Ê
Individual Value Plot
Ê
With Groups
Το γράφημα των κουκκίδων για την παρούσα εφαρμογή είναι το εξής:
Σχήμα 7.3: Διάγραμμα Κουκκίδων - Σωλήνες Πίεσης
από το οποίο φαίνεται ότι το τέταρτο (4) επίπεδο παρουσιάζει πολύ χαμηλότερο βάρος από ότι
τα άλλα τρία, με τα επίπεδα (1) και (2) να φαίνεται ότι έχουν τα υψηλότερα επίπεδα. Άρα, οπτικά
πιθανολογείται ότι υπάρχουν διαφορές μεταξύ των τεσσάρων επιπέδων ποιότητας.
Το ζητούμενο είναι η διερεύνηση του ελέγχου:
H0 : α1 = α2 = α3 = α4 = 0
vs
H1 : Όχι όλα τα αi , i = 1, 2, 3, 4 ίσα με 0,
η οποία επιτυγχάνεται μέσω του Πίνακα ANOVA (Πίνακας 7.4):
Stat
Ê
ANOVA
Ê
General Linear Model
Ê
Fit General Linear Model
όπου επιλέγουμε ως Response το Βάρος και ως Factor την Ποιότητα, ενώ στην επιλογή Random/Nest θα πρέπει να επιλεχθεί το είδος των επιδράσεων (εδώ επιλέγεται το Fixed). Τα αποτελέσματα φαίνονται στον Πίνακα 7.10:
ΓΡΑΜΜΙΚΑ ΜΟΝΤΕΛΑ ΚΑΙ ΣΧΕΔΙΑΣΜΟΣ & ΑΝΑΛΥΣΗ ΠΕΙΡΑΜΑΤΩΝ ΜΕ ΕΦΑΡΜΟΓΕΣ ΣΕ R ΚΑΙ MINITAB
153
Πίνακας 7.10: Πίνακας ANOVA - Σωλήνες Πίεσης
Από τα αποτελέσματα του παραπάνω πίνακα διαπιστώνουμε ότι:
τα επίπεδα του παράγοντα ενδιαφέροντος (ποιότητα) είναι k = 4,
οι αντίστοιχοι βαθμοί ελευθερίας είναι k − 1 = 3,
οι συνολικοί βαθμοί ελευθερίας είναι n − 1 = 24 − 1 = 23,
οι βαθμοί που απομένουν για τα σφάλματα είναι n − 1 − (k − 1) = 23 − 3 = 20,
η συνολική μεταβλητότητα είναι SST O = 7447.833 με τα 2/3 της οποίας (SSR =
5168.167) να μπορούν να δικαιολογηθούν από το πρότυπο (και άρα τον παράγοντα ενδιαφέροντος) και το υπόλοιπο περίπου 1/3 (SSE = 7447.833 − 5168.167 = 2279.667)
να μην μπορεί να δικαιολογηθεί από το πρότυπο και να αποτελεί το άθροισμα τετραγώνων
των σφαλμάτων,
– τα δύο μέσα τετραγωνικά σφάλματα του πειράματος ισούνται με M SR = SSR/(k −
1) = 5168.167/3 = 1722.722 και M SE = SSE/(n − k) = 2279.667/20 =
113.983,
– η τιμή της ελεγχοσυνάρτησης για τον έλεγχο μηδενικών επιδράσεων, να ισούται με F =
M SR/M SE = 1722.722/113.983 = 15.114 και κατά συνέπεια
– η μηδενική υπόθεση να απορρίπτεται σε όλα τα συνήθη επίπεδα σημαντικότητας (1%, 5%,
και 10%), αφού η p-value του ελέγχου ισούται με 0.000023.
–
–
–
–
–
Από τη στιγμή που η μηδενική υπόθεση απορρίπτεται γνωρίζουμε ότι οι μέσοι των τεσσάρων
επιπέδων δεν είναι όλοι ίσοι. Για να διαπιστωθεί ποιοι διαφέρουν, δηλαδή σε ποιους οφείλεται
το πιο πάνω συμπέρασμα της ανάλυσης διακύμανσης, πρέπει, όπως έχει αναφερθεί, να γίνουν
Πολλαπλές Συγκρίσεις, καταλήγοντας ότι η δημοφιλέστερη αλλά και ιδανικότερη, για όλες τις
δυνατές συγκρίσεις ανά δύο, είναι η μέθοδος Tukey. Η διαδρομή που πρέπει να ακολουθηθεί
είναι:
Stat
Ê
ANOVA
Ê
General Linear Model
Ê
Comparisons
Ê
Tukey
όπου στην επιλογή Results, συστήνεται να τικάρεται η επιλογή Tests and Confidence Intervals,
ώστε να καταγράφονται στο output τόσο τα διαστήματα εμπιστοσύνης (το επίπεδο εμπιστοσύνης που επιθυμεί ο Ερευνητής καταχωρίζεται στα Options) όσο και οι p-values των αντίστοιχων
ελέγχων.
Τα αποτελέσματα των συγκρίσεων (Πίνακας 7.11) δείχνουν ότι οι μέσοι των επιπέδων 1 και 2
είναι σημαντικά μεγαλύτεροι από αυτούς των επιπέδων 3 και 4. Σε επίπεδο 95% οι διαφορές
μεταξύ 4 − 1, 4 − 2, 3 − 1 και 3 − 2 είναι στατιστικώς σημαντικές σε οποιοδήποτε επίπεδο
μεγαλύτερο από α = 0.018 (οι p-values κυμαίνονται από 0.000 έως 0.018). Οι χαρακτήρες
A και B, που εμφανίζονται δίπλα σε κάθε επίπεδο, δηλώνουν ότι οι μέσοι των επιπέδων που
154
ΑΝΑΛΥΣΗ ΔΙΑΚΥΜΑΝΣΗΣ ΚΑΤΑ ΕΝΑΝ ΠΑΡΑΓΟΝΤΑ
αντιστοιχούν σε ίδιο χαρακτήρα είναι ίσοι. Με άλλα λόγια, αν και η δειγματική τιμή της ποιότητας 1 είναι μεγαλύτερη (181.500) από αυτή της ποιότητας 2 (175.500), αυτή η διαφορά δεν
διαπιστώθηκε να είναι στατιστικώς σημαντική (p-value = 0.766). Το ίδιο ισχύει και για τις
δειγματικές τιμές (155.333 και 145.333) για τις ποιότητες 3 και 4 (p-value = 0.389). Κατά
συνέπεια τα επίπεδα 1 και 2, όπως και τα επίπεδα 3 και 4, θεωρούνται ισοδύναμα. Από στατιστική σκοπιά μπορεί να ειπωθεί ότι τελικά δεν έχουμε έναν παράγοντα με 4 επίπεδα, δηλαδή
δεν έχουμε 4 διαφορετικούς πληθυσμούς, αλλά μόνο δύο, και άρα οι μετρήσεις των επιπέδων 1
και 2 (όπως και αυτές των επιπέδων 3 και 4) μπορούν να συμπτυχθούν και να μην μελετώνται
ξεχωριστά, έτσι ώστε το πρόβλημα των τεσσάρων πληθυσμών, με βάση τα αποτελέσματα της παρούσας μελέτης, να εκφυλίζεται σε πρόβλημα δύο πληθυσμών. Μάλιστα, σε αυτή την περίπτωση
θα μπορούσε να εφαρμοστεί το γνωστό από τη Στατιστική t − test της σύγκρισης των μέσων
δύο ανεξαρτήτων δειγμάτων, με μεγέθη n1 = 12 και n2 = 12.
Πίνακας 7.11: Πολλαπλές Συγκρίσεις Tukey - Σωλήνες Πίεσης
Σημειώνεται ότι το ταυτόχρονο επίπεδο εμπιστοσύνης των διαστημάτων Tukey είναι ίσο με 95%
αλλά το επίπεδο εμπιστοσύνης για κάθε διάστημα ξεχωριστά (Individual Confidence Level) είναι ίσο με 98.89%. Αυτό είναι το νόημα των πολλαπλών συγκρίσεων Tukey οι οποίες διασφαλίζουν ότι ταυτόχρονα όλα τα διαστήματα θα έχουν επίπεδο αυτό που έχει απαιτήσει ο Ερευνητής,
αλλά το κάθε διάστημα θα έχει επίπεδο τουλάχιστον ίσο με το επιλεχθέν από τον Ερευνητή. Είναι
προφανές ότι αν ο Ερευνητής είχε απαιτήσει το κάθε διάστημα να είναι 95%, τότε όλα μαζί τα
διαστήματα θα είχαν λιγότερο από 95%, χωρίς να μπορεί αυτό να προκαθοριστεί (εξαρτάται από
τον αριθμό των επιπέδων και τον αριθμό των μετρήσεων).
ii. Για τη μελέτη των καταλοίπων, θα πρέπει να ζητηθεί από το Minitab αυτά να αποθηκευτούν
(Storage) στο αρχείο με τα δεδομένα, ώστε στη συνέχεια να χρησιμοποιηθούν για να γίνει η
ανάλυσή τους. Από τη διαδρομή που ακολουθήθηκε για την ανάλυση διακύμανσης και στο Storage, ο Ερευνητής μπορεί να επιλέξει το είδος των καταλοίπων που επιθυμεί να χρησιμοποιήσει με
ΓΡΑΜΜΙΚΑ ΜΟΝΤΕΛΑ ΚΑΙ ΣΧΕΔΙΑΣΜΟΣ & ΑΝΑΛΥΣΗ ΠΕΙΡΑΜΑΤΩΝ ΜΕ ΕΦΑΡΜΟΓΕΣ ΣΕ R ΚΑΙ MINITAB
155
τις δύο συνηθέστερες επιλογές (Ενότητα 4.1) να είναι Residuals (τα συνηθισμένα κατάλοιπα)
και Standardized Residuals (τα τυποποιημένα κατάλοιπα στα οποία έχει αφαιρεθεί η μέση τους
τιμή - πάντα πολύ κοντά στο μηδέν (Θεώρημα 2.2) - και έχει γίνει διαίρεση με την τυπική τους
απόκλιση). Στην εφαρμογή επιλέχθηκαν τα κατάλοιπα και αποθηκεύτηκαν με το όνομα της μεταβλητής να είναι RESI.
Αν ο Ερευνητής επιθυμεί μόνο τη γραφική διερεύνηση των προϋποθέσεων της κανονικότητας,
ομοσκεδαστικότητας και ανεξαρτησίας μπορεί στην επιλογή Graphs να επιλέξει είτε από τα Individual Plots
– το Histogram of Residuals ή το Normal Probability Plot of Residuals ή και τα δύο για τη
διερεύνηση της Κανονικότητας,
– το Residuals versus Fit για τη διερεύνηση της Ομοσκεδαστικότητας και
– το Residuals versus Order για τη διερεύνηση της Ανεξαρτησίας/Τυχαιότητας
είτε να επιλέξει το γράφημα Four in One που σχεδιάζει και τα τέσσερα προηγούμενα γραφήματα
ταυτόχρονα. Όποια επιλογή και να κάνει ο Ερευνητής δεν θα του επιτρέψει να κάνει στατιστική
ανάλυση, αλλά μόνο μια οπτική αξιολόγηση των προϋποθέσεων.
Ειδικά για την περίπτωση της κανονικότητας και της ομοσκεδαστικότητας, συστήνεται η αξιοποίηση τεχνικών που επιτυγχάνουν ταυτόχρονα γραφική και στατιστική αξιολόγηση. Έτσι, ακολουθώντας τη διαδρομή:
Stat
Ê
Basic Statistics
Ê
Normality Test
και επιλέγοντας μία από τις τρεις επιλογές ελέγχων μεταξύ των:
– Anderson-Darling (ένας από τους δύο δημοφιλέστερους),
– Kolmogorov-Smirnov (ο έτερος δημοφιλής έλεγχος) και
– Shapiro-Wilk (ο λιγότερος δημοφιλής),
καταφέρνει να κατασκευάσει ταυτόχρονα τόσο το Normal Probability Plot for Residuals (το οποίο
κατασκευάζεται και με το Four in One γράφημα) όσο και τον στατιστικό έλεγχο της επιλογής
του (από τους τρεις προαναφερθέντες).
Το output περιλαμβάνει τον αριθμό των παρατηρήσεων (δηλώνεται με N ), τη μέση τιμή (πάντα
πάρα πολύ κοντά στο μηδέν) και την τυπική απόκλιση των καταλοίπων, καθώς και την τιμή της
στατιστικής ελεγχοσυνάρτησης με την αντίστοιχη p-value του ελέγχου. Tο αποτέλεσμα για την
παρούσα εφαρμογή οδηγεί στην αποδοχή της μηδενικής υπόθεσης της κανονικότητας, αφού
p-value = 0.686 (επιλέγοντας τον έλεγχο Anderson-Darling, AD):
156
ΑΝΑΛΥΣΗ ΔΙΑΚΥΜΑΝΣΗΣ ΚΑΤΑ ΕΝΑΝ ΠΑΡΑΓΟΝΤΑ
Σχήμα 7.4: Διερεύνηση Κανονικότητας - Σωλήνες Πίεσης
Αναφορικά με τη διερεύνηση της ομοσκεδαστικότητας η διαδρομή:
Stat
Ê
ANOVA
Ê
Test for Equal Variances
επιτρέπει τη γραφική και στατιστική αξιολόγηση όταν επιλέγουμε ως Response το Βάρος και
ως Factor την Ποιότητα. Αναφορικά με τα Options, θα πρέπει να τικαριστεί η επιλογή Use of
test based on the Normal Distribution, εφόσον έχει προηγουμένως επιβεβαιωθεί η κανονικότητα
των καταλοίπων. Διαφορετικά δεν τικάρεται η συγκεκριμένη επιλογή. Στην πρώτη περίπτωση,
εκτελείται ο έλεγχος Bartlett, ενώ στη δεύτερη ο έλεγχος Levene. Για τις διασπορές στα k επίπεδα του παράγοντα ενδιαφέροντος κατασκευάζονται και διαστήματα εμπιστοσύνης, σε όποιο
επίπεδο εμπιστοσύνης επιθυμεί ο Ερευνητής (η προτίμησή του καταχωρίζεται στο Confidence
Level στα Options).
Το αποτέλεσμα για την εφαρμογή φαίνεται στη συνέχεια. Όπως διαπιστώνεται, η τιμή της ελεγχοσυνάρτησης καταχωρίζεται ανεξάρτητα από το γράφημα (σε αντίθεση με την κανονικότητα
όπου η τιμή της ελεγχοσυνάρτησης είναι ενσωματωμένη στο γράφημα):
Πίνακας 7.12: Διερεύνηση Ομοσκεδαστικότητας - Σωλήνες Πίεσης
ΓΡΑΜΜΙΚΑ ΜΟΝΤΕΛΑ ΚΑΙ ΣΧΕΔΙΑΣΜΟΣ & ΑΝΑΛΥΣΗ ΠΕΙΡΑΜΑΤΩΝ ΜΕ ΕΦΑΡΜΟΓΕΣ ΣΕ R ΚΑΙ MINITAB
157
Σχήμα 7.5: Διερεύνηση Ομοσκεδαστικότητας - Σωλήνες Πίεσης
Για την περίπτωση της ανεξαρτησίας δεν διατίθεται διαδικασία για ταυτόχρονη γραφική και στατιστική διερεύνηση. Έτσι, στη συνέχεια δίνεται καταρχάς η γραφική ανάλυση με το Individual
Plot Residuals versus Order που αναφέρθηκε πιο πάνω:
Σχήμα 7.6: Γραφική Διερεύνηση Ανεξαρτησίας - Σωλήνες Πίεσης
ενώ για τη στατιστική ανάλυση εφαρμόζεται το μη παραμετρικό Runs Test (Έλεγχος των Ροών),
ακολουθώντας τη διαδρομή:
Stat
Ê
Nonparametrics
Ê
Runs Test
όπου είναι προεπιλεγμένη η επιλογή Above and Below the Mean, αφού αυτή είναι η συνήθης περίπτωση που εξετάζεται ώστε να διαπιστωθεί η ανεξαρτησία (ή τυχαιότητα), ελέγχοντας πόσες
παρατηρήσεις είναι πάνω και πόσες κάτω από το κέντρο (μέσο). Τα αποτελέσματα του Minitab
δείχνουν ότι η υπόθεση της ανεξαρτησίας γίνεται δεκτή, αφού p-value = 0.210:
158
ΑΝΑΛΥΣΗ ΔΙΑΚΥΜΑΝΣΗΣ ΚΑΤΑ ΕΝΑΝ ΠΑΡΑΓΟΝΤΑ
Πίνακας 7.13: Στατιστική Διερεύνηση Ανεξαρτησίας - Σωλήνες Πίεσης
Για τη διερεύνηση της ανεξαρτησίας ελήφθη υπόψη η χρονική σειρά των μετρήσεων, με τις μετρήσεις του επιπέδου (1) να συλλέχθηκαν στις χρονικές στιγμές 2, 5, 19, 23, 14 και 8. Οι αντίστοιχες χρονικές στιγμές για τις μετρήσεις των επιπέδων 2, 3 και 4 είναι 1, 3, 11, 21, 13 και 12
(επίπεδο 2), 4, 9, 17, 20, 22 και 24 (επίπεδο 3) και 15, 6, 16, 18, 10 και 7 (επίπεδο 4).
iii. Η ανάλυση διακύμανσης μπορεί να συνοδευτεί και από μια ανάλυση μέσων που θεωρείται ως
μια γραφική μέθοδος, με την έννοια ότι παρουσιάζει συγκριτικά τους μέσους των επιπέδων του
παράγοντα ενδιαφέροντος για συγκεκριμένο επίπεδο σημαντικότητας, χωρίς να δίνει μια γενικότερη εικόνα με βάση την p-value. Έτσι, αν κάποιος θέλει να εξετάσει διάφορα επίπεδα για να
εντοπίσει για ποιο επίπεδο θα έχει συγκεκριμένες διαφορές, θα πρέπει να επαναλαμβάνει τη διαδικασία ελπίζοντας να πετύχει το κομβικό εκείνο επίπεδο που προσδοκά. Η γραφική μέθοδος
ανάλυσης των μέσων επιτυγχάνεται ακολουθώντας τη διαδικασία:
Stat
Ê
ANOVA
Ê
Analysis of Means
επιλέγοντας τη μεταβλητή απόκρισης στα Responses, κλικάρωντας το Normal για το Distribution of Data και τον παράγοντα ενδιαφέροντος στο Factor 1. Επίσης, στο Aplha level μπορεί ο
Ερευνητής να καταχωρίσει το επιθυμητό επίπεδο σημαντικότητας και στο Title να δώσει έναν
τίτλο της επιλογής του, για το γράφημα που θα προκύψει. Η μέθοδος χαρακτηρίζεται από τρεις
γραμμές που αντιπροσωπεύουν το κέντρο (μέσον) και το άνω και κάτω όριο. ’Οσοι μέσοι βρίσκονται πάνω από το άνω όριο ή κάτω από το κάτω όριο θεωρούνται ότι διαφέρουν για το συγκεκριμένο επίπεδο σημαντικότητας που έχει επιλεγεί. Για την εφαρμογή διαπιστώνεται ότι οι μέσοι
των επιπέδων 1 και 2 βρίσκονται πάνω από το άνω όριο, ενώ ο μέσος του επιπέδου 4 βρίσκεται
κάτω από το κάτω όριο:
ΓΡΑΜΜΙΚΑ ΜΟΝΤΕΛΑ ΚΑΙ ΣΧΕΔΙΑΣΜΟΣ & ΑΝΑΛΥΣΗ ΠΕΙΡΑΜΑΤΩΝ ΜΕ ΕΦΑΡΜΟΓΕΣ ΣΕ R ΚΑΙ MINITAB
159
Σχήμα 7.7: Ανάλυση Μέσων, α = 5% - Σωλήνες Πίεσης
Από το γράφημα, είναι σαφές ότι αν μειωθεί ελάχιστα το επίπεδο σημαντικότητας (δηλαδή αν
διευρυνθούν έστω και ελάχιστα τα άνω και κάτω όρια), ενδεχομένως κοντά στο 4% (κατ’ ακρίβεια είναι 3.6% όπως μπορεί να διαπιστωθεί μετά από μερικές δοκιμές), τότε ο μέσος του επιπέδου 2 (που γνωρίζουμε από την ανάλυση διακύμανσης ότι ισούται με 175) θα βρεθεί εντός των
ορίων και δεν θα διαφέρει στατιστικώς σημαντικά πλέον.
iv. Κλείνοντας θα σχολιαστεί η περίπτωση όπου τα τέσσερα επίπεδα του παράγοντα ενδιαφέροντος δεν είναι τα μοναδικά, αλλά αποτελούν δείγμα που έχει επιλεχθεί τυχαία από έναν μεγάλο
αριθμό ποιοτήτων που είναι διαθέσιμες στο εμπόριο. Το πρόβλημα διαφοροποιείται ως προς τη
φιλοσοφία του, αφού τώρα πρόκειται για πρότυπο τυχαίων επιδράσεων όπου οι όροι αi αποτελούν τυχαίες μεταβλητές ανεξάρτητες από τα σφάλματα, και τέτοιες ώστε:
αi ∼ N 0, σα2 .
Έτσι, δεν εξετάζεται η μέση τιμή αλλά η διασπορά (μεταβλητότητα) και ο έλεγχος που θα πρέπει
να εξεταστεί είναι αυτός που δίνεται στη σχέση (8.31):
H0 : σα2 = 0
vs
H1 : σα2 > 0.
Εάν η μηδενική υπόθεση γίνει δεκτή, και άρα σα2 = 0, τότε κάθε επίδραση αi δεν είναι πλέον
τυχαία μεταβλητή, αφού τόσο η μέση της τιμή όσο και η διασπορά της θα ισούται με το μηδέν
και κατά συνέπεια, δεν θα υπάρχει επίδραση στη μεταβλητή απόκρισης από τα επίπεδα του παράγοντα ενδιαφέροντος.
Ο Πίνακας ANOVA ταυτίζεται με τον πίνακα για την περίπτωση σταθερών επιδράσεων, με την
ελεγχοσυνάρτηση να δίνεται και πάλι από τον ίδιο τύπο (7.15):
F =
M ST
.
M SE
Αφού λοιπόν η p-value του ελέγχου βρέθηκε προηγουμένως ίση με 0.000023, άρα η μηδενική υπόθεση απορρίπτεται (σε όλα τα συνήθη επίπεδα σημαντικότητας) και άρα καταλήγουμε
στο ότι σα2 > 0. Συμπερασματικά, υπάρχει διαφοροποίηση ως προς τη μεταβλητότητα μεταξύ
160
ΑΝΑΛΥΣΗ ΔΙΑΚΥΜΑΝΣΗΣ ΚΑΤΑ ΕΝΑΝ ΠΑΡΑΓΟΝΤΑ
των τεσσάρων επιπέδων του παράγοντα ενδιαφέροντος και μπορούμε λόγω του ότι τα τέσσερα
επίπεδα επιλέχθηκαν τυχαία, να γενικεύσουμε το συμπέρασμα για οποιοδήποτε επίπεδο του παράγοντα (και όχι μόνο αυτών που μελετήθηκαν).
Υπενθυμίζεται ότι αν και φαινομενικά η μελέτη είναι ίδια είτε οι επιδράσεις είναι σταθερές είτε
τυχαίες, ο μηχανισμός με τον οποίο λειτουργούν οι δύο περιπτώσεις είναι διαφορετικός. Στην
περίπτωση των σταθερών επιδράσεων εξετάζουμε κατά πόσο οι μέσες τιμές των πληθυσμών
(επιπέδων/θεραπειών) είναι ίσες ή όχι (ενώ η μεταβλητότητα μεταξύ των πληθυσμών είναι σταθερή και ίση με σ 2 ), ενώ στην περίπτωση των τυχαίων επιδράσεων ισχύει το αντίστροφο, δηλαδή
οι μέσες τιμές είναι ίσες μεταξύ των πληθυσμών (επιπέδων), και εξετάζεται αν η μεταβλητότητα
είναι σταθερή (και ίση με σ 2 ) ή μεταβάλλεται εξαιτίας των επιπέδων (ίση με σ 2 +σα2 ). Θα πρέπει
μάλιστα να αναφερθεί ότι η ομοιότητα στην ανάλυση οφείλεται στο γεγονός ότι στη διαδικασία
εμπλέκεται ένας μόνο παράγοντας. Όταν στην ανάλυση εμπλακούν κι άλλοι παράγοντες (βλ.
Κεφάλαιο 9), και ιδιαιτέρως όταν η αλληλεπίδραση κάποιων παραγόντων επηρεάζει τη μεταβλητή απόκρισης, η μελέτη, όπως θα διαπιστωθεί, διαφοροποιείται σημαντικά.
7.8 Σχόλια και χρήσιμες σημειώσεις
Στην ενότητα αυτή παρατίθενται, για διευκόλυνση του αναγνώστη, χρήσιμες σημειώσεις και σχόλια αναφορικά με το Minitab και την R για τα θέματα που μελετά το παρόν Κεφάλαιο.
7.8.1 Σχόλια και χρήσιμες σημειώσεις - Minitab
• Για την Ανάλυση Διακύμανσης κατά έναν παράγοντα ο Ερευνητής μπορεί να επιλέξει εναλλακτικά τη
διαδρομή:
Stat
Ê
ANOVA
Ê
One way
για τη δημιουργία του Πίνακα ANOVA όπου έχει τη δυνατότητα να τικάρει στα Options την επιλογή
Assume Equal Variances ή όχι, στα Comparisons την επιθυμητή μέθοδο πολλαπλών συγκρίσεων, στο
Storage να επιλεχτούν τα Residuals (μόνο τα συνήθη είναι διαθέσιμα) ή/και οι εκτιμώμενες τιμές (Fits)
και στα Graphs το επιθυμητό εξατομικευμένο γράφημα (Individual Plot) ή το πολλαπλό γράφημα
(Four in One) για τη διερεύνηση των προϋποθέσεων του προτύπου.
• Για τον επιθυμητό αριθμό δεκαδικών ψηφίων στο output o Ερευνητής επιλέγει δεξί click στο output
που τον ενδιαφέρει και επιλέγει τον επιθυμητό αριθμό Decimal Points. Με τον ίδιο τρόπο μπορεί να
κάνει Εκτύπωση (Print), Αντιγραφή (Copy), Αποστολή (Send) κλπ.
• Για την εκτέλεση της διαδρομής για τις πολλαπλές συγκρίσεις:
Stat
Ê
ANOVA
Ê
General Linear Model
Ê
Comparisons
Ê
Tukey
απαιτείται προηγουμένως να έχει γίνει η ανάλυση διακύμανσης κατά έναν παράγοντα, δηλαδή να έχει
προηγηθεί η διενέργεια της διαδρομής:
Stat
Ê
ANOVA
Ê
General Linear Model
Ê
Fit General Linear Model
ΓΡΑΜΜΙΚΑ ΜΟΝΤΕΛΑ ΚΑΙ ΣΧΕΔΙΑΣΜΟΣ & ΑΝΑΛΥΣΗ ΠΕΙΡΑΜΑΤΩΝ ΜΕ ΕΦΑΡΜΟΓΕΣ ΣΕ R ΚΑΙ MINITAB
161
• Το ίδιο απαιτείται και για την εκτέλεση της διαδρομής για τις πολλαπλές συγκρίσεις Dunnett:
Stat
Ê
Ê
ANOVA
General Linear Model
Ê
Comparisons
Ê
Dunnett
• Η διερεύνηση της ομοσκεδαστικότητας είναι δυνατόν να γίνει ακόμα και αν τα δεδομένα έχουν καταχωριστεί σε k διαφορετικές στήλες, ανάλογα με το επίπεδο στο οποίο αντιστοιχούν οι μετρήσεις (μία
στήλη για κάθε επίπεδο). Στην περίπτωση αυτή, κατά τη διεκπεραίωση της διαδικασίας:
Stat
Ê
ANOVA
Ê
Test for Equal Variances
θα πρέπει αντί της προεπιλεγμένης επιλογής Response Data are in One Column for all Factor Levels να
κλικαριστεί η επιλογή Response Data are in a Separate Column for Each Factor Level.
• Για τη διερεύνηση της ανεξαρτησίας είναι απαραίτητο να είναι γνωστή η χρονική σειρά των μετρήσεων, αφού με βάση αυτήν διαπιστώνεται η τυχαιότητα (και άρα η ανεξαρτησία). Αν η χρονική σειρά
των μετρήσεων είναι γνωστή (είτε καταγράφεται είτε όχι στο αρχείο δεδομένων), τότε τα δεδομένα θα
πρέπει να αναδιαταχτούν σε αύξουσα χρονική σειρά, πριν τη γραφική και τη στατιστική διερεύνηση
της ανεξαρτησίας. Αυτό είναι δυνατόν να γίνει ακολουθώντας τη διαδικασία:
Data
Ê
Short
επιλέγοντας στα Columns to Short by τη στήλη που αντιπροσωπεύει τη χρονική σειρά. Για την αποφυγή προβλημάτων συστήνεται η επιλογή All Columns στο Columns to Short.
Αν δεν είναι γνωστή η χρονική σειρά, ο Ερευνητής θα πρέπει να αποφασίσει πώς θα προχωρήσει στη
μελέτη. Μια συνήθης πρακτική, ελλείψει άλλης πληροφορίας, είναι να θεωρήσει ότι οι μετρήσεις έγιναν με τη σειρά που έχουν καταχωριστεί στο αρχείο δεδομένων. Στην περίπτωση αυτή, δεν χρειάζεται
να αναδιαταχτούν τα δεδομένα.
• Για μια πρώτη οπτική αξιολόγηση εκτός από το διάγραμμα κουκκίδων, ο Ερευνητής μπορεί να ζητήσει
την κατασκευή του Boxplot μέσω της διαδικασίας:
Graphs
Ê
BoxPlot
Ê
With Groups
7.8.2 Σχόλια και χρήσιμες σημειώσεις - R
Στον Πίνακα 7.14 δίνεται πληθώρα χρήσιμων εντολών για την εφαρμογή της Ανάλυσης Διακύμανσης κατά
έναν Παράγοντα στην R.
162
ΑΝΑΛΥΣΗ ΔΙΑΚΥΜΑΝΣΗΣ ΚΑΤΑ ΕΝΑΝ ΠΑΡΑΓΟΝΤΑ
Πίνακας 7.14: One-way ANOVA - Χρήσιμες εντολές στην R
Πακέτο
Εντολή (Όρισμα)
Χρησιμότητα
base
as.factor(Παράγοντας)
Μετατροπή μεταβλητής σε παράγοντα
graphics
boxplot(Απόκριση∼Παράγοντας)
Κατασκευή θηκογράμματος
stats
aov(Απόκριση∼Παράγοντας)
Κατασκευή μοντέλου ANOVA (fixed effects)
stats
aov(Απόκριση∼ Error(Παράγοντας))
Κατασκευή μοντέλου ANOVA (random effects)
stats
TukeyHSD(ANOVA μοντέλο μέσω
aov)
Κατασκευή Tukey διαστημάτων εμπιστοσύνης
DescTools
DunnettTest(Απόκριση, Παράγοντας)
Κατασκευή Dunnett διαστημάτων εμπιστοσύνης
stats
shapiro.test(Κατάλοιπα μοντέλου μέσω aov)
Εφαρμογή ελέγχου κανονικότητας Shapiro-Wilk
stats
bartlett.test(Κατάλοιπα μοντέλου μέσω aov, Παράγοντας)
Έλεγχος ίσων διακυμάνσεων κατά Bartlett
multcomp
glht(Μοντέλο μέσω aov, mcp(Παράγοντας=''GrandMean''))
Μετατροπή μοντέλου σε glht
ANOM
ANOM(Μοντέλο μέσω glht)
Εφαρμογή ανάλυσης μέσων
DescTools
RunsTest(Κατάλοιπα μοντέλου μέσω aov)
Εφαρμογή ελέγχου συσχέτισης
7.9 Άλυτες ασκήσεις
1. Για καθένα από τα σύνολα δεδομένων των Πινάκων 7.15-7.21, ζητούνται τα ακόλουθα:
i. Nα διερευνηθεί αν η μέση τιμή διαφέρει μεταξύ των επιπέδων του εμπλεκόμενου παράγοντα ο
οποίος θεωρείται ότι είναι σταθερών επιδράσεων, και να εντοπιστεί εκείνο το επίπεδο (ή τα επίπεδα) που κάνουν τη διαφορά.
ii. Να γίνει ανάλυση καταλοίπων ώστε να διαπιστωθεί αν πληρούνται οι προϋποθέσεις του προτύπου που θα χρησιμοποιηθεί.
iii. Να γίνει μια γραφικού τύπου ανάλυση ώστε να διαπιστωθεί αν η γραφική μέθοδος συμφωνεί με
τη στατιστική μέθοδο.
iv. Να επαναληφθεί η ανάλυση για την περίπτωση, όπου τα επίπεδα του εμπλεκόμενου παράγοντα
δεν είναι τα μοναδικά αλλά αποτελούν τυχαίο δείγμα που έχει επιλεχτεί από έναν μεγάλο αριθμό
διαθέσιμων επιπέδων.
Πίνακας 7.15: Σύνολο Δεδομένων 1 - Παράγοντας A
Επίπεδο 1
1.25, 1.30, 1.27, 1.32, 1.23
Επίπεδο 2
1.31, 1.32, 1.33, 1.25, 1.30
Επίπεδο 3
1.28, 1.29, 1.38, 1.32, 1.31
Επίπεδο 4
1.25, 1.36, 1.29, 1.38, 1.33
ΓΡΑΜΜΙΚΑ ΜΟΝΤΕΛΑ ΚΑΙ ΣΧΕΔΙΑΣΜΟΣ & ΑΝΑΛΥΣΗ ΠΕΙΡΑΜΑΤΩΝ ΜΕ ΕΦΑΡΜΟΓΕΣ ΣΕ R ΚΑΙ MINITAB
Πίνακας 7.16: Σύνολο Δεδομένων 2 - Παράγοντας B
Επίπεδο 1
11.4, 11.8, 12.2, 11.3, 11.6
Επίπεδο 2
11.1, 11.2, 11.5, 11.6
Επίπεδο 3
10.0, 10.2, 10.4
Επίπεδο 4
10.1, 9.8, 9.9, 9.7, 10.2, 10.3
Πίνακας 7.17: Σύνολο Δεδομένων 3 - Παράγοντας C
Επίπεδο 1
2, 3, 4, 5, 5, 5
Επίπεδο 2
2, 3, 4, 5, 4, 4
Επίπεδο 3
1, 2, 3, 4, 4, 3
Επίπεδο 4
1, 1, 1, 2, 2, 3
Πίνακας 7.18: Σύνολο Δεδομένων 4 - Παράγοντας D
Επίπεδο 1
19, 18, 21, 18
Επίπεδο 2
16, 11, 13, 14, 11
Επίπεδο 3
13, 11, 11, 15, 18, 16
Πίνακας 7.19: Σύνολο Δεδομένων 5 - Παράγοντας E
Επίπεδο 1
24.8, 24.7, 27.9, 28.0, 28.7, 34.8, 30.9
Επίπεδο 2
22.0, 30.5, 30.7, 24.7, 28.6, 28.8, 26.7, 22.6, 34.8
Επίπεδο 3
24.8, 30.5, 30.9, 22.5, 37.6, 28.6, 28.7, 28.8, 24.0, 33.6
Επίπεδο 4
27.8, 28.9, 30.4, 30.7, 32.7, 30.8, 30.5, 34.5, 32.8, 28.6, 38.8, 31.7
Επίπεδο 5
20.8, 22.9, 17.8, 23.6, 18.9, 28.5, 16.3, 24.7, 25.4, 25.1, 20.9
Πίνακας 7.20: Σύνολο Δεδομένων 6 - Παράγοντας F
Επίπεδο 1
14.2, 14.2, 14.3, 14.4
Επίπεδο 2
14.1, 14.1, 14.0, 14.0
Επίπεδο 3
14.2, 14.4, 14.3, 14.3
Επίπεδο 4
14.2, 13.8, 13.9, 14.1
Επίπεδο 5
13.8, 13.8, 13.9, 13.6
163
164
ΑΝΑΛΥΣΗ ΔΙΑΚΥΜΑΝΣΗΣ ΚΑΤΑ ΕΝΑΝ ΠΑΡΑΓΟΝΤΑ
Πίνακας 7.21: Σύνολο Δεδομένων 7 - Παράγοντας G
Επίπεδο 1
93, 111, 98, 114, 118, 106, 107, 108, 120, 125, 114, 96
Επίπεδο 2
121, 127, 129, 138, 134, 134, 130, 126, 147, 135
Επίπεδο 3
106, 102, 110, 108, 108, 109, 104, 108
ΒΙΒΛΙΟΓΡΑΦΙΑ
[1] Βόντα, Φ., & Καραγρηγορίου, Α. (2012). Εφαρμοσμένη στατιστική ανάλυση & στοιχεία πιθανοτήτων.
Αθήνα: Εκδόσεις Παρασκήνιο.
[2] Δαμιανού, Χ., & Κούτρας, Μ. (1998). Εισαγωγή στη στατιστική, Μέρος ΙΙ. Αθήνα: Εκδόσεις Συμμετρία.
[3] Καλαματιανού, Α. Γ. (1997). Εφαρμοσμένη ανάλυση παλινδρόμησης. Αθήνα: Εκδόσεις Παπαζήσης.
[4] Καρώνη, Χ., & Οικονόμου, Π. (2017). Στατιστικά μοντέλα παλινδρόμησης: Με χρήση M initab και R
(2η έκδ.). Αθήνα: Συμεών.
[5] Κουτρουβέλης, Ι. Α. (2015). Εφαρμοσμένες πιθανότητες και στατιστική για μηχανικούς και θετικούς επιστήμονες. Αθήνα: Εκδόσεις Gotsis.
[6] Κουτρουβέλης, Ι. Α. (2000). Προηγμένα εργαλεία και μέθοδοι για τον έλεγχο της ποιότητας, Τόμος Β,
Σχεδιασμός και Ανάλυση Πειραμάτων. Πάτρα: Ελληνικό Ανοικτό Πανεπιστήμιο.
[7] Κολυβά-Μαχαίρα, Φ., & Μπόρα-Σέντα, Ε. (1995). Στατιστική, θεωρία και εφαρμογές. Θεσσαλονίκη:
Εκδόσεις Ζήτη.
[8] Κουνιάς, Σ., Κολυβά-Μαχαίρα, Φ., Μπαγιάτης, Γ., & Μπόρα-Σέντα, Ε. (1985). Εισαγωγή στη στατιστική. Θεσσαλονίκη: Εκτύπωση Γιαχούδη-Γιαπούλη Ο.Ε.
[9] Κούτρας Μ. Β., & Ευαγγελάρας, Χ. (2010). Ανάλυση παλινδρόμησης, θεωρία και εφαρμογές. Αθήνα:
Εκδόσεις Σταμούλη Α. Ε.
[10] Μπόρα-Σέντα, Ε., & Μωυσιάδης, Χ. (1990). Εφαρμοσμένη στατιστική, Θεσσαλονίκη: Εκδόσεις Ζήτη.
[11] Παπαδόπουλος, Γ. Κ. (2015). Εισαγωγή στις πιθανότητες και τη στατιστική. Αθήνα: Εκδόσεις Gutenberg.
[12] Παπαϊωάννου, Τ., & Λουκάς, Σ. (2002). Εισαγωγή στη στατιστική. Αθήνα: Εκδόσεις Σταμούλη Α. Ε.
[13] Φερεντίνος, Κ., Ζωγράφος, Κ., & Παπαϊωάννου, Τ. (2020). Εκτιμητική και έλεγχος υποθέσεων. Αθήνα:
Εκδόσεις Σταμούλη Α. Ε.
166
ΒΙΒΛΙΟΓΡΑΦΙΑ
[14] Brown, M.B., & Forsythe, A. B. (1974). Robust tests for the equality of variances. Journal of the
American Statistical Association, 69, 364-367.
[15] Draper, R.D., & Smith, H. (1998). Applied regression analysis (3rd ed.). Wiley-Interscience.
[16] Dunnett, C.W. (1955). A multiple comparison procedure for comparing several treatments with a
control. Journal of the American Statistical Association, 50, 1096–1121.
[17] Dunnett, C.W. (1964). New tables for multiple comparisons with a control. Biometrics, 20, 482–491.
[18] Field, A. (2021). Μία περιπέτεια στη στατιστική (Ε. Γάκη, Χ. Παρπούλα & Η. Σαντουρίδης, Επιμ.).
Αθήνα: Εκδόσεις Προπομπός.
[19] Field, A., Miles, J., & Field, Z. (2012). Discovering statistics using R (1st ed.). Sage Ltd.
[20] Fisher, R.A. (1935). Design of experiments. London: Oliver & Boyd.
[21] Galton, F. (1886). Regression towards mediocrity in hereditary stature. The Journal of the Anthropological Institute of Great Britain and Ireland, 15, 246-263.
[22] Hicks, C.R. (1997). Fundamental concepts in the design of experiments (4th ed.). John Wiley and Sons.
[23] Levene, H. (1960). Robust tests for equality of variances, In I. Olkin et al. (Eds)Contributions to
probability and statistics: essays in honor of Harold Hotelling. Stanford University Press, 278-292.
[24] Nelson, L.S. (1983). Exact critical values for use for the analysis of means. Journal of Quality Technology, 15, 40-44.
[25] Snedecor, G.W., & Cochran, W. G. (1989). Statistical Methods (8th ed.). Iowa State University Press.
[26] Tukey, J. (1949). Comparing individual means in the analysis of variance. Biometrics, 5(2), 99–114.
[27] Wald, A., & Wolfowitz, J. (1940). On a test whether two samples are from the same population.
Annals of Mathematical Statistics, 11(2), 147-162.
[28] Wackerly, D.D., Mendenhall, W., & Scheaffer, R.L. (2008). Mathematical statistics with applications
(7th ed.). Belmont, California: Duxbury, Thompson Learning Inc.
ΚΕΦΑΛΑΙΟ 8
ΣΧΕΔΙΑΣΜΟΣ ΠΕΙΡΑΜΑΤΩΝ
Σύνοψη
Το παρόν κεφάλαιο παρουσιάζει τα πειράματα με έναν παράγοντα ενδιαφέροντος, ομαδοποιημένα ως προς μία ή δύο μεταβλητές πλαισίου.
Προαπαιτούμενη γνώση
Το κεφάλαιο προϋποθέτει τη γνώση και την κατανόηση των προηγουμένων κεφαλαίων.
Προσδοκώμενα μαθησιακά αποτελέσματα
Μετά τη μελέτη του παρόντος κεφαλαίου ο αναγνώστης αναμένεται να:
• αναγνωρίζει πειράματα με έναν παράγοντα ενδιαφέροντος, σε ομάδες,
• να χρησιμοποιεί τη μονοπαραγοντική ανάλυση διακύμανσης σε σχέδια τυχαιοποιημένων πλήρων ομάδων ή λατινικών τετραγώνων,
• χρησιμοποιεί τεχνικές σχεδιασμού πειραμάτων, και ειδικότερα της διπαραγοντικής ανάλυσης
διακύμανσης, σε πειράματα δύο παραγόντων, προκειμένου να μελετά τόσο τις κύριες επιδράσεις
των παραγόντων ενδιαφέροντος όσο και την αλληλεπίδρασή τους,
• διακρίνει το είδος των επιδράσεων των εμπλεκόμενων μεταβλητών, και να επιλέγει και προσαρμόζει το κατάλληλο κατά περίπτωση πρότυπο, συμπεριλαμβανομένου και του μεικτού,
• να εφαρμόζει τη διπαραγοντική ανάλυση διακύμανσης με τη χρήση στατιστικών πακέτων.
Καραγρηγορίου, Α., & Καλλιγέρης, Ε. Ν. (�2023). «Γραμμικά Μοντέλα και Σχεδιασμός & Ανάλυση Πειραμάτων με Εφαρμογές
σε R και Minitab».
Αθήνα: Κάλλιπος, Ανοικτές Ακαδημαϊκές Εκδόσεις. http://dx.doi.org/10.57713/kallipos-70
Creative Commons Αναφορά Δημιουργού - Μη Εμπορική Χρήση - Παρόμοια Διανομή 4.0
168
ΣΧΕΔΙΑΣΜΟΣ ΠΕΙΡΑΜΑΤΩΝ
8.1 Εισαγωγή
Στον πειραματικό σχεδιασμό, ο βασικός στόχος είναι ο περιορισμός της μεταβλητότητας, ιδιαιτέρως όταν
αυτή οφείλεται σε παράγοντες που δεν ενδιαφέρουν τον Ερευνητή. Είναι συχνό το φαινόμενο σε μία διεργασία να επιδρά εκ κατασκευής, εκ φύσεως ή και αναγκαστικά, κάποια μεταβλητή. Για παράδειγμα, αν ο Ερευνητής επιθυμεί να αξιολογήσει την κατανάλωση δύο διαφορετικών τύπων βενζίνης (π.χ. 95 και 100 οκτανίων), αν χρησιμοποιήσει αυτοκίνητα διαφορετικών κατασκευαστών ή διαφορετικού κυβισμού αυτή η διαφορετικότητα, αν δεν την λάβει υπόψη του, μάλλον θα επηρεάσει τα αποτελέσματά του και θα οδηγηθεί σε
παραπλανητικά συμπεράσματα ως προς την αξιολόγηση των δύο διαθέσιμων ειδών βενζίνης. Ένας τρόπος να
αντιμετωπιστεί ένα τέτοιο ενδεχόμενο είναι να χρησιμοποιηθεί ακριβώς ο ίδιος τύπος αυτοκινήτου (κοινός
κατασκευαστής και ίδιος κυβισμός). Ένας εναλλακτικός τρόπος είναι να χρησιμοποιηθούν πολλοί διαφορετικοί τύποι αλλά να γίνουν μετρήσεις κατανάλωσης για καθέναν από τους δύο τύπους βενζίνης σε καθέναν από
τους διαφορετικούς τύπους αυτοκινήτων.
Στις περιπτώσεις αυτές η μεταβλητή που υπεισέρχεται στη διεργασία, χωρίς να είναι του άμεσου ενδιαφέροντος του Ερευνητή (όπως ο τύπος του αυτοκινήτου), ονομάζεται μεταβλητή πλαισίου ή εξωγενής παράγοντας ή ομάδα ή block. Το πρόβλημα με τον τρόπο αυτό κάνει ξεκάθαρη την επίδραση του κάθε τύπου βενζίνης
στην κατανάλωση. Πράγματι, από τη στιγμή που κάθε αυτοκίνητο δίνει μέτρηση της κατανάλωσης και για
τον έναν και για τον άλλο τύπο βενζίνης, η όποια επίδραση του τύπου αυτοκινήτου στην κατανάλωση αποτυπώνεται ανεξάρτητα από την επίδραση του κάθε τύπου βενζίνης, και κατ΄ αυτόν τον τρόπο απομονώνεται.
Είναι εύκολο να διαπιστώσει κανείς ότι το συγκεκριμένο σχέδιο είναι γνωστό από τη Στατιστική Συμπερασματολογία. Πράγματι, αν θεωρηθεί ότι οι δύο τύποι βενζίνης είναι δύο διαφορετικοί πληθυσμοί που πρέπει
να μελετηθούν, τότε η μελέτη μπορεί να γίνει χρησιμοποιώντας δειγματοληψία σε ζεύγη όπου ο ίδιος τύπος
αυτοκινήτου θα χρησιμοποιηθεί τη μία φορά με τον έναν τύπο βενζίνης, και μία δεύτερη, με τον άλλο τύπο
βενζίνης. Οι δύο μετρήσεις θα αποτελούν μετρήσεις σε ζεύγη, αφού στην πράξη η ίδια δειγματική μονάδα (το
ίδιο αυτοκίνητο) χρησιμοποιείται και για τους δύο τύπους βενζίνης. Άρα, ο συγκεκριμένος σχεδιασμός αντιστοιχεί στη δειγματοληψία σε ζεύγη για τη σύγκριση πληθυσμών. Το συγκεκριμένο σχέδιο που αναφέρεται
και ως Τυχαιοποιημένος Τμηματικός Σχεδιασμός, μπορεί να γενικευτεί για έναν παράγοντα με k επίπεδα και μία
μεταβλητή πλαισίου (ομάδα, block) με b επίπεδα. Ο σχεδιασμός αυτός επιτρέπει τη μελέτη τόσο σταθερών
όσο και τυχαίων επιδράσεων.
Μία περαιτέρω γενίκευση προκύπτει όταν υπάρχουν δύο μεταβλητές πλαισίου αντί για μία. Για παράδειγμα,
στο παραπάνω πρόβλημα, πέρα από τον τύπο αυτοκινήτου θα μπορούσε να επιδρά και ο βαθμός εμπειρίας
του οδηγού. Στην περίπτωση αυτή, και εφόσον ο αριθμός επιπέδων τόσο του παράγοντα ενδιαφέροντος όσο
και της καθεμίας από τις δύο μεταβλητές πλαισίου είναι ίδιος, το πρόβλημα μπορεί να αντιμετωπιστεί με το
σχέδιο Λατινικών Τετραγώνων ( Latin Squares) το οποίο είναι ένας ειδικός σχεδιασμός με περιορισμένο (αλλά
κατάλληλα επιλεγμένο) αριθμό μετρήσεων που εξασφαλίζει την αξιοπιστία των τελικών πορισμάτων. Στην
ενότητα αυτή θα μελετηθούν όλοι οι πιο πάνω σχεδιασμοί.
Το πιο πάνω πρόβλημα θα μπορούσε να θεωρηθεί ως ένα πρόβλημα δύο (ή τριών αν έχουμε δύο μεταβλητές πλαισίου) παραγόντων, αλλά αυτό δεν είναι ακριβές, αφού ο Ερευνητής ενδιαφέρεται μόνο για έναν παράγοντα (τον τύπο βενζίνης) ενώ ο δεύτερος (ή και ο τρίτος) δεν τον ενδιαφέρει. Ο λόγος που επιλέγει να
τον συμπεριλάβει στη μελέτη είναι γιατί γνωρίζει ότι επηρεάζει τη διεργασία και με το να τον συμπεριλάβει, καταφέρνει να τον απομονώσει (να τον αδρανοποιήσει, να τον εξουδετερώσει) ώστε να μπορεί να εξάγει
ακριβή συμπεράσματα για εκείνον τον παράγοντα που πραγματικά θέλει να μελετήσει. Στην περίπτωση που
υπάρχουν δύο παράγοντες ενδιαφέροντος είτε με είτε χωρίς μεταβλητές πλαισίου, ο σχεδιασμός αφορά τη
Διπαραγοντική Ανάλυση Διακύμανσης, η οποία επίσης θα μελετηθεί στο παρόν Κεφάλαιο.
ΓΡΑΜΜΙΚΑ ΜΟΝΤΕΛΑ ΚΑΙ ΣΧΕΔΙΑΣΜΟΣ & ΑΝΑΛΥΣΗ ΠΕΙΡΑΜΑΤΩΝ ΜΕ ΕΦΑΡΜΟΓΕΣ ΣΕ R ΚΑΙ MINITAB
169
8.2 Σχέδιο τυχαιοποιημένων πλήρων ομάδων (μεταβλητές πλαισίου)
Έστω ότι ενδιαφερόμαστε να μελετήσουμε κατά πόσο διαφέρουν k πληθυσμοί/θεραπείες (δηλαδή κατά πόσο
είναι ίσοι ή όχι οι μέσοι των k επιπέδων/πληθυσμών του παράγοντα ενδιαφέροντος) στην παρουσία ενός
εξωγενούς παράγοντα (ομάδα, μεταβλητή πλαισίου, block). Ο Τυχαιοποιημένος Τμηματικός Σχεδιασμός (
Randomized Block Design) που θα περιγράψουμε εδώ, όπως ειπώθηκε προηγουμένως, αποτελεί τη γενίκευση για k πληθυσμούς της δειγματοληψίας κατά ζεύγη για τη σύγκριση δύο πληθυσμών. Ο σχεδιασμός
αναφέρεται σε πλήρεις ομάδες, γιατί σε κάθε ομάδα εφαρμόζονται όλες οι διαθέσιμες θεραπείες ώστε να μην
μένει κάποιο επίπεδο από τα k επίπεδα του παράγοντα που να μην δοκιμαστεί/εφαρμοστεί. Επιπρόσθετα, ο
σχεδιασμός είναι Ισορροπημένος, που σημαίνει ότι έχουμε ίδιο αριθμό μετρήσεων (επαναλήψεων ή εκτελέσεων
του πειράματος) για κάθε θεραπεία.
Τα βήματα του Τυχαιοποιημένου Τμηματικού Σχεδιασμού είναι τα εξής:
1. Οι δειγματικές μονάδες χωρίζονται σε b ομάδες ( blocks). To κάθε block αποτελείται από k δειγματικές μονάδες που έχουν όσο το δυνατόν περισσότερα κοινά χαρακτηριστικά. Έτσι, έχουμε την πιο
κάτω διαμέριση του αρχικού δείγματος:
ΟΜΑΔΑ #1
k δειγματικές
μονάδες
ΟΜΑΔΑ #2
k δειγματικές
μονάδες
···
ΟΜΑΔΑ #b
k δειγματικές .
μονάδες
Παρατηρούμε ότι σε κάθε ομάδα γίνονται k μετρήσεις, ενώ το ολικό δείγμα έχει μέγεθος:
(Αριθμός blocks) × (Αριθμός μονάδων ανά block) = bk.
2. Από το block #1, επιλέγουμε τυχαία 1 δειγματική μονάδα από τις k μονάδες, για τη θεραπεία/πληθυσμό
#1, 1 δειγματική μονάδα από τις υπόλοιπες k − 1 μονάδες για τη θεραπεία/πληθυσμό #2, κ.ο.κ. μέχρις ότου η τελευταία εναπομείνασα μονάδα να χρησιμοποιηθεί για τη θεραπεία/πληθυσμό #k. Στη
συνέχεια, ακολουθείται η ίδια διαδικασία για τα blocks 2, 3, . . . , b. Έτσι, έχουμε:
ΟΜΑΔΑ #1
Θεραπεία 1
Θεραπεία 2
..
.
ΟΜΑΔΑ #2
Θεραπεία 1
Θεραπεία 2
..
.
Θεραπεία k
Θεραπεία k
···
ΟΜΑΔΑ #b
Θεραπεία 1
Θεραπεία 2 .
..
.
Θεραπεία k
Με αυτό τον σχεδιασμό σε κάθε block υπάρχει ακριβώς μία δειγματική μονάδα για καθεμία από τις k θεραπείες/πληθυσμούς. Το σκεπτικό του σχεδιασμού αυτού είναι το εξής:
Αφού σε κάθε block οι δειγματικές μονάδες έχουν πολλά κοινά χαρακτηριστικά, οι διαφορές που θα προκύψουν μεταξύ των k θεραπειών μέσα στο ίδιο block, θα είναι πιο αντικειμενικές. Ως αποτέλεσμα, οι διακυμάνσεις των παρατηρήσεων που οφείλονταν στις διαφορές μεταξύ των δειγματικών μονάδων κάθε block, είναι
μηδαμινές.
Έστω yij η παρατήρηση/μέτρηση που αντιστοιχεί στην i θεραπεία και στο j block. Στον τυχαιοποιημένο
τμηματικό σχεδιασμό υπάρχουν 3 τύποι μέσων τιμών που μπορούν να οριστούν, και είναι ο μέσος µi. της θεραπείας i, ο μέσος µ.j της ομάδας j και ο ολικός μέσος µ με εκτιμητές τις αντίστοιχες δειγματικές ποσότητες:
b
1X
yij
Δειγματική Μέση τιμή i πληθυσμού/θεραπείας: ȳi. =
b j=1
170
ΣΧΕΔΙΑΣΜΟΣ ΠΕΙΡΑΜΑΤΩΝ
k
1X
Δειγματική Μέση τιμή j block: ȳ.j =
yij
k i=1
Δειγματικός Ολικός Μέσος: ȳ.. =
k X
b
1 X
yij .
bk i=1 j=1
Όλα τα βασικά στοιχεία του σχεδιασμού συνοψίζονται στον Πίνακα 8.1:
Πίνακας 8.1: Τυχαιοποιημένος Τμηματικός Σχεδιασμός Πλήρων Ομάδων
Block
1
2
...
b
Μέσος Θεραπείας
Εκτιμητής Μέσου
Θεραπεία 1
y11
y12
···
y1b
µ1.
ȳ1.
Θεραπεία 2
..
.
y21
..
.
y22
..
.
···
···
y2b
..
.
µ2.
..
.
ȳ2.
..
.
Θεραπεία k
yk1
yk2
···
ykb
µk.
ȳk.
Μέσος Block
µ.1
µ.2
···
µ.b
µ
Εκτιμητής Μέσου
ȳ.1
ȳ.2
···
ȳ.b
ȳ..
Η προφανής ταυτότητα:
yij − ȳ.. = (ȳi. − ȳ.. ) + (ȳ.j − ȳ.. ) + (yij − ȳ.j − ȳi. + ȳ.. ) ,
δείχνει ότι η απόκλιση της κάθε παρατήρησης yij από τον ολικό μέσο ȳ.. οφείλεται εν μέρει στην απόκλιση του
μέσου ȳi. του πληθυσμού i από τον ολικό μέσο ȳ.. , εν μέρει στην απόκλιση του μέσου ȳ.j , του block j, από τον
μέσο ȳ.. και εν μέρει στην απόκλιση της ποσότητας yij + ȳ.. από το άθροισμα των μέσων του πληθυσμού και
του block, από όπου η συγκεκριμένη παρατήρηση/μέτρηση προέρχεται. Τετραγωνίζοντας και τα δύο μέλη
της πιο πάνω σχέσης και αθροίζοντας ως προς i και j, έχουμε (είναι εύκολο να δειχτεί ότι όλα τα διπλάσια
γινόμενα μηδενίζονται):
X
2
(yij − ȳ.. ) =
i,j
XX
i
2
(ȳi. − ȳ.. ) +
XX
j
i
2
(ȳ.j − ȳ.. ) +
j
X
2
(yij − ȳ.j − ȳi. + ȳ.. ) ,
i,j
η οποία μπορεί να απλοποιηθεί και να πάρει την τελική μορφή:
XX
i
j
2
(yij − ȳ.. ) = b
k
X
b
X
2
(ȳi. − ȳ.. ) + k
i
2
(ȳ.j − ȳ.. ) +
j
XX
i
2
(yij − ȳ.j − ȳi. + ȳ.. ) .
(8.1)
j
Ορισμός 8.1. Για τον Τυχαιοποιημένο Τμηματικό Σχεδιασμό ορίζουμε την Ολική Μεταβλητότητα:
SST O =
XX
i
(yij − ȳ.. )2 ,
(8.2)
j
με bk − 1 ≡ n − 1 β.ε., τη Μεταβλητότητα μεταξύ των Θεραπειών:
SST = b
k
X
(ȳi. − ȳ.. )2 ,
(8.3)
i=1
με k − 1 β.ε., τη Μεταβλητότητα μεταξύ των Blocks:
SSB = k
b
X
j=1
(ȳ.j − ȳ.. )2 ,
(8.4)
ΓΡΑΜΜΙΚΑ ΜΟΝΤΕΛΑ ΚΑΙ ΣΧΕΔΙΑΣΜΟΣ & ΑΝΑΛΥΣΗ ΠΕΙΡΑΜΑΤΩΝ ΜΕ ΕΦΑΡΜΟΓΕΣ ΣΕ R ΚΑΙ MINITAB
171
με b − 1 β.ε. και το Άθροισμα των Τετραγωνικών Σφαλμάτων, δηλαδή τη μεταβλητότητα που δεν μπορεί να
ερμηνευθεί από το προτεινόμενο πρότυπο:
SSE =
XX
i
(yij − ȳ.j − ȳi. + ȳ.. )2
(8.5)
j
με (b − 1)(k − 1) β.ε.
Η σχέση που συνδέει τους βαθμούς ελευθερίας είναι:
n − 1 ≡ bk − 1 = (k − 1) + (b − 1) + (b − 1)(k − 1),
ενώ λόγω του πιο πάνω ορισμού, η σχέση (8.1) παίρνει τη μορφή:
SST O = SST + SSB + SSE.
(8.6)
Ο επόμενος ορισμός δίνει τα μέσα αθροίσματα τετραγώνων τα οποία προκύπτουν διαιρώντας το κάθε άθροισμα τετραγώνων με τους αντίστοιχους βαθμούς ελευθερίας.
Ορισμός 8.2.
είναι:
α) Το Μέσο Άθροισμα Τετραγώνων, αναφορικά με το SST , δηλαδή μεταξύ των θεραπειών,
M ST =
SST
.
k−1
(8.7)
β) Το Μέσο Άθροισμα Τετραγώνων, αναφορικά με το SSB, δηλαδή μεταξύ των blocks, είναι:
SSB
.
b−1
(8.8)
SSE
.
(b − 1) (k − 1)
(8.9)
M SB =
γ) Το Μέσο Άθροισμα Τετραγωνικών Σφαλμάτων είναι:
M SE =
Συνοψίζοντας, ο ANOVA πίνακας για τον Τυχαιοποιημένο Τμηματικό Σχεδιασμό με μία μεταβλητή πλαισίου
(ομάδα) είναι:
Πίνακας 8.2: Πίνακας ANOVA - Τυχαιοποιημένος Τμηματικός Σχεδιασμός Πλήρων Ομάδων
Μέσο
Πηγή
Μεταβλητότητας
Βαθμοί
Ελευθερίας
Άθροισμα
Τετραγώνων
Θεραπείες - Πληθυσμοί
k−1
SST
M ST =
SST
k−1
Blocks - Ομάδες
b−1
SSB
M SB =
SSB
b−1
Σφάλμα
(b − 1) (k − 1)
SSE
Ολική
n − 1 ≡ bk − 1
SST O
Άθροισμα
Τετραγώνων
M SE =
SSE
(b−1)(k−1)
–
Βάσει των ανωτέρω, το πρότυπο για τη σύγκριση k πληθυσμών/θεραπειών ή εναλλακτικά για τα k επίπεδα
του παράγοντα ενδιαφέροντος A, στην παρουσία μίας μεταβλητής πλαισίου O με b επίπεδα, αποτελεί γενίκευση του προτύπου (7.5) της μονοπαραγοντικής ανάλυσης διακύμανσης:
yij = µij + ϵij ≡ µ + αi + oj + ϵij ,
i = 1, ..., k,
j = 1, ..., b,
(8.10)
172
ΣΧΕΔΙΑΣΜΟΣ ΠΕΙΡΑΜΑΤΩΝ
όπου µij η επίδραση του i επιπέδου του παράγοντα ενδιαφέροντος εντός της ομάδας j (δηλαδή όταν η μεταβλητή πλαισίου είναι στο επίπεδο j), µ ο ολικός μέσος (συχνά ορίζεται και ως µ.. ), αi η επίδραση του i
επιπέδου του παράγοντα ενδιαφέροντος A, oj η επίδραση του επιπέδου j της μεταβλητής πλαισίου O και
i.i.d.
ϵij ∼ N (0, σ 2 ).
Οι σχέσεις που συνδέουν τις παραμέτρους του προτύπου είναι:
αi = µi· − µ & oj = µ.j − µ.
Θα πρέπει να σημειωθεί ότι εκτελείται ένα μόνο πείραμα (δηλαδή μία μόνο μέτρηση) σε κάθε συνδυασμό επιπέδων i και j του παράγοντα A και της μεταβλητής πλαισίου O, αλλά η σειρά με την οποία εκτελούνται τα
πειράματα είναι τυχαία και η τυχαιοποίηση αλλάζει εντός κάθε επιπέδου της μεταβλητής O. Επιπλέον, σημειώνεται ότι η πιο πάνω εξίσωση καθορίζει ένα πλήρως προσθετικό πρότυπο, δηλαδή ένα πρότυπο στο οποίο
δεν υπάρχει αλληλεπίδραση μεταξύ του παράγοντα A και της μεταβλητής O.
Στις διεργασίες όπου εμπλέκεται μία ή δύο μεταβλητές πλαισίου, θεωρούμε ότι τέτοιες αλληλεπιδράσεις (με
τον παράγοντα ενδιαφέροντος) δεν υφίστανται. Αν δεν είναι δυνατόν να υποθέσει ο Ερευνητής την απουσία
αλληλεπίδρασης μεταξύ του παράγοντα και της μεταβλητής πλαισίου, τότε η εφαρμογή της μεθοδολογίας της
παρούσας ενότητας οδηγεί σε εσφαλμένα συμπεράσματα. Άρα, αν υπάρχει υπόνοια για ύπαρξη αλληλεπίδρασης, τότε η μεταβλητή πλαισίου θα πρέπει να αντιμετωπιστεί ως ένας δεύτερος παράγοντας ενδιαφέροντος
και η μελέτη θα πρέπει να γίνει με τη διπαραγοντική ανάλυση διακύμανσης με παραγοντικό πείραμα δύο παραγόντων σε σχεδιασμό πλήρους τυχαιοποίησης και με τουλάχιστον μία μέτρηση (ένα πείραμα), δηλαδή με
επανάληψη, ανά συνδυασμό επιπέδων (βλ. στη συνέχεια στο ίδιο Κεφάλαιο, στην Ενότητα 8.4 της Διπαραγοντικής Ανάλυσης Διακύμανσης). Η επανάληψη εξασφαλίζει τη διερεύνηση του κατά πόσο η ταυτόχρονη
εμπλοκή δύο παραγόντων (δηλαδή η αλληλεπίδρασή τους) επηρεάζει τη μεταβλητή απόκρισης.
8.2.1 Πρότυπα σταθερών και τυχαίων επιδράσεων
Στην ενότητα αυτή θα αναλυθούν τα βασικά πρότυπα με σταθερές και τυχαίες επιδράσεις.
8.2.1.1 Πρότυπο σταθερών επιδράσεων
Στην περίπτωση των σταθερών επιδράσεων, οι παράμετροι α1 , . . ., αk είναι καθορισμένοι πραγματικοί αριθP
P
μοί, έτσι ώστε i αi = 0. Η αντίστοιχη προϋπόθεση ισχύει και για τις ομάδες: j oj = 0 ώστε να είναι
εφικτός ο μονοσήμαντος προσδιορισμός των µ, α1 , . . . , αk , o1 , . . . , ob . Στην περίπτωση αυτή, και με βάση
τα δεδομένα του προτύπου, ισχύει ότι:
& V ar (Yij ) = σ 2 .
E (Yij ) = E (µ + αi + oj ) = µ + αi + oj
8.2.1.2 Εκτίμηση και έλεγχος υποθέσεων
Έχοντας τους δειγματικούς μέσους από την προηγούμενη ενότητα να αποτελούν ιδανικούς εκτιμητές των
αντίστοιχων παραμέτρων, καταλήγουμε ότι:
1X
µ̂ =
yij = ȳ.. ,
n i,j
b
1X
µ̂i. =
yij = ȳi.
b j=1
&
ενώ οι εκτιμήτριες των επιδράσεων αi και oj είναι αντίστοιχα:
α̂i = µ̂i. − µ̂ = ȳi. − ȳ..
και
ôj = µ̂.j − µ̂ = ȳ.j − ȳ..
k
1X
µ̂.j =
yij = ȳ.j ,
k i=1
ΓΡΑΜΜΙΚΑ ΜΟΝΤΕΛΑ ΚΑΙ ΣΧΕΔΙΑΣΜΟΣ & ΑΝΑΛΥΣΗ ΠΕΙΡΑΜΑΤΩΝ ΜΕ ΕΦΑΡΜΟΓΕΣ ΣΕ R ΚΑΙ MINITAB
173
Τέλος, η εκτιμήτρια της διασποράς σ 2 είναι αντίστοιχη με αυτήν στη μονοπαραγοντική ανάλυση διακύμανσης:
X
1
σ̂ 2 = s2 =
(yij − ȳ.. )2 ≡ M SE,
(b − 1)(k − 1) i,j
όπου η διαίρεση έχει γίνει με τους β.ε. του σφάλματος ώστε να διασφαλίζονται οι καλές θεωρητικές ιδιότητες
(π.χ. αμεροληψία) του εκτιμητή.
Με βάση τα παραπάνω, η εκτίμηση (πρόβλεψη) της οποιασδήποτε τιμής j της μεταβλητής απόκρισης για
το επίπεδο i, όταν η μεταβλητή πλαισίου είναι στο επίπεδο j, είναι:
ŷij = µ̂ + α̂i + ôj .
Η πιο πάνω ποσότητα ŷij αποτελεί εκτίμηση της yij , έτσι ώστε τα κατάλοιπα ( residuals), δηλαδή οι αποκλίσεις μεταξύ παρατηρούμενων και εκτιμώμενων τιμών, να ορίζονται με τον συνήθη τρόπο:
ϵ̂ij = yij − ŷij = yij − ȳi. − ȳi. + ȳ.. .
Η μηδενική (και η αντίστοιχη εναλλακτική) υπόθεση της μη ύπαρξης διαφοράς μεταξύ των μέσων των k πληθυσμών, δηλαδή των μηδενικών επιδράσεων των θεραπειών, μπορεί να διατυπωθεί όπως και προηγουμένως:
H0 : µ1· = µ2· = ... = µk· ≡ µ vs
H1 : Όχι όλα τα µi· , i = 1, ..., k ίσα
ή ισοδύναμα,
H0 : α1 = α2 = ... = αk = 0
vs
H1 : Όχι όλα τα αi , i = 1, ..., k ίσα με 0.
(8.11)
Από το Θεώρημα Cochran (Πρόταση 2.5) έχουμε και πάλι ότι η ελεγχοσυνάρτηση για τον έλεγχο της πιο
πάνω H0 , είναι η ακόλουθη:
F =
M ST
=
M SE
SST
H0
k−1
∼
SSE
(b−1)(k−1)
Fk−1,(b−1)(k−1) ,
ενώ το χωρίο απόρριψης της H0 είναι το εξής:
F > Fk−1,(b−1)(k−1);α ,
όπου Fk−1,(b−1)(k−1);α το 100(1 − α)% ποσοστημόριο της κατανομής F με k − 1 και (b − 1)(k − 1)
βαθμούς ελευθερίας. Ο Πίνακας Ανάλυσης Διασποράς παίρνει τελικά τη μορφή:
Πίνακας 8.3: Πίνακας ANOVA - Τυχαιοποιημένος Τμηματικός Σχεδιασμός Πλήρων Ομάδων - Σταθερές
Επιδράσεις
Μέσο
Πηγή
Μεταβλητότητας
Βαθμοί
Ελευθερίας
Άθροισμα
Τετραγώνων
Θεραπείες - Πληθυσμοί
k−1
SST
M ST =
SST
k−1
M ST
M SE
Blocks - Ομάδες
b−1
SSB
M SB =
SSB
b−1
M SB
M SE
Σφάλματα
(b − 1)(k − 1)
SSE
SSE
(b−1)(k−1)
–
Ολική
n − 1 ≡ bk − 1
SST O
Άθροισμα
F
Τετραγώνων
M SE =
–
–
174
ΣΧΕΔΙΑΣΜΟΣ ΠΕΙΡΑΜΑΤΩΝ
Από τα παραπάνω είναι προφανές ότι αν είναι αληθής η μηδενική υπόθεση, τότε το πρότυπο παίρνει τη μορφή:
yij = µ + oj + ϵij
για κάθε επίπεδο i, που σημαίνει ότι δεν υπάρχει διαφοροποίηση μεταξύ των πληθυσμών, και άρα η συνολική
μεταβλητότητα των δεδομένων αποδίδεται αφενός μεν στις ομάδες (κάτι που ήταν γνωστό στον Ερευνητή
από την αρχή) και σε τυχαία σφάλματα, και άρα οι πληθυσμοί δεν διαφέρουν μεταξύ τους, δηλαδή ως προς τα
επίπεδα του παράγοντα ενδιαφέροντος A.
Σημειώνεται ότι ο Πίνακας ANOVA περιλαμβάνει και μία γραμμή με πληροφορίες για τη μεταβλητή πλαισίου, δίνοντας το SSB, το M SB, τους β.ε και την τιμή F = M SB/M SE. Η τελευταία αυτή ποσότητα
μπορεί να αξιοποιηθεί ως ελεγχοσυνάρτηση για τη διερεύνηση της ισότητας των ίσων μέσων της μεταβλητής απόκρισης για τις διαφορετικές ομάδες 1, . . . , b, δηλαδή για την υπόθεση μηδενικών επιδράσεων των
ομάδων:
H0 : o1 = o2 = . . . = ob = 0
vs
H1 : Όχι όλα τα oj , j = 1, . . . , b ίσα με 0.
Ο έλεγχος αυτός γίνεται καθαρά για πρακτικούς λόγους, στην περίπτωση που ο Ερευνητής θέλει να επιβεβαιώσει την αρχική του υπόθεση (που συνήθως προκύπτει είτε από τη βιβλιογραφία είτε από πρότερη εμπειρία είτε και από τα δύο μαζί) ότι υφίσταται διαφοροποίηση μεταξύ των επιπέδων της μεταβλητής πλαισίου.
Ο έλεγχος έχει την αξία του, διότι αν οι συνθήκες έχουν αλλάξει και δεν υφίσταται πλέον (για οποιονδήποτε
λόγο) μία τέτοια διαφοροποίηση, τότε ο έλεγχος διαπιστώνει την αποδοχή της μηδενικής υπόθεσης (δηλαδή
των μηδενικών επιδράσεων) καταλήγοντας στο συμπέρασμα ότι δεν υπήρχε λόγος ομαδοποίησης, και το κυριότερο, ότι δεν πρέπει να γίνεται ομαδοποίηση σε οποιαδήποτε μελλοντικά πειράματα. Κατά αντιστοιχία με
τον έλεγχο των μηδενικών επιδράσεων για τις θεραπείες, εδώ ισχύει ότι:
M SB
=
F =
M SE
SSB
H0
b−1
∼
SSE
(b−1)(k−1)
Fb−1,(b−1)(k−1) ,
ενώ το χωρίο απόρριψης της H0 είναι το εξής:
F > Fb−1,(b−1)(k−1);α ,
όπου Fb−1,(b−1)(k−1);α το 100(1 − α)% ποσοστημόριο της κατανομής F με b − 1 και (b − 1)(k − 1)
βαθμούς ελευθερίας.
Nα σημειωθεί ότι οι Ερευνητές σπάνια επιλέγουν να προβούν στον συμπληρωματικό αυτόν έλεγχο. Ένας
σημαντικός λόγος γι’ αυτό αφορά την κανονικότητα των σφαλμάτων. Αν και ο έλεγχος για τις θεραπείες δεν
επηρεάζεται σημαντικά όταν η υπόθεση της κανονικότητας δεν είναι (απολύτως) αποδεκτή, δεν ισχύει το ίδιο
για τον έλεγχο για τις ομάδες. Με άλλα λόγια, αν και ο έλεγχος για τις θεραπείες εξακολουθεί να ισχύει ακόμα
και για αποκλίσεις από την υπόθεση της κανονικότητας, και τα συμπεράσματά του είναι έγκυρα, ο έλεγχος για
τις ομάδες δεν παραμένει αξιόπιστος (όταν δεν πληρείται η κανονικότητα), και όποια συμπεράσματα προκύπτουν από αυτόν, είναι επισφαλή (βλ. [?]).
8.2.1.3 Κλασικά διαστήματα εμπιστοσύνης και πολλαπλές συγκρίσεις
Βασιζόμενοι στα προηγούμενα, μπορούμε να προβούμε στη μελέτη ενός μέσου ή τη σύγκριση δύο μέσων,
με την κατασκευή κατάλληλου διαστήματος εμπιστοσύνης ή ελέγχου υποθέσεων. Πράγματι, από το ΚΟΘ
γνωρίζουμε ότι:
ȳi. − µi·
q
∼ N (0, 1),
σ 2 /b
ΓΡΑΜΜΙΚΑ ΜΟΝΤΕΛΑ ΚΑΙ ΣΧΕΔΙΑΣΜΟΣ & ΑΝΑΛΥΣΗ ΠΕΙΡΑΜΑΤΩΝ ΜΕ ΕΦΑΡΜΟΓΕΣ ΣΕ R ΚΑΙ MINITAB
175
ενώ εάν η διασπορά είναι άγνωστη και αντικαθίσταται από τον κλασικό εκτιμητή M SE τότε:
ȳi. − µi·
q
M SE/b
∼ tn−(b−1)(k−1) .
Οι αντίστοιχες σχέσεις για τη σύγκριση των μέσων µi1 . και µi2 . δύο θεραπειών i1 και i2 είναι:
(ȳi1 . − ȳi2 . ) − (µi1 . − µi2 . )
q
και
2σ 2 /b
(ȳi1 . − ȳi2 . ) − (µi1 . − µi2 . )
q
2M SE/b
∼ N (0, 1)
∼ tn−(b−1)(k−1) .
Όπως αναφέρθηκε και στα προηγούμενα Κεφάλαια (π.χ. Ενότητα 7.5), όταν ο έλεγχος ισότητας των μέσων
(8.11) καταλήγει στο συμπέρασμα ότι οι μέσοι δεν είναι όλοι ίσοι, δηλαδή στην περίπτωση που γίνεται δεκτή η εναλλακτική υπόθεση, ο Ερευνητής μπορεί (και ενδείκνυται) να προχωρήσει σε Πολλαπλές Συγκρίσεις, ( Multiple Comparisons) όπου για όλες τις συγκρίσεις ανά δύο, το συνολικό σφάλμα να μην υπερβαίνει
έναν προκαθορισμένο επίπεδο α ή διαφορετικά το συνολικό επίπεδο εμπιστοσύνης να μην είναι χαμηλότερο
από ένα προκαθορισμένο συντελεστή εμπιστοσύνης 100(1 − α)%. Τροποποιώντας
κατάλληλα την εξίσωση
√
(7.17), δηλαδή θέτοντας n/k = b, n − k = (k − 1)(b − 1) και s = M SE, έχουμε:
s
ȳi1 . − ȳi2 . ± qk,(k−1)(b−1);α
M SE
,
b
(8.12)
το οποίο χρησιμοποιείται για την κατασκευή όλων των δυνατών συγκρίσεων ανά δύο μεταξύ των k επιπέδων
ή πληθυσμών του παράγοντα ενδιαφέροντος Α. Έτσι, το επίπεδο εμπιστοσύνης για τα συνολικά k(k − 1)/2
διαστήματα εμπιστοσύνης θα είναι τουλάχιστον 100(1 − α)%. Σημειώνεται ότι εάν κρίνεται αναγκαίο, είναι
εφικτή η κατασκευή διαστημάτων εμπιστοσύνης είτε απλών είτε πολλαπλών, και για τους μέσους των επιπέδων της μεταβλητής πλαισίου με ακριβώς τον ίδιο τρόπο με παραπάνω. Εδώ, παραλείπεται υπό την έννοια
ότι αυτή δεν αποτελεί μεταβλητή ενδιαφέροντος, αφού ο Ερευνητής είναι γνώστης της επίδρασής της στη
μεταβλητή απόκρισης.
8.2.1.4 Πρότυπο τυχαίων επιδράσεων
Η ανάγκη μελέτης τυχαίων επιδράσεων, όπως είχε αναφερθεί και στο προηγούμενο Κεφάλαιο, προκύπτει στις
περιπτώσεις όπου ο Ερευνητής έχει να μελετήσει πληθώρα διαφορετικών επιπέδων (πληθυσμών), και χρονικοί ή/και οικονομικοί περιορισμοί δεν του το επιτρέπουν. Στην παρούσα περίπτωση, το πρόβλημα επιλύεται
με την αξιοποίηση του προτύπου τυχαίων επιδράσεων, όπου περιορισμένος αριθμός επιπέδων και από τον παράγοντα ενδιαφέροντος και από τη μεταβλητή πλαισίου, επιλέγεται τυχαία. Υπενθυμίζεται ότι στο πρότυπο
τυχαίων επιδράσεων δεν εξετάζεται η μέση τιμή (των επιπέδων), αλλά η μεταβλητότητα.
Το πρότυπο τυχαίων επιδράσεων δίνεται και πάλι, όπως και πιο πάνω, από τον τύπο:
yij = µ + αi + oj + ϵij ,
i = 1, ..., k,
j = 1, ..., b,
(8.13)
όπου σε αντίθεση με το πρότυπο σταθερών επιδράσεων, οι επιδράσεις αi είναι τυχαίες μεταβλητές με κατανομή N (0, σα2 ), οι επιδράσεις oj είναι επίσης τυχαίες μεταβλητές με κατανομή N (0, σ 2 ), τα σφάλματα είναι
i.i.d.
τυχαίες μεταβλητές τέτοιες ώστε ϵij ∼ N (0, σ 2 ), ενώ οι τυχαίες μεταβλητές αi , oj και ϵij είναι ανεξάρτητες, ανά δύο. Με βάση τις πιο πάνω κατανομές είναι προφανές ότι:
Yij ∼N (µ, σ 2 + σα2 + σo2 ),
176
ΣΧΕΔΙΑΣΜΟΣ ΠΕΙΡΑΜΑΤΩΝ
και άρα:
E (Yij ) = µ & V ar (Yij ) = σ 2 + σα2 + σo2 ,
∀i, j
όπου σ 2 , σα2 και σo2 ονομάζονται συνιστώσες διασποράς. H μελέτη του προτύπου είναι ίδια με προηγουμένως,
αφού αν σα2 = 0, τότε όλες οι θεραπείες είναι ίδιες και η διασπορά θα ισούται μόνο με σ 2 +σo2 , ενώ αν σα2 > 0
υπάρχει μεταβλητότητα μεταξύ των θεραπειών και η διασπορά θα είναι μεγαλύτερη από σ 2 + σo2 . Υπενθυμίζεται ότι η διερεύνηση της επίδρασης της μεταβλητής πλαισίου θεωρείται δεδομένη και μη αμφισβητήσιμη,
δηλαδή είναι δεδομένο ότι σo2 > 0. Αν βέβαια, ο Ερευνητής θέλει να το επιβεβαιώσει, μπορεί να προβεί στον
σχετικό έλεγχο. Σε οποιαδήποτε περίπτωση, ο αναγκαίος και επιθυμητός έλεγχος για ίδιες ή μη θεραπείες
στην περίπτωση του προτύπου τυχαίων επιδράσεων είναι:
H0 : σα2 = 0
vs
H1 : σα2 > 0.
(8.14)
Σημειώνεται ότι οι τύποι της περίπτωσης των σταθερών επιδράσεων σχετικά με τα αθροίσματα τετραγώνων
(SST , SSE), τα μέσα τετραγωνικά αθροίσματα (M ST , M SE), την ολική μεταβλητότητα (SST O) και
τους βαθμούς ελευθερίας, εξακολουθούν να ισχύουν, ως έχουν. Στη συγκεκριμένη περίπτωση, και για το μέσο
τετραγωνικό άθροισμα M ST ισχύει ότι (βλ. [18]):
E(M ST ) = σ 2 + kσα2 .
(8.15)
Λαμβάνοντας υπόψη τα πιο πάνω, και το γεγονός ότι το M SE είναι (αμερόληπτος) εκτιμητής του σ 2 , δηλαδή
E(M SE) = σ 2 , αναμένεται ότι το κλάσμα:
M ST
M SE
θα είναι κοντά στη μονάδα όταν η H0 ισχύει (αφού αριθμητής και παρονομαστής θα είναι και οι δύο, κοντά
στο σ 2 ), ενώ θα είναι μεγαλύτερο της μονάδας όταν η H1 ισχύει, οπότε το σα2 > 0 (και άρα ο αριθμητής
αναμένεται να είναι μεγαλύτερος από τον παρονομαστή). Συμπερασματικά, η μελέτη για την περίπτωση των
τυχαίων επιδράσεων ταυτίζεται με αυτή των σταθερών επιδράσεων και βασίζεται στον Πίνακα ANOVA που
δίνεται στη συνέχεια. Θα πρέπει να παρατηρηθεί ότι αν η μηδενική υπόθεση γίνει δεκτή και δηλαδή σα2 = 0,
τότε τόσο η μέση τιμή όσο και η διασπορά του αi (για κάθε i) είναι μηδέν και κατά συνέπεια, το αi παύει να
αποτελεί τυχαία μεταβλητή και εκφυλίζεται σε μία και μοναδική τιμή, το μηδέν, με αποτέλεσμα να έχουμε:
F =
yij = µ + oj + ϵij
με σταθερή μέση τιμή E (Yij ) = µ και σταθερή διασπορά V ar (Yij ) = σ 2 + σo2 , για όλα τα επίπεδα του
παράγοντα ενδιαφέροντος.
Για την εκτίμηση των συνιστωσών διασποράς, υπενθυμίζεται ότι η εκτιμήτρια του σ 2 είναι ίση με M SE και
δίνεται στον Πίνακα ANOVA. Όσο για την εκτιμήτρια του σα2 , αυτή μπορεί εύκολα να εξαχθεί από τη σχέση
(8.15):
M ST − M SE
,
M ST ∼ M SE + kσ̂α2 → σ̂α2 =
k
όπου οι δειγματικές τιμές των M ST και M SE έχουν χρησιμοποιηθεί ως οι δειγματικές εκτιμήτριες που αντιστοιχούν στις ποσότητες E(M ST ) και E(M SE) ≡ σ 2 . Κατά αντιστοιχία του τύπου (8.15), έχουμε και
τον τύπο για τη διασπορά των ομάδων:
E(M SB) = σ 2 + bσo2 ,
(8.16)
από όπου προκύπτει ότι:
M SB − M SE
,
b
όπου και πάλι οι δειγματικές τιμές των M SB και M SE έχουν χρησιμοποιηθεί ως οι δειγματικές εκτιμήτριες
που αντιστοιχούν στις ποσότητες E(M SB) και E(M SE), αντίστοιχα.
M SB ∼ M SE + bσ̂o2 → σ̂o2 =
ΓΡΑΜΜΙΚΑ ΜΟΝΤΕΛΑ ΚΑΙ ΣΧΕΔΙΑΣΜΟΣ & ΑΝΑΛΥΣΗ ΠΕΙΡΑΜΑΤΩΝ ΜΕ ΕΦΑΡΜΟΓΕΣ ΣΕ R ΚΑΙ MINITAB
177
8.2.2 Αναπλήρωση χαμένων/ελλειπουσών μετρήσεων
Στις πειραματικές επιστήμες, είναι συχνό το φαινόμενο να μην είναι αξιοποιήσιμη μία μέτρηση είτε λόγω απρόβλεπτης καταστροφής του παραχθέντος προϊόντος είτε λόγω αμέλειας είτε λόγω λανθασμένης πληκτρολόγησης στο ηλεκτρονικό σύστημα καταχώρισης δεδομένων. Σε τέτοιες περιπτώσεις, είναι αναγκαία η εκτίμηση
της μη αξιοποιήσιμης μέτρησης (π.χ. για να έχουμε ισορροπημένο σχεδιασμό), κάτι που όμως συνεπάγεται
ότι διαφοροποιούνται τα δεδομένα του Πίνακα ANOVA. Για παράδειγμα, οι συνολικές μετρήσεις είναι κατά
μία λιγότερες από τον αρχικό σχεδιασμό, με αντίκτυπο στους βαθμούς ελευθερίας. Επιπρόσθετα, η εκτίμηση
της μη αξιοποιήσιμης παρατήρησης εισάγει πρόσθετη μεταβλητότητα (λόγω του σφάλματος εκτίμησης) με
αποτέλεσμα να διαφοροποιείται και η μεταβλητότητα που οφείλεται στο μοντέλο. Σημειώνεται ότι η διαδικασία εκτίμησης δεν είναι ενσωματωμένη στα συνήθη στατιστικά πακέτα και απαιτείται να γίνει χειροκίνητα και
μετά να καταχωριστεί στις τιμές του λογισμικού που χρησιμοποιείται για την ανάλυση. Σημειώνεται ότι στην
περίπτωση αυτή το λογισμικό αντιμετωπίζει τη συγκεκριμένη μέτρηση/εκτίμηση όπως και τις υπόλοιπες, και
προχωρά στην ανάλυση και στη δημιουργία του Πίνακα ANOVA σαν η μέτρηση να είναι πραγματική. Αυτό
έχει ως συνέπεια ο Ερευνητής να πρέπει να προβεί στη διόρθωση των στοιχείων του Πίνακα ANOVA για την
ορθή εξαγωγή συμπερασμάτων χειροκίνητα.
Έστω ότι η μέτρηση yi∗ j ∗ , η οποία αντιστοιχεί στο i∗ επίπεδο του παράγοντα ενδιαφέροντος και στο j ∗ επίπεδο της μεταβλητής πλαισίου, δεν είναι αξιοποιήσιμη. Για την εκτίμησή της θα αξιοποιηθούν:
(α) οι λοιπές μετρήσεις που αντιστοιχούν στο ίδιο επίπεδο του παράγοντα ενδιαφέροντος,
(β) οι λοιπές μετρήσεις που αντιστοιχούν στο ίδιο επίπεδο της μεταβλητής πλαισίου και
(γ) όλες οι μετρήσεις που έχουν καταχωριστεί επιτυχώς.
Ορίζουμε:
A(i∗ ) =
X
X
yi∗ j , B(j ∗ ) =
j, j̸=j ∗
X
yij ∗ , S(i∗ j ∗ ) =
i, i̸=i∗
yij .
i,j, i̸=i∗ ,j̸=j ∗
Τότε η χαμένη μέτρηση εκτιμάται από την ποσότητα:
ŷi∗ j ∗ =
kA(i∗ ) + bB(j ∗ ) − S(i∗ j ∗ )
.
(k − 1)(b − 1)
Για την ολοκλήρωση της ανάλυσης, ο Πίνακας ANOVA που προκύπτει, αξιοποιώντας (σαν να ήταν πραγματική) την τιμή ŷi∗ j ∗ , δεν είναι έγκυρος, με αποτέλεσμα ο Ερευνητής να πρέπει να προβεί στις εξής παρεμβάσεις:
• Διορθώνουμε το άθροισμα τετραγώνων για τις θεραπείες ως εξής:
SST∗ = SST −
(B(j ∗ ) − (k − 1)ŷi∗ j ∗ )2
.
k(k − 1)
• Οι συνολικοί βαθμοί ελευθερίας γίνονται bk − 2 (οι μετρήσεις είναι κατά μία λιγότερες).
• Οι βαθμοί ελευθερίας για τα σφάλματα γίνονται (k − 1)(b − 1) − 1 (ως απόρροια της μείωσης των
συνολικών βαθμών ελευθερίας).
• Η ποσότητα M SE αντικαθίσταται από την M SE ∗ =
• Η ποσότητα M ST αντικαθίσταται από την M ST∗ =
SSE
.
(k−1)(b−1)−1
SST∗
.
k−1
178
ΣΧΕΔΙΑΣΜΟΣ ΠΕΙΡΑΜΑΤΩΝ
• Η ελεγχοσυνάρτηση F για τη σύγκριση των μέσων των επιπέδων του A, γίνεται F = M ST∗ /M SE ∗ ,
με κρίσιμη τιμή που ακολουθεί την κατανομή F με k − 1 και (k − 1)(b − 1) − 1 βαθμούς ελευθερίας.
Παράδειγμα 8.1. Έστω ο πιο κάτω Πίνακας Δεδομένων που αντιστοιχεί στις μετρήσεις που αφορούν τα 5 επίπεδα
ενός παράγοντα ενδιαφέροντος Α και μίας μεταβλητής πλαισίου Ο με 4 επίπεδα.
Πίνακας 8.4: Πίνακας Δεδομένων
Α
Α1
Α2
Α3
Α4
Α5
O1
1.30
1.32
1.27
1.23
1.25
O2
1.38
1.36
1.25
1.29
1.33
O3
1.31
1.33
1.30
1.30
1.32
O4
1.32
1.38
1.31
1.28
1.29
Ο
Ακολουθώντας στο Minitab τη διαδρομή:
Stat
Ê
ANOVA
Ê
Ê
General Linear Model
Fit General Linear Model
επιλέγουμε τη μεταβλητή απόκρισης για το κελί Responses και τον παράγοντα και τη μεταβλητή πλαισίου για το
κελί Factors. Επιβεβαιώνουμε στα Options ότι οι δύο μεταβλητές που έχουν καταχωριστεί ως Factors είναι χαρακτηρισμένες ως Fixed και όχι Random (δεν έχουμε ενδείξεις ότι τα επίπεδα είναι περισσότερα, ούτε ότι έχει γίνει
τυχαία επιλογή των επιπέδων που μελετώνται) και καταλήγουμε στα εξής αποτελέσματα:
Πίνακας 8.5: Πίνακας ANOVA
Πηγή
Μεταβλητότητας
Βαθμοί
Ελευθερίας
Άθροισμα
Τετραγώνων
A
0.01508
4
O
0.00708
Error
Total
Μέσο
F
p-value
0.00377
5.57
0.009
3
0.00236
3.49
0.050
0.00812
12
0.000677
−
−
0.03028
19
−
−
−
Άθροισμα
Τετραγώνων
Από τον Πίνακα ANOVA προκύπτει ότι στο σύνηθες επίπεδο σημαντικότητας (α = 0.05) παρατηρούνται στατιστικώς σημαντικές επιδράσεις του παράγοντα Α (p-value = 0.009), ενώ επιβεβαιώνεται (οριακά) η επίδραση
της μεταβλητής πλαισίου (p-value = 0.050).
Ας υποθέσουμε ότι η παρατήρηση y33 = 1.30 δεν έχει καταχωριστεί και πρέπει να εκτιμηθεί. Με βάση τα προηγούμενα, η εκτίμησή της θα προκύψει με τη βοήθεια των εξής τριών ποσοτήτων:
A(3∗ ) = 3.80,
B(3∗ ) = 5.26 &
S(3∗ 3∗ ) = 24.82.
Τότε ŷ3∗ 3∗ = 1.27, με αποτέλεσμα ο αναθεωρημένος Πίνακας ANOVA με 1.27 στη θέση της παρατήρησης
y33 = 1.30, να είναι:
ΓΡΑΜΜΙΚΑ ΜΟΝΤΕΛΑ ΚΑΙ ΣΧΕΔΙΑΣΜΟΣ & ΑΝΑΛΥΣΗ ΠΕΙΡΑΜΑΤΩΝ ΜΕ ΕΦΑΡΜΟΓΕΣ ΣΕ R ΚΑΙ MINITAB
179
Πίνακας 8.6: Αναθεωρημένος Πίνακας ANOVA
Πηγή
Μεταβλητότητας
Βαθμοί
Ελευθερίας
Άθροισμα
Τετραγώνων
A
0.01712
4
O
0.006855
Error
Total
Μέσο
F
p-value
0.00428
6.83
0.004
3
0.002285
3.65
0.045
0.00752
12
0.000627
−
−
0.031495
19
−
−
−
Άθροισμα
Τετραγώνων
Ο Αναθεωρημένος Πίνακας 8.6 αντιμετωπίζει την εκτίμηση ŷ3∗ 3∗ = 1.27 ως πραγματική μέτρηση και όπως
αναφέρθηκε προηγουμένως, πρέπει να προβούμε στις απαραίτητες διορθώσεις. Έτσι, με βάση τα προηγούμενα,
έχουμε:
• Διορθώνουμε το άθροισμα τετραγώνων για τις θεραπείες ως εξής:
SST∗ = 0.01712 −
(5.26 − 4.1.27)2
= 0.0155.
20
• Οι συνολικοί βαθμοί ελευθερίας μειώνονται σε 18.
• Οι βαθμοί ελευθερίας για τα σφάλματα μειώνονται σε 11.
• Η ποσότητα M SE αντικαθίσταται από την M SE ∗ =
• Η ποσότητα M ST αντικαθίσταται από την M ST∗ =
0.00752
11
0.0155
4
= 0.0006836.
= 0.03875.
• Η ελεγχοσυνάρτηση F για τη σύγκριση των μέσων των επιπέδων του παράγοντα A, ισούται με F =
0.03875/0.0006836 = 5.67, με κρίσιμη τιμή που ακολουθεί την κατανομή F4,11 .
Είτε υπολογιστεί η p-value που αντιστοιχεί στην πιο πάνω τιμή της στατιστικής συνάρτησης είτε η κρίσιμη
τιμή F4,11;0.05 , διαπιστώνεται ότι η επίδραση του παράγοντα Α είναι στατιστικώς σημαντική. Παρά ταύτα
παρατηρούμε ότι ο βαθμός επίδρασης είναι ελαφρώς ηπιότερος, αφού η τιμή της στατιστικής συνάρτησης
μειώθηκε μετά τη διόρθωση από 6.83 (Αναθεωρημένος Πίνακας 8.6) σε 5.67 (διόρθωση Αναθεωρημένου
Πίνακα 8.6, F = 0.03875/0.0006836 = 5.67), κάτι που ήταν αναμενόμενο, αφού η εκτίμηση της μη
αξιοποιήσιμης μέτρησης μείωσε τον βαθμό εγκυρότητας, αυξάνοντας το σφάλμα.
Κλείνοντας την ενότητα αυτή θα προβούμε σε σύντομο σχολιασμό των προϋποθέσεων του προτύπου, ήτοι
της κανονικότητας, ομοσκεδαστικότητας, ανεξαρτησίας, καθώς και της υπόθεσης του προσθετικού προτύπου
(απουσία αλληλεπίδρασης). Θα πρέπει να σημειωθεί ότι οι υποθέσεις της κανονικότητας και ομοσκεδαστικότητας δεν θεωρούνται τόσο σημαντικές όσο εκείνες της ανεξαρτησίας (μη συσχέτισης των σφαλμάτων) και
της προσθετικότητας του προτύπου (δηλαδή της απουσίας αλληλεπίδρασης). Οι δύο πρώτες υποθέσεις δεν
είναι τόσο σημαντικές επειδή ο έλεγχος F της υπόθεσης των ίσων μέσων είναι προσεγγιστικά ορθός, ακόμα
και όταν τα σφάλματα δεν έχουν κανονική κατανομή ή/και δεν πληρείται η υπόθεση της ομοσκεδαστικότητας.
Με άλλα λόγια, η στατιστική συνάρτηση για τον βασικό έλεγχο του προτύπου εξακολουθεί, έστω και προσεγγιστικά, να ακολουθεί την κατανομή F , με αποτέλεσμα να είναι αξιόπιστο το συμπέρασμα του ελέγχου.
Σε οποιαδήποτε περίπτωση, οι απλές γραφικές που αναφέρθηκαν στο προηγούμενο Κεφάλαιο και βασίζονται
στα κατάλοιπα ϵ̂ij = yij − ŷij μπορούν να αξιοποιηθούν για τη διερεύνηση των συγκεκριμένων προϋποθέσεων.
180
ΣΧΕΔΙΑΣΜΟΣ ΠΕΙΡΑΜΑΤΩΝ
Σχετικά τώρα με τις δύο σημαντικότερες προϋποθέσεις, σημειώνεται ότι αποκλίσεις από την τυχαιότητα μπορεί να οφείλονται είτε σε παραβίαση της υπόθεσης της ομοσκεδαστικότητας είτε στην ύπαρξη αλληλεπίδρασης είτε και στα δύο. Στην περίπτωση που ισχύει η ομοσκεδαστικότητα και δεν ισχύει το προσθετικό πρότυπο
ή στην περίπτωση που δεν ισχύει ούτε το ένα ούτε το άλλο, έχουμε μη αξιόπιστα αποτελέσματα, επειδή έχει
παρεισφρήσει στη στατιστική συνάρτηση η έννοια της μεροληψίας. Πράγματι, στην πρώτη περίπτωση, δεν
απορρίπτεται η μηδενική υπόθεση, όχι όμως επειδή δεν υπάρχουν επιδράσεις αλλά επειδή υπάρχει αλληλεπίδραση. Στη δεύτερη περίπτωση, απορρίπτεται η μηδενική υπόθεση όχι όμως επειδή υπάρχουν επιδράσεις
αλλά επειδή υπάρχει ετεροσκεδαστικότητα, καθώς και αλληλεπίδραση μεταξύ του παράγοντα ενδιαφέροντος
και της μεταβλητής πλαισίου. Το πρόβλημα της ετεροσκεδαστικότητας αντιμετωπίζεται συχνά με επιδέξιους
μετασχηματισμούς (π.χ. λογάριθμος, αντίστροφος, ρίζα) των yij , αντίστοιχους αυτών της γραμμικής παλινδρόμησης (Ενότητα 4.2), ενώ για την περίπτωση της αλληλεπίδρασης θα πρέπει το πρόβλημα να αναχθεί σε
πρόβλημα μελέτης δύο παραγόντων με αλληλεπίδραση, που είναι το αντικείμενο της Διπαραγοντικής Ανάλυσης Διακύμανσης (βλ. Ενότητα 8.4) και απαιτεί να εκτελεστούν περισσότερες από μία μετρήσεις, ανά συνδυασμό επιπέδων (πειραματικός σχεδιασμός με επανάληψη).
8.3 Σχέδιο Λατινικού Τετραγώνου
Η μέθοδος των Λατινικών Τετραγώνων ( Latin Squares) αποτελεί γενίκευση της προηγούμενης μεθόδου,
αφού εδώ υπεισέρχονται δύο μεταβλητές πλαισίου, αντί για μία. Στόχος της μεθόδου είναι η απαλοιφή των
πηγών μεταβλητότητας, που αδιαμφισβήτητα οφείλονται στις δύο μεταβλητές πλαισίου και έτσι μπορεί να
αναδειχτεί με τη μεγαλύτερη δυνατή ακρίβεια, η επίδραση των επιπέδων/θεραπειών του παράγοντα ενδιαφέροντος. Η μόνη προϋπόθεση για την εφαρμογή του συγκεκριμένου σχεδιασμού είναι οι τρεις εμπλεκόμενες μεταβλητές (συμπεριλαμβανομένου δηλαδή του παράγοντα ενδιαφέροντος) να έχουν τον ίδιο ακριβώς αριθμό
επιπέδων, και αυτός να είναι τουλάχιστον 3. Τα λατινικά τετράγωνα είναι διαστάσεως 3 × 3, 4 × 4, 5 × 5
κ.ο.κ., ανάλογα με τον αριθμό των επιπέδων που μελετώνται. Κάθε τετράγωνο είναι ένας πίνακας αντίστοιχης
διάστασης, το κάθε κελί του οποίου συμπληρώνεται με ένα γράμμα του λατινικού αλφάβητου (A, B, C για
το 3 × 3 τετράγωνο, A, B, C, D, για το 4 × 4 τετράγωνο κ.ο.κ.). Το κάθε γράμμα αντιστοιχεί σε κάποιο από
τα επίπεδα του παράγοντα ενδιαφέροντος.
Εδώ, είναι σημαντικό να αναφερθεί ότι ο σχεδιασμός είναι επιδέξια σχεδιασμένος ώστε να μην απαιτείται η
μελέτη, και άρα ο πειραματισμός, σε όλους τους δυνατούς συνδυασμούς επιπέδων των τριών εμπλεκόμενων
μεταβλητών. Εάν κάποιος επιθυμεί να εκτελέσει ένα πλήρες πείραμα θα πρέπει να εκτελέσει πειράματα για
3 × 3 × 3 = 27 διαφορετικούς συνδυασμούς, στην περίπτωση που οι τρεις εμπλεκόμενες μεταβλητές
έχουν τρία επίπεδα η καθεμία. Ο τελικός αριθμός πειραμάτων στο 3 × 3 Λατινικό Τετράγωνο, θα είναι μόλις
3 × 3 = 9, όσα δηλαδή τα κελιά του πίνακα που αντιστοιχεί στο συγκεκριμένο τετράγωνο. Οι αντίστοιχοι
αριθμοί πειραμάτων είναι 16 πειράματα (αντί για 64 για τον πλήρη σχεδιασμό) για το 4 × 4 Λατινικό Τετράγωνο και 25 (αντί για 125) για το 5 × 5 Λατινικό Τετράγωνο.
Ο πιο κάτω πίνακας δίνει τον σχεδιασμό ενός 4 × 4 Λατινικού Τετραγώνου, όπου η μία μεταβλητή πλαισίου έχει τα 4 επίπεδα Ο1, Ο2, Ο3 και Ο4, η άλλη μεταβλητή πλαισίου έχει τα 4 επίπεδα ΟΟ1, ΟΟ2, ΟΟ3
και ΟΟ4 και ο παράγοντας ενδιαφέροντος τα 4 επίπεδα A, B, C και D.
ΓΡΑΜΜΙΚΑ ΜΟΝΤΕΛΑ ΚΑΙ ΣΧΕΔΙΑΣΜΟΣ & ΑΝΑΛΥΣΗ ΠΕΙΡΑΜΑΤΩΝ ΜΕ ΕΦΑΡΜΟΓΕΣ ΣΕ R ΚΑΙ MINITAB
181
Πίνακας 8.7: 4 × 4 Σχέδιο Λατινικού Τετραγώνου
Επίπεδα Μεταβλητής
Πλαισίου 2
ΟΟ1
ΟΟ2
ΟΟ3
ΟΟ4
O1
A
B
C
D
O2
B
C
D
A
O3
C
D
A
B
O4
D
A
B
C
Επίπεδα Μεταβλητής
Πλαισίου 1
Στον πιο πάνω πίνακα παρατηρούμε ότι στην 1η γραμμή και την 1η στήλη η διάταξη είναι σε αλφαβητική
σειρά και για τον λόγο αυτό το συγκεκριμένο τετράγωνο ονομάζεται τυπικό λατινικό τετράγωνο. Η ανάθεση
των επιπέδων του παράγοντα ενδιαφέροντος στα κελιά του Λατινικού Τετραγώνου, είναι σημαντικό να γίνεται με τρόπο τυχαίο ώστε να διασφαλίζεται η αξιοπιστία των αποτελεσμάτων της ανάλυσης. Σημειώνεται ότι
συνολικά υπάρχουν πάρα πολλά τετράγωνα που μπορούν να αξιοποιηθούν σε κάθε Λατινικό Τετράγωνο διάστασης m × m, ανάλογα με τον συνδυασμό που θα επιλεχθεί (τυχαία) για την ανάθεση των m γραμμάτων
του λατινικού αλφάβητου στα m2 κελιά του τετραγώνου. Πράγματι, για παράδειγμα υπάρχουν 576 διαφορετικά Λατινικά Τετράγωνα διάστασης 4 × 4, ενώ ο αριθμός εκτοξεύεται στα 161280 τετράγωνα διάστασης
5 × 5 [17]. Η απλοποιημένη διαδικασία που εφαρμόζεται συχνά στην πράξη για την ανάθεση των επιπέδων
του παράγοντα ενδιαφέροντος σε ένα m × m Λατινικό Τετράγωνο, είναι η ακόλουθη:
• Επιλέγεται τυχαία μία από τις m! διατάξεις των γραμμάτων (έστω A1 , . . . , Am ) και η διάταξη αυτή
τοποθετείται στην πρώτη γραμμή του τετραγώνου. Προκύπτει το ίδιο αποτέλεσμα, αν χρησιμοποιηθεί
η πρώτη στήλη αντί της πρώτης γραμμής.
• Για την ανάθεση των επιπέδων στη 2η γραμμή, μετατοπίζουμε τα γράμματα της διάταξης της 1ης γραμμής κατά μία θέση αριστερά, με το 1ο γράμμα της 1ης γραμμής να τοποθετείται στο τελευταίο κελί της
2ης γραμμής. Στην περίπτωση αξιοποίησης της 1ης στήλης η μετατόπιση γίνεται κατά μία θέση προς
τα επάνω.
• Επαναλαμβάνεται το προηγούμενο βήμα της διαδικασίας τόσες φορές όσες οι εναπομείνασες γραμμές
(ή στήλες) του τετραγώνου.
Παρατηρούμε ότι ο προηγούμενος Πίνακας που αφορά ένα πρότυπο Λατινικό Τετράγωνο, έχει ακολουθήσει
την πιο πάνω διαδικασία κατασκευής αξιοποιώντας ταυτόχρονα τόσο τις στήλες όσο και τις γραμμές του τετραγώνου. Ο επόμενος πίνακας παρουσιάζει ένα παράδειγμα σχεδιασμού αξιοποιώντας τις γραμμές του 5 × 5
τετραγώνου, όταν η τυχαία διάταξη που έχει επιλεχθεί είναι η B, D, A, E, C.
182
ΣΧΕΔΙΑΣΜΟΣ ΠΕΙΡΑΜΑΤΩΝ
Πίνακας 8.8: 5 × 5 Σχέδιο Λατινικού Τετραγώνου
Επίπεδα Μεταβλητής
Πλαισίου 2
ΟΟ1
ΟΟ2
ΟΟ3
ΟΟ4
ΟΟ5
O1
B
D
A
E
C
O2
D
A
E
C
B
O3
A
E
C
B
D
O4
E
C
B
D
A
O5
C
B
D
A
E
Επίπεδα Μεταβλητής
Πλαισίου 1
Παράδειγμα 8.2. Εφαρμόζοντας το 5 × 5 Λατινικό Τετράγωνο του προηγούμενου Πίνακα και εκτελώντας το
πείραμα, έχουμε τις εξής μετρήσεις:
Πίνακας 8.9: Πίνακας Δεδομένων - 5 × 5 Σχέδιο Λατινικού Τετραγώνου
Επίπεδα Μεταβλητής
Πλαισίου 2
ΟΟ1
ΟΟ2
ΟΟ3
ΟΟ4
ΟΟ5
O1
B 17.9
D 8.7
A 14.4
E 20.5
C 20.0
O2
D 13.4
A 8.6
E 13.0
C 18.5
B 20.0
O3
A 21.8
E 13.5
C 20.2
B 22.7
D 10.0
O4
E 8.2
C 15.1
B 19.8
D 21.3
A 20.0
O5
C 10.0
B 7.0
D 10.0
A 12.0
E 13.0
Επίπεδα Μεταβλητής
Πλαισίου 1
To παράδειγμα αφορά τον βαθμό φθοράς ελαστικών 5 διαφορετικών τύπων ( A, B, C, D, E) λαμβάνοντας υπόψη
δύο μεταβλητές πλαισίου, ήτοι τον τύπο βενζίνης με 5 επίπεδα (Ο1, Ο2, Ο3, Ο4, Ο5) και τον τύπο αυτοκινήτου
με επίσης 5 επίπεδα (ΟΟ1, ΟΟ2, ΟΟ3, ΟΟ4, ΟΟ5).
Στόχος του πειράματος είναι η χρήση των ελαστικών (και στις τέσσερις ρόδες) όχι μόνο σε έναν τύπο αυτοκινήτου
ή σε έναν τύπο βενζίνης κίνησης, αλλά μία φορά σε κάθε συνδυασμό τύπου αυτοκινήτου και βενζίνης, με προφανή
στόχο να περιοριστεί (δηλαδή να τεθεί υπό ελέγχο) η καθεμία από τις εξωγενείς αυτές μεταβλητές (τύπος βενζίνης
και τύπος αυτοκινήτου) που θεωρείται δεδομένο ότι παίζουν ρόλο στην κίνηση και άρα στη φθορά των ελαστικών. Στην ουσία, περιορίζεται το πειραματικό σφάλμα και κατά συνέπεια, η σύγκριση των μέσων καθίσταται πιο
αξιόπιστη.
Ο γενικός τύπος του προτύπου για το m × m Λατινικό Τετράγωνο είναι:
yijk = µ + αi + oj + θk + ϵijk ,
i, j, k = 1, ..., m,
(8.17)
ΓΡΑΜΜΙΚΑ ΜΟΝΤΕΛΑ ΚΑΙ ΣΧΕΔΙΑΣΜΟΣ & ΑΝΑΛΥΣΗ ΠΕΙΡΑΜΑΤΩΝ ΜΕ ΕΦΑΡΜΟΓΕΣ ΣΕ R ΚΑΙ MINITAB
183
όπου µ ο ολικός μέσος (συχνά ορίζεται και ως µ... ), αi η επίδραση του i επιπέδου του παράγοντα ενδιαφέροντος , oj η επίδραση του επιπέδου j της μεταβλητής πλαισίου O, θk η επίδραση του επιπέδου k της άλλης
i.i.d.
μεταβλητής πλαισίου, έστω O, και ϵij ∼ N (0, σ 2 ).
Θα πρέπει να σημειωθεί ότι εκτελείται ένα μόνο πείραμα (δηλαδή μία μόνο μέτρηση) σε κάθε συνδυασμό
επιπέδων j και k των μεταβλητών πλαισίου, με τη μέτρηση να αφορά κάποιο συγκεκριμένο από τα m επίπεδα
του παράγοντα A, με αποτέλεσμα να έχει τη σημασία του ο τριπλός δείκτης της μεταβλητής απόκρισης yijk ,
αφού ο δείκτης i δηλώνει/αντιπροσωπεύει το συγκεκριμένο επίπεδο του παράγοντα ενδιαφέροντος για το
οποίο εκτελείται το πείραμα.
Όπως και στο πρότυπο ενός παράγοντα και μίας μεταβλητής πλαισίου, έτσι και εδώ και για την περίπτωση
των σταθερών επιδράσεων, οι παράμετροι α1 , . . ., αm είναι καθορισμένοι πραγματικοί αριθμοί, έτσι ώστε
P
P
α = 0. Η αντίστοιχη προϋπόθεση ισχύει και για καθεμία από τις μεταβλητές πλαισίου: j oj =
Pi i
k θk = 0, ώστε να είναι εφικτός ο μονοσήμαντος προσδιορισμός όλων των παραμέτρων του προτύπου.
Στην περίπτωση αυτή, και με βάση τα δεδομένα του προτύπου, ισχύει ότι:
E (Yijk ) = E (µ + αi + oj + θk ) = µ + αi + oj + θk & V ar (Yij ) = σ 2 .
Η μηδενική (και η αντίστοιχη εναλλακτική) υπόθεση της μη ύπαρξης διαφοράς μεταξύ των μέσων των m
πληθυσμών, δηλαδή των μηδενικών επιδράσεων των θεραπειών/επιπέδων του παράγοντα ενδιαφέροντος Α,
μπορεί να διατυπωθεί όπως και προηγουμένως:
H0 : α1 = α2 = ... = αm = 0
vs
H1 : Όχι όλα τα αi , i = 1, ..., m ίσα με 0,
(8.18)
για τη διερεύνηση της οποίας απαιτείται η αξιοποίηση του κατάλληλου Πίνακα ANOVA ο οποίος δίνεται πιο
κάτω, όπου τα σύμβολα R και C χρησιμοποιούνται για τις Γραμμές ( Rows) και τις Στήλες ( Columns) του
Τετραγώνου:
Πίνακας 8.10: Πίνακας ANOVA - m × m Σχέδιο Λατινικού Τετραγώνου
Μέσο
Πηγή
Μεταβλητότητας
Βαθμοί
Ελευθερίας
Άθροισμα
Τετραγώνων
Θεραπείες - Πληθυσμοί
m−1
SST
M ST =
SST
m−1
M ST
M SE
Blocks R - Γραμμές
m−1
SSR
M SR =
SSR
m−1
M SR
M SE
Blocks C - Στήλες
m−1
SSC
M SC =
SSC
m−1
M SC
M SE
Σφάλματα
(m − 1)(m − 2)
SSE
SSE
(m−1)(m−2)
–
Ολική
m2 − 1
SST O
–
–
Άθροισμα
F
Τετραγώνων
M SE =
Από το Θεώρημα Cochran έχουμε και πάλι ότι η ελεγχοσυνάρτηση για τον έλεγχο της πιο πάνω H0 , είναι η
ακόλουθη:
SST
M ST
H0
m−1
F =
=
∼ Fm−1,(m−1)(m−2) ,
SSE
M SE
(m−1)(m−2)
ενώ το χωρίο απόρριψης της H0 είναι το εξής:
F > Fm−1,(m−1)(m−2);α ,
184
ΣΧΕΔΙΑΣΜΟΣ ΠΕΙΡΑΜΑΤΩΝ
όπου Fm−1,(m−1)(m−2);α το 100(1 − α)% ποσοστημόριο της κατανομής F με m − 1 και (m − 1)(m − 2)
βαθμούς ελευθερίας.
Από τα παραπάνω είναι προφανές ότι αν η μηδενική υπόθεση είναι αληθής, τότε το πρότυπο απλοποιείται
και παίρνει τη μορφή:
yijk = µ + oj + θk + ϵijk
για κάθε επίπεδο i του παράγοντα ενδιαφέροντος, που σημαίνει ότι δεν υπάρχει διαφοροποίηση μεταξύ των
πληθυσμών/επιπέδων/θεραπειών και άρα η συνολική μεταβλητότητα των δεδομένων αποδίδεται αφενός μεν
στους συνδυασμούς των επιπέδων των 2 μεταβλητών πλαισίου (κάτι που ήταν γνωστό στον Ερευνητή από
την αρχή) αφετέρου δε, σε τυχαία σφάλματα και άρα οι πληθυσμοί δεν διαφέρουν μεταξύ τους, δηλαδή ως
προς τα επίπεδα του παράγοντα ενδιαφέροντος A.
Σημειώνεται ότι ο Πίνακας ANOVA περιλαμβάνει δύο γραμμές με πληροφορίες για τις μεταβλητές πλαισίου, δίνοντας το SSR ( Sum of Squares of Rows) και το SSC ( Sum of Squares of Columns), καθώς και
τα αντίστοιχα M SR και M SC με τους αντίστοιχους β.ε και τις τιμές των αντίστοιχων ελεγχοσυναρτήσεων
F = M SR/M SE και F = M SC/M SE. Οι δύο τελευταίες ποσότητες μπορούν να αξιοποιηθούν για
τη διερεύνηση της ισότητας των ίσων μέσων της μεταβλητής απόκρισης για τα διαφορετικά επίπεδα της κάθε
μεταβλητής πλαισίου, δηλαδή για τη διερεύνηση των υποθέσεων:
H0 : o1 = o2 = . . . = om = 0
vs
H1 : Όχι όλα τα oj , j = 1, . . . , m ίσα με 0
H0 : θ1 = θ2 = . . . = θm = 0
vs
H1 : Όχι όλα τα θk , k = 1, . . . , m ίσα με 0.
και
Οι συμπληρωματικοί αυτοί έλεγχοι γίνονται για τυπικούς λόγους, στην περίπτωση που ο Ερευνητής θέλει να
επιβεβαιώσει την αρχική του υπόθεση (που συνήθως προκύπτει είτε από τη βιβλιογραφία είτε από πρότερη
εμπειρία είτε και από τα δύο μαζί) ότι υφίσταται διαφοροποίηση μεταξύ των επιπέδων των μεταβλητών πλαισίου. Δεν αποκλείεται φυσικά, οι συνθήκες να έχουν αλλάξει και να μην υφίσταται πλέον (για οποιονδήποτε
λόγο) διαφοροποίηση (είτε για τη μία είτε για την άλλη είτε και για τις δύο μεταβλητές πλαισίου), οπότε ο
έλεγχος, εφόσον το διαπιστώσει, θα οδηγήσει στην κατάργηση της σχετικής ομαδοποίησης (ως προς τη μία ή
την άλλη ή και τις δύο μεταβλητές πλαισίου, δηλαδή ως προς τις γραμμές ή τις στήλες ή και τα δύο) σε οποιαδήποτε μελλοντικά πειράματα. Κατά αντιστοιχία με τον έλεγχο των μηδενικών επιδράσεων για τις θεραπείες,
τα χωρία απορρίψεων των πιο πάνω μηδενικών υποθέσεων σε επίπεδο σημαντικότητας α, δίνονται από τις
σχέσεις:
SSR
M SR
m−1
=
> Fm−1,(m−1)(m−2);α ,
FR =
SSE
M SE
(m−1)(m−2)
και
FC =
M SC
=
M SE
SSC
m−1
SSE
(m−1)(m−2)
> Fm−1,(m−1)(m−2);α .
Αξίζει να τονιστεί ότι η κρίσιμη τιμή ισούται με Fm−1,(m−1)(m−2);α και είναι κοινή και για τους τρεις ελέγχους, λόγω του ότι οι τρεις εμπλεκόμενες μεταβλητές (συμπεριλαμβανομένου του παράγοντα ενδιαφέροντος)
έχουν τον ίδιο αριθμό επιπέδων (m), κάτι που αποτελεί προϋπόθεση για την εφαρμογή της τεχνικής των Λατινικών Τετραγώνων.
Το πρότυπο του σχεδιασμού των Λατινικών Τετραγώνων, όπως ορίστηκε νωρίτερα, υποθέτει ότι δεν υφίσταται αλληλεπίδραση ούτε μεταξύ των μεταβλητών πλαισίου ούτε μεταξύ του παράγοντα ενδιαφέροντος και
καθεμίας από τις δύο μεταβλητές πλαισίου.
ΓΡΑΜΜΙΚΑ ΜΟΝΤΕΛΑ ΚΑΙ ΣΧΕΔΙΑΣΜΟΣ & ΑΝΑΛΥΣΗ ΠΕΙΡΑΜΑΤΩΝ ΜΕ ΕΦΑΡΜΟΓΕΣ ΣΕ R ΚΑΙ MINITAB
185
Επίσης, σημειώνεται ότι η μεθοδολογία των Λατινικών Τετραγώνων εφαρμόζεται χωρίς διαφοροποιήσεις,
ακόμα και αν οι 2 μεταβλητές πλαισίου (δηλαδή οι εξωγενείς μεταβλητές) είναι τυχαίων επιδράσεων, δηλαδή
όταν τα υπό εξέταση επίπεδά τους επιλέγονται τυχαία από ένα σύνολο πολύ περισσότερων επιπέδων, αρκεί ο
παράγοντας ενδιαφέροντος να είναι σταθερών επιδράσεων.
Τέλος, θα πρέπει να αναφερθεί ότι η εφαρμογή πολλαπλών συγκρίσεων ακολουθεί τη συνήθη μεθοδολογία,
όπως έχει οριστεί ήδη στην Ενότητα 8.2.1.
Παράδειγμα 8.3. Ο Πίνακας ANOVA για το παράδειγμα ελαστικών (Παράδειγμα 8.2) με βάση το 5 × 5 Λατινικό Τετράγωνο, δίνεται στη συνέχεια:
Πίνακας 8.11: Πίνακας ANOVA - 5 × 5 Σχέδιο Λατινικού Τετραγώνου
Πηγή
Μεταβλητότητας
Βαθμοί
Ελευθερίας
Άθροισμα
Τετραγώνων
Θεραπείες - Πληθυσμοί
4
111.2
Blocks - Γραμμές ( Rows)
4
Blocks - Στήλες ( Columns)
Μέσο
F
p-value
27.81
2.08
0.146
218.2
54.55
4.09
0.026
4
194.6
48.64
3.64
0.036
Σφάλματα
12
160.3
13.35
–
–
Ολική
24
684.3
–
–
–
Άθροισμα
Τετραγώνων
Από τα πιο πάνω αποτελέσματα συνάγεται ότι οι διαφορετικοί τύποι ελαστικών δεν διαφέρουν ως προς τη φθορά,
αφού ο σχετικός έλεγχος δίνει p-value = 0.146 που είναι σημαντικά μεγαλύτερο από τα συνήθη επίπεδα σημαντικότητας (5% και 10%). Από την άλλη πλευρά, η εκ των προτέρων γνωστή επίδραση του τύπου βενζίνης, καθώς
και του τύπου αυτοκινήτου, επιβεβαιώνονται, αφού οι p-values που προκύπτουν είναι μικρότερες από το σύνηθες
5% επίπεδο σημαντικότητας (2.6% και 3.6% αντίστοιχα). Η διερεύνηση έχει γίνει με τη χρήση του Στατιστικού
πακέτου Minitab ακολουθώντας τη διαδρομή:
Stat
Ê
ANOVA
Ê
General Linear Model
Ê
Fit General Linear Model
Όσον αφορά την καταχώριση των δεδομένων, αυτά παρατίθενται σε 4 στήλες με τις 3 πρώτες να αφορούν τις “τιμές”
των επιπέδων των τριών εμπλεκόμενων μεταβλητών (συμπεριλαμβανομένου του παράγοντα ενδιαφέροντος) και
την τελευταία να αφορά τις μετρήσεις (που αντιστοιχούν στον κάθε συνδυασμό επιπέδων των τριών μεταβλητών).
Συνολικά, χρησιμοποιούνται 25 γραμμές στο κεντρικό παράθυρο του Minitab, μία για κάθε μέτρηση του πειράματος.
Άσκηση Αυτοαξιολόγησης
Να προσδιοριστούν τα 12 Λατινικά Τετράγωνα διάστασης 3 × 3. Πόσα από αυτά είναι
πρότυπα;
186
ΣΧΕΔΙΑΣΜΟΣ ΠΕΙΡΑΜΑΤΩΝ
8.4 Διπαραγοντικά πειράματα πλήρους τυχαιοποίησης (Διπαραγοντική ανάλυση διακύμανσης)
Τα παραγοντικά πειράματα αναφέρονται συχνά και ως πλήρη παραγοντικά πειράματα ή πλήρεις πειραματικοί
σχεδιασμοί και αφορούν σχεδιασμούς όπου εμπλέκονται περισσότεροι από ένας παράγοντες ενδιαφέροντος οι
οποίοι επιδρούν στη μεταβλητή απόκρισης είτε ανεξάρτητα ο καθένας είτε και συνδυαστικά στη μεταβλητή
απόκρισης. Στα πειράματα αυτά, ο βασικός στόχος του Ερευνητή είναι η διερεύνηση της επίδρασης στη μεταβλητή απόκρισης αφενός μεν του καθενός παράγοντα αυτόνομα με τις επιδράσεις αυτές να ονομάζονται
κύριες επιδράσεις, αφετέρου δε, της καθεμιάς αλληλεπίδρασης (ανά δύο παραγόντων, ανά τριών κ.ο.κ.) με τις
επιδράσεις αυτές να αναφέρονται απλά ως αλληλεπιδράσεις.
Όπως και στην περίπτωση του ενός παράγοντα, αν η μελέτη αφορά το σύνολο των συνδυασμών των επιπέδων
των εμπλεκόμενων παραγόντων, επικεντρώνεται στη σύγκριση των μέσων τιμών της μεταβλητής απόκρισης
στους αντίστοιχους συνδυασμούς των επιπέδων των παραγόντων (ή πληθυσμούς) και αφορά το Πρότυπο
Σταθερών Επιδράσεων. Αν η μελέτη αφορά ένα τυχαία επιλεγμένο υποσύνολο όλων των δυνατών συνδυασμών, τότε επικεντρώνεται στην ανάλυση της μεταβλητότητας και την εκτίμηση των συνιστωσών της που
οφείλονται σε κάθε κύρια επίδραση και κάθε αλληλεπίδραση, και αφορά το Πρότυπο Τυχαίων Επιδράσεων.
Ο ενδιαφερόμενος αναγνώστης μπορεί να ανατρέξει στα συγγράμματα των Hicks [18], Lawson [19] και
Montgomery [22] για λεπτομέρειες σε θέματα σχεδιασμού πειραμάτων τέτοιου είδους.
8.4.1 Πρότυπο με και χωρίς αλληλεπίδραση
Η μελέτη ενός διπαραγοντικού πειράματος, δηλαδή ενός πειράματος με δύο παράγοντες, έστω A και B με
a και b επίπεδα αντίστοιχα, μπορεί να θεωρηθεί ότι προσομοιάζει (ως προς τη μαθηματική προσέγγιση) με
τη μελέτη ενός παράγοντα στην παρουσία μίας μεταβλητής πλαισίου η οποία παίζει τον ρόλο του δεύτερου
παράγοντα. Επιπρόσθετα, στη μελέτη εμπλέκεται και η αλληλεπίδραση των δύο παραγόντων, κάτι που δεν
είναι σύνηθες στην περίπτωση του προτύπου με μία μεταβλητή πλαισίου.
Μιμούμενοι το πρότυπο (8.10) μπορούμε να ορίσουμε δύο πρότυπα, αυτό χωρίς αλληλεπίδραση που δίνεται από τον τύπο:
yijk = µij + ϵijk ≡ µ + αi + βj + ϵijk ,
i = 1, ..., a,
j = 1, ..., b,
k = 1, ..., n,
(8.19)
όπου n o αριθμός επαναλήψεων (μετρήσεων) ανά συνδυασμό επιπέδων των A και B, µij η επίδραση του
συνδυασμού του i επιπέδου του παράγοντα ενδιαφέροντος και του j επιπέδου του παράγοντα ενδιαφέροντος
B (δηλαδή όταν το πείραμα εκτελείται στον συνδυασμό επιπέδων (i, j)), µ ο ολικός μέσος (συχνά ορίζεται
και ως µ.. ), αi η επίδραση του i επιπέδου του παράγοντα ενδιαφέροντος , βj η επίδραση του j επιπέδου του
i.i.d.
παράγοντα B και ϵijk ∼ N (0, σ 2 ) με τις σχέσεις που συνδέουν τις παραμέτρους του προτύπου να είναι:
αi = µi· − µ & βj = µ.j − µ,
καθώς και αυτό με αλληλεπίδραση:
yijk = µij + ϵijk ≡ µ + αi + βj + (αβ)ij + ϵijk ,
i = 1, ..., a,
j = 1, ..., b,
k = 1, ..., n,
(8.20)
όπου επιπρόσθετα των προηγουμένων όρων, ο όρος (αβ)ij αντιπροσωπεύει την επίδραση στη θεραπεία (i, j)
(δηλαδή στον συνδυασμό επιπέδων), που οφείλεται στην αλληλεπίδραση των δύο παραγόντων A και B, για
τον οποίο ισχύει η σχέση:
(αβ)ij = µij − (µ − αi − βj ) = µij − µi· − µ.j + µ.
Οι παράμετροι του προτύπου ικανοποιούν τις σχέσεις:
X
i
αi =
X
j
βi =
X
i
(αβ)ij =
X
j
(αβ)ij = 0.
(8.21)
(8.22)
ΓΡΑΜΜΙΚΑ ΜΟΝΤΕΛΑ ΚΑΙ ΣΧΕΔΙΑΣΜΟΣ & ΑΝΑΛΥΣΗ ΠΕΙΡΑΜΑΤΩΝ ΜΕ ΕΦΑΡΜΟΓΕΣ ΣΕ R ΚΑΙ MINITAB
187
Όπως είχε τονιστεί και προηγουμένως, η μελέτη της αλληλεπίδρασης απαιτεί το πείραμα να εκτελεστεί τουλάχιστον μία φορά (δηλαδή με επανάληψη) ανά θεραπεία (συνδυασμό επιπέδων των A και B), αφού όπως
έχει ειπωθεί, η επανάληψη εξασφαλίζει τη διερεύνηση του κατά πόσο η ταυτόχρονη εμπλοκή δύο παραγόντων (δηλαδή η αλληλεπίδρασή τους) επηρεάζει τη μεταβλητή απόκρισης. Η μελέτη της αλληλεπίδρασης
αποτελεί ένα από τα κυριότερα πλεονεκτήματα των παραγοντικών πειραμάτων, διότι η διερεύνηση της αλληλεπίδρασης διευκολύνει την εξαγωγή έγκυρων συμπερασμάτων, ιδιαιτέρως όταν η αυτόνομη παρουσία του
κάθε παράγοντα δεν έχει επίδραση στη μεταβλητή απόκρισης, αλλά η επίδραση οφείλεται (ακόμα και σχεδόν αποκλειστικά) στην από κοινού επίδραση (δηλαδή στην αλληλεπίδραση) των εμπλεκόμενων παραγόντων. Σημειώνεται ότι στη βιομηχανία, μία δημοφιλής παραλλαγή των παραγοντικών πειραμάτων είναι τα
πειράματα αλλαγής ενός παράγοντα κάθε φορά, όπου για παράδειγμα, εκτελούνται πειράματα σε κάθε επίπεδο
ενός παράγοντα με τους υπόλοιπους παράγοντες να διατηρούνται σταθεροί (στο ίδιο επίπεδο). Η διαδικασία επαναλαμβάνεται για κάθε εμπλεκόμενο παράγοντα (με τους υπόλοιπους να διατηρούνται σταθεροί). Αν
και δημοφιλής στη βιομηχανία, η προσέγγιση αυτή δεν διευκολύνει την αξιόπιστη αξιολόγηση των αλληλεπιδράσεων, και αυτό διότι αν κάποιος παράγοντας δεν επενεργεί ανεξάρτητα στη μεταβλητή απόκρισης (όπως
αναφέρθηκε προηγουμένως ότι είναι δυνατόν να συμβεί στην πράξη) η εκτέλεση πειραμάτων στα διάφορα
επίπεδά του δεν αναδεικνύει τις επιδράσεις που οφείλονται σε αλληλεπιδράσεις (αφού οι υπόλοιποι παράγοντες δεν μεταβάλλονται, αλλά διατηρούνται σταθεροί).
Τόσο το πρότυπο με, όσο και το πρότυπο χωρίς αλληλεπίδραση προϋποθέτουν την ικανοποίηση των κλασικών προϋποθέσεων, όπως έχουν διατυπωθεί στην Ανάλυση Παλινδρόμησης, καθώς και στην Ανάλυση Διακύμανσης κατά έναν παράγοντα, δηλαδή την κανονικότητα, την ανεξαρτησία και την ομοσκεδαστικότητα
(Ενότητα 7.6). Η διερεύνηση των προϋποθέσεων αυτών γίνεται με την Ανάλυση Καταλοίπων, όπως είχε γίνει και νωρίτερα. Σημειώνεται πάντως ότι ακόμα και μικρές αποκλίσεις από την Κανονικότητα δεν μειώνουν
την αξιοπιστία των ελέγχων που διενεργούνται, διότι οι ελεγχοσυναρτήσεις που βασίζονται στην κατανομή
F παραμένουν προσεγγιστικά σωστές, ακόμα και όταν τα σφάλματα δεν ακολουθούν την κανονική κατανομή
[14, 15].
H ομοιότητα του προτύπου με αυτό των σταθερών επιδράσεων σε πρότυπο ενός παράγοντα με μία μεταβλητή
πλαισίου, καλύπτει τόσο την εκτίμηση των εμπλεκόμενων παραμέτρων όσο και τη μελέτη των σχετικών ελέγχων υποθέσεων. Για διευκόλυνση, αναπαράγεται κατωτέρω ο Πίνακας Δεδομένων 8.1 όπου απλά η Θεραπεία
και το Block αναφέρονται ως Παράγοντας Α και Παράγοντας Β, ενώ σε κάθε συνδυασμό επιπέδων (δηλαδή σε
κάθε κελί) έχουμε n επαναλήψεις (πειράματα). Αν n = 1 ο νέος Πίνακας 8.12 ταυτίζεται με τον Πίνακα 8.1.
Πίνακας 8.12: Πίνακας Δεδομένων - Διπαραγοντική Ανάλυση με ή χωρίς Αλληλεπίδραση
Παράγοντας Β
1
2
...
b
Μέσος A
Εκτιμητής
1
y111 , ..., y11n
y121 , ..., y12n
···
y1b1 , ..., y1bn
µ1.
ȳ1..
2
..
.
y211 , ..., y21n
..
.
y221 , ..., y22n
..
.
···
···
y2b1 , ..., y2bn
..
.
µ2.
..
.
ȳ2..
..
.
a
ya11 , ..., ya1n
ya21 , ..., ya2n
···
yab1 , ..., yabn
µa.
ȳa..
Μέσος B
µ.1
µ.2
···
µ.b
µ(µ.. )
Εκτιμητής
ȳ.1.
ȳ.2.
···
ȳ.b.
Παράγοντας Α
Με βάση τα παραπάνω, οι εκτιμητές των κύριων επιδράσεων δίνονται από τους τύπους:
α̂i = µ̂i. − µ̂ = ȳi.. − ȳ...
ȳ...
188
ΣΧΕΔΙΑΣΜΟΣ ΠΕΙΡΑΜΑΤΩΝ
και
β̂j = µ̂.j − µ̂ = ȳ.j. − ȳ...
P
όπου:
µ̂i. = ȳi.. =
yijk
,
bn
j,k
P
µ̂.j = ȳ.j. =
yijk
an
i,k
P
και
yijk
.
abn
Είναι προφανές ότι για την εκτίμηση της μέσης τιμής μίας συγκεκριμένης θεραπείας (i, j) (δηλαδή για τον
πληθυσμό που αντιστοιχεί σε συγκεκριμένο κελί του Πίνακα 8.12) θα υπολογιστεί ο δειγματικός μέσος των
n επαναλήψεων του πειράματος που εκτελέστηκαν για τον συγκεκριμένο συνδυασμό επιπέδων i και j των
παραγόντων A και B:
Pn
yijk
µ̂ij = ȳij. = k=1
n
έτσι ώστε με βάση τη σχέση (8.21) η εκτίμηση της αλληλεπίδρασης να δίνεται από τον τύπο:
µ̂ = µ̂.. = ȳ... =
i,j,k
d
(αβ)
ij = ȳij. − ȳi.. − ȳ.j. + ȳ... .
Η μελέτη προτύπων με περισσότερους από έναν παράγοντες, μπορεί να γίνει σε πρώιμο στάδιο με τη χρήση
απλών γραφικών μεθόδων που δίνουν στον Ερευνητή μία εικόνα των ενδεχόμενων επιδράσεων στη μεταβλητή
απόκρισης. Αν και χρήσιμες, τέτοιες τεχνικές δεν μπορούν να αναδείξουν τη στατιστική σημαντικότητα των
επιδράσεων, μπορούν όμως να διευκολύνουν τον Ερευνητή στο έργο του και να τον προϊδεάσουν για το τι
αναμένεται να συναντήσει κατά τη στατιστική ανάλυση του προβλήματος. Τα κλασικά γραφικά που χρησιμοποιούνται μαζικά είναι:
• το Διάγραμμα Κουκκίδων το οποίο μπορεί να αναδείξει διαφορές μεταξύ των επιπέδων των παραγόντων,
αλλά δεν βοηθάει στην αξιολόγηση των αλληλεπιδράσεων,
• το Θηκόγραμμα το οποίο λειτουργεί όπως το Διάγραμμα Κουκκίδων, αν και απαιτεί να υπάρχουν αρκετές παρατηρήσεις ανά θεραπεία (τουλάχιστον 5 ή 6), ώστε να δώσει μία ικανοποιητική εικόνα των
κύριων επιδράσεων,
• το Διάγραμμα Κύριων Επιδράσεων το οποίο δίνει μία συγκριτική εικόνα των μέσων ανά θεραπεία (δηλαδή
ανά συνδυασμό επιπέδων των παραγόντων) και
• το Διάγραμμα Αλληλεπιδράσεων για την οπτική ανάδειξη επιδράσεων που οφείλονται σε αλληλεπιδράσεις, και δίνει μία συγκριτική εικόνα των μέσων ξεχωριστά για κάθε επίπεδο του ενός παράγοντα σε
σχέση με καθένα επίπεδο του (των) άλλου (άλλων). Τα διαγράμματα αυτά καθίστανται δύσχρηστα
όταν οι εμπλεκόμενοι παράγοντες είναι περισσότεροι από δύο ή τρεις.
Το παρακάτω παράδειγμα αναδεικνύει τη χρησιμότητα των πιο πάνω διαγραμματικών μεθόδων οπτικής αξιολόγησης των επιδράσεων σε ένα πρότυπο διπαραγοντικής ανάλυσης.
Παράδειγμα 8.4. Δίνονται τα δεδομένα του πιο κάτω πίνακα που αφορούν τις μετρήσεις που έγιναν σε μία μεταβλητή απόκρισης όπου εμπλέκονται δύο παράγοντες A και B με δύο (2) επίπεδα έκαστος (πρότυπο σταθερών
επιδράσεων). Το πείραμα εκτελέστηκε τέσσερις φορές ανά συνδυασμό επιπέδων (δηλαδή έγιναν 4 επαναλήψεις).
ΓΡΑΜΜΙΚΑ ΜΟΝΤΕΛΑ ΚΑΙ ΣΧΕΔΙΑΣΜΟΣ & ΑΝΑΛΥΣΗ ΠΕΙΡΑΜΑΤΩΝ ΜΕ ΕΦΑΡΜΟΓΕΣ ΣΕ R ΚΑΙ MINITAB
189
Πίνακας 8.13: Πίνακας Δεδομένων - Γραφικές Μέθοδοι
Παράγοντας Β
1
2
Μέσος A
Εκτιμητής
1
120, 125, 130, 132
120, 116, 110, 112
µ1.
ȳ1.. = 120.83
2
96, 98, 100, 106
88, 90, 86, 86
µ2.
ȳ2.. = 93.75
Μέσος B
µ.1
µ.2
µ(µ.. )
Εκτιμητής
ȳ.1. = 113.38
ȳ.2. = 101.00
Παράγοντας Α
ȳ... = 107.19
Παρατηρούμε ότι το πρόβλημα έχει τέσσερις θεραπείες (πληθυσμούς) που αντιστοιχούν στους 4 συνδυασμούς των
επιπέδων των A και B: (1, 1), (1, 2), (2, 1) και (2, 2). Στόχος της μελέτης είναι να διαπιστωθεί (οπτικά) αν
oι κύριες επιδράσεις α1 , α2 , β1 , β2 αλλά και οι 4 αλληλεπιδράσεις (αβ)11 , (αβ)12 , (αβ)21 , και (αβ)22 , είναι
σημαντικές ή όχι. Δύο πρώτα σχόλια που μπορούν να γίνουν παρατηρώντας τα δεδομένα είναι τα ακόλουθα:
• Οι μετρήσεις που αντιστοιχούν στο επίπεδο 2 του παράγοντα A φαίνεται να είναι αρκετά μικρότερες από
τις αντίστοιχες μετρήσεις στο επίπεδο 1 του παράγοντα A.
• Οι μετρήσεις που αντιστοιχούν στα δύο επίπεδα του παράγοντα B φαίνεται να είναι συγκρίσιμες.
• Οι διαγώνιες μετρήσεις, δηλαδή αυτές που αντιστοιχούν στα επίπεδα (1, 2) και (2, 1) (δηλαδή αυτές που
αντιστοιχούν σε χιαστί τιμές των επιπέδων των A και B) δεν φαίνεται να διαφέρουν από αυτές που αντιστοιχούν στα επίπεδα (1, 1) και (2, 2).
Από τα ανωτέρω ο Ερευνητής μπορεί να υποψιαστεί ότι ο παράγοντας A φαίνεται να επιδρά, κάτι που μάλλον δεν
ισχύει για τον παράγοντα B (ή αν ισχύει θα ισχύει σε πολύ χαμηλότερο επίπεδο), αλλά ούτε και για την αλληλεπίδραση.
Είναι εύκολο να διαπιστωθεί ότι οι εκτιμητές των μέσων στους 4 πληθυσμούς/θεραπείες (κελιά του πίνακα δεδομένων) είναι:
µ̂11 = ȳ11. = 126.75, µ̂12 = ȳ12. = 114.50
και
µ̂21 = ȳ21. = 100.00,
µ̂22 = ȳ22. = 87.5.
Η διαδρομή στο Minitab για τον σχεδιασμό των τεσσάρων γραφημάτων είναι η ακόλουθη:
• Διάγραμμα Κουκκίδων:
Graph
Ê
Dotplot
Ê
Stack Groups
τικάροντας την επιλογή Stack dots of last categorical variable, με τη Graph Variable να είναι η μεταβλητή
απόκρισης και οι Categorical Variables να είναι οι δύο παράγοντες A και B.
• Θηκόγραμμα:
Graph
Ê
με τις μεταβλητές όπως και προηγουμένως.
Boxplot
Ê
With Groups
190
ΣΧΕΔΙΑΣΜΟΣ ΠΕΙΡΑΜΑΤΩΝ
• Διάγραμμα Κύριων Επιδράσεων:
Stat
Ê
ANOVA
Ê
Main Effects Plot
με τη μεταβλητή απόκρισης να ανατίθεται στα Responses και τους παράγοντες A και B στα Factors, και
• Διάγραμμα Αλληλεπιδράσεων:
Stat
Ê
ANOVA
Ê
Interaction Plot
με τις μεταβλητές, όπως και προηγουμένως. Συστήνεται να τικαριστεί η επιλογή Display full interaction
plot matrix, ώστε ο Ερευνητής να έχει καλύτερη εικόνα των αλληλεπιδράσεων από δύο γωνίες (τον παράγοντα A ως προς τον B, καθώς και αντιστρόφως).
Τα Διαγράμματα Κουκκίδων, Κύριων Επιδράσεων και Αλληλεπιδράσεων του προηγουμένου παραδείγματος, δίνονται πιο κάτω:
Σχήμα 8.1: Διάγραμμα Κουκκίδων
Σχήμα 8.2: Διάγραμμα Κύριων Επιδράσεων
ΓΡΑΜΜΙΚΑ ΜΟΝΤΕΛΑ ΚΑΙ ΣΧΕΔΙΑΣΜΟΣ & ΑΝΑΛΥΣΗ ΠΕΙΡΑΜΑΤΩΝ ΜΕ ΕΦΑΡΜΟΓΕΣ ΣΕ R ΚΑΙ MINITAB
191
Σχήμα 8.3: Διάγραμμα Αλληλεπιδράσεων
Τα γραφήματα δείχνουν με σαφήνεια ότι (πρέπει να) υπάρχει επίδραση του παράγοντα A αλλά και του παράγοντα
B (αν και αυτή φαίνεται να είναι σαφώς μικρότερης ισχύος). Το Διάγραμμα Αλληλεπίδρασης δείχνει με σαφήνεια μία παραλληλία ή οποία συνδέεται με απουσία αλληλεπίδρασης. Αν η οπτική αυτή αξιολόγηση με τη χρήση
διαγραμμάτων, επιβεβαιωθεί και στατιστικά (με τον Πίνακα ANOVA), το ιδανικό πρότυπο θα είναι ένα πρότυπο
χωρίς αλληλεπίδραση.
Με την ολοκλήρωση της γραφικής αξιολόγησης, ο Ερευνητής μπορεί να προχωρήσει στη στατιστική ανάλυση μέσω
της Ανάλυσης Διακύμανσης. Για την κατανόηση της τεχνικής, επικεντρωνόμαστε στη συνέχεια τόσο για την περίπτωση του Προτύπου Σταθερών Επιδράσεων όσο και για την περίπτωση του Προτύπου Τυχαίων Επιδράσεων,
στη μελέτη δύο παραγόντων με αλληλεπίδραση, αν και η αναγωγή στην περίπτωση περισσότερων παραγόντων
είναι προφανής.
8.4.2 Πρότυπο σταθερών επιδράσεων
Επανερχόμαστε στο πρότυπο δύο παραγόντων A και B με αλληλεπίδραση:
yijk = µ + αi + βj + (αβ)ij + ϵijk ,
i = 1, ..., a,
j = 1, ..., b,
k = 1, ..., n
(8.23)
και έστω κατά τα συνήθη, τα κατάλοιπα να ορίζονται ως εξής:
ϵ̂ijk = ŷijk − yijk ,
όπου:
d ,
ŷijk = µ̂ + α̂i + β̂j + (αβ)
ij
όπου η εκτίμηση ŷijk της τιμής yijk της μεταβλητής απόκρισης προκύπτει αξιοποιώντας τους εκτιμητές των
παραμέτρων αi , βj και (αβ)ij , όπως δόθηκαν στην προηγούμενη ενότητα.
Ο πίνακας ANOVA, για την περίπτωση του προτύπου με 2 παράγοντες A και B και αλληλεπίδραση, δίνεται
στη συνέχεια, όπου:
• Οι βαθμοί ελευθερίας κάθε παράγοντα είναι ίσοι με τον αριθμό των αντίστοιχων επιπέδων μειωμένο
κατά ένα, δηλαδή με a − 1 και b − 1 αντίστοιχα.
192
ΣΧΕΔΙΑΣΜΟΣ ΠΕΙΡΑΜΑΤΩΝ
• Οι βαθμοί ελευθερίας της αλληλεπίδρασης AB ισούνται με το γινόμενο των βαθμών ελευθερίας των
δύο παραγόντων, δηλαδή με (a − 1)(b − 1).
• Οι συνολικοί βαθμοί ελευθερίας είναι ως συνήθως ίσοι με το σύνολο των δεδομένων (μετρήσεων) μειωμένοι κατά ένα, δηλαδή με abn−1, ενώ οι βαθμοί ελευθερίας για τα σφάλματα είναι ίσοι με τη διαφορά
[abn − 1] − [(a − 1) + (b − 1) + (a − 1)(b − 1)].
• Το συνολικό (ολικό) άθροισμα τετραγώνων που αντιπροσωπεύει τη συνολική μεταβλητότητα ισούται
P
με SST O = ijk (yijk − ȳ... )2 .
• Το άθροισμα των τετραγωνικών σφαλμάτων ισούται με SSE =
P
2
ijk ϵ̂ijk
=
P
ijk
(yijk − ŷijk )2
• Η συνολική μεταβλητότητα που μπορεί να εξηγηθεί/δικαιολογηθεί από το πρότυπο είναι:
SSR = SST O − SSE =
X
(ŷijk − ŷ... )2 ,
ijk
που δεν είναι δύσκολο να δειχθεί ότι ισούται με:
SSR = SSA + SSB + SSAB
=
X
(ȳi.. − ȳ... )2 +
X
ijk
(ȳ.j. − ȳ... )2 +
ijk
X
(ȳij. − ȳi.. − ȳ.j. + ȳ... )2 .
(8.24)
ijk
Πίνακας 8.14: Πίνακας ANOVA - Διπαραγοντική Ανάλυση με Αλληλεπίδραση - Σταθερές Επιδράσεις
Μέσο
Πηγή
Μεταβλητότητας
Βαθμοί
Ελευθερίας
Άθροισμα
Τετραγώνων
A
a−1
SSA
M SA =
SSA
(a−1)
M SA
M SE
B
b−1
SSB
M SB =
SSB
(b−1)
M SB
M SE
AB
(a − 1)(b − 1)
SSAB
Σφάλματα
ab(n − 1)
SSE
Ολική
abn − 1
SST O
Άθροισμα
F
Τετραγώνων
M SAB =
M SE =
SSAB
(a−1)(b−1)
SSE
ab(n−1)
–
M SAB
M SE
–
–
Η μηδενική (και η αντίστοιχη εναλλακτική) υπόθεση των μηδενικών (κύριων) επιδράσεων του παράγοντα
A, μπορεί να διατυπωθεί κατά τα συνήθη:
H0 : αi = 0
vs
H1 : Όχι όλα τα αi , i = 1, ..., a, ίσα με 0.
(8.25)
Από το Θεώρημα Cochran έχουμε και πάλι ότι η ελεγχοσυνάρτηση για τον έλεγχο της πιο πάνω H0 , όπως
φαίνεται και από την τελευταία στήλη του Πίνακα ANOVA, είναι η ακόλουθη:
M SA
F =
=
M SE
SSA
a−1 H0
SSE ∼
abn−1
Fa−1,abn−1 ,
ενώ το χωρίο απόρριψης της H0 είναι το εξής:
F > Fa−1,abn−1;α ,
ΓΡΑΜΜΙΚΑ ΜΟΝΤΕΛΑ ΚΑΙ ΣΧΕΔΙΑΣΜΟΣ & ΑΝΑΛΥΣΗ ΠΕΙΡΑΜΑΤΩΝ ΜΕ ΕΦΑΡΜΟΓΕΣ ΣΕ R ΚΑΙ MINITAB
193
όπου Fa−1,abn−1;α το 100(1 − α)% ποσοστημόριο της κατανομής F με a − 1 και abn − 1 βαθμούς ελευθερίας.
Κατά αντιστοιχία, η μηδενική (και η αντίστοιχη εναλλακτική) υπόθεση των μηδενικών (κύριων) επιδράσεων
του παράγοντα B, μπορεί να διατυπωθεί ως εξής:
H0 : βj = 0
vs
H1 : Όχι όλα τα βj , j = 1, ..., b, ίσα με 0,
(8.26)
ενώ τώρα ισχύει ότι:
F =
M SB
=
M SE
SSB
b−1 H0
SSE ∼
abn−1
Fb−1,abn−1 ,
με το χωρίο απόρριψης της H0 να είναι το εξής:
F > Fb−1,abn−1;α ,
όπου Fb−1,abn−1;α το 100(1 − α)% ποσοστημόριο της κατανομής F με b − 1 και abn − 1 βαθμούς ελευθερίας.
Τέλος, ο έλεγχος για την απουσία αλληλεπίδρασης είναι:
H0 : (αβ)ij = 0
vs
H1 : όχι όλα τα (αβ)ij , i = 1, ..., a, j = 1, ..., b, ίσα με 0,
(8.27)
ενώ τώρα ισχύει ότι:
M SAB
F =
=
M SE
SSAB
(a−1)(b−1) H0
∼
SSE
abn−1
F(a−1)(b−1),abn−1 ,
με το χωρίο απόρριψης της H0 να είναι το εξής:
F > F(a−1)(b−1),abn−1;α ,
όπου F(a−1)(b−1),abn−1;α το 100(1 − α)% ποσοστημόριο της κατανομής F με (a − 1)(b − 1) και abn − 1
βαθμούς ελευθερίας.
Ο σημαντικότερος από τους τρεις ελέγχους της διπαραγοντικής ανάλυσης διακύμανσης είναι ο έλεγχος απουσίας αλληλεπίδρασης γιατί αν ο έλεγχος αναδείξει ότι η αλληλεπίδραση είναι στατιστικώς σημαντική (σε
όποιο επίπεδο σημαντικότητας α επιλέξει ο Ερευνητής), τότε το πρότυπο θα πρέπει να παραμείνει στην αρχική του μορφή, όπως δίνεται στη σχέση (8.20), ακόμα και αν κάποια από τις κύριες επιδράσεις αποδειχτεί από
τον (αντίστοιχο) έλεγχο ως στατιστικώς μη σημαντική. Είναι πράγματι πιθανόν, ένας ή ακόμα και δύο παράγοντες αυτόνομα, να μην έχουν σημαντική επίδραση σε μία διεργασία, αλλά η συνύπαρξή τους (μέσω της
αλληλεπίδρασης) να αποδεικνύεται σημαντική. Σε τέτοιες περιπτώσεις, η παρουσία των παραγόντων στον
πειραματισμό κρίνεται αναγκαία ώστε η ανάλυση να μπορεί να αναδείξει τη σημαντικότητα της αλληλεπίδρασής τους.
Από την άλλη πλευρά, αν η αλληλεπίδραση αποδειχτεί από τον σχετικό έλεγχο ως μη σημαντική, τότε μπορεί
να αφαιρεθεί από το πρότυπο, και αυτό να πάρει την πιο απλή μορφή του, χωρίς αλληλεπίδραση. Στην περίπτωση αυτή, τόσο οι βαθμοί ελευθερίας όσο και η όποια μεταβλητότητα σχετίζεται με την αλληλεπίδραση
(όπως αποτυπώνεται στην ποσότητα SSAB), καταπίπτει στα σφάλματα. Στην περίπτωση αυτή, ο Πίνακας
ANOVA για το πρότυπο χωρίς αλληλεπίδραση (όπως αυτό δίνεται στη σχέση (8.19)), παίρνει τη μορφή:
194
ΣΧΕΔΙΑΣΜΟΣ ΠΕΙΡΑΜΑΤΩΝ
Πίνακας 8.15: Πίνακας ANOVA - Διπαραγοντική Ανάλυση χωρίς Αλληλεπίδραση - Σταθερές Επιδράσεις
Μέσο
Πηγή
Μεταβλητότητας
Βαθμοί
Ελευθερίας
Άθροισμα
Τετραγώνων
A
a−1
SSA
M SA =
SSA
(a−1)
M SA
M SE
B
b−1
SSB
M SB =
SSB
(b−1)
M SB
M SE
Σφάλματα
(abn − 1) − (a + b)
SSE
SSE
(abn−1)−(a+b)
–
Ολική
abn − 1
SST O
Άθροισμα
F
Τετραγώνων
M SE =
–
–
Σημειώνεται πάντως ότι η απουσία αλληλεπίδρασης θα πρέπει να επιβεβαιωθεί από την ανάλυση, πριν απομακρυνθεί από το αρχικό πρότυπο. Με άλλα λόγια, δεν συστήνεται η απευθείας χρήση του προτύπου χωρίς
αλληλεπίδραση, παρά μόνο αν έχουμε από πρότερη εμπειρία, ικανές πληροφορίες περί απουσίας αλληλεπίδρασης (κάτι που όμως σε πρακτικές εφαρμογές δεν είναι εύκολο να συμβαίνει).
Πριν ολοκληρωθεί η παρούσα ενότητα, για λόγους πληρότητας παρατίθεται στη συνέχεια η μορφή του προτύπου με τρεις παράγοντες A, B και Γ με αλληλεπιδράσεις 1ου και 2ου βαθμού (δηλαδή μεταξύ δύο, καθώς
και τριών παραγόντων):
yijkl = µ + αi + βj + γk + (αβ)ij + (αγ)ik + (βγ)jk
+ (αβγ)ijk + ϵijkl , i = 1, ..., a, j = 1, ..., b, k = 1, ..., c, l = 1, ..., n,
(8.28)
όπου και πάλι για χάρη απλότητας θεωρούμε ότι ο σχεδιασμός είναι ισορροπημένος, δηλαδή ότι έχουμε ίδιο
αριθμό επαναλήψεων (n) ανά θεραπεία (συνδυασμό επιπέδων των παραγόντων). Για τη μελέτη μη ισορροπημένων σχεδιασμών, ο αναγνώστης μπορεί να ανατρέξει στο βιβλίο του Montgomery [22].
Στις περιπτώσεις εκείνες που το πείραμα με περισσότερους από δύο παράγοντες, εκτελείται χωρίς επανάληψη
(δηλαδή n = 1), είναι δυνατόν ο Ερευνητής να προβεί στη μελέτη κάποιων αλληλεπιδράσεων. Ένα πείραμα
χωρίς αλληλεπίδραση, είναι αδύνατον να αξιολογήσει όλες τις αλληλεπιδράσεις (πιο πάνω φαίνονται τρεις
αλληλεπιδράσεις 1ης τάξης - δηλαδή μεταξύ δύο παραγόντων - και μία αλληλεπίδραση 2ης τάξης) και αυτό
διότι σε αυτή την περίπτωση θα εξαντλούνταν όλοι οι διαθέσιμοι βαθμοί ελευθερίας και δεν θα έμεναν βαθμοί
ελευθερίας για τα σφάλματα. Σε τέτοιες περιπτώσεις, ο Ερευνητής μπορεί να συμπεριλάβει στο πείραμα την
αξιολόγηση των αλληλεπιδράσεων 1ης τάξης και να αγνοήσει την αλληλεπίδραση της 2ης , η οποία θα παίξει
τον ρόλο του σφάλματος. Στην πράξη, είναι σύνηθες φαινόμενο να χρησιμοποιούνται στη θέση των σφαλμάτων οι όροι που αντιστοιχούν στη μεγαλύτερης τάξης αλληλεπίδραση. Τέτοιες αλληλεπιδράσεις και είναι
δύσκολο να ερμηνευθούν και να αξιολογηθούν, αλλά και πολύ συχνά έχουν μηδαμινή (έως και μηδενική) επίδραση στη μεταβλητή απόκρισης, ώστε τελικά να είναι ανέξοδη (δηλαδή να μην αλλοιώνει την ανάλυση) η
επιλογή του Ερευνητή να τις θεωρήσει αμελητέες.
Παράδειγμα 8.5. Δίνονται τα δεδομένα του Πίνακα 8.16 που αφορούν τις μετρήσεις που έγιναν σε μία μεταβλητή
απόκρισης Y όπου εμπλέκονται δύο παράγοντες A και B με 10 και 2 επίπεδα αντίστοιχα τα οποία αποτελούν
το σύνολο όλων των δυνατών επιπέδων των εμπλεκόμενων παραγόντων. Το πείραμα εκτελέστηκε δύο φορές ανά
συνδυασμό επιπέδων (δηλαδή έγιναν 2 επαναλήψεις).
ΓΡΑΜΜΙΚΑ ΜΟΝΤΕΛΑ ΚΑΙ ΣΧΕΔΙΑΣΜΟΣ & ΑΝΑΛΥΣΗ ΠΕΙΡΑΜΑΤΩΝ ΜΕ ΕΦΑΡΜΟΓΕΣ ΣΕ R ΚΑΙ MINITAB
195
Πίνακας 8.16: Πίνακας Δεδομένων - Διπαραγοντική Ανάλυση - Σταθερές Επιδράσεις
Παράγοντας Β
1
2
Μέσος A
Εκτιμητής
1
289, 273
319, 324
µ1.
ȳ1.. = 301.25
2
311, 327
333, 340
µ2.
ȳ2.. = 327.75
3
295, 318
335, 326
µ1.
ȳ1.. = 318.50
4
301, 303
333, 314
µ2.
ȳ2.. = 312.75
5
288, 265
289, 279
µ1.
ȳ1.. = 280.25
6
304, 298
305, 299
µ2.
ȳ2.. = 301.50
7
273, 293
250, 287
µ1.
ȳ1.. = 275.75
8
301, 276
275, 305
µ2.
ȳ2.. = 289.25
9
341, 328
316, 314
µ2.
ȳ2.. = 324.75
10
293, 282
300, 297
µ1.
ȳ1.. = 293.00
Μέσος B
µ.1
µ.2
µ(µ.. )
Εκτιμητής
ȳ.1. = 297.95
ȳ.2. = 307
Παράγοντας Α
ȳ... = 302.48
Παρατηρούμε ότι το πρόβλημα έχει 20 θεραπείες (πληθυσμούς), που αντιστοιχούν στους συνδυασμούς των επιπέδων των A και B: (1, 1), .., (1, 10), (2, 1), ..., (2, 10). Στόχος της μελέτης είναι να διαπιστωθεί αν oι κύριες
επιδράσεις α1 − α10 , β1 , β2 , αλλά και οι 20 παράμετροι αλληλεπίδρασης (αβ)ij , i = 1, ..., 10, j = 1, 2 είναι
σημαντικές ή όχι. Ένα πρώτο σχόλιο από τα δεδομένα, είναι ότι όταν ο παράγοντας B είναι στο επίπεδο 2, οι τιμές
της μεταβλητής απόκρισης φαίνεται να είναι υψηλότερες, αφού παρατηρούνται λιγότερες μετρήσεις κάτω από 300
και αρκετές κοντά ή γύρω στο 330. Όσο για τον παράγοντα A, είναι ολοφάνερο ότι κάποια επίπεδα, όπως π.χ. τα
επίπεδα 5 και 7, έχουν πολύ χαμηλότερες μετρήσεις ανεξάρτητα από το επίπεδο του παράγοντα B.
Για την εύρεση του Πίνακα ANOVA με τη χρήση του Minitab, ακολουθούμε τη διαδρομή:
Stat
Ê
ANOVA
Ê
General Linear Model
Ê
Fit General Linear Model
με τη μεταβλητή απόκρισης Y να τίθεται στο Responses και τους παράγοντες A και στα Factors. Σημειώνεται ότι:
• στο Model θα πρέπει να επιλεχθούν οι 2 παράγοντες και να τικαριστεί η επιλογή Interactions through
order 2, ώστε στο μοντέλο να περιληφθεί και η αλληλεπίδραση,
• στο Random/Nest θα πρέπει να καθοριστεί το Type των παραγόντων μεταξύ των επιλογών Fixedκαι
Random (εδώ πρέπει να τικαριστεί η επιλογή Fixed),
• στο Graphs μπορεί να ζητηθεί η κατασκευή διαγραμμάτων για τη διερεύνηση των προϋποθέσεων με την
επιλογή Four in one να συστήνεται, επειδή δίνει ταυτόχρονα τέσσερα διαγράμματα για την κανονικότητα
(δύο), ομοσκεδαστικότητα (δεξιά άνω) και ανεξαρτησία (δεξιά κάτω),
• στα Options ο Ερευνητής έχει τη δυνατότητα (α) να επιλέξει το επιθυμητό επίπεδο εμπιστοσύνης για
τυχόν διαστήματα εμπιστοσύνης που κατασκευάζονται, (β) να ζητήσει τους Means για κάθε επίπεδο κάθε
196
ΣΧΕΔΙΑΣΜΟΣ ΠΕΙΡΑΜΑΤΩΝ
παράγοντα και για κάθε συνδυασμό επιπέδων των παραγόντων και (γ) να ζητήσει κατάλληλο ή τον ιδανικό (Optimal) μετασχηματισμό των Box & Cox ο οποίος συστήνεται για την αντιμετώπιση προβλημάτων
σχετικά με τη μη ικανοποίηση των προϋποθέσεων του προτύπου (Ενότητα 4.7). Ο μετασχηματισμός συμβάλει στον περιορισμό ή και την εξάλειψη προβλημάτων σχετικά με την απουσία κανονικότητας και την
ετεροσκεδαστικότητα,
• στα Results μπορεί ο Ερευνητής να επιλέξει από μία μεγάλη γκάμα αποτελεσμάτων όπως (α) την εξίσωση
που αντιστοιχεί στο μοντέλο, (β) τους εκτιμητές των παραμέτρων, (γ) τις συνιστώσες διασποράς (στην
περίπτωση που εξετάζεται το πρότυπο τυχαίων επιδράσεων), (δ) τις εκτιμώμενες τιμές είτε για όλες τις
παρατηρήσεις είτε μόνο για αυτές που δεν φαίνονται φυσιολογικές (δηλαδή έχουν μεγάλα κατάλοιπα σε
σχέση με τις υπόλοιπες - οι τελευταίες συμβολίζονται με R),
• στο Storage μπορεί ο Ερευνητής να επιλέξει τις ποσότητες που θέλει να αποθηκεύσει. Μεταξύ των επιλογών του είναι οι εκτιμώμενες παρατηρήσεις, τα κατάλοιπα (τόσο τα συνήθη όσο και τα τυποποιημένα),
καθώς και ποσότητες όπως η Cook’s Distance και η μόχλευση (Leverage) (βλ. Ενότητα 4.8) που σχετίζονται με επηρεάζουσες παρατηρήσεις και την επίδρασή τους στη διαμόρφωση του μοντέλου.
Ο Πίνακας που προκύπτει είναι:
Πίνακας 8.17: Πίνακας ANOVA - Με Αλληλεπίδραση
Πηγή
Μεταβλητότητας
Βαθμοί
Ελευθερίας
Άθροισμα
Τετραγώνων
A
9
11890.7
B
1
AB
Μέσο
F
p-value
1321.2
9.02
0.000
819.0
819.0
5.59
0.028
9
2936.7
326.3
2.23
0.065
Σφάλματα
20
2929.5
146.5
–
–
Ολική
39
18576
–
–
–
Άθροισμα
Τετραγώνων
Με βάση τα αποτελέσματα της ανάλυσης, το τελικό συμπέρασμα είναι ότι στο σύνηθες 5% επίπεδο σημαντικότητας
τόσο ο A όσο και ο B παράγοντας είναι στατιστικώς σημαντικοί (δηλαδή απορρίπτονται οι μηδενικές υποθέσεις
H0 : αi = 0 και H0 : βj = 0), αφού οι αντίστοιχες p-values είναι 0.000 και 0.028. Από την άλλη πλευρά
διαπιστώνεται η απουσία αλληλεπίδρασης (δηλαδή γίνεται αποδεκτή η μηδενική υπόθεση H0 : (αβ)ij = 0) στο
συγκεκριμένο επίπεδο σημαντικότητας, αν και ο Ερευνητής θα πρέπει να δώσει ιδιαίτερη προσοχή στην περίπτωση
αυτή, αφού η p-value είναι ελάχιστα μεγαλύτερη από το επιθυμητό επίπεδο σημαντικότητας (0.065). Με βάση το
συγκεκριμένο επίπεδο (5%), ο Ερευνητής μπορεί να αποφασίσει να απλοποιήσει το πρότυπο και να χρησιμοποιήσει
εκείνο χωρίς αλληλεπίδραση, οπότε ο ανανεωμένος Πίνακας ANOVA γίνεται:
ΓΡΑΜΜΙΚΑ ΜΟΝΤΕΛΑ ΚΑΙ ΣΧΕΔΙΑΣΜΟΣ & ΑΝΑΛΥΣΗ ΠΕΙΡΑΜΑΤΩΝ ΜΕ ΕΦΑΡΜΟΓΕΣ ΣΕ R ΚΑΙ MINITAB
197
Πίνακας 8.18: Πίνακας ANOVA - Χωρίς Αλληλεπίδραση
Πηγή
Μεταβλητότητας
Βαθμοί
Ελευθερίας
Άθροισμα
Τετραγώνων
A
9
11890.7
B
1
Σφάλματα
Ολική
Μέσο
F
p-value
1321.2
6.53
0.000
819
819
4.05
0.054
29
5866.2
202.3
–
–
39
18576
–
–
–
Άθροισμα
Τετραγώνων
Παρατηρώντας τα αποτελέσματα για το πρότυπο χωρίς αλληλεπίδραση, διαπιστώνουμε ότι αν και η επίδραση του
παράγοντα A παραμένει στατιστικώς σημαντική ( p-value = 0.000), το ίδιο παύει να ισχύει (οριακά) για
τον παράγοντα B ( p-value = 0.054). Αυτό οφείλεται στο γεγονός ότι τόσο οι βαθμοί ελευθερίας όσο και η
μεταβλητότητα που αφορούσαν την αλληλεπίδραση προστέθηκαν στις αντίστοιχες ποσότητες που αφορούσαν τα
σφάλματα. Η διαφοροποίηση αυτή οδήγησε σε αύξηση του μέσου τετραγωνικού σφάλματος M SE (από 146.5 σε
202.3). Η αύξηση αυτή δεν ήταν αρκετή για να αλλάξει την κατάσταση για τον παράγοντα A, ήταν όμως υπεραρκετή (έστω και οριακά) για να αλλάξει την κατάσταση για τον παράγοντα B (με την p-value να αυξάνεται από
0.028 σε 0.054). Στη συγκεκριμένη περίπτωση φαίνεται ότι ο Ερευνητής πρέπει να επιστρέψει στο αρχικό πρότυπο, με την έννοια ότι η απουσία αλληλεπίδρασης αλλοίωσε σημαντικά τη φυσιογνωμία του προτύπου. Ειδικά
στην περίπτωση αυτή, αφού η αλληλεπίδραση χαρακτηρίστηκε οριακά ως στατιστικώς μη σημαντική, ενώ ταυτόχρονα ο Ερευνητής είναι πρόθυμος να εκτελέσει το πείραμα με επανάληψη (αγνοώντας το κόστος), συστήνεται να
διατηρηθεί η αλληλεπίδραση στο πρότυπο για μία αξιόπιστη αντιμετώπιση του προβλήματος, έστω και αν αυτή
αφορά 6.5% επίπεδο σημαντικότητας, το οποίο πάντως, σε οποιαδήποτε περίπτωση, είναι πάρα πολύ κοντά στο
σύνηθες επίπεδο του 5%.
Επανερχόμενοι στο αρχικό πρότυπο με αλληλεπίδραση, και ζητώντας να καταγραφούν τα βασικά χαρακτηριστικά
από την ανάλυση με το Minitab, έχουμε τα ακόλουθα:
Regression Equation
ŷ = 302.48 − 1.22α1 + 25.27α2 + 16.02α3 + 10.28α4 − 22.23α5 − 0.98α6 − 26.72α7 − 13.23α8
+ 22.28α9 − 9.47α10 − 4.53β1 + 4.53β2 − 15.72(αβ)11 + ...
Fits and Diagnostics
Διαπιστώνεται η ύπαρξη δύο μη φυσιολογικών παρατηρήσεων (συμβολίζονται με R): η παρατήρηση 27 που αντιστοιχεί στην μέτρηση 250, καθώς και η παρατήρηση 28 που αντιστοιχεί στη μέτρηση 287 για τις οποίες η εκτιμώμενη τιμή είναι κοινή και ίση με 268.5, και άρα η καθεμία απέχει ε̂27 = ε̂28 = 18.5 μονάδες, από την αντίστοιχη
παρατηρηθείσα τιμή.
Means
Οι δειγματικοί μέσοι για τα 10 επίπεδα του παράγοντα A φαίνονται στον Πίνακα Δεδομένων 8.16, όπως και
οι δειγματικοί μέσοι για τα 2 επίπεδα του παράγοντα B (297.95 και 307) από όπου φαίνεται ότι η διαφορά των
δύο αυτών μέσων δεν είναι σημαντικά μεγάλη. Από την άλλη πλευρά, οι διαφοροποιήσεις μεταξύ των μέσων των
επιπέδων του παράγοντα A είναι αρκετά μεγάλες και κυμαίνονται από 280.25 και 275.75 (για τα επίπεδα 5 και
198
ΣΧΕΔΙΑΣΜΟΣ ΠΕΙΡΑΜΑΤΩΝ
7) μέχρι 327.75 και 324.75 (για τα επίπεδα 2 και 9), κάτι που δικαιολογεί απόλυτα την έντονα στατιστικώς σημαντική επίδραση του παράγοντα A, σε αντιπαραβολή με αυτή του παράγοντα B που φαίνεται να είναι σαφώς
ηπιότερη.
Όπως έχει ήδη αναφερθεί στο προηγούμενο Κεφάλαιο, όταν ο έλεγχος ισότητας των μέσων καταλήγει στο συμπέρασμα ότι οι μέσοι δεν είναι όλοι ίσοι, δηλαδή στην περίπτωση που γίνεται δεκτή η εναλλακτική υπόθεση, ο
Ερευνητής μπορεί (και ενδείκνυται) να προχωρήσει σε Πολλαπλές Συγκρίσεις, ( Multiple Comparisons) όπου για
όλες τις συγκρίσεις ανά δύο, το συνολικό σφάλμα να μην υπερβαίνει ένα προκαθορισμένο επίπεδο α ή διαφορετικά
το συνολικό επίπεδο εμπιστοσύνης να μην είναι χαμηλότερο από έναν προκαθορισμένο συντελεστή εμπιστοσύνης
100(1 − α)%. Στην περίπτωση της Διπαραγοντικής Ανάλυσης, το ενδιαφέρον επικεντρώνεται σε καθέναν από
τους δύο παράγοντες ώστε να διαπιστωθεί ποιο επίπεδο του καθενός οδηγεί στη μέγιστη ή στην ελάχιστη (ανάλογα
με το τι ενδιαφέρει τον Ερευνητή) μέση τιμή της μεταβλητής απόκρισης. Η δημοφιλέστερη μέθοδος είναι αυτή των
διαστημάτων εμπιστοσύνης Tukey. Η σύγκριση των μέσων αφορά τις διαφορές µi1 . − µi2 . για τη σύγκριση των
επιπέδων του παράγοντα A, καθώς και τις διαφορές µ.j1 − µ.j2 για τη σύγκριση των επιπέδων του παράγοντα
B. Για την κατασκευή των διαστημάτων απαιτούνται τα εξής:
• οι εκτιμητές των αντίστοιχων μέσων, δηλαδή των yi1 .. και yi2 .. για τη διαφορά µi1 . − µi2 . και των y.j1 .
και y.j2 . για τη διαφορά µ.j1 − µ.j2 ,
• η εκτιμήτρια της κοινής διασποράς σ 2 η οποία, ως συνήθως, ισούται με το M SE,
• το 100(1 − α)% ποσοστημόριο του τυποποιημένου εύρους qλ,ab(n−1) με λ = a και b, ανάλογα με το
αν μελετάται ο παράγοντας A ή ο B. Υπενθυμίζεται ότι η πινακοποίηση των ποσοστημορίων αφορά τα
διαστήματα εμπιστοσύνης 90%, 95% και 99%,
• η κάτωθι διαδικασία στο Minitab η οποία πρέπει να ακολουθηθεί αφού προηγουμένως έχει γίνει
Fit General Linear Model
Stat
Ê
:
ANOVA
Ê
General Linear Model
Ê
Comparisons
με τη μεταβλητή απόκρισης να χρησιμοποιείται ως Response, ενώ ο Ερευνητής καλείται να επιλέξει το Type
of Comparisons μεταξύ των δύο επιλογών Pairwise (για όλες τις ανά δύο συγκρίσεις) ή With a Control (για
σύγκριση με gold standard - δοκιμασία ελέγχου), δηλαδή να επιλέξει την κατασκευή διαστημάτων Tukey
ή διαστημάτων Dunnett. Αν και τα δύο προαναφερθέντα είδη είναι τα δημοφιλέστερα, ο Ερευνητής έχει ως
πρόσθετες επιλογές τα διαστήματα Bonferroni, Fisher (LSD) και Sidak. Τέλος, ο Ερευνητής καλείται να
τικάρει τους παράγοντες για τους οποίους ζητείται η κατασκευή των διαστημάτων (στο πεδίο Choose the
terms for comparison).
Στην ειδική περίπτωση όπου τα μεγέθη των δειγμάτων είναι όλα ίσα, δηλαδή n, το ταυτόχρονο επίπεδο εμπιστοσύνης είναι ακριβώς ίσο με 100(1 − α)%, ενώ ο τύπος για τον παράγοντα A είναι ο εξής:
s
ȳi1 .. − ȳi2 .. ± qa,ab(n−1);α
M SE
bn
(8.29)
M SE
.
an
(8.30)
και για τον παράγοντα B είναι ο εξής:
s
ȳ.j1 . − ȳ.j2 . ± qb,ab(n−1);α
ΓΡΑΜΜΙΚΑ ΜΟΝΤΕΛΑ ΚΑΙ ΣΧΕΔΙΑΣΜΟΣ & ΑΝΑΛΥΣΗ ΠΕΙΡΑΜΑΤΩΝ ΜΕ ΕΦΑΡΜΟΓΕΣ ΣΕ R ΚΑΙ MINITAB
199
8.4.3 Πρότυπο τυχαίων επιδράσεων
Η ανάγκη μελέτης τυχαίων επιδράσεων, όπως είχε αναφερθεί και στο προηγούμενο Κεφάλαιο, προκύπτει και
στην περίπτωση της διπαραγοντικής ανάλυσης διακύμανσης, όταν ο Ερευνητής έχει να μελετήσει πληθώρα
διαφορετικών επιπέδων για καθέναν από τους παράγοντες ενδιαφέροντος που συνήθως χρονικοί ή/και οικονομικοί περιορισμοί δεν του το επιτρέπουν. Συχνά, συναντάται η περίπτωση να συμβαίνει αυτό για τον έναν
παράγοντα ενδιαφέροντος, ενώ για τον άλλο είναι δυνατή η μελέτη όλων των δυνατών επιπέδων του. Στην
παρούσα ενότητα, το πρώτο πρότυπο που μελετάται είναι αυτό των Τυχαίων Επιδράσεων, ενώ το δεύτερο που
θα μελετηθεί στην επόμενη ενότητα, είναι το Μεικτό Πρότυπο. Υπενθυμίζεται ότι στο πρότυπο τυχαίων επιδράσεων δεν εξετάζεται η μέση τιμή (των επιπέδων) αλλά η μεταβλητότητα.
Το πρότυπο τυχαίων επιδράσεων με αλληλεπίδραση, δίνεται και πάλι, όπως και πιο πάνω, από τον τύπο (8.20)
όπου:
• οι επιδράσεις αi είναι τυχαίες μεταβλητές με κατανομή N (0, σα2 ),
• οι επιδράσεις βj είναι τυχαίες μεταβλητές με κατανομή N 0, σβ2 ,
2
• οι αλληλεπιδράσεις (αβ)ij είναι τυχαίες μεταβλητές με κατανομή N 0, σαβ
,
i.i.d.
• τα σφάλματα είναι τυχαίες μεταβλητές τέτοιες ώστε ϵijk ∼ N (0, σ 2 ) ,
• οι τυχαίες μεταβλητές αi , βj , (αβ)ij και ϵijk είναι ανεξάρτητες.
Με βάση τις πιο πάνω κατανομές είναι προφανές ότι:
2
Yijk ∼N µ, σ 2 + σα2 + σβ2 + σαβ
και άρα:
2
E (yijk ) = µ & V ar (yij ) = σ 2 + σα2 + σβ2 + σαβ
,
∀i, j, k
2
ονομάζονται συνιστώσες διασποράς. H μελέτη του προτύπου είναι ίδια με προηγουμέόπου σ 2 , σα2 , σβ2 και σαβ
νως, αφού αν κάποια από τις συνιστώσες της διασποράς που αφορούν τους παράγοντες είναι 0, η αντίστοιχη
κύρια επίδραση είναι μηδενική. Σε οποιαδήποτε περίπτωση, ο αναγκαίος και επιθυμητός έλεγχος για τις επιδράσεις του παράγοντα A, στην περίπτωση του προτύπου τυχαίων επιδράσεων, είναι:
H0 : σα2 = 0
vs
H1 : σα2 > 0.
(8.31)
Οι αντίστοιχοι έλεγχοι για τον παράγοντα B και την αλληλεπίδραση AB είναι:
H0 : σβ2 = 0
vs
H1 : σβ2 > 0
(8.32)
2
H0 : σαβ
=0
vs
2
H1 : σαβ
> 0.
(8.33)
και
Υπενθυμίζεται ότι όπως και προηγουμένως, οι τύποι της περίπτωσης των σταθερών επιδράσεων και γενικά
ο Πίνακας ANOVA, εξακολουθούν να ισχύουν ως έχουν. Παρά ταύτα, η διερεύνηση των πιο πάνω ελέγχων
για τις κύριες επιδράσεις βασίζεται στις συγκρίσεις των M SA και M SB με το M SAB, αντί του συνήθους
M SE. Για να γίνει σαφής η αιτία της διαφοροποίησης, θα πρέπει να ανατρέξει κανείς αρχικά στον μηχανισμό
λειτουργίας των ελέγχων, σύμφωνα με τον οποίο η μηδενική υπόθεση γίνεται δεκτή (δηλαδή όταν η συνιστώσα της διασποράς που μελετάται ισούται με το μηδέν) για τιμές της ελεγχοσυνάρτησης F πολύ κοντά
στη μονάδα (1), ενώ αυτή απορρίπτεται (δηλαδή όταν η συνιστώσα της διασποράς που μελετάται είναι μεγαλύτερη από το μηδέν) για τιμές της F μεγαλύτερες από τη μονάδα. Αφενός ο πιο πάνω μηχανισμός, αφετέρου
200
ΣΧΕΔΙΑΣΜΟΣ ΠΕΙΡΑΜΑΤΩΝ
οι αναμενόμενες τιμές των τυχαίων μεταβλητών των μέσων τετραγώνων (για ευκολία θα χρησιμοποιήσουμε
εδώ το ίδιο σύμβολο τόσο για την τυχαία μεταβλητή όσο και για την τιμή που προκύπτει από τις εκτελέσεις
του πειράματος, δηλαδή M S) που δίνονται από τους τύπους
2
E (M SA) = σ 2 + nσαβ
+ bnσα2 ,
2
E (M SB) = σ 2 + nσαβ
+ anσβ2 ,
2
E (M SAB) = σ 2 + nσαβ
&
E (M SE) = σ 2 ,
(8.34)
(8.35)
οδηγούν αναγκαστικά σε διαφοροποιήσεις οι οποίες παρουσιάζονται κατωτέρω. Τονίζεται ότι στην πράξη, με
βάση τις μετρήσεις που είναι διαθέσιμες, τα M S που υπολογίζονται αποτελούν εκτιμήσεις, και άρα προσεγγίσεις (∼) των αντίστοιχων θεωρητικών αναμενόμενων τιμών, οπότε για παράδειγμα, έχουμε ότι:
M SA ≡ E \
(M SA) ∼ E (M SA) .
(8.36)
Έτσι, αν για παράδειγμα ισχύει ότι σα2 = 0, τότε μόνο αν διαιρεθεί το M SA με το M SAB θα προκύψει
αποτέλεσμα ίσο με τη μονάδα, ενώ σε διαφορετική περίπτωση το κλάσμα θα είναι μεγαλύτερο της μονάδας.
Το ίδιο παρατηρείται και στην περίπτωση του παράγοντα B, ενώ για την περίπτωση της αλληλεπίδρασης
αρκεί η διαίρεση μεταξύ M SAB και M SE.
Λαμβάνοντας υπόψη τα πιο πάνω, οι έλεγχοι για μηδενικές διασπορές σα2 και σβ2 βασίζονται αντίστοιχα στις
ελεγχοσυναρτήσεις
M SB
M SA
& FB =
FA =
M SAB
M SAB
με τις αντίστοιχες μηδενικές υποθέσεις να απορρίπτονται όταν αντίστοιχα,
FA > F(a−1),abn−1;α
& FB > F(b−1),abn−1;α
όπου F(a−1),abn−1;α και F(b−1),abn−1;α τα 100(1 − α)% ποσοστημόρια των κατανομών F με τους αντίστοιχους βαθμούς ελευθερίας.
Για τη μελέτη της αλληλεπίδρασης ο έλεγχος παραμένει ο ίδιος, όπως και στην περίπτωση του προτύπου
σταθερών επιδράσεων, και άρα η μηδενική υπόθεση για την απουσία αλληλεπίδρασης απορρίπτεται αν
FAB
M SAB
=
=
M SE
SSAB
(a−1)(b−1) H0
>
SSE
abn−1
F(a−1)(b−1),abn−1;α ,
όπου F(a−1)(b−1),abn−1;α το 100(1 − α)% ποσοστημόριο της κατανομής F με (a − 1)(b − 1) και abn − 1
βαθμούς ελευθερίας.
Στις περιπτώσεις των προτύπων δύο παραγόντων με αλληλεπίδραση συστήνεται η μελέτη των υποθέσεων
να ξεκινά πρώτα με τη μελέτη απουσίας αλληλεπίδρασης, γιατί αν αυτή απορριφτεί το πρότυπο ισχύει ως
έχει, αφού η ύπαρξη αλληλεπίδρασης καθιστά αναγκαία τη διατήρηση των δύο εμπλεκόμενων παραγόντων
στο πρότυπο (ανεξαρτήτως του αποτελέσματος των ελέγχων τους).
Ένα σημαντικό στοιχείο στην περίπτωση των προτύπων τυχαίων επιδράσεων είναι η ανάγκη εκτίμησης των
συνιστωσών διασποράς (σε αντιπαραβολή με την εκτίμηση των παραμέτρων αi , βj και (αβ)ij στα πρότυπα σταθερών επιδράσεων). Οι εκτιμήσεις προκύπτουν συνδυάζοντας τις σχέσεις (8.34), (8.35), και (8.36).
Πράγματι αντιμετωπίζοντας τις εξισώσεις ως σύστημα τεσσάρων εξισώσεων με τέσσερις αγνώστους και λύνοντας, έχουμε τους εκτιμητές των τεσσάρων συνιστωσών διασποράς ως εξής:
σ̂α2 =
M SA − M SAB
,
bn
σ̂β2 =
M SB − M SAB
,
an
(8.37)
ΓΡΑΜΜΙΚΑ ΜΟΝΤΕΛΑ ΚΑΙ ΣΧΕΔΙΑΣΜΟΣ & ΑΝΑΛΥΣΗ ΠΕΙΡΑΜΑΤΩΝ ΜΕ ΕΦΑΡΜΟΓΕΣ ΣΕ R ΚΑΙ MINITAB
201
και
M SAB − M SE
, σ̂ 2 = M SE.
(8.38)
n
2
Θα πρέπει να σημειωθεί ότι αν το πρότυπο είναι χωρίς αλληλεπίδραση, τότε δεν υφίσταται η συνιστώσα σαβ
και άρα αυτή δεν εμπλέκεται στις εξισώσεις (8.34), με αποτέλεσμα οι συγκρίσεις να γίνονται (λόγω απουσίας
αλληλεπίδρασης) με το M SE και κατ΄ επέκταση ο όρος M SAB στις εκτιμήσεις (8.37) να αντικαθίσταται
από τον όρο M SE:
2
σ̂αβ
=
σ̂α2 =
M SA − M SE
bn
& σ̂β2 =
M SB − M SE
.
an
(8.39)
Σημειώνεται ότι οι τύποι (8.39) προκύπτουν κατά αντιστοιχία με τους τύπους για την εκτίμηση των συνιστωσών διασποράς στο πρότυπο τυχαίων επιδράσεων στην ανάλυση διακύμανσης κατά έναν παράγοντα με
μία μεταβλητή πλαισίου (Ενότητα 7.4.2).
Παράδειγμα 8.6. Δίνονται τα δεδομένα του προηγούμενου παραδείγματος, αλλά αυτή τη φορά θεωρούμε ότι
τα 10 επίπεδα του παράγοντα A, καθώς και τα 2 επίπεδα του παράγοντα B αποτελούν τυχαία δείγματα από το
σύνολο όλων των δυνατών επιπέδων των δύο παραγόντων (που είναι πάρα πολλά). Στην περίπτωση αυτή, το ενδιαφέρον του Ερευνητή επικεντρώνεται στις συνιστώσες διασποράς και όχι στις μέσες τιμές, με αποτέλεσμα ο Πίνακας
Δεδομένων να μην περιλαμβάνει οποιαδήποτε αναφορά σε μέσους.
Πίνακας 8.19: Πίνακας Δεδομένων - Διπαραγοντική Ανάλυση - Τυχαίες Επιδράσεις
Παράγοντας Β
1
2
1
289, 273
319, 324
2
311, 327
333, 340
3
295, 318
335, 326
4
301, 303
333, 314
5
288, 265
289, 279
6
304, 298
305, 299
7
273, 293
250, 287
8
301, 276
275, 305
9
341, 328
316, 314
10
293, 282
300, 297
Παράγοντας Α
Ο Πίνακας ANOVA, που προκύπτει για το πρότυπο τυχαίων επιδράσεων με αλληλεπίδραση, είναι ο εξής:
202
ΣΧΕΔΙΑΣΜΟΣ ΠΕΙΡΑΜΑΤΩΝ
Πίνακας 8.20: Πίνακας ANOVA - Διπαραγοντική Ανάλυση - Τυχαίες Επιδράσεις
Πηγή
Μεταβλητότητας
Βαθμοί
Ελευθερίας
Άθροισμα
Τετραγώνων
A
9
11890.7
B
1
AB
Μέσο
F
p-value
1321.2
4.05
0.025
819.0
819.0
2.51
0.148
9
2936.7
326.3
2.23
0.065
Σφάλματα
20
2929.5
146.5
–
–
Ολική
39
18576
–
–
–
Άθροισμα
Τετραγώνων
Εύκολα παρατηρούμε ότι μόνο οι τιμές της ελεγχοσυνάρτησης F και οι p-values που αφορούν τους παράγοντες
A και B έχουν αλλάξει σε σχέση με το πρότυπο σταθερών επιδράσεων. Αυτό οφείλεται στον μαθηματικό μηχανισμό της διεργασίας που έχει ως αποτέλεσμα οι έλεγχοι για τις κύριες επιδράσεις να βασίζονται στη σύγκριση
των M SA και M SB με το M SAB. Επομένως, οι τιμές της ελεγχοσυνάρτησης F αυξήθηκαν (σε σχέση με το
πρότυπο σταθερών επιδράσεων), αφού αντί για το M SE = 146.5 τώρα χρησιμοποιείται η υπερδιπλάσια τιμή
M SAB = 326.3. Το αποτέλεσμα αυτής της μεθοδολογίας είναι να αυξηθούν οι p-values, έτσι ώστε ο μεν παράγοντας A να (συνεχίσει να) χαρακτηρίζεται ως σημαντικός (p-value = 0.025), ο δε παράγοντας B να καταστεί
στατιστικώς μη σημαντικός (p-value = 0.148). Παρατηρούμε επίσης ότι η αλληλεπίδραση παραμένει οριακά
μη σημαντική (p-value = 0.065), αφού δεν υπάρχει διαφοροποίηση για την ελεγχοσυνάρτηση F η οποία όπως
και στην περίπτωση του προτύπου σταθερών επιδράσεων, βασίζεται στις τιμές M SAB και M SE.
Με βάση τα αποτελέσματα αυτά, ο Ερευνητής φαίνεται σκόπιμο να χαρακτηρίσει στατιστικώς σημαντική (έστω
και οριακά) την αλληλεπίδραση. Από τη στιγμή όμως που θα πάρει αυτή την απόφαση είναι υποχρεωμένος να
διατηρήσει στο πρότυπο και τους δύο παράγοντες, αφού η απομάκρυνση του B (που αυτόνομα χαρακτηρίστηκε
στατιστικώς μη σημαντικός) θα οδηγήσει σε αναγκαστική κατάργηση την αλληλεπίδραση (η οποία προφανώς
υφίσταται μόνο όσο οι εμπλεκόμενοι παράγοντες συμμετέχουν στο πείραμα). Με βάση τα παραπάνω, το πρότυπο
παραμένει με δύο παράγοντες και αλληλεπίδραση. Επιπρόσθετα, τονίζεται ότι όλα όσα αναφέρθηκαν στην περίπτωση του προτύπου σταθερών επιδράσεων όσον αφορά το Regression Equation, τα Fits and Diagnostics και τα
Means, παραμένουν αυτούσια, σε ισχύ. Το μόνο και ουσιαστικότερο θέμα που χρήζει σχολιασμού είναι η εκτίμηση
των συνιστωσών διασποράς, που με βάση το πρότυπο που επιλέχθηκε, είναι:
σ̂α2 = 248.722,
σ̂β2 = 24.6361,
2
σ̂αβ
= 89.9136 &
σ̂ 2 = 146.475,
όπως άλλωστε αποτυπώνονται στον Πίνακα Διασπορών που προκύπτει από το Minitab μέσω της επιλογής
(επιλέγοντας Variance Components):
Results
203
ΓΡΑΜΜΙΚΑ ΜΟΝΤΕΛΑ ΚΑΙ ΣΧΕΔΙΑΣΜΟΣ & ΑΝΑΛΥΣΗ ΠΕΙΡΑΜΑΤΩΝ ΜΕ ΕΦΑΡΜΟΓΕΣ ΣΕ R ΚΑΙ MINITAB
Πίνακας 8.21: Variance Components
Πηγή
Μεταβλητότητας
Διασπορά
% επί του
Συνόλου
A
248.722
48.79%
B
24.6361
4.83%
AB
89.9139
17.64%
Σφάλματα
146.475
28.73%
Σύνολο
509.747
−
8.4.4 Πρότυπο μεικτών επιδράσεων
Στην πράξη, είναι σύνηθες μεταξύ των δύο παραγόντων ο ένας, π.χ. ο A, να είναι σταθερών και ο άλλος, π.χ.
ο B, τυχαίων επιδράσεων. Τέτοια πρότυπα ονομάζονται Μεικτά και ένα από αυτά είναι το λεγόμενο Περιορισμένο Μεικτό Πρότυπο (Restricted Mixed Model), όπου ο παράγοντας A είναι σταθερών επιδράσεων και
ο B τυχαίων. Στο συγκεκριμένο πρότυπο, ο γενικός τύπος του οποίου περιγράφεται και πάλι από τη σχέση
(8.20) έχουμε:
• οι επιδράσεις αi που αντιστοιχούν στον σταθερό παράγοντα A, ικανοποιούν τη σχέση
P
i
αi = 0,
• οι επιδράσεις βj είναι τυχαίες μεταβλητές με κατανομή N 0, σβ2 ,
2
και
• οι αλληλεπιδράσεις (αβ)ij είναι τυχαίες μεταβλητές που ακολουθούν την κατανομή N 0, σαβ
P
τέτοιες ώστε i (αβ)ij = 0,
i.i.d.
• τα σφάλματα είναι τυχαίες μεταβλητές τέτοιες ώστε ϵijk ∼ N (0, σ 2 ) και
• οι τυχαίες μεταβλητές βj , (αβ)ij και ϵijk είναι ανεξάρτητες.
Με βάση τις πιο πάνω κατανομές είναι προφανές ότι:
2
Yijk ∼N (µ, σ 2 + σβ2 + σαβ
)
2
όπου οι σ 2 , σβ2 και σαβ
ονομάζονται συνιστώσες διασποράς. H μελέτη του προτύπου συνδυάζει ελέγχους για
τις σταθερές παραμέτρους αi και τις τυχαίες μεταβλητές βj και (αβ)ij :
H0 : αi = 0
vs
H1 : Όχι όλα τα αi , i = 1, ..., a, ίσα με 0,
(8.40)
H0 : σβ2 = 0
vs
H1 : σβ2 > 0
(8.41)
2
H0 : σαβ
=0
vs
2
H1 : σαβ
> 0.
(8.42)
και
Στην περίπτωση αυτή, οι τύποι των θεωρητικών αναμενόμενων τιμών των μέσων τετραγώνων είναι:
P
αi2
2
+ anσβ2 ,
, E (M SB) = σ 2 + nσαβ
a−1
2
& E (M SE) = σ 2 .
E (M SAB) = σ 2 + nσαβ
2
E (M SA) = σ +
2
nσαβ
+ bn
i
(8.43)
(8.44)
Με βάση τις πιο πάνω σχέσεις, αν για παράδειγμα ισχύουν οι μηδενικές επιδράσεις για τον σταθερό παράγοντα A (δηλαδή όταν αi = 0), τότε μόνο αν διαιρεθεί το M SA με το M SAB θα προκύψει αποτέλεσμα
204
ΣΧΕΔΙΑΣΜΟΣ ΠΕΙΡΑΜΑΤΩΝ
ίσο με τη μονάδα (που ισοδυναμεί με αποδοχή της υπόθεσης μηδενικής επίδρασης για τον παράγοντα A),
ενώ σε διαφορετική περίπτωση το κλάσμα θα είναι μεγαλύτερο της μονάδας (που ισοδυναμεί με αποδοχή της
εναλλακτικής υπόθεσης). Από την άλλη πλευρά, στην περίπτωση μηδενικής μεταβλητότητας για τον τυχαίο
παράγοντα B (δηλαδή όταν σβ2 = 0), η ελεγχοσυνάρτηση F θα είναι ίση με τη μονάδα (που ισοδυναμεί με
αποδοχή της μηδενικής υπόθεσης) μόνο εφόσον η διαίρεση θα αφορά τα M SB και M SE. Τέλος, η μελέτη
της απουσίας αλληλεπίδρασης, κατά τα συνήθη βασίζεται στη σύγκριση των μέσων τετραγώνων M SAB και
M SE.
2
Λαμβάνοντας υπόψη τα πιο πάνω, οι έλεγχοι για μηδενικές διασπορές σαβ
και σβ2 βασίζονται αντίστοιχα,
στις ελεγχοσυναρτήσεις:
M SB
M SAB
FAB =
& FB =
M SE
M SE
με τις αντίστοιχες μηδενικές υποθέσεις να απορρίπτονται όταν αντίστοιχα:
FAB > F(a−1)(b−1),abn−1;α ,
& FB > F(b−1),abn−1;α ,
ενώ ο έλεγχος για μηδενικές επιδράσεις του σταθερού παράγοντα A απορρίπτεται όταν:
FA =
M SA
> F(a−1),abn−1;α .
M SAB
2
Οι εκτιμητές των συνιστωσών διασποράς σ̂β2 , σ̂αβ
και σ̂ 2 δίνονται από τους ίδιους τύπους με προηγουμένως,
δηλαδή τους (8.37) και (8.38).
8.4.5 Πρότυπο με μεταβλητές πλαισίου και σχέδια Λατινικού Τετραγώνου
Στη Διπαραγοντική Ανάλυση ο Ερευνητής μπορεί να συμπεριλάβει είτε μία είτε δύο μεταβλητές πλαισίου
και να δημιουργήσει πρότυπα με μία μεταβλητή πλαισίου, καθώς και πρότυπα με σχέδια Λατινικού Τετραγώνου (δηλαδή με δύο μεταβλητές πλαισίου). Η διαδικασία μελέτης δεν διαφέρει από αυτή που συζητήθηκε
νωρίτερα στην Ανάλυση Διακύμανσης ενός Παράγοντα, αφού οι μεταβλητές πλαισίου υπεισέρχονται για να
τεθούν υπό έλεγχο εξωγενείς μεταβλητές που είναι δεδομένο ότι επηρεάζουν τη μεταβλητή απόκρισης ή γενικότερα λόγω περιορισμών που απαιτείται να επιβληθούν στην τυχαιοποίηση ακόμα και εξαιτίας αντικειμενικών δυσκολιών. Η συνήθης μελέτη περιλαμβάνει μία μεταβλητή πλαισίου με n επίπεδα και με το πείραμα να
εκτελείται n φορές χωρίς επανάληψη, μία για κάθε επίπεδο της μεταβλητής πλαισίου. Στην ειδική περίπτωση
που υπάρχουν δύο μεταβλητές πλαισίου και ταυτόχρονα το πλήθος των συνδυασμών των επιπέδων των παραγόντων ταυτίζεται με τον αριθμό επιπέδων των μεταβλητών πλαισίου, εφαρμόζεται διπαραγοντικό πείραμα
με σχέδιο Λατινικού Τετραγώνου. Οι δύο αυτοί τύποι σχεδιασμών παρουσιάζονται συνοπτικά στην παρούσα
ενότητα.
Η περίπτωση του προτύπου με 2 παράγοντες A και B (με ή χωρίς αλληλεπίδραση) με μία μεταβλητή πλαισίου με n επίπεδα μπορεί από μεθοδολογικής άποψης να θεωρηθεί ως μία περίπτωση με 3 εμπλεκόμενους
παράγοντες, όπου ο ένας εκ των τριών γνωρίζουμε ότι επηρεάζει τη μεταβλητή απόκρισης και δεν ενδιαφερόμαστε (ή δεν υφίσταται) αλληλεπίδραση μεταξύ του συγκεκριμένου παράγοντα (δηλαδή της μεταβλητής
πλαισίου) και των δύο παραγόντων ενδιαφέροντος. Επομένως, το μεν πρότυπο θα έχει έναν επιπλέον όρο που
θα αντιστοιχεί στη μεταβλητή πλαισίου, ενώ ο Πίνακας ANOVA θα έχει μία επιπλέον γραμμή που και πάλι
θα αντιστοιχεί στη μεταβλητή πλαισίου. Στην περίπτωση αυτή, το πρότυπο προκύπτει από τη σχέση (8.20)
με την προσθήκη της μεταβλητής πλαισίου:
yijk = µ + αi + βj + (αβ)ij + ok + ϵijk ,
i = 1, ..., a,
j = 1, ..., b,
k = 1, ..., n,
(8.45)
όπου υπεισέρχεται ο όρος ok που αντιπροσωπεύει τη σταθερή (ή τυχαία) επίδραση της μεταβλητής πλαισίου
(με n επίπεδα) στη μεταβλητή απόκρισης.
ΓΡΑΜΜΙΚΑ ΜΟΝΤΕΛΑ ΚΑΙ ΣΧΕΔΙΑΣΜΟΣ & ΑΝΑΛΥΣΗ ΠΕΙΡΑΜΑΤΩΝ ΜΕ ΕΦΑΡΜΟΓΕΣ ΣΕ R ΚΑΙ MINITAB
205
Τονίζεται ότι στην περίπτωση που ο Ερευνητής επιθυμεί ή θεωρεί ότι είναι αναγκαία η διερεύνηση αλληλεπίδρασης μεταξύ της μεταβλητής πλαισίου και των παραγόντων ενδιαφέροντος, είναι υποχρεωμένος να
αντιμετωπίσει τη μεταβλητή πλαισίου ως παράγοντα ενδιαφέροντος.
Η μεταβλητή πλαισίου, όπως και οι παράγοντες ενδιαφέροντος, μπορεί να είναι σταθερών ή τυχαίων επιδράσεων, αν και συχνά τα επίπεδα της μεταβλητής πλαισίου είναι πολλά και αναγκάζουν τον Ερευνητή να
αντιμετωπίσει τη μεταβλητή αποκλειστικά ως μεταβλητή τυχαίων επιδράσεων. Στην περίπτωση που όλοι οι
παράγοντες ενδιαφέροντος είναι σταθερών επιδράσεων, ο Πίνακας ANOVA έχει την ίδια μορφή, ανεξάρτητα
από τον εάν η μεταβλητή πλαισίου είναι σταθερών ή τυχαίων επιδράσεων. Για τη διττή αυτή περίπτωση, ο Πίνακας ANOVA (δηλαδή με τη μεταβλητή O να είναι είτε σταθερών είτε τυχαίων επιδράσεων) αποτυπώνεται
στη συνέχεια:
Πίνακας 8.22: Πίνακας ANOVA- Διπαραγοντική Ανάλυση με Αλληλεπίδραση και Μεταβλητή Πλαισίου
Μέσο
Άθροισμα
Πηγή
Μεταβλητότητας
Βαθμοί
Ελευθερίας
Άθροισμα
Τετραγώνων
A
a−1
SSA
M SA =
SSA
(a−1)
M SA
M SE
B
b−1
SSB
M SB =
SSB
(b−1)
M SB
M SE
AB
(a − 1)(b − 1)
SSAB
O
n−1
SSO
Σφάλματα
(ab − 1)(n − 1)
SSE
Ολική
abn − 1
SST O
F
Τετραγώνων
M SAB =
SSAB
(a−1)(b−1)
SSO
n−1
M SO
M SE
SSE
(ab−1)(n−1)
–
–
–
M SO =
M SE =
M SAB
M SE
Οι έλεγχοι για τις κύριες επιδράσεις και την αλληλεπίδραση, αλλά και τη μεταβλητή πλαισίου διεκπεραιώνονται κατά τα συνήθη:
• με βάση την ελεγχοσυνάρτηση M SAB/M SE για τον έλεγχο της αλληλεπίδρασης (ανεξαρτήτως
του είδους των επιδράσεων του προτύπου),
• με βάση την ελεγχοσυνάρτηση M SO/M SE για τον έλεγχο που αφορά τη μεταβλητή πλαισίου
(ανεξαρτήτως του είδους των επιδράσεων του προτύπου),
• αν πρόκειται για σταθερές επιδράσεις των A και B, με βάση τον παραπάνω Πίνακα ANOVA, δηλαδή
με βάση τις ελεγχοσυναρτήσεις M SA/M SE και M SB/M SE,
• αν πρόκειται για τυχαίες επιδράσεις των A και B σύμφωνα με την αντίστοιχη ενότητα νωρίτερα (Ενότητα
8.4.3), δηλαδή με βάση τις ελεγχοσυναρτήσεις M SA/M SAB και M SB/M SAB,
• αν πρόκειται για πρότυπο με έναν παράγοντα σταθερών επιδράσεων (π.χ. τον A) και έναν τυχαίων
(π.χ. τον B), τότε ο έλεγχος για τον μεν A (τον σταθερό) βασίζεται στη σύγκριση των M SA και
M SAB και για τον δε B (τον τυχαίο) στη σύγκριση των M SB και M SE. Ανάλογα, αντιμετωπίζεται η αντίθετη περίπτωση με τον A να είναι τυχαίος και τον B να είναι σταθερός.
Υπενθυμίζεται ότι στην περίπτωση σταθερών επιδράσεων, οι έλεγχοι αφορούν μηδενικές επιδράσεις και σχετίζονται με τις μέσες τιμές, ενώ στην περίπτωση τυχαίων επιδράσεων οι έλεγχοι αφορούν μηδενικές διασπορές
και σχετίζονται με τη μεταβλητότητα. Στην τελευταία περίπτωση, οι παράμετροι του προτύπου αi , βj , (αβ)ij
206
ΣΧΕΔΙΑΣΜΟΣ ΠΕΙΡΑΜΑΤΩΝ
και ok είναι ανεξάρτητες τυχαίες μεταβλητές (και μεταξύ τους και σε σχέση με τα σφάλματα) που ακολουθούν
2
την κανονική κατανομή με μέση τιμή 0 και με διασπορά σα2 , σβ2 , σαβ
και σo2 αντίστοιχα.
Σημειώνεται ότι στην περίπτωση τυχαίων επιδράσεων για τη μεταβλητή πλαισίου είναι δυνατή η εκτίμηση
της διασποράς σo2 των τυχαίων μεταβλητών ok , με βάση τη θεωρητική μέση τιμή του M SO. Συγκεκριμένα,
επειδή:
E (M SO) = σ 2 + abσo2
προκύπτει ότι:
M SO − M SE
ab
όπου M SO και M SE αντιπροσωπεύουν τις δειγματικές ποσότητες και άρα τους εκτιμητές για την αναμενόμενη τιμή της τυχαίας μεταβλητής M SO και για τη διασπορά των σφαλμάτων, αντίστοιχα.
M SO = M SE + abσ̂o2 → σ̂o2 =
Έστω τώρα η περίπτωση πειράματος με δύο παράγοντες ενδιαφέροντος A και B με a και b επίπεδα αντίστοιχα και με δύο μεταβλητές πλαισίου O και P με ab επίπεδα καθεμία, σε σχέδιο Λατινικού Τετραγώνου.
Λόγω του σχεδίου Λατινικού Τετραγώνου η μία μεταβλητή πλαισίου θεωρείται η μεταβλητή που αντιστοιχεί
στις γραμμές του Λατινικού Τετραγώνου (εξού και ο συμβολισμός “R” (Rows) και η άλλη στις στήλες (από
όπου ο συμβολισμός “C” (Columns)). Το πρότυπο προκύπτει από το προηγούμενο (8.45) με την προσθήκη
μίας ακόμα μεταβλητής πλαισίου:
yijk = µ+αi +βj +(αβ)ij +ok +pl +ϵijkl ,
i = 1, ..., a,
j = 1, ..., b,
k, l = 1, ..., ab (8.46)
όπου υπεισέρχονται οι όροι ok και pl που αντιπροσωπεύουν τη σταθερή ή τυχαία επίδραση των δύο μεταβλητών πλαισίου στη μεταβλητή απόκρισης.
Ο σχετικός Πίνακας ANOVA είναι της μορφής:
Πίνακας 8.23: Πίνακας ANOVA - Διπαραγοντική Ανάλυση με Αλληλεπίδραση σε Σχέδιο Λατινικού Τετραγώνου
Μέσο
Πηγή
Μεταβλητότητας
Βαθμοί
Ελευθερίας
Άθροισμα
Τετραγώνων
A
a−1
SSA
M SA =
SSA
(a−1)
M SA
M SE
B
b−1
SSB
M SB =
SSB
(b−1)
M SB
M SE
AB
(a − 1)(b − 1)
SSAB
Blocks-R Γραμμές
ab − 1
SSR
M SR =
SSR
ab−1
M SR
M SE
Blocks-C Στήλες
ab − 1
SSC
M SC =
SSC
ab−1
M SC
M SE
Σφάλματα
(ab − 1)(ab − 2)
SSE
SSE
(ab−1)(ab−2)
–
Ολική
a2 b 2 − 1
SST O
–
–
Άθροισμα
F
Τετραγώνων
M SAB =
M SE =
SSAB
(a−1)(b−1)
M SAB
M SE
Σημειώνεται ότι το Λατινικό Τετράγωνο είναι ένα τετράγωνο ab×ab όπου a και b τα επίπεδα των εμπλεκόμενων παραγόντων ενδιαφέροντος A και B. Επομένως, οι δυνατοί συνδυασμοί που ενδιαφέρουν τον Ερευνητή
είναι ab και άρα τόσοι είναι οι προς εξέταση πληθυσμοί (θεραπείες). Κατά συνέπεια, η καθεμία από τις δύο
μεταβλητές πλαισίου θα πρέπει να έχει τον ίδιο αριθμό επιπέδων με τις υπό εξέταση θεραπείες, δηλαδή ab, και
ΓΡΑΜΜΙΚΑ ΜΟΝΤΕΛΑ ΚΑΙ ΣΧΕΔΙΑΣΜΟΣ & ΑΝΑΛΥΣΗ ΠΕΙΡΑΜΑΤΩΝ ΜΕ ΕΦΑΡΜΟΓΕΣ ΣΕ R ΚΑΙ MINITAB
207
έτσι προκύπτει το Λατινικό Τετράγωνο. Αν για παράδειγμα, ο παράγοντας A έχει 2 επίπεδα και ο B έχει 4
επίπεδα, τότε προκύπτουν 8 συνδυασμοί επιπέδων, δηλαδή 8 θεραπείες. Άρα, θα έχουμε έναν σχεδιασμό ενός
8×8 Λατινικού Τετραγώνου, με 64 συνολικά πειράματα και 63 βαθμούς ελευθερίας (a2 b2 −1 = 22 ×42 −1).
Οι έλεγχοι για τις κύριες επιδράσεις και την αλληλεπίδραση αλλά και τις μεταβλητές πλαισίου, διεκπεραιώνονται κατά τα συνήθη.
Θα πρέπει επίσης να αναφερθεί ότι ο συγκεκριμένος σχεδιασμός επιτρέπει τη μελέτη της αλληλεπίδρασης
ακόμα και όταν δεν υπάρχει επανάληψη, δηλαδή έστω και αν έχουμε μία μέτρηση ανά κελί. Μία τέτοια περίπτωση αποτυπώνεται στο επόμενο παράδειγμα με δύο παράγοντες με 2 επίπεδα έκαστος (1 και 2) και δύο
μεταβλητές πλαισίου που έχουν (αναγκαστικά) 4 επίπεδα η καθεμία (αφού ο αριθμός προκύπτει από το γινόμενο των επιπέδων των δύο παραγόντων ενδιαφέροντος). Σημειώνεται ότι σε κάθε κελί καταγράφεται τόσο
η μέτρηση όσο και τα επίπεδα (σε παρένθεση) των παραγόντων A και B στα οποία εκτελέστηκε το πείραμα
που αφορά τη συγκεκριμένη μέτρηση.
Παράδειγμα 8.7. Δίνονται τα παρακάτω δεδομένα:
Πίνακας 8.24: Πίνακας Δεδομένων - Λατινικό Τετράγωνο
Επίπεδα Μεταβλητής
Πλαισίου 2
ΟΟ1
ΟΟ2
ΟΟ3
ΟΟ4
O1
(1, 1) 33.5
(1, 2) 33.5
(2, 1) 32.5
(2, 2) 32.1
O2
(1, 2) 32.7
(2, 1) 32.5
(2, 2) 32.1
(1, 1) 33.3
O3
(2, 1) 32.9
(2, 2) 32.7
(1, 1) 33.5
(1, 2) 32.9
O4
(2, 2) 32.1
(1, 1) 33.5
(1, 2) 33.7
(2, 1) 32.3
Επίπεδα Μεταβλητής
Πλαισίου 1
Για την εύρεση του Πίνακα ANOVA με τη χρήση του Minitab, ακολουθούμε τη γνωστή διαδρομή:
Stat
Ê
ANOVA
Ê
General Linear Model
Ê
Fit General Linear Model
με τη μεταβλητή απόκρισης Y να τίθεται στο Responses και τους παράγοντες A, B, R και C στα Factors. Σημειώνεται ότι για την περίπτωση του προτύπου με αλληλεπίδραση θα πρέπει στο Model να επιλεχθούν οι 2
παράγοντες ενδιαφέροντος και να τικαριστεί η επιλογή Interactions through order 2 ώστε να περιληφθεί στο μοντέλο και η αλληλεπίδραση, ενώ στο Random/Nest θα πρέπει να καθοριστεί το Type όλων των εμπλεκόμενων
παραγόντων (συμπεριλαμβανομένων των μεταβλητών πλαισίου) μεταξύ των επιλογών Fixed και Random. Ο πίνακας ANOVA, για το παράδειγμα με σταθερές επιδράσεις για τους παράγοντες ενδιαφέροντος και ανεξαρτήτως
του είδους των μεταβλητών πλαισίου, είναι:
208
ΣΧΕΔΙΑΣΜΟΣ ΠΕΙΡΑΜΑΤΩΝ
Πίνακας 8.25: Πίνακας ANOVA - Λατινικό Τετράγωνο
Πηγή
Μεταβλητότητας
Βαθμοί
Ελευθερίας
Άθροισμα
Τετραγώνων
A
1
3.4225
B
1
AB
Μέσο
F
p-value
3.4225
38.38
0.001
0.3025
0.3025
3.39
0.115
1
0.0025
0.0025
0.03
0.873
Blocks-R Γραμμές
3
0.2675
0.08917
1
0.455
Blocks-C Στήλες
3
0.3675
0.1225
1.37
0.338
Σφάλματα
6
0.535
0.08917
–
–
Ολική
15
4.8975
–
–
–
Άθροισμα
Τετραγώνων
Tα συμπεράσματα που προκύπτουν από την παραπάνω ανάλυση συνοψίζονται ως εξής:
• Η υπόθεση των μηδενικών κύριων επιδράσεων για τον παράγοντα A απορρίπτεται σε όλα τα συνήθη επίπεδα σημαντικότητας, αφού διαπιστώνεται ότι p-value = 0.001.
• Η υπόθεση των μηδενικών κύριων επιδράσεων για τον παράγοντα B δεν απορρίπτεται στα συνήθη επίπεδα
σημαντικότητας, αφού διαπιστώνεται ότι p-value = 0.115.
• Διαπιστώνεται η απουσία αλληλεπίδρασης μεταξύ των A και B. αφού p-value = 0.873.
• Αν και η μελέτη γίνεται με δεδομένη την επίδραση των δύο μεταβλητών πλαισίου στη μεταβλητή απόκρισης, αυτό δεν επιβεβαιώνεται από την ανάλυση, αφού από οι p-values που παρατηρήθηκαν (0.455 και
0.338) δεν προκύπτει επίδραση. Η σύσταση προς τον υπεύθυνο Ερευνητή είναι να προγραμματιστεί άμεσα
επανέλεγχος για τις δύο μεταβλητές πλαισίου και αν επαναβεβαιωθεί με νέα ανεξάρτητη μελέτη η μη σημαντικότητα των μεταβλητών πλαισίου, αυτές θα πρέπει να παύσουν να λαμβάνονται υπόψη, δηλαδή να
πάψει η ομαδοποίηση των πειραμάτων με βάση τις δύο αυτές μεταβλητές, αφού μία τέτοια ομαδοποίηση
είναι περιττή (αχρείαστη).
Το προτεινόμενο πρότυπο, με βάση τα παραπάνω, είναι ένα πρότυπο ενός παράγοντα χωρίς μεταβλητές πλαισίου
του οποίου η συναρτησιακή μορφή είναι:
yik = µ + αi + ϵik ,
i = 1, ..., a, k = 1, ..., n
(8.47)
για το οποίο ο Πίνακας ANOVA προκύπτει από τον προηγούμενο με την ενσωμάτωση της μεταβλητότητας των
B, R, C και AB στα σφάλματα:
Πίνακας 8.26: Πίνακας Δεδομένων - Λατινικό Τετράγωνο - Εναλλακτικό Πρότυπο
Πηγή
Μεταβλητότητας
Βαθμοί
Ελευθερίας
Άθροισμα
Τετραγώνων
A
1
3.4225
Σφάλματα
14
Ολική
15
Μέσο
F
p-value
3.4225
32.62
0.002
1.475
0.105
–
–
4.8975
–
–
–
Άθροισμα
Τετραγώνων
ΓΡΑΜΜΙΚΑ ΜΟΝΤΕΛΑ ΚΑΙ ΣΧΕΔΙΑΣΜΟΣ & ΑΝΑΛΥΣΗ ΠΕΙΡΑΜΑΤΩΝ ΜΕ ΕΦΑΡΜΟΓΕΣ ΣΕ R ΚΑΙ MINITAB
209
Με βάση το τροποποιημένο πρότυπο δεν διαφοροποιούνται τα προηγούμενα συμπεράσματα, αφού επαναβεβαιώνεται η σημαντικότητα του παράγοντα A με ελαφρά μόνο, αλλά άνευ σημασίας, μεταβολή της p-value.
8.5 Εφαρμογές στο Minitab και στην R
1. Βιομηχανία παραγωγής λεπίδων διαθέτει 3 γραμμές παραγωγής τις οποίες θέλει να αξιολογήσει όσον
αφορά την αντοχή των παραγομένων προϊόντων. Ο υπεύθυνος παραγωγής γνωρίζει ότι πρέπει να ομαδοποιήσει τα πειράματα ανά γραμμή παραγωγής ως προς τους 3 προμηθευτές της πρώτης ύλης, γιατί
είναι γνωστό ότι παρουσιάζουν διαφορετικά ποιοτικά χαρακτηριστικά. Επομένως, θα προχωρήσει σε
σχέδιο τυχαιοποιημένων πλήρων ομάδων, δηλαδή σε ανάλυση διακύμανσης κατά έναν παράγοντα, την
αντοχή, έστω A, με τρία επίπεδα (1, 2, 3) και με μία μεταβλητή πλαισίου (ομάδα), τον προμηθευτή,
έστω O1 με επίσης τρία επίπεδα (1, 2 και 3), αφού τόσοι είναι όλοι οι προμηθευτές που προμηθεύουν
την πρώτη ύλη για τις λεπίδες.
Πίνακας 8.27: Πίνακας Δεδομένων - Αντοχή
Προμηθευτής
1
2
3
1
50
50
130
2
90
80
190
3
70
120
190
Γραμμή Παραγωγής
i. Ζητείται να διερευνηθεί αν η αντοχή των λεπίδων διαφέρει ανάλογα με τη γραμμή παραγωγής.
ii. Συστήνεται να επιβεβαιωθεί η επίδραση, σύμφωνα με τον υπεύθυνο παραγωγής, του προμηθευτή στην αντοχή των λεπίδων. Αν δεν επιβεβαιωθεί, να προτείνετε εναλλακτικά σχέδια για
την αξιολόγηση των λεπίδων, σε μελλοντικές μελέτες.
iii. Αν παρατηρούνται διαφορές στην αντοχή στις γραμμές παραγωγής να διερευνηθεί σε ποια ή
ποιες οφείλεται αυτή η διαφορά. Επιπρόσθετα, να διερευνηθούν οι γραμμές παραγωγής 1 και 2
συγκρινόμενες με την 3 η οποία θεωρείται, κατά τον υπεύθυνο παραγωγής, υποδειγματική.
iv. Τέλος, ζητείται να διαπιστωθεί πώς διαφοροποιείται το πρόβλημα αν οι 3 γραμμές παραγωγής
δεν είναι οι μοναδικές αλλά η βιομηχανία έχει πολλές γραμμές παραγωγής σε διάφορα μέρη ανά
την επικράτεια και οι συγκεκριμένες αποτελούν δείγμα, που έχει επιλεχθεί τυχαία.
v. Έστω ότι στο πρόβλημα υπεισέρχεται και δεύτερη μεταβλητή πλαισίου, ο χειριστής (της γραμμής παραγωγής), έστω O2, με τρία επίσης επίπεδα (1, 2 και 3 που αντιστοιχούν σε 3 διαφορετικούς χειριστές), και ο Πίνακας Δεδομένων διαφοροποιείται όπως παρουσιάζεται στη συνέχεια
(σε παρένθεση τα επίπεδα του παράγοντα ενδιαφέροντος). Να διερευνηθεί και πάλι αν υπάρχουν διαφορές ως προς τη μέση αντοχή μεταξύ των γραμμών παραγωγής και να επιβεβαιωθεί (ή
όχι) η σημαντικότητα των δύο μεταβλητών πλαισίου.
210
ΣΧΕΔΙΑΣΜΟΣ ΠΕΙΡΑΜΑΤΩΝ
Πίνακας 8.28: Πίνακας Δεδομένων - Αντοχή - Λατινικό Τετράγωνο
Επίπεδα Μεταβλητής
Πλαισίου 2
1
2
3
1
50 (1)
90 (2)
70 (3)
2
80 (2)
120 (3)
50 (1)
3
190 (3)
130 (1)
190 (2)
Επίπεδα Μεταβλητής
Πλαισίου 1
Ȫ
Λύση
i. Με βάση την εκφώνηση, το κατάλληλο πρότυπο είναι αυτό που αφορά το σχέδιο τυχαιοποιημένων πλήρων ομάδων (σχέση (8.10)), με σταθερές επιδράσεις. Υπενθυμίζεται ότι τα σφάλματα
πρέπει να είναι ανεξάρτητες τυχαίες μεταβλητές με κανονική κατανομή και σταθερή διασπορά:
ϵ ∼ N 0, σ 2
ενώ οι παράμετροι του προτύπου, που αντιπροσωπεύουν τις επιδράσεις των τριών επιπέδων του
παράγοντα ενδιαφέροντος (γραμμή παραγωγής, A) και τις επιδράσεις των επιπέδων της μεταβλητής πλαισίου, ικανοποιούν τις σχέσεις
3
X
i=1
αi
&
3
X
oi = 0.
i=1
Υπενθυμίζεται ότι επιλέγοντας τη χρήση του συγκεκριμένου προτύπου, δηλαδή του προσθετικού προτύπου, δεχόμαστε την απουσία αλληλεπίδρασης μεταξύ του παράγοντα ενδιαφέροντος
και της μεταβλητής πλαισίου.
Για την εισαγωγή των δεδομένων στο Minitab χρησιμοποιούνται οι 3 πρώτες στήλες (C1 , C2 ,
& C3 ) στο κεντρικό παράθυρο του Minitab. Οι μετρήσεις καταχωρίζονται π.χ. στην 3η στήλη,
η μία κάτω από την άλλη, ενώ στην 1η και 2η στήλη καταχωρίζονται η γραμμή παραγωγής και ο
προμηθευτής (1, 2, 3) που αντιστοιχούν στην κάθε μέτρηση. Έτσι, προκύπτει ένα σύνολο δεδομένων με 9 γραμμές και 3 στήλες. Τα ονόματα που δόθηκαν στις δύο ποσότητες είναι A, O1 και
Y.
Για τη διερεύνηση της αντοχής των λεπίδων ακολουθούμε τη διαδρομή
Stat
Ê
ANOVA
Ê
General Linear Model
Ê
Fit General Linear Model
επιλέγοντας να τοποθετήσουμε την Y στα Responses και τις A και O1 στα Factors και καταλήγουμε στον ακόλουθο Πίνακα ANOVA:
ΓΡΑΜΜΙΚΑ ΜΟΝΤΕΛΑ ΚΑΙ ΣΧΕΔΙΑΣΜΟΣ & ΑΝΑΛΥΣΗ ΠΕΙΡΑΜΑΤΩΝ ΜΕ ΕΦΑΡΜΟΓΕΣ ΣΕ R ΚΑΙ MINITAB
211
Πίνακας 8.29: Πίνακας ANOVA - Αντοχή
Για τον έλεγχο των ίσων μέσων μεταξύ των τριών γραμμών παραγωγής, δηλαδή για τον έλεγχο
H0 : α1 = α2 = α3 = 0
από τη γραμμή του Πίνακα ANOVA που αφορά τον παράγοντα A, βλέπουμε ότι
F = 7.11 & p-value = 0.048
με αποτέλεσμα η γραμμή παραγωγής να έχει στατιστικώς σημαντική επίδραση στην αντοχή στα
συνήθη επίπεδα σημαντικότητας 5% και 10%.
ii. Για την επιβεβαίωση ότι ο προμηθευτής επιδρά στην αντοχή, δηλαδή για τον έλεγχο
H0 : o1 = o2 = o3 = 0
vs
H1 : Όχι όλα τα oj , j = 1, . . . , 3 ίσα με 0
από τη δεύτερη γραμμή του Πίνακα ANOVA που αφορά τη μεταβλητή πλαισίου O1, βλέπουμε
ότι
F = 28.43 & p-value = 0.004
με αποτέλεσμα το πείραμα να επαληθεύει την πεποίθηση του υπεύθυνου παραγωγής στα συνήθη
επίπεδα σημαντικότητας 1%, 5% και 10%. Σε περίπτωση που δεν μπορούσε να επιβεβαιωθεί ο
ισχυρισμός του υπεύθυνου, θα έπρεπε να γίνει εισήγηση για κατάργηση της ομαδοποίησης και
τροποποίηση των μελλοντικών μελετών με σχεδιασμούς πλήρους τυχαιοποίησης με έναν παράγοντα.
Το Minitab, ταυτόχρονα με τον Πίνακα ANOVA, δίνει και τους εκτιμητές των παραμέτρων του
προτύπου μαζί με τα βασικά χαρακτηριστικά τους:
Πίνακας 8.30: ANOVA Συντελεστές - Αντοχή
212
ΣΧΕΔΙΑΣΜΟΣ ΠΕΙΡΑΜΑΤΩΝ
από όπου, αφού
P
αi =
P
oi =
P
α̂i =
P
ôi = 0, προκύπτει ότι:
µ̂ = 107.78, α̂1 = −31.11, α̂2 = 12.22, α̂3 = 18.89,
ô1 = −37.78, ô2 = −24.44 & ô3 = 62.22
και έτσι το πρότυπο να παίρνει την τελική μορφή:
(8.48)
iii. Από τη στιγμή που έχει διαπιστωθεί ότι η επίδραση της γραμμής παραγωγής είναι στατιστικώς
σημαντική, απαιτείται η μελέτη των Πολλαπλών Συγκρίσεων του Tukey για να διαπιστωθεί πού
οφείλεται, δηλαδή ποια γραμμή οδηγεί στα βέλτιστα αποτελέσματα και ποια στα χειρότερα. Εφόσον έχει εξεταστεί το πρότυπο και έχουν προκύψει τα αποτελέσματα της Ανάλυσης Διακύμανσης
(και μόνο τότε), μπορεί να εκτελεστεί η ακόλουθη αλληλουχία βημάτων στο Minitab:
Stat
Ê
ANOVA
Ê
General Linear Model
Ê
Comparisons
τικάροντας την επιλογή Tukey. Στα Choose terms for comparisons θα μπορούσαν να επιλεχθούν
τόσο ο παράγοντας A όσο και η μεταβλητή πλαισίου O1 αλλά εδώ έχει επιλεχθεί μόνο ο παράγοντας A, αφού αυτός αποτελεί το κεντρικό αντικείμενο μελέτης. Tα αποτελέσματα της σύγκρισης
για επίπεδο 95% παρουσιάζονται στον Πίνακα 8.31.
Πίνακας 8.31: Πολλαπλές Συγκρίσεις Tukey - Αντοχή
Τα αποτελέσματα που προκύπτουν οδηγούν σε μία ιδιαίτερα ακραία περίπτωση όπου οι πολλαπλές συγκρίσεις Tukey δεν καταφέρνουν στο επίπεδο 5% να αναδείξουν στατιστικώς σημαντική διαφορά μεταξύ των επιπέδων των τριών γραμμών παραγωγής, συγκρινόμενων ανά δύο.
Η πολύ οριακή τιμή της p-value νωρίτερα (ίση με 0.048,) σε συνδυασμό με τον μικρό αριθμό
πειραμάτων και την απαίτηση από κοινού όλα τα διαστήματα ανά δύο, να έχουν επίπεδο τουλάχιστον 95% οδήγησε στο ακραίο συμπέρασμα ότι δεν υπάρχουν διαφορές. Παρά ταύτα θα
πρέπει να σημειώσει κανείς ότι το Individual level που προέκυψε είναι 97.65%, ενώ μία από τις
p-values είναι οριακά αποδεκτή (ισούται με 0.054), κάτι που επιτρέπει στον Ερευνητή να αποδεχτεί οριακά τη διαφορά των αντοχών στις 3 γραμμές παραγωγής με τη μηχανή υπ’ αριθμό 1
να είναι η λιγότερη ανθεκτική, κάτι που άλλωστε φαίνεται και από τη μέση αντοχή της (ίση με
76.667) συγκριτικά με τις άλλες δύο, αλλά και από τις δύο οριακές p-values (τόσο το 0.054
που αναφέρθηκε νωρίτερα, όσο και το 0.083). Επίσης, παρατηρούμε ότι οι άλλες δύο γραμμές
παραγωγής με μέσες τιμές 126.667 και 120.000 αντίστοιχα, συγκριτικά, θεωρούνται στατιστικώς ισοδύναμες, με την p-value της σύγκρισης να είναι ίση με 0.892.
ΓΡΑΜΜΙΚΑ ΜΟΝΤΕΛΑ ΚΑΙ ΣΧΕΔΙΑΣΜΟΣ & ΑΝΑΛΥΣΗ ΠΕΙΡΑΜΑΤΩΝ ΜΕ ΕΦΑΡΜΟΓΕΣ ΣΕ R ΚΑΙ MINITAB
213
Σημειώνεται ότι έχει τικαριστεί η επιλογή Tests and Confidence Intervals στα Results ώστε να δοθούν τα αποτελέσματα των σχετικών ελέγχων μαζί με τα αντίστοιχα διαστήματα εμπιστοσύνης
των συγκρίσεων ανά δύο, καθώς και η επιλογή Interval plot of differences of means στα Graphs
με τα εξής αποτελέσματα:
Πίνακας 8.32: Πολλαπλές Συγκρίσεις Tukey 95% Διαστήματα Εμπιστοσύνης - Αντοχή
Σχήμα 8.4: Πολλαπλές Συγκρίσεις Tukey 95% Διαστήματα Εμπιστοσύνης - Αντοχή
Σημειώνεται ότι αν επιλεχτεί επίπεδο εμπιστοσύνης ίσο με 94.5% (δηλαδή επίπεδο σημαντικότητας 5.5%), οι συγκρίσεις Tukey οδηγούν στο συμπέρασμα ότι οι μέσοι διαφέρουν και τα
διαγράμματα για τα διαστήματα εμπιστοσύνης δεν θα τέμνουν (όλα) την (διακεκομμένη) κάθετο που περνά από το μηδέν. Πιο συγκεκριμένα, το διάστημα για τη σύγκριση της 3ης με την
1η γραμμή θα βρίσκεται εξ ολοκλήρου στα δεξιά της κάθετης γραμμής στο μηδέν, ενώ τα υπόλοιπα δύο θα έχουν ελαφρά μετατοπιστεί προς τα δεξιά. Αν πάλι ο Ερευνητής επιλέξει το επίπεδο
να ισούται με 91.6% (δηλαδή επίπεδο σημαντικότητας 8.4%) τότε τα δύο πρώτα διαστήματα
για τη σύγκριση του επιπέδου 1 με τα επίπεδα 2 και 3 δεν θα τέμνουν την κάθετο στο μηδέν. Πιο
κάτω δίνονται τα διαστήματα για επίπεδο εμπιστοσύνης 94.5%:
214
ΣΧΕΔΙΑΣΜΟΣ ΠΕΙΡΑΜΑΤΩΝ
Σχήμα 8.5: Πολλαπλές Συγκρίσεις Tukey 94.5% Διαστήματα Εμπιστοσύνης - Αντοχή
Για τη σύγκριση των γραμμών 1 και 2 με την 3 θα γίνουν τα διαστήματα Dunnett με ιδανική (
gold standard) κατάσταση (επίπεδο) τη γραμμή παραγωγής 3 ακολουθώντας την ίδια διαδρομή,
όπως προηγουμένως
Stat
Ê
ANOVA
Ê
General Linear Model
Ê
Comparisons
επιλέγοντας στο Type of comparison την επιλογή With Control και τικάροντας την επιλογή Dunnett. Ταυτόχρονα, επιλέγεται το Control Level (το 3 για την περίπτωση της εφαρμογής):
Πίνακας 8.33: Πολλαπλές Συγκρίσεις Dunnett - Αντοχή
Το πιο πάνω αποτέλεσμα, όπως άλλωστε αναφέρεται και στην υποσημείωση, δείχνει ότι το επίπεδο 1 είναι στατιστικώς σημαντικό, ενώ το 2 δεν παρουσιάζει διαφορές από την ιδανική κατάσταση (τη γραμμή παραγωγής 3). Τα αποτελέσματα των δύο ελέγχων και τα αντίστοιχα διαστήματα για τις συγκρίσεις των επιπέδων 1 και 2 με το control level 3 είναι:
ΓΡΑΜΜΙΚΑ ΜΟΝΤΕΛΑ ΚΑΙ ΣΧΕΔΙΑΣΜΟΣ & ΑΝΑΛΥΣΗ ΠΕΙΡΑΜΑΤΩΝ ΜΕ ΕΦΑΡΜΟΓΕΣ ΣΕ R ΚΑΙ MINITAB
215
Πίνακας 8.34: Πολλαπλές Συγκρίσεις Dunnett 95% Διαστήματα Εμπιστοσύνης - Αντοχή
Σχήμα 8.6: Πολλαπλές Συγκρίσεις Dunnett 95% Διαστήματα Εμπιστοσύνης - Αντοχή
Εδώ παρατηρούμε ότι το επιλεχθέν επίπεδο εμπιστοσύνης 95% είναι επαρκές για να αναδειχτεί
η διαφορά του επιπέδου 1 με το 3 και αυτό γιατί εδώ οι έλεγχοι είναι μόνο 2 και άρα το συνολικό
σφάλμα είναι μικρότερο, σε σχέση με τους 3 ελέγχους για την περίπτωση Tukey. Άρα, η διαφορά
του επιπέδου 1 από το 3 είναι σαφής και αναδεικνύεται καθαρά (p-value = 0.043). Σημειώνεται ότι αν ως Control Level επιλεχθεί το επίπεδο 2, τότε οι συγκρίσεις Dunnett δεν καταφέρνουν
να αναδείξουν ότι διαφέρει από το επίπεδο 1. Πράγματι, η p-value του ελέγχου προκύπτει να
είναι ίση με 0.066 που είναι μεν μικρότερη από την τιμή 0.083 που προέκυψε για τις συγκρίσεις
Tukey, αλλά όχι μικρότερη από το σύνηθες επίπεδο του 5%.
iv. Έστω τώρα η περίπτωση όπου τα τρία επίπεδα του παράγοντα ενδιαφέροντος δεν είναι τα μοναδικά, αλλά αποτελούν δείγμα που έχει επιλεχθεί τυχαία από έναν μεγάλο αριθμό γραμμών παραγωγής που διαθέτει η βιομηχανία. Το πρόβλημα διαφοροποιείται ως προς τη φιλοσοφία του,
αφού τώρα πρόκειται για πρότυπο τυχαίων επιδράσεων όπου οι όροι αi αποτελούν τυχαίες μεταβλητές ανεξάρτητες από τα σφάλματα και τέτοιες ώστε αi ∼ N (0, σα2 ). Έτσι, δεν εξετάζεται
η μέση τιμή αλλά η διασπορά (μεταβλητότητα) και ο έλεγχος που θα πρέπει να εξεταστεί είναι,
από τη σχέση (8.31), ο
H0 : σα2 = 0 vs H1 : σα2 > 0.
Το πρόβλημα δεν διαφοροποιείται στην πράξη, ούτε όταν η μεταβλητή πλαισίου χαρακτηριστεί
τυχαία (στην εφαρμογή δεν έχει ζητηθεί κάτι τέτοιο) πέραν του ότι η επιβεβαίωση για την επίδραση της μεταβλητής πλαισίου ελέγχεται μέσω της μελέτης της διασποράς, έστω σo2 της τυχαίας μεταβλητής oi :
H0 : σo2 = 0 vs H1 : σo2 > 0.
216
ΣΧΕΔΙΑΣΜΟΣ ΠΕΙΡΑΜΑΤΩΝ
Ο Πίνακας ANOVA στην περίπτωση των τυχαίων επιδράσεων για τον παράγοντα ενδιαφέροντος, ταυτίζεται με τον πίνακα για την περίπτωση σταθερών επιδράσεων, με την ελεγχοσυνάρτηση να δίνεται και πάλι από τον ίδιο τύπο, και αφού η p-value του ελέγχου βρέθηκε προηγουμένως ίση με 0.048 καταλήγουμε στο συμπέρασμα ότι η μηδενική υπόθεση απορρίπτεται σε
επίπεδο σημαντικότητας 5% (καθώς και 10%) και άρα έχουμε ότι σα2 > 0. Συμπερασματικά,
υπάρχει διαφοροποίηση ως προς τη μεταβλητότητα μεταξύ των τριών γραμμών παραγωγής και
μπορούμε λόγω του ότι τα τρία επίπεδα επιλέχθηκαν τυχαία, να γενικεύσουμε το συμπέρασμα
για οποιαδήποτε γραμμή παραγωγής (και όχι μόνο αυτών που μελετήθηκαν).
Αξίζει να σημειωθεί ότι αφού είναι σημαντική η επίδραση του παράγοντα ενδιαφέροντος και κατ’
επέκταση η διασπορά σα2 είναι θετική, η συνήθης διαδρομή στο Minitab δίνει και τους εκτιμητές
των συνιστωσών της διασποράς του προβλήματος ταυτόχρονα με τον Πίνακα ANOVA, αρκεί
στα Results να είναι τικαρισμένη η επιλογή Variance Components, από όπου έχουμε τους εξής
εκτιμητές:
σ̂ 2 = 311.111 & σ̂a2 = 633.333,
με τη συνολική μεταβλητότητα η οποία αντιπροσωπεύει την εκτίμηση της διασποράς της μεταβλητής απόκρισης, να είναι:
2
V\
ar (Y ) ≡ σ̂total
= σ̂ 2 + σ̂a2 = 311.111 + 633.333 = 944.444.
v. Το τελευταίο μέρος της εφαρμογής είναι ένα κλασικό σχέδιο Λατινικού Τετραγώνου 3 × 3 με
έναν παράγοντα ενδιαφέροντος (τη γραμμή παραγωγής) και δύο μεταβλητές πλαισίου (τον
προμηθευτή και τον χειριστή) με την καθεμία να έχει τρία επίπεδα (1, 2 και 3) με το κατάλληλο
πρότυπο να δίνεται στη σχέση (8.17):
yijk = µ + αi + oj + θk + ϵijk ,
i, j, k = 1, 2, 3.
(8.49)
To πρόβλημα ζητά τη διερεύνηση μηδενικών επιδράσεων για τον παράγοντα ενδιαφέροντος
αλλά και την επιβεβαίωση ότι οι δύο μεταβλητές πλαισίου είναι σημαντικές.
Για τη συμπλήρωση των δεδομένων, στο κεντρικό παράθυρο του Minitab προσθέτουμε και την
τέταρτη στήλη (C4 ) για τις τιμές (επίπεδα) της νέας μεταβλητής πλαισίου που εδώ έχει ονομαστεί O2 . Η μελέτη θα γίνει ακολουθώντας τη διαδρομή
Stat
Ê
ANOVA
Ê
General Linear Model
Ê
Fit General Linear Model
με τη μεταβλητή απόκρισης να επιλέγεται στα Responses και τις υπόλοιπες 3 μεταβλητές να επιλέγονται στα Factors. Υπενθυμίζεται ότι όλες οι μεταβλητές είναι σταθερών επιδράσεων, ενώ στο
πρότυπο δεν υπεισέρχονται αλληλεπιδράσεις (διαφορετικά θα έπρεπε να μελετηθεί ένα πρότυπο
πολυπαραγοντικής ανάλυσης διακύμανσης - Κεφάλαιο 10). Τα αποτελέσματα της ανάλυσης φαίνονται στον πιο κάτω πίνακα:
Πίνακας 8.35: Πίνακας ANOVA - 3 × 3 Λατινικό Τετράγωνο - Αντοχή
ΓΡΑΜΜΙΚΑ ΜΟΝΤΕΛΑ ΚΑΙ ΣΧΕΔΙΑΣΜΟΣ & ΑΝΑΛΥΣΗ ΠΕΙΡΑΜΑΤΩΝ ΜΕ ΕΦΑΡΜΟΓΕΣ ΣΕ R ΚΑΙ MINITAB
217
Από τα αποτελέσματα προκύπτει ότι δεν υπάρχει επίδραση από τον παράγοντα ενδιαφέροντος
( p-value = 0.198) αλλά ούτε επιβεβαιώνεται η σημαντικότητα της μεταβλητής πλαισίου O2
που αφορά τους χειριστές γραμμών παραγωγής ( p-value = 0.875). Η εξαιρετικά υψηλή τιμή
της p-value δηλώνει ότι δεν τίθεται κανένας λόγος για την ομαδοποίηση ως προς τους χειριστές,
γιατί δεν φαίνεται να επιδρούν στη μεταβλητή απόκρισης. Αντίθετα, επαναβεβαιώνεται η σημαντικότητα της πρώτης μεταβλητής πλαισίου O1 που αφορά τους προμηθευτές. Έτσι, οδηγούμαστε στο συμπέρασμα ότι το ιδανικό σχέδιο που θα πρέπει να χρησιμοποιείται για αξιολόγηση του
συγκεκριμένου προβλήματος σε μελλοντικές μελέτες είναι αυτό των τυχαιοποιημένων πλήρων
ομάδων με ομάδα (μεταβλητή πλαισίου), τους προμηθευτές.
2. Βιομηχανία παραγωγής σωλήνων επιθυμεί να μελετήσει την αντοχή τους σε σχέση με δύο παράγοντες
A και B που αντιπροσωπεύουν την περιεκτικότητα μίας χημικής ένωσης (ως % επί της συνολικής
περιεκτικότητας) και τη θερμοκρασία. Το πείραμα εκτελείται στα 4 διαθέσιμα επίπεδα θερμοκρασίας
(5, 10, 20 και 30o βαθμούς Κελσίου) και στις 4 διαθέσιμες δοκιμαστικές περιεκτικότητες (0%, 1%,
2% και 3%). Σε κάθε συνδυασμό επιπέδων εκτελούνται 2 επαναλήψεις.
Πίνακας 8.36: Πίνακας Δεδομένων (2 επαναλήψεις ανά θεραπεία) - Σωλήνες
Επίπεδα Παράγοντα Β
5
10
20
30
0
10, 8
7, 8
5, 6
2, 3
1
14, 12
9, 8
7, 8
3, 3
2
17, 14
12, 11
9, 11
5, 4
3
22, 28
15, 17
10, 13
8, 10
Επίπεδα Παράγοντα Α
i. Να δοθεί το κατάλληλο πρότυπο για την περιγραφή του προβλήματος και να κατασκευαστούν
και σχολιαστούν τα διαγράμματα κύριων επιδράσεων των παραγόντων, καθώς και το διάγραμμα
αλληλεπίδρασης αυτών.
ii. Να διερευνηθεί η σημαντικότητα των κύριων επιδράσεων, καθώς και της αλληλεπίδρασής τους.
iii. Να επαναληφθεί η μελέτη στο ερώτημα (ii) θεωρώντας ότι και οι δύο παράγοντες είναι τυχαίων
επιδράσεων (δηλαδή ότι τα συγκεκριμένα επίπεδα έχουν επιλεχθεί τυχαία από ένα ευρύ σύνολο
διαθέσιμων επιπέδων για κάθε παράγοντα ενδιαφέροντος).
iv. Να επαναληφθεί η μελέτη στο ερώτημα (ii) θεωρώντας ότι ο παράγοντας A είναι τυχαίων και
ο B σταθερών επιδράσεων.
Ȫ
Λύση
i. Με βάση τα δεδομένα της μελέτης και λαμβάνοντας υπόψη ότι το πείραμα εκτελείται με επανάληψη, το ιδανικότερο πρότυπο είναι το παραγοντικό πείραμα σταθερών επιδράσεων, δύο παραγόντων, με αλληλεπίδραση που δίνεται στη σχέση (8.20):
yijk = µ + αi + βj + (αβ)ij + ϵijk ,
i = 1, ..., 4,
j = 1, ..., 4,
k = 1, 2 (8.50)
218
ΣΧΕΔΙΑΣΜΟΣ ΠΕΙΡΑΜΑΤΩΝ
όπου οι παράμετροι του προτύπου ικανοποιούν τις σχέσεις
X
αi =
i
X
j
βj =
X
(αβ)ij =
i
X
(αβ)ij = 0
j
ενώ τα σφάλματα είναι τυχαίες μεταβλητές, τέτοιες ώστε ϵijk ∼ N (0, σ 2 ) .
Το διάγραμμα κύριων επιδράσεων ( Main Effects Plot) προκύπτει από τη διαδρομή
Stat
Ê
ANOVA
Ê
Main Effects Plot
ενώ εκείνο για την αλληλεπίδραση ( Interaction Plot) από τη διαδρομή
Stat
Ê
ANOVA
Ê
Interaction Plot
Σχήμα 8.7: Διάγραμμα Κύριων Επιδράσεων - Σωλήνες
Από το διάγραμμα κύριων επιδράσεων φαίνεται να υπάρχει διαφοροποίηση των μέσων τιμών
τόσο λόγω του παράγοντα A (περιεκτικότητα) όσο και λόγω του παράγοντα B (θερμοκρασία).
Οι μέσες τιμές για τα τέσσερα επίπεδα του παράγοντα A εκτείνονται από περίπου την τιμή 5
(για το επίπεδο 0) μέχρι την τιμή 15 (για το επίπεδο 3), κάτι που υποδηλώνει ύπαρξη επίδρασης τουλάχιστον μεταξύ των επιπέδων 0 και 3. Παρόμοια εικόνα δίνει και το διάγραμμα για τον
παράγοντα B με τις μέσες τιμές να κυμαίνονται από την τιμή περίπου 5 (για το επίπεδο 30%)
μέχρι πάνω από 15 (για το επίπεδο 5%).
Από την άλλη πλευρά, το διάγραμμα αλληλεπιδράσεων, αν και φαινομενικά παρουσιάζει μία
ασθενή παραλληλία, αν παρατηρήσουμε με προσοχή θα εντοπίσουμε μία αυξητική τάση (που
ξεφεύγει από την παραλληλία) όταν ο παράγοντας A είναι στο επίπεδο 3 και ο παράγοντας B
στο επίπεδο 5. Από τον Πίνακα Δεδομένων παρατηρούμε ότι ο συνδυασμός επιπέδων (A =
3, B = 5) παρουσιάζει τις μεγαλύτερες μετρήσεις (22 και 28 με μέση τιμή 25) που είναι αισθητά μεγαλύτερες από όλες τις υπόλοιπες τιμές του Πίνακα Δεδομένων. Η παρατήρηση αυτή
οδηγεί στην υποψία ύπαρξης αλληλεπίδρασης.
ΓΡΑΜΜΙΚΑ ΜΟΝΤΕΛΑ ΚΑΙ ΣΧΕΔΙΑΣΜΟΣ & ΑΝΑΛΥΣΗ ΠΕΙΡΑΜΑΤΩΝ ΜΕ ΕΦΑΡΜΟΓΕΣ ΣΕ R ΚΑΙ MINITAB
219
Σχήμα 8.8: Διάγραμμα Αλληλεπιδράσεων - Σωλήνες
ii. Τα πορίσματα της γραφικής αξιολόγησης απαιτείται να διασταυρωθούν με τη στατιστική ανάλυση της Ανάλυσης Διακύμανσης μέσω της συνήθους διαδρομής:
Stat
Ê
ANOVA
Ê
General Linear Model
Ê
Fit General Linear Model
Πίνακας 8.37: Πίνακας ANOVA - Σταθερές Επιδράσεις - Σωλήνες
Παρατηρούμε ότι τα μέσα αθροίσματα τετραγώνων (M S) έχουν εξαιρετικά υψηλές τιμές, με
αποτελέσματα η τιμή της στατιστικής συνάρτησης F για τον έλεγχο μηδενικών επιδράσεων
τόσο για τον παράγοντα A όσο και για τον παράγοντα B να ισούνται με F = 50.61 και
F = 65.16 αντίστοιχα και έτσι να επιβεβαιώνεται η επίδραση και των δύο παραγόντων σε
όλα τα συνήθη επίπεδα εμπιστοσύνης ( p-value = 0.000). Ταυτόχρονα, από την 3η γραμμή
του Πίνακα ANOVA, και για τον έλεγχο απουσίας αλληλεπίδρασης που δίνεται από τη σχέση
(8.27), δηλαδή:
H0 : (αβ)ij = 0
vs
H1 : Όχι όλα τα (αβ)ij , i = 1, ..., a, j = 1, ..., b, ίσα με 0
(8.51)
220
ΣΧΕΔΙΑΣΜΟΣ ΠΕΙΡΑΜΑΤΩΝ
έχουμε ότι:
M SAB = 8.365, F = 3.30 & p-value = 0.018.
Κατά συνέπεια επιβεβαιώνεται η ύπαρξη αλληλεπίδρασης στα συνήθη επίπεδα σημαντικότητας
5% και 10% ( p-value = 0.018).
Οι εκτιμητές των παραμέτρων του προτύπου προκύπτουν στο ίδιο output με τον Πίνακα ANOVA
και δίνονται στον Πίνακα 8.38.
Πίνακας 8.38: ANOVA Συντελεστές - Σταθερές Επιδράσεις - Σωλήνες
Όπως φαίνεται από τον Πίνακα των εκτιμητών, σε κάθε περίπτωση λείπει η εκτίμηση μίας παραμέτρου και αυτό γιατί η εναπομείνασα εκτιμήτρια προκύπτει με βάση τον αντίστοιχο τύπο στις
σχέσεις (8.22). Έτσι για παράδειγμα, αφού:
α̂0 = −3.844,
α̂1 = −1.969 &
α̂3 = 0.406,
η εναπομείνασα εκτιμήτρια ισούται με α̂4 = 5.407 ώστε και οι τέσσερις μαζί να αθροίζουν στο 0.
Είναι απόλυτα αναμενόμενο ο τελευταίος εκτιμητής να είναι θετικός, γιατί στο επίπεδο 3 παρατηρούνται οι υψηλότερες τιμές και άρα αναμένεται να αυξάνεται η τιμή σε σχέση με τον κεντρικό
γενικό μέσο ο οποίος έχει εκτιμηθεί από την τιμή 9.969 (ο Constant στον Πίνακα των εκτιμητών). Αντίθετα, ο εκτιμητής για το επίπεδο 0 είναι αισθητά αρνητικός, αφού στο επίπεδο 0 συναντάμε τις χαμηλότερες τιμές και κατά συνέπεια η μέση τιμή εμφανίζεται μειούμενη σε σχέση
με τον κεντρικό γενικό μέσο όρο (με εκτιμητή την τιμή 9.969). Σημειώνεται ότι η επιβεβαίωση
όσον αφορά τον παράγοντα A, ότι οι μέσες τιμές στο επίπεδο 3 είναι οι υψηλότερες και στο 0
οι χαμηλότερες, είχε ήδη εντοπιστεί στο Διάγραμμα Κύριων Επιδράσεων αλλά φαίνεται και στο
output των πολλαπλών συγκρίσεων ανά δύο, που αν και δεν ζητείται, δίνεται στη συνέχεια στο
output των Πολλαπλών Συγκρίσεων.
ΓΡΑΜΜΙΚΑ ΜΟΝΤΕΛΑ ΚΑΙ ΣΧΕΔΙΑΣΜΟΣ & ΑΝΑΛΥΣΗ ΠΕΙΡΑΜΑΤΩΝ ΜΕ ΕΦΑΡΜΟΓΕΣ ΣΕ R ΚΑΙ MINITAB
221
Επειδή στις περιπτώσεις ύπαρξης επιδράσεων συστήνεται να γίνεται διερεύνηση για τον εντοπισμό των επιπέδων εκείνων που οδηγούν σε πολύ μεγάλες ή πολύ μικρές τιμές, δίνονται στη
συνέχεια οι Πολλαπλές Συγκρίσεις Tukey τόσο για τον παράγοντα A (Πίνακας 8.39) όσο και
για τον παράγοντα (Πίνακας 8.40).
Πίνακας 8.39: Πολλαπλές Συγκρίσεις Tukey A - Σωλήνες
222
ΣΧΕΔΙΑΣΜΟΣ ΠΕΙΡΑΜΑΤΩΝ
Πίνακας 8.40: Πολλαπλές Συγκρίσεις Tukey B - Σωλήνες
Από τα αποτελέσματα προκύπτει ότι για τον παράγοντα A (περιεκτικότητα) το επίπεδο 3 διαφέρει από καθένα από τα υπόλοιπα επίπεδα και το ίδιο ισχύει για το επίπεδο 2. Μόνο τα επίπεδα
0 και 1 καταλήγουν να είναι στατιστικώς ισοδύναμα. Στο επίπεδο 3 παρατηρείται ο υψηλότερος μέσος (15.375), ενώ οι χαμηλότεροι μέσοι παρατηρούνται στα επίπεδα 0 και 1 (6.125 και
8.000 αντίστοιχα), χωρίς όμως να έχει δειχθεί ότι διαφέρουν στατιστικώς, αφού το σχετικό διάστημα εμπιστοσύνης είναι το (−0.403, 4.153) στο οποίο περιλαμβάνεται το μηδέν ( p-value
για την ισότητα των συγκεκριμένων δύο μέσων = 0.126).
Για τον παράγοντα B προκύπτει ότι όλα τα επίπεδα διαφέρουν, με το επίπεδο 5 να έχει την υψηλότερη μέση τιμή (15.625) και το επίπεδο 30 τη χαμηλότερη (4.750). Τα επίπεδα 10 και 20 αν
και διαφέρουν από τα υπόλοιπα, μεταξύ τους, έστω και οριακά ( p-value = 0.053), θεωρούνται στατιστικώς ισοδύναμα, εκτός αν το επίπεδο σημαντικότητας που θα επιλέξει ο Ερευνητής
είναι έστω και ελάχιστα μεγαλύτερο από 0.053. Μπορούμε να παρατηρήσουμε ότι το σχετικό
διάστημα εμπιστοσύνης (−4.528, 0.028) περιλαμβάνει έστω και οριακά την τιμή μηδέν ώστε
να μην απορρίπτεται η ισότητα των μέσων των επιπέδων 10 και 20, σε επίπεδο σημαντικότητας
5% ( p-value = 0.053).
iii. Για την περίπτωση του ερωτήματος iii, με βάση τα δεδομένα της μελέτης, το ιδανικότερο πρότυπο είναι το παραγοντικό πείραμα τυχαίων επιδράσεων, δύο παραγόντων, με αλληλεπίδραση
που δίνεται, όπως και προηγουμένως, από τη σχέση (8.20) με τις ποσότητες αi , βj και (αβ)ij
να είναι τυχαίες μεταβλητές που ακολουθούν την κανονική κατανομή με μέση τιμή 0 και δια2
που μαζί με τη διασπορά των σφαλμάτων σ 2 , αποτελούν τις
σπορές αντίστοιχα σα2 , σβ2 και σαβ
συνιστώσες διασποράς.
Ο αναγκαίος και επιθυμητός έλεγχος για τη διερεύνηση της απουσίας επίδρασης του παράγοντα
ΓΡΑΜΜΙΚΑ ΜΟΝΤΕΛΑ ΚΑΙ ΣΧΕΔΙΑΣΜΟΣ & ΑΝΑΛΥΣΗ ΠΕΙΡΑΜΑΤΩΝ ΜΕ ΕΦΑΡΜΟΓΕΣ ΣΕ R ΚΑΙ MINITAB
223
A, στην περίπτωση του προτύπου τυχαίων επιδράσεων, είναι
H0 : σα2 = 0
vs
H1 : σα2 > 0.
Οι αντίστοιχοι έλεγχοι για τον παράγοντα B και την αλληλεπίδραση AB είναι:
H0 : σβ2 = 0
vs
H1 : σβ2 > 0
2
=0
H0 : σαβ
vs
2
> 0.
H1 : σαβ
και
Υπενθυμίζεται ότι όπως και προηγουμένως, οι τύποι της περίπτωσης των σταθερών επιδράσεων
και γενικά ο Πίνακας ANOVA, εξακολουθούν να ισχύουν ως έχουν. Παρά ταύτα, η διερεύνηση
των πιο πάνω ελέγχων για τις κύριες επιδράσεις βασίζεται στις συγκρίσεις των M SA και M SB
με το M SAB, αντί του συνήθους M SE. Ακολουθώντας την ίδια ακριβώς διαδρομή, όπως και
στο ερώτημα (α), δηλαδή
Stat
Ê
ANOVA
Ê
General Linear Model
Ê
Fit General Linear Model
τικάροντας όμως και για τους δύο παράγοντες, την επιλογή Random στο Random/Nest, καταλήγουμε στον εξής Πίνακα ANOVA:
Πίνακας 8.41: Πίνακας ANOVA - Τυχαίες Επιδράσεις - Σωλήνες
Όσον αφορά τις συνιστώσες διασποράς, αυτές δίνονται στο output εφόσον στα Results έχει τικαριστεί η επιλογή Variance Components.
Πίνακας 8.42: Εκτιμητές Συνιστωσών Διασποράς - Τυχαίες Επιδράσεις - Σωλήνες
Από το output προκύπτει ότι οι εκτιμήτριες των συνιστωσών της διασποράς που αφορούν τον
παράγοντα A (14.9688) και τον παράγοντα B (19.5729) καλύπτουν ένα πάρα πολύ μεγάλο
224
ΣΧΕΔΙΑΣΜΟΣ ΠΕΙΡΑΜΑΤΩΝ
ποσοστό της συνολικής διασποράς του προτύπου που ισούται με 39.9896, αφήνοντας ένα μικρό
ποσοστό για τη συνιστώσα που αφορά την αλληλεπίδραση (2.91667) και ένα ακόμα μικρότερο ποσοστό που δεν έχει μπορέσει να ερμηνευθεί από το πρότυπο και αποτελεί τη διασπορά
του σφάλματος (2.53125). Υπενθυμίζεται ότι η τελευταία αυτή ποσότητα αντιπροσωπεύει το
M SE που εμφανίζεται στον Πίνακα ANOVA. Για τις συνιστώσες της διασποράς δίνονται ξεχωριστά (στο πιο πάνω output) τα ποσοστά της κάθε συνιστώσας στη συνολική διασπορά, όπως
και τα τυπικά σφάλματα ( Standard Deviations) των εκτιμητών των συνιστωσών. Στη συγκεκριμένη περίπτωση, τα τυπικά σφάλματα κυμαίνονται από 1.59099, για το σ 2 μέχρι 6.32373
μονάδες, για τη συνολική μεταβλητότητα.
iv. Η τελευταία μελέτη της εφαρμογής αφορά το μεικτό πρότυπο με αλληλεπίδραση, όπου ο παράγοντας A είναι τυχαίων και ο παράγοντας B σταθερών επιδράσεων. Ο γενικός τύπος του προτύπου είναι και πάλι ο ίδιος με προηγουμένως (σχέση (8.20)), όπου όμως τα αi είναι τυχαίες
μεταβλητές τέτοιες ώστε
αi ∼ N (0, σα2 ), τα (αβ)ij είναι επίσης τυχαίες μεταβλητές τέτοιες
P
2
ώστε (αβ)ij ∼ N 0, σαβ
, ενώ τα βj είναι σταθερές που ικανοποιούν τις σχέσεις j βj =
P
και j (αβ)ij = 0.
Υπενθυμίζεται
ότι για το συγκεκριμένο
πρότυπο και με βάση τις πιο πάνω κατανομές, ισχύει ότι
2
2
2
Yijk ∼N µ, σ + σα + σαβ , ενώ η μελέτη του προτύπου συνδυάζει ελέγχους για τις σταθερές παραμέτρους βj και τις διασπορές των τυχαίων μεταβλητών αi και (αβ)ij :
H0 : βj = 0
vs
H1 : Όχι όλα τα βj , j = 1, 2, 3, 4 ίσα με 0,
H0 : σα2 = 0
vs
H1 : σα2 > 0
2
H0 : σαβ
=0
vs
2
H1 : σαβ
> 0.
και
Για τη μελέτη του προτύπου ακολουθούμε τη διαδρομή
Stat
Ê
ANOVA
Ê
Balanced ANOVA
επιλέγοντας τη μεταβλητή απόκρισης στα Responses, τον παράγοντα A στα Random Factors,
ενώ στο Model καταχωρίζονται όλοι οι πριν εμπλεκόμενοι παράγοντες, δηλαδή ο παράγοντας
A, ο παράγοντας B, καθώς και η αλληλεπίδραση των A και B η οποία καταχωρίζεται ως A ∗ B.
Τα αποτελέσματα του Πίνακα ANOVA φαίνονται στον Πίνακα 8.43.
Πίνακας 8.43: Πίνακας ANOVA - Μεικτό Πρότυπο - Σωλήνες
ΓΡΑΜΜΙΚΑ ΜΟΝΤΕΛΑ ΚΑΙ ΣΧΕΔΙΑΣΜΟΣ & ΑΝΑΛΥΣΗ ΠΕΙΡΑΜΑΤΩΝ ΜΕ ΕΦΑΡΜΟΓΕΣ ΣΕ R ΚΑΙ MINITAB
225
Για την ορθή μελέτη του μοντέλου, στα Options πρέπει υποχρεωτικά να τικαριστεί η επιλογή Use
the restricted form of the model (Περιορισμένο Μεικτό Πρότυπο), που αποτελεί τη συνηθέστερη
μορφή μεικτού προτύπου που χρησιμοποιείται στην πράξη. Όσον αφορά τις συνιστώσες διασποράς, υπενθυμίζεται ότι δίνονται εφόσον στα Results έχει τικαριστεί η επιλογή Variance Components, ενώ δίνεται επιπρόσθετα η δυνατότητα να καταχωρίσουμε στο πλαίσιο Display means
corresponding to the terms τους παράγοντες για τα επίπεδα των οποίων επιθυμούμε να υπολογιστούν οι μέσες τιμές (για την εφαρμογή έχουν επιλεχθεί και οι δύο παράγοντες ενδιαφέροντος).
Οι συνιστώσες της διασποράς φαίνονται στον Πίνακα 8.44, ενώ οι μέσες τιμές ανά επίπεδο φαίνονται στον Πίνακα 8.45.
Πίνακας 8.44: Εκτιμητές Συνιστωσών Διασποράς - Μεικτό Πρότυπο - Σωλήνες
Πίνακας 8.45: Μέσες Τιμές Επιπέδων - Μεικτό Πρότυπο - Σωλήνες
8.6 Σχόλια και χρήσιμες σημειώσεις
Στην ενότητα αυτή, για διευκόλυνση του αναγνώστη παρατίθενται χρήσιμες σημειώσεις και σχόλια αναφορικά με το Minitab και την R για τα θέματα που μελετήθηκαν στο παρόν κεφάλαιο.
8.6.1 Σχόλια και χρήσιμες σημειώσεις - Minitab
• Για την περίπτωση του General Linear Model , το Minitab δίνει τη δυνατότητα να καταχωριστεί στο
κεντρικό παράθυρο της Minitab μία πληθώρα μεταβλητών. Έτσι, ο Ερευνητής μέσω της συνήθους
διαδρομής
Stat
Ê
ANOVA
Ê
General Linear Model
Ê
Fit General Linear Model
226
ΣΧΕΔΙΑΣΜΟΣ ΠΕΙΡΑΜΑΤΩΝ
μπορεί να καταχωρίσει μέσω της επιλογής Storage ποσότητες όπως είναι οι εκτιμώμενες τιμές της μεταβλητής απόκρισης (Fits), τα διάφορα κατάλοιπα (Residuals, Standardized Residulas, Deleted Residuals), οι διάφοροι δείκτες αξιολόγησης της συνεισφοράς των μετρήσεων (Leverage, Cook’s distance
κλπ.) ή ακόμα και οι εκτιμητές των συντελεστών του προτύπου (Coefficients).
• Το Minitab δίνει τη δυνατότητα να μελετηθούν τα πρότυπα του παρόντος Κεφαλαίου και μέσω της
διαδρομής
Stat
Ê
ANOVA
Ê
Balanced ANOVA
θέτοντας στα Responses τη μεταβλητή απόκρισης και στο Model τον παράγοντα ενδιαφέροντος και τη
μεταβλητή (ή τις μεταβλητές) πλαισίου. Σημειώνεται ότι η επιλογή Options δεν χρειάζεται να χρησιμοποιηθεί, αλλά και αν χρησιμοποιηθεί δεν πρόκειται να διαφοροποιηθούν τα αποτελέσματα. Η συγκεκριμένη επιλογή είναι απολύτως απαραίτητη στα μεικτά πρότυπα όπου δύο ή περισσότεροι παράγοντες εμπλέκονται, κάποιοι εκ των οποίων είναι σταθερών και κάποιοι τυχαίων επιδράσεων. Στα μεικτά
αυτά πρότυπα είναι απαραίτητο να τικαριστεί η επιλογή Use the restricted form of the model για να
διασφαλιστεί ότι θα χρησιμοποιηθούν οι κατάλληλοι τύποι για την ορθή μελέτη των επιδράσεων όλων
των παραγόντων.
• Για την περίπτωση του Balanced ANOVA , το Minitab δίνει τη δυνατότητα να καταχωριστούν στο
κεντρικό παράθυρο της Minitab δύο χρήσιμες ποσότητες. Συγκεκριμένα, ο Ερευνητής μέσω της συνήθους διαδρομής
Stat
Ê
ANOVA
Ê
Balanced ANOVA
μπορεί να καταχωρίσει μέσω της επιλογής Storage τις εκτιμώμενες τιμές της μεταβλητής απόκρισης
(Fits) ή/και τα κατάλοιπα (Residuals).
• Γενικώς, ο Ερευνητής συστήνεται να ελέγχει την εγκυρότητα των τριών βασικών προϋποθέσεων κανονικότητας, ανεξαρτησίας και ομοσκεδαστικότητας, δηλαδή να προβεί σε Ανάλυση Καταλοίπων, τουλάχιστον μέσω μίας πολλαπλής γραφικής μεθόδου, ακολουθώντας είτε τη διαδρομή
Stat
Ê
ANOVA
Ê
General Linear Model
Ê
Fit General Linear Model
είτε τη διαδρομή
Stat
Ê
ANOVA
Ê
Balanced ANOVA
και τικάροντας την επιλογή Four in One στο Graphs με την πρώτη επιλογή να μην αφορά το μεικτό
πρότυπο. Για την πλήρη στατιστική ανάλυση των καταλοίπων, και αφού αυτά έχουν καταχωριστεί σύμφωνα με το προηγούμενο σχόλιο στο κεντρικό παράθυρο του Minitab, θα πρέπει για την κανονικότητα
να εφαρμοστεί η διαδικασία
Stat
Ê
Basic Statistics
Ê
Normality Test
ΓΡΑΜΜΙΚΑ ΜΟΝΤΕΛΑ ΚΑΙ ΣΧΕΔΙΑΣΜΟΣ & ΑΝΑΛΥΣΗ ΠΕΙΡΑΜΑΤΩΝ ΜΕ ΕΦΑΡΜΟΓΕΣ ΣΕ R ΚΑΙ MINITAB
227
για την ομοσκεδαστικότητα η διαδικασία
Stat
Ê
ANOVA
Ê
Test for Equal Variances
και για την ανεξαρτησία η διαδικασία (για την αναλυτική παρουσίαση των τεχνικών αυτών βλέπε εφαρμογή Κεφαλαίου 7):
Stat
Ê
Nonparametrics
Ê
Runs Test
8.6.2 Σχόλια και χρήσιμες σημειώσεις - R
Στον Πίνακα 8.46 δίνεται πληθώρα χρήσιμων εντολών για την εφαρμογή της Ανάλυσης Διακύμανσης κατά
δύο Παράγοντες στην R.
Πίνακας 8.46: Τwo-way ANOVA - Χρήσιμες εντολές στην R
Πακέτο
Εντολή(Όρισμα)
Χρησιμότητα
aov
aov(Απόκριση∼ Παράγοντας Α*Παράγοντας Β)
Κατασκευή μοντέλου ANOVA (A, B fixed)
lme4
lmer(Απόκριση∼ (1|Παράγοντας Α)*Παράγοντας Β
Κατασκευή μοντέλου ANOVA (A random, B fixed)
lme4
lmer(Απόκριση∼ Παράγοντας Α*(1|Παράγοντας Β))
Κατασκευή μοντέλου ANOVA (A fixed, B random)
lme4
lmer(Απόκριση∼ (1|Παράγοντας Α)*(1|Παράγοντας Β))
Κατασκευή μοντέλου ANOVA (A, B random)
8.7 Άλυτες ασκήσεις
1. Για καθένα από τα πιο κάτω σύνολα δεδομένων ζητούνται τα ακόλουθα:
i. Να διερευνηθεί αν παρατηρούνται διαφορές στις μέσες τιμές της μεταβλητής απόκρισης μεταξύ
των διαφόρων επιπέδων του παράγοντα ενδιαφέροντος A όταν αυτός θεωρείται ότι είναι σταθερών επιδράσεων.
ii. Να επιβεβαιωθεί η επίδραση της μεταβλητής πλαισίου O. Αν δεν επιβεβαιωθεί, να προτείνετε
εναλλακτικά σχέδια για την αξιολόγηση του παράγοντα ενδιαφέροντος.
iii. Αν παρατηρούνται διαφορές στα επίπεδα του παράγοντα ενδιαφέροντος να διερευνηθεί σε ποιο ή
ποια επίπεδα οφείλεται αυτή η διαφορά. Επιπρόσθετα, να συγκριθεί κάθε επίπεδο με το τελευταίο
επίπεδο του παράγοντα A το οποίο θεωρείται υποδειγματικό.
iv. Τέλος, ζητείται να διαπιστωθεί πώς διαφοροποιείται (και πώς επιλύεται) το πρόβλημα, αν ο παράγοντας ενδιαφέροντος A θεωρηθεί ότι είναι τυχαίων επιδράσεων.
Πίνακας 8.47: Σύνολο Δεδομένων 1 - Παράγοντας Α - Μεταβλητή Πλαισίου O
Α
Α1
Α2
Α3
Α4
Α5
O1
40.13
80.26
70.42
99.93
70.30
O2
59.92
79.83
69.84
97.49
69.70
O3
40.41
80.04
61.30
91.30
81.32
O4
29.82
77.60
70.16
90.21
71.29
Ο
228
ΣΧΕΔΙΑΣΜΟΣ ΠΕΙΡΑΜΑΤΩΝ
Πίνακας 8.48: Σύνολο Δεδομένων 2 - Παράγοντας Α - Μεταβλητή Πλαισίου O
Α
Α1
Α2
Α3
O1
40.13, 69.84, 40.38, 49.68, 70.04
80.26, 89.63, 80.45, 70.42, 70.12
99.93, 89.77, 99.79, 70.30, 89.75
O2
59.92, 49.65, 60.23, 50.19, 50.19
59.59, 59.59, 70.20, 60.10, 50.39
69.72, 90.02, 89.79, 70.32, 80.32
O3
40.41, 39.85, 50.15, 50.36, 60.33
70.18, 59.52, 69.89, 50.39, 49.59
80.29, 59.61, 69.75, 50.05, 49.98
Ο
Πίνακας 8.49: Σύνολο Δεδομένων 3 - Παράγοντας Α - Μεταβλητή Πλαισίου O
Α
Α1
Α2
Α3
Α4
Α5
Α6
Α7
Α8
O1
728
731
728
731
730
730
729
730
O2
726
732
726
730
729
728
729
732
Ο
Πίνακας 8.50: Σύνολο Δεδομένων 4 - Παράγοντας Α - Μεταβλητή Πλαισίου O
Α
Α1
Α2
Α3
Α4
Α5
Α6
Α7
Α8
O1
728, 725
731, 730
728, 729
731, 731
730, 730
730, 731
729, 729
730, 730
O2
726, 723
732, 731
726, 728
730, 728
729, 730
728, 729
729, 731
732, 731
Ο
2. Για το πιο κάτω σύνολο δεδομένων θεωρήστε ότι υπάρχουν δύο μεταβλητές πλαισίου O και OO και ότι
ο παράγοντας ενδιαφέροντος έχει τα επίπεδα A, B, C και D. Να αναφέρετε το είδος του σχεδιασμού
και τα βασικά χαρακτηριστικά του. Επίσης, να διερευνηθεί αν υπάρχουν διαφορές ως προς τη μέση
τιμή των επιπέδων του παράγοντα ενδιαφέροντος και να επιβεβαιωθεί (ή όχι) η σημαντικότητα των
δύο μεταβλητών πλαισίου. Αν δεν επιβεβαιωθεί, να προτείνετε εναλλακτικά σχέδια για την αξιολόγηση
του παράγοντα ενδιαφέροντος.
Έστω ότι ο Ερευνητής ενδιαφέρεται επιπρόσθετα για την αλληλεπίδραση του παράγοντα ενδιαφέροντος και της μεταβλητής πλαισίου O. Να αναφέρετε το είδος του σχεδιασμού που πρέπει να χρησιμοποιηθεί, καθώς και τα βασικά χαρακτηριστικά του. Να προχωρήσετε στη μελέτη του συγκεκριμένου
σχεδιασμού και αν αυτό δεν είναι εφικτό, να εξηγήσετε τους λόγους.
Πίνακας 8.51: Σύνολο Δεδομένων 5 - Παράγοντας Ενδιαφέροντος - Μεταβλητές Πλαισίου O και OO
OO
OO1
OO2
OO3
OO4
O1
A 10
B7
C5
D2
O2
B 14
C9
D7
A3
O3
C 17
D 12
A9
B5
O4
D 22
A 15
B 10
C8
Ο
ΓΡΑΜΜΙΚΑ ΜΟΝΤΕΛΑ ΚΑΙ ΣΧΕΔΙΑΣΜΟΣ & ΑΝΑΛΥΣΗ ΠΕΙΡΑΜΑΤΩΝ ΜΕ ΕΦΑΡΜΟΓΕΣ ΣΕ R ΚΑΙ MINITAB
229
3. Για τα επόμενα σύνολα δεδομένων:
i. Να δοθεί το κατάλληλο πρότυπο για την περιγραφή του προβλήματος και να κατασκευαστούν
και σχολιαστούν τα διαγράμματα κύριων επιδράσεων των παραγόντων, καθώς και το διάγραμμα
αλληλεπίδρασης αυτών.
ii. Να διερευνηθεί η σημαντικότητα των κύριων επιδράσεων, καθώς και της αλληλεπίδρασής τους.
iii. Να επαναληφθεί η μελέτη στο ερώτημα ( ii) θεωρώντας ότι και οι δύο παράγοντες είναι τυχαίων
επιδράσεων (δηλαδή ότι τα συγκεκριμένα επίπεδα έχουν επιλεχθεί τυχαία από ένα ευρύ σύνολο
διαθέσιμων επιπέδων για κάθε παράγοντα ενδιαφέροντος).
iv. Να επαναληφθεί η μελέτη στο ερώτημα ( ii) θεωρώντας ότι ο παράγοντας A είναι τυχαίων και
ο B σταθερών επιδράσεων.
Πίνακας 8.52: Σύνολο Δεδομένων 6 - A και B (3 επαναλήψεις ανά θεραπεία)
Επίπεδα Παράγοντα Β
Β1
Β2
Β3
0
1.14, 1.15, 1.19
1.12, 1.15, 1.16
1.18, 1.17, 1.15
1
0.91, 0.88, 0.86
1.09, 1.11, 1.14
0.89, 0.92, 0.95
Επίπεδα Παράγοντα Α
Πίνακας 8.53: Σύνολο Δεδομένων 7 - A και B (5 επαναλήψεις ανά θεραπεία)
Β
Β1
Β2
Β3
Α1
90, 96, 98, 106, 100
90, 94, 92, 80, 88
80, 82, 84, 87, 85
Α2
120, 132, 115, 124, 125
118, 119, 114, 125, 116
108, 110, 120, 116, 106
Α
230
ΣΧΕΔΙΑΣΜΟΣ ΠΕΙΡΑΜΑΤΩΝ
ΒΙΒΛΙΟΓΡΑΦΙΑ
[1] Βόντα, Φ., & Καραγρηγορίου, Α. (2012). Εφαρμοσμένη στατιστική ανάλυση & στοιχεία πιθανοτήτων.
Αθήνα: Εκδόσεις Παρασκήνιο.
[2] Δαμιανού, Χ., & Κούτρας, Μ. (1998). Εισαγωγή στη στατιστική, Μέρος ΙΙ. Αθήνα: Εκδόσεις Συμμετρία.
[3] Καλαματιανού, Α. Γ. (1997). Εφαρμοσμένη ανάλυση παλινδρόμησης. Αθήνα: Εκδόσεις Παπαζήσης.
[4] Καρώνη, Χ., & Οικονόμου, Π. (2017). Στατιστικά μοντέλα παλινδρόμησης: Με χρήση M initab και R
(2η έκδ.). Αθήνα: Συμεών.
[5] Κουτρουβέλης, Ι.Α. (2015). Εφαρμοσμένες πιθανότητες και στατιστική για μηχανικούς και θετικούς επιστήμονες. Αθήνα: Εκδόσεις Gotsis.
[6] Κουτρουβέλης, Ι.Α. (2000). Προηγμένα εργαλεία και μέθοδοι για τον έλεγχο της ποιότητας, Τόμος Β,
Σχεδιασμός και Ανάλυση Πειραμάτων. Πάτρα: Ελληνικό Ανοικτό Πανεπιστήμιο.
[7] Κολυβά-Μαχαίρα, Φ., & Μπόρα-Σέντα, Ε. (1995). Στατιστική, θεωρία και εφαρμογές. Θεσσαλονίκη:
Εκδόσεις Ζήτη.
[8] Κουνιάς, Σ., Κολυβά-Μαχαίρα, Φ., Μπαγιάτης, Γ., & Μπόρα-Σέντα, Ε. (1985). Εισαγωγή στη στατιστική. Θεσσαλονίκη: Εκτύπωση Γιαχούδη-Γιαπούλη Ο.Ε.
[9] Κούτρας, Μ. Β., & Ευαγγελάρας, Χ. (2010). Ανάλυση παλινδρόμησης, θεωρία και εφαρμογές. Αθήνα:
Εκδόσεις Σταμούλη Α. Ε.
[10] Μπόρα-Σέντα, Ε., & Μωυσιάδης, Χ. (1990). Εφαρμοσμένη στατιστική, Θεσσαλονίκη: Εκδόσεις Ζήτη.
[11] Παπαδόπουλος, Γ.Κ. (2015). Εισαγωγή στις πιθανότητες και τη στατιστική. Αθήνα: Εκδόσεις Gutenberg.
[12] Παπαϊωάννου, Τ., & Λουκάς, Σ. (2002). Εισαγωγή στη στατιστική. Αθήνα: Εκδόσεις Σταμούλη Α. Ε.
[13] Φερεντίνος, Κ., Ζωγράφος, Κ., & Παπαϊωάννου, Τ. (2020). Εκτιμητική και έλεγχος υποθέσεων. Αθήνα:
Εκδόσεις Σταμούλη Α. Ε.
232
ΒΙΒΛΙΟΓΡΑΦΙΑ
[14] Box, G.E.P., Hunter, W.G., & Hunter, J. S. (2005). Statistics for experimenters: design, innovation and
discovery (2nd ed.). John Wiley and Sons.
[15] Box, G.E.P., Hunter, W.G., & Hunter, J.S. (1978). Statistics for experimenters. John Wiley and Sons.
[16] Field, A. (2021). Μία περιπέτεια στη στατιστική (Ε. Γάκη, Χ. Παρπούλα & Η. Σαντουρίδης, Επιμ.).
Αθήνα: Εκδόσεις Προπομπός.
[17] Fisher, R.A., & Yates, F. (1953). Statistical tables for biological, agricultural, and medical Research (4th
ed.). Oliver and Boyd.
[18] Hicks, C.R. (1997). Fundamental concepts in the design of experiments (4th ed.). John Wiley and Sons.
[19] Lawson, J. (2014). Design and analysis of experiments with R. Chapman and Hall/CRC.
[20] Martins, M.C.M., Caldana, C., Wolf, L.D., & de Abreu, L.G.F. (2018). The importance of experimental design, quality assurance, and control in plant metabolomics experiments. Methods Mol Biol.,
1778, 3-17. doi: 10.1007/978-1-4939-7819-9_1. PMID: 29761427
[21] Mitra, A. (2016). Fundamentals of quality control and improvement (4th ed.). John Wiley and Sons.
[22] Montgomery, D.C. (2013). Design and analysis of experiments (8th ed.). John Wiley and Sons.
ΚΕΦΑΛΑΙΟ 9
ΠΕΙΡΑΜΑΤΑ f ΠΑΡΑΓΟΝΤΩΝ ΜΕ 2 ΕΠΙΠΕΔΑ
Σύνοψη
Το παρόν κεφάλαιο παρουσιάζει πλήρη και κλασματικά παραγοντικά πειράματα, με παράγοντες ενδιαφέροντος με δύο ή τρεις στάθμες.
Προαπαιτούμενη γνώση
Το κεφάλαιο προϋποθέτει τη γνώση και την κατανόηση των προηγουμένων κεφαλαίων.
Προσδοκώμενα μαθησιακά αποτελέσματα
Μετά τη μελέτη του παρόντος κεφαλαίου ο αναγνώστης αναμένεται να:
• αναγνωρίζει πειράματα με παράγοντες δύο ή τριών επιπέδων και να προσδιορίζει την επίδραση
τόσο καθενός ξεχωριστά όσο και της αλληλεπίδρασής τους, σε μία διεργασία,
• εφαρμόζει την ανάλυση διακύμανσης σε πειράματα με f δι- ή τρι-σταθμικούς παράγοντες και
να αναδεικνύει τη σχέση μεταξύ ανάλυσης διακύμανσης και ανάλυσης παλινδρόμησης,
• χρησιμοποιεί πλήρη ή κλασματικά παραγοντικά πειράματα, προκειμένου να μελετώνται μέσω
της ανάλυσης διακύμανσης, πειράματα με παράγοντες δύο ή τριών επιπέδων (σταθμών),
• επιλέγει μεταξύ υποψήφιων κλασματικών πειραματικών σχεδιασμών, εκείνον που εξυπηρετεί
τις ανάγκες του για τη μελέτη των σημαντικών για την έρευνα παραγόντων.
Καραγρηγορίου, Α., & Καλλιγέρης, Ε. Ν. (�2023). «Γραμμικά Μοντέλα και Σχεδιασμός & Ανάλυση Πειραμάτων με Εφαρμογές
σε R και Minitab».
Αθήνα: Κάλλιπος, Ανοικτές Ακαδημαϊκές Εκδόσεις. http://dx.doi.org/10.57713/kallipos-70
Creative Commons Αναφορά Δημιουργού - Μη Εμπορική Χρήση - Παρόμοια Διανομή 4.0
234
ΠΕΙΡΑΜΑΤΑ f ΠΑΡΑΓΟΝΤΩΝ ΜΕ 2 ΕΠΙΠΕΔΑ
9.1 2f παραγοντικά πειράματα
Στο κεφάλαιο αυτό θα συνεχίσουμε τη μελέτη παραγοντικών πειραμάτων (σχεδιασμών) τα οποία είναι ιδιαίτερα δημοφιλή στην πράξη και αφορούν παράγοντες που έχουν δύο μόνο επίπεδα (ή στάθμες). Οι σχεδιασμοί
αυτοί συμβολίζονται με 2f , όπου η βάση του συμβόλου δηλώνει τον αριθμό των επιπέδων και η δύναμη f τον
αριθμό των εξεταζομένων παραγόντων. Τα δύο κλασικότερα παραδείγματα είναι τα παραγοντικά 22 και 23
στα οποία θα δοθεί έμφαση στο κεφάλαιο αυτό.
Τα συγκεκριμένα παραγοντικά πειράματα αποτελούν ένα ιδανικό παράδειγμα που επιτρέπει να γίνει η διασύνδεση μεταξύ των δύο βασικών συστατικών του παρόντος εγχειριδίου, δηλαδή της Ανάλυσης Παλινδρόμησης
και της Ανάλυσης Διακύμανσης. Με άλλα λόγια, θα εκμεταλλευτούμε την απλότητα των 2f παραγοντικών
σχεδιασμών για να αναδείξουμε την ισχυρή μαθηματική σχέση αλλά και την ισοδυναμία των δύο αυτών τεχνικών, που τελικά είναι άρρηκτα συνδεδεμένες. Η συγκεκριμένη κατηγορία πειραμάτων επιτρέπει επιπρόσθετα
να αναδειχθεί και ο μηχανισμός λειτουργίας της ανάλυσης διακύμανσης και της εκτίμησης των επιδράσεων
των εμπλεκόμενων παραγόντων, με τρόπο απλό, ώστε να γίνει κατανοητός ο στατιστικός (μαθηματικός) μηχανισμός της μεθοδολογίας.
Για τον συμβολισμό των δύο επιπέδων των παραγόντων χρησιμοποιούνται τα σύμβολα − και +, ενώ συχνά χρησιμοποιούνται και οι χαρακτηρισμοί χαμηλό και υψηλό ή 1 και 2 ή ακόμα και −1 και +1. Στην πράξη,
μπορεί να μην υπάρχει πραγματική ιεράρχηση μεταξύ των επιπέδων και ο Ερευνητής να αναθέτει στο κάθε
επίπεδο τον χαρακτηρισμό που επιθυμεί. Αυτό συμβαίνει συχνά σε ποιοτικούς παράγοντες (π.χ. οι 2 χειριστές, οι 2 μηχανές παραγωγής ή το φύλο του χειριστή κ.ο.κ.) αλλά όχι σε ποσοτικούς όπου είναι σχεδόν πάντα
εφικτό να ιεραρχηθούν τα δύο επίπεδα (χαμηλό ποσοστό υγρασίας, υψηλό ποσοστό υγρασίας ή θερμοκρασίες
κάτω από 10 βαθμούς και θερμοκρασίες από 10 και άνω κ.ο.κ.).
Σε ένα 2f παραγοντικό ο Ερευνητής έχει να μελετήσει 2f θεραπείες, αφού τόσοι είναι οι συνδυασμοί των
επιπέδων των f παραγόντων. Το πρόβλημα είναι αρκετά απλό, όταν ο αριθμός f των παραγόντων είναι σχετικά μικρός, 2, 3 ή 4. Όσο όμως το f αυξάνεται το πρόβλημα καθίσταται ιδιαίτερα πολύπλοκο γιατί αυξάνεται
σημαντικά ο αριθμός θεραπειών και άρα ο χρόνος και το κόστος πειραματισμού εύκολα εκτοξεύονται. Για
παράδειγμα, για 5 παράγοντες A, B, C, D και E οι θεραπείες είναι 25 = 32 και αν ο Ερευνητής θέλει να
μελετήσει και αλληλεπιδράσεις θα πρέπει να κάνει τουλάχιστον μία επανάληψη και άρα θα χρειαστεί 64 μετρήσεις. Ο αριθμός εκτελέσεων του πειράματος (με μία επανάληψη) αυξάνεται στα 128 για 7 παράγοντες και στα
1024 για 10 παράγοντες. Οι τιμές αυτές καθιστούν απαγορευτική τη μελέτη του πλήρους παραγοντικού πειράματος για f ίσο ακόμα και με 4 ή με 5. Αυτός είναι και ο λόγος που στο παρόν κεφάλαιο θα εξεταστούν μόνο
οι περιπτώσεις για f = 2 και f = 3. Για τις υπόλοιπες περιπτώσεις θα συζητηθούν και θα μελετηθούν τα κλασματικά παραγοντικά πειράματα στο επόμενο κεφάλαιο. Πράγματι, όπως είχε αναφερθεί και στην εισαγωγή
του Κεφαλαίου 7, ο αυξημένος αριθμός παραγόντων από τη μία και η ανάγκη διερεύνησης αλληλεπιδράσεων
μεταξύ των εμπλεκόμενων παραγόντων από την άλλη, επιφέρουν πρόσθετη πολυπλοκότητα. Τα προβλήματα
αυτά αντιμετωπίζονται επιτυχώς με τη χρήση κατάλληλων πειραματικών σχεδιασμών που βασίζονται σε ένα
κατάλληλα επιλεγμένο υποσύνολο όλων των δυνατών συνδυασμών (θεραπειών) περιορίζοντας πολύ και τον
χρόνο και το κόστος του πειράματος. Τα Κλασματικά Παραγοντικά Πειράματα βασίζονται στις μισές ή στο
ένα τέταρτο των συνδυασμών (θεραπειών) που απαιτεί το Πλήρες Παραγοντικό Πείραμα, και επιλέγονται με
τρόπο ώστε να διασφαλίζονται η αξιολόγηση των κύριων επιδράσεων και ένας ικανοποιητικός αριθμός (αλλά
όχι όλων) των αλληλεπιδράσεων. Το θέμα αυτό θα είναι το αντικείμενο του δεύτερου μέρους του παρόντος
κεφαλαίου.
ΓΡΑΜΜΙΚΑ ΜΟΝΤΕΛΑ ΚΑΙ ΣΧΕΔΙΑΣΜΟΣ & ΑΝΑΛΥΣΗ ΠΕΙΡΑΜΑΤΩΝ ΜΕ ΕΦΑΡΜΟΓΕΣ ΣΕ R ΚΑΙ MINITAB
235
9.1.1 Το 22 παραγοντικό πείραμα
Για διευκόλυνση της μελέτης του 22 παραγοντικού πειράματος, θα χρησιμοποιηθεί ειδικός συμβολισμός για
την παρουσίαση του οποίου θα αξιοποιηθεί το πιο κάτω παράδειγμα:
Παράδειγμα 9.1. Έστω δύο παράγοντες A και με δύο επίπεδα έκαστος, έστω + και −. Εκτελούνται n = 4 επαναλήψεις σε καθεμία από τις τέσσερις θεραπείες, δηλαδή τις (−, −), (+, −), (−, +) και (+, +). Tα αθροίσματα
των επαναλήψεων ανά θεραπεία παρατίθενται στην τελευταία στήλη του Πίνακα Δεδομένων.
Πίνακας 9.1: Πίνακας Δεδομένων - 22 Παραγοντικό Πείραμα με n = 4 επαναλήψεις
Επανάληψη
I
II
III
IV
Σύνολο
(−, −)
118.7
116.9
120.7
112.6
(1) = 468.7
(+, −)
114.7
115.5
116.7
119.2
a = 466.1
(−, +)
107.1
107.5
106.6
105.9
b = 427.1
(+, +)
124.0
125.1
120.3
124.5
ab = 493.7
(Α,Β)
Όπως φαίνεται στον Πίνακα Δεδομένων, στην τελευταία στήλη γίνεται χρήση ειδικών συμβόλων. Τα σύμβολα που
εμφανίζονται είναι τέσσερα: (1), a, b και ab και αντιστοιχούν στις τέσσερις θεραπείες του πειράματος ((−, −),
(+, −), (−, +) και (+, +)) με τα σύμβολα a και b να παραπέμπουν στους αντίστοιχους παράγοντες A και B.
Συγκεκριμένα, στην περίπτωση που ο χαρακτηρισμός/σύμβολο είναι:
• το (1) σημαίνει ότι όλοι οι εμπλεκόμενοι παράγοντες συμμετέχουν στο αντίστοιχο/α πείραμα/τα με το
χαμηλό τους επίπεδο (δηλαδή δεν υπάρχουν παράγοντες που να μετέχουν στο πείραμα στο υψηλό τους
επίπεδο) - η θεραπεία είναι η (−, −),
• το a (ή το b) σημαίνει ότι ο αντίστοιχος παράγοντας A (ή ο B) είναι ο μοναδικός που μετέχει στο/α αντίστοιχο/α πείραμα/τα με το υψηλό του επίπεδο, ενώ ο άλλος, δηλαδή ο B (ή ο A) μετέχει με το χαμηλό του
επίπεδο - η θεραπεία είναι η (+, −) για το σύμβολο a, ενώ για το σύμβολο b είναι η θεραπεία (−, +) και
• το ab σημαίνει ότι και οι δύο παράγοντες μετέχουν στα αντίστοιχα πειράματα με το υψηλό τους επίπεδο - η
θεραπεία είναι η (+, +).
Tα σύμβολα μπορούν να γενικευτούν για να καλύψουν οποιονδήποτε αριθμό παραγόντων. Έτσι για παράδειγμα, σε
ένα 25 παραγοντικό πείραμα με τους παράγοντες A, B, C, D και E, η θεραπεία με συμβολισμό ace είναι εκείνη
όπου οι παράγοντες που αντιστοιχούν στα σύμβολα a, c και e, δηλαδή οι A, C και μετέχουν στο πείραμα (ή στα
πειράματα, αν γίνονται επαναλήψεις) με το υψηλό τους επίπεδο, ενώ όλοι οι υπόλοιποι παράγοντες, δηλαδή οι B
και D με το χαμηλό τους επίπεδο (θεραπεία (+, −, +, −, +)).
Παρατηρώντας τα δεδομένα του Πίνακα 9.1, ο Ερευνητής μπορεί να αποκομίσει μία πρώτη εικόνα για το φαινόμενο που έχει κληθεί να μελετήσει. Εδώ διαπιστώνεται ότι:
• όταν ο παράγοντας A είναι στο χαμηλό επίπεδο (−), ανεξάρτητα από το επίπεδο στο οποίο βρίσκεται ο
παράγοντας B, οι τιμές της μεταβλητής απόκρισης Y είναι αρκετά χαμηλές (περίπου από το 105 έως το
120) σε σχέση με τις τιμές όταν ο A βρίσκεται στο υψηλό επίπεδο (+) (είναι περίπου από το 115 έως το
125). Κατά μέσο όρο, οι τιμές στο χαμηλό επίπεδο του A πρέπει να είναι κοντά στο 110, ενώ στο υψηλό
επίπεδο του A πρέπει (ο μέσος όρος) να είναι κοντά στο 120,
236
ΠΕΙΡΑΜΑΤΑ f ΠΑΡΑΓΟΝΤΩΝ ΜΕ 2 ΕΠΙΠΕΔΑ
• τα αθροίσματα (τελευταία στήλη του Πίνακα Δεδομένων) που αντιστοιχούν στο χαμηλό επίπεδο του A
((1) = 468.7, b = 427.1) είναι σαφώς χαμηλότερα από αυτά που αντιστοιχούν στο υψηλό επίπεδο του
A (a = 466.1, ab = 493.7) - δηλαδή επιβεβαιώνεται η προηγούμενη παρατήρηση,
• όταν ο παράγοντας B είναι στο χαμηλό επίπεδο (−), ανεξάρτητα από το επίπεδο στο οποίο βρίσκεται ο
παράγοντας A, οι τιμές της μεταβλητής απόκρισης Y είναι αρκετά όμοιες κατά μέσο όρο (γύρω στο 115 με
μέσο όρο περίπου 115) με τις τιμές όταν ο B βρίσκεται στο υψηλό επίπεδο (+) (από 105 έως 125 με μέσο
όρο περίπου 115). Η ίδια παρατήρηση επιβεβαιώνεται και από τα αθροίσματα στην τελευταία στήλη του
Πίνακα Δεδομένων (συγκρίνοντας τα αθροίσματα που περιλαμβάνουν στον συμβολισμό τους το b με αυτά
που δεν περιέχουν το b),
• οι τιμές της μεταβλητής απόκρισης για τα πειράματα για τα οποία οι παράγοντες είναι τοποθετημένοι ο
ένας στο χαμηλό και ο άλλος στο υψηλό του επίπεδο (πρόκειται για τις θεραπείες a και b - μετρήσεις στις
δύο μεσαίες γραμμές του Πίνακα Δεδομένων), είναι αρκετά χαμηλότερες (από το 105 έως το 120 με μέσο
όρο περίπου 110) από τις τιμές που αντιστοιχούν στα πειράματα με τους παράγοντες είτε και τους δύο στο
χαμηλό είτε και τους δύο στο υψηλό επίπεδο (πρόκειται για τις θεραπείες ab και (1) - μετρήσεις στην πρώτη
και στην τέταρτη γραμμή του Πίνακα Δεδομένων με τιμές από 112 μέχρι 125 και μέσο όρο περίπου 120).
Με βάση τις παρατηρήσεις, ο Ερευνητής μπορεί να πιθανολογήσει ότι ο Παράγοντας A πρέπει να έχει επίδραση
στη μεταβλητή απόκρισης αλλά το ίδιο μάλλον δεν ισχύει για τον Παράγοντα B. Όσον αφορά την αλληλεπίδραση,
φαίνεται να παρουσιάζει μία εικόνα παρόμοια, εάν όχι ταυτόσημη, με τον Παράγοντα A. Αν όλες αυτές οι παρατηρήσεις επιβεβαιωθούν και στατιστικά με τη Διπαραγοντική Ανάλυση Διακύμανσης με αλληλεπίδραση, τότε το
ιδανικό (θεωρητικό) πρότυπο θα είναι:
yijk = µ + αi + βj + (αβ)ij + εijk , i, j = 1, 2, k = 1, 2, 3, 4.
Ο Πίνακας Δεδομένων μπορεί να βοηθήσει στον προσδιορισμό των επιδράσεων τόσο των κύριων επιδράσεων όσο
και των αλληλεπιδράσεων. Πράγματι, οι εκτιμητές των παραμέτρων µ, α1 , α2 , β1 , β2 , (αβ)11 , (αβ)12 , (αβ)21
και (αβ)22 μπορούν, με βάση την απλή λογική, να προσδιοριστούν:
• Ο Ολικός (γενικός) μέσος µ μπορεί να εκτιμηθεί ως ο μέσος όρος όλων των μετρήσεων:
µ̂ =
(1) + a + b + ab
1856
1 X
yijk =
=
= 116.
4n i,j,k
16
16
• Για την επίδραση του παράγοντα A θα πρέπει να συγκριθούν τα αθροίσματα που αφορούν θεραπείες στις
οποίες εμφανίζεται το σύμβολο a (a, ab) με αυτά που αφορούν θεραπείες στις οποίες δεν εμφανίζεται το
σύμβολο a ((1), b). Επειδή το κάθε άθροισμα βασίζεται σε n = 4 επαναλήψεις, η επίδραση προκύπτει
από τον μέσο όρο των δύο περιπτώσεων:
A=
960 − 896
a + ab (1) + b
−
=
= 8.
2n
2n
8
• Για την επίδραση του παράγοντα B θα πρέπει να συγκριθούν τα αθροίσματα που αφορούν θεραπείες στις
οποίες εμφανίζεται το σύμβολο b (b, ab) με αυτά που αφορούν θεραπείες στις οποίες δεν εμφανίζεται το
σύμβολο b ((1), a). Η επίδραση προκύπτει από τον μέσο όρο των δύο περιπτώσεων (κάθε άθροισμα βασίζεται σε n = 4 επαναλήψεις):
B=
921 − 935
b + ab (1) + a
−
=
= −1.75.
2n
2n
8
ΓΡΑΜΜΙΚΑ ΜΟΝΤΕΛΑ ΚΑΙ ΣΧΕΔΙΑΣΜΟΣ & ΑΝΑΛΥΣΗ ΠΕΙΡΑΜΑΤΩΝ ΜΕ ΕΦΑΡΜΟΓΕΣ ΣΕ R ΚΑΙ MINITAB
237
• Για την αλληλεπίδραση των παραγόντων A και B θα πρέπει να συγκριθούν τα αθροίσματα που αφορούν
θεραπείες στις οποίες εμφανίζεται μόνο ένας παράγοντας στο υψηλό επίπεδο (a, b) με αυτά που αφορούν τις
λοιπές θεραπείες ((1), ab). Η επίδραση προκύπτει από τον μέσο όρο των δύο περιπτώσεων (κάθε άθροισμα
βασίζεται σε n = 4 επαναλήψεις):
AB =
b + a (1) + ab
962.4 − 893.2
−
=
= 8.70.
2n
2n
8
Είναι προφανές ότι αν οι συγκρίσεις γίνουν αντίστροφα, οι τιμές που θα προκύψουν θα είναι ίδιες με αντίθετο πρόσημο. Πράγματι, αν για παράδειγμα, για τον παράγοντα A συγκριθούν οι μετρήσεις όταν βρίσκεται στο χαμηλό
επίπεδο (−) με αυτές που αντιστοιχούν στο υψηλό επίπεδο (+) το αποτέλεσμα θα είναι −8. Ομοίως, για τα B
και AB θα προκύψουν οι τιμές +1.75 και −8.70.
Οι τιμές αναδεικνύουν όσα είχαν παρατηρηθεί και νωρίτερα, ότι δηλαδή οι επιδράσεις των A και AB είναι κοντά στις 10 μονάδες (δηλαδή είναι πολύ ισχυρές), ενώ η επίδραση του B είναι πολύ κοντά στο μηδέν (δηλαδή είναι
πολύ ασθενής). Η στατιστική σημαντικότητα των τιμών αυτών θα διαπιστωθεί με την εφαρμογή της Διπαραγοντικής Ανάλυσης Διακύμανσης.
Οι πιο πάνω τύποι μπορούν να αναδιατυπωθούν ως ακολούθως:
(1) + a + b + ab
,
n22
−(1) + a − b + ab
A=
,
n22−1
−(1) − a + b + ab
B=
n22−1
µ̂ =
(9.1)
(9.2)
(9.3)
και
+(1) − a − b + ab
,
(9.4)
n22−1
όπου η τιμή 2, που εμφανίζεται σε όλες τις δυνάμεις (στους παρονομαστές), αναφέρεται στον αριθμό των εμπλεκόμενων παραγόντων (A και B).
AB =
Οι πιο πάνω τύποι αποτυπώνονται και στον λεγόμενο Πίνακα Αλγεβρικών Προσήμων ο οποίος έχει μία 1η στήλη
όπου καταχωρίζονται η μία μετά την άλλη οι συμβολισμοί των θεραπειών, με τη σειρά που φαίνονται στον Πίνακα
Δεδομένων, δηλαδή (1), a, b και ab.
Ο Πίνακας Αλγεβρικών Προσήμων έχει τέσσερις ακόμα στήλες με τη 2η να συμβολίζεται με I και να αντιπροσωπεύει ένα μοναδιαίο στοιχείο (γι’ αυτό έχει παντού το σύμβολο (+)) και τρεις ακόμα στήλες που αντιστοιχούν
στις επιδράσεις των A, B και AB. Στη στήλη που αφορά τον παράγοντα A, καταχωρίζονται τα τέσσερα πρόσημα
(από τον τύπο (9.2) για το A) που αντιστοιχούν στις τέσσερις θεραπείες (με τη σειρά που αυτές έχουν καταχωριστεί στην 1η στήλη του Πίνακα). Ομοίως, για τις στήλες που αφορούν τα B και AB.
238
ΠΕΙΡΑΜΑΤΑ f ΠΑΡΑΓΟΝΤΩΝ ΜΕ 2 ΕΠΙΠΕΔΑ
Πίνακας 9.2: Πίνακας Αλγεβρικών Προσήμων - 22 Παραγοντικό Πείραμα με n = 4 επαναλήψεις
Επίδραση
I
A
B
AB
(1)
+
−
−
+
a
+
+
−
−
b
+
−
+
−
ab
+
+
+
+
Θεραπεία
Από τον Πίνακα Αλγεβρικών Προσήμων βλέπουμε ότι:
• πολλαπλασιάζοντας τα πρόσημα στις στήλες των κύριων επιδράσεων A και B ανά δύο, προκύπτουν τα
πρόσημα της στήλης της αλληλεπίδρασης,
• πολλαπλασιάζοντας τα πρόσημα της στήλης που αντιστοιχεί στο μοναδιαίο στοιχείο I με τα αντίστοιχα
πρόσημα οποιασδήποτε άλλης από τις επόμενες στήλες, οι στήλες αυτές παραμένουν αμετάβλητες,
• πολλαπλασιάζοντας τα πρόσημα στις στήλες A, B και AB με τον εαυτό τους, προκύπτει η στήλη I, δηλαδή
A2 = B 2 = (AB)2 = I,
• συνδυάζοντας τα πρόσημα της στήλης μίας κύριας επίδρασης με τα σύμβολα των θεραπειών στην 1η στήλη
και αθροίζοντας, προκύπτει ο τύπος της κύριας επίδρασης, όπως δόθηκε νωρίτερα (αφού γίνει η διαίρεση
με 2n, όπου n ο αριθμός των επαναλήψεων),
• συνδυάζοντας τα πρόσημα της στήλης της αλληλεπίδρασης με τις θεραπείες στην 1η στήλη του Πίνακα
προκύπτει ο τύπος για την επίδραση της αλληλεπίδρασης (αφού γίνει η διαίρεση με 2n, όπου n ο αριθμός
των επαναλήψεων),
• συνδυάζοντας τα πρόσημα της στήλης που αντιστοιχεί στο μοναδιαίο στοιχείο I με τα σύμβολα των θεραπειών στην 1η στήλη και αθροίζοντας, προκύπτει ο τύπος του ολικού μέσου, όπως δόθηκε νωρίτερα (αφού
γίνει η διαίρεση με 4n, όπου n ο αριθμός των επαναλήψεων),
• αντιστοιχίζοντας τα σύμβολα (1), a, b και ab με τα σύμβολα W1 , W2 , W3 και W4 παρατηρούμε ότι οι
προηγούμενοι τύποι για όλες τις επιδράσεις (συμπεριλαμβανομένης της αλληλεπίδρασης), μπορούν να δοθούν από τον γενικό τύπο του Contrast C:
C=
4
X
ci W i ,
(9.5)
i=1
όπου ci συντελεστές (διαφορετικοί για κάθε επίδραση) ίσοι με −1 ή +1 τέτοιοι ώστε για οποιαδήποτε από
τις τρεις επιδράσεις του 22 παραγοντικού πειράματος, να ικανοποιούν τη σχέση:
4
X
ci = 0,
i=1
ενώ παράλληλα ισχύει ότι:
4
X
i=1
c2i = 4.
ΓΡΑΜΜΙΚΑ ΜΟΝΤΕΛΑ ΚΑΙ ΣΧΕΔΙΑΣΜΟΣ & ΑΝΑΛΥΣΗ ΠΕΙΡΑΜΑΤΩΝ ΜΕ ΕΦΑΡΜΟΓΕΣ ΣΕ R ΚΑΙ MINITAB
239
Λόγω του ότι η ενότητα αυτή αφορά δύο μόνο παράγοντες και τέσσερις θεραπείες, είναι εύκολο με απλές πράξεις,
να διαπιστώσει κανείς ότι τα αθροίσματα τετραγώνων που αντιστοιχούν στα A, B και AB δίνονται από τους
απλοποιημένους (γενικούς) τύπους:
SSA = n22−2 A2 , SSB = n22−2 B 2 , SSAB = n22−2 [AB]2 ,
(9.6)
όπου A, B και AB δίνονται από τους τύπους των επιδράσεων και το +2 στους εκθέτες αναφέρεται στον αριθμό
των εμπλεκόμενων παραγόντων.
Εφαρμόζοντας τους τύπους (9.6) εύκολα προκύπτει ότι για το παράδειγμα έχουμε:
SSA = 4 × 1 × 82 = 256, SSB = 4 × 1 × (−1.75)2 = 12.25 & SSAB = 4 × 1 × 8.72 = 302.76.
Ακολουθώντας τη συνήθη διαδικασία στο Minitab, δηλαδή:
Stat
Ê
ANOVA
Ê
General Linear Model
Ê
Fit General Linear Model
μπορούμε να δημιουργήσουμε τον Πίνακα Ανάλυσης Διασποράς για το πρότυπο με δύο σταθερούς παράγοντες και
αλληλεπίδραση:
Πίνακας 9.3: Πίνακας ANOVA - Παράδειγμα 22 Παραγοντικό Πείραμα με n = 4 επαναλήψεις
Πηγή
Μεταβλητότητας
Βαθμοί
Ελευθερίας
Άθροισμα
Τετραγώνων
A
1
256.00
B
1
AB
Μέσο
F
p-value
256.00
48.92
0.000
12.25
12.25
2.34
0.152
1
302.76
302.76
57.86
0.000
Σφάλματα
12
62.79
5.233
−
−
Ολική
15
633.80
−
−
−
Άθροισμα
Τετραγώνων
με τους εκτιμητές των παραμέτρων να προκύπτουν, εάν στα Results για τους Coefficients γίνει η επιλογή Full
Set of Coefficients που θα δώσει τις τιμές όλων των παραμέτρων (συμπεριλαμβανομένων των τυπικών τους σφαλμάτων):
µ̂ = 116, â(−) = −4.00, â(+) = +4.00, b̂(−) = +0.875, b̂(+) = −0.875,
c
c
c
c
ab
(−,−) = ab(+,+) = 4.35, ab(+,−) = ab(−,+) = −4.35.
Δεν είναι δύσκολο να προσέξει κάποιος στα πιο πάνω αποτελέσματα, ότι:
• ο εκτιμητής του γενικού μέσου ταυτίζεται με αυτόν που προέκυψε νωρίτερα ως ο μέσος όρος όλων των μετρήσεων του πειράματος,
• οι εκτιμητές των κύριων επιδράσεων των παραγόντων A και B στο υψηλό επίπεδο, ισούνται αντιστοίχως
με â(+) = +4.00 και b̂(+) = −0.875 που είναι ίσοι με το ήμισυ των επιδράσεων που υπολογίστηκαν
νωρίτερα με τη χρήση των μέσων και ήταν = 8.00 και = −1.75.
• η εκτιμήτρια της αλληλεπίδρασης για την περίπτωση που οι παράγοντες είναι και οι δύο στο υψηλό ή και
c
c
οι δύο στο χαμηλό επίπεδο, υπολογίστηκαν ab
(−,−) = ab(+,+) = 4.35 που είναι το ήμισυ της αλληλεπίδρασης που υπολογίστηκε με τη χρήση των μέσων, και ήταν = 8.70.
240
ΠΕΙΡΑΜΑΤΑ f ΠΑΡΑΓΟΝΤΩΝ ΜΕ 2 ΕΠΙΠΕΔΑ
Το φαινόμενο των εκτιμητών των παραμέτρων που ισούνται με το ήμισυ των επιδράσεων που υπολογίστηκαν νωρίτερα, σχετίζεται με τη συναρτησιακή μορφή του προτύπου και θα παρατηρηθεί και αργότερα όταν γίνει η διασύνδεση της Ανάλυσης Διακύμανσης με την Ανάλυση Παλινδρόμησης, όπου αξιοποιώντας τον Πίνακα Αλγεβρικών
Προσήμων θα προκύψει ένα μοντέλο παλινδρόμησης με την ίδια ιδιαιτερότητα, όπως αυτή που μόλις εντοπίστηκε.
Πρώτα όμως, στην επόμενη ενότητα θα γίνει η γενίκευση της μελέτης για 2f παραγοντικά πειράματα με έμφαση
στην περίπτωση 23 .
9.1.2 Το 23 παραγοντικό πείραμα
Έστω ότι f = 3 και ότι οι τρεις εμπλεκόμενοι παράγοντες είναι οι A, B και C με δύο επίπεδα ο καθένας, τα
οποία συμβολίζονται με (−) και (+) και αντιπροσωπεύουν το χαμηλό και το υψηλό επίπεδο του κάθε παράγοντα.
Είναι εύκολο να διαπιστωθεί ότι το πείραμα έχει 8 θεραπείες, οι οποίες με τη βοήθεια του συμβολισμού που
έχει ήδη προταθεί, είναι οι εξής:
Πίνακας 9.4: Θεραπείες στο 23 Παραγοντικό Πείραμα
A
B
C
Θεραπεία
−
−
−
(1)
+
−
−
a
−
+
−
b
+
+
−
ab
−
−
+
c
+
−
+
ac
−
+
+
bc
+
+
+
abc
Πολλαπλασιάζοντας τα πρόσημα των παραγόντων ανά δύο, εντοπίζονται τα πρόσημα των αλληλεπιδράσεων
ανά δύο (δηλαδή των AB, AC και BC), ενώ αν πολλαπλασιαστούν τα πρόσημα και των τριών παραγόντων,
θα προκύψουν τα πρόσημα της αλληλεπίδρασης 2ης τάξης, δηλαδή της ABC. Κατά συνέπεια, είναι εύκολος ο
προσδιορισμός του Πίνακα Αλγεβρικών Προσήμων για την περίπτωση του 23 παραγοντικού πειράματος που
περιγράφεται από το πρότυπο:
yijkl = µ + αi + βj + γk + (αβ)ij + (αγ)ik + (βγ)jk
+ (αβγ)ijk + ϵijkl , i = 1, ..., a, j = 1, ..., b, k = 1, ..., c, l = 1, ..., n.
(9.7)
ΓΡΑΜΜΙΚΑ ΜΟΝΤΕΛΑ ΚΑΙ ΣΧΕΔΙΑΣΜΟΣ & ΑΝΑΛΥΣΗ ΠΕΙΡΑΜΑΤΩΝ ΜΕ ΕΦΑΡΜΟΓΕΣ ΣΕ R ΚΑΙ MINITAB
241
Πίνακας 9.5: Πίνακας Αλγεβρικών Προσήμων στο 23 Παραγοντικό Πείραμα
Θεραπεία
I
A
B
C
AB
AC
BC
ABC
(1)
+
−
−
−
+
+
+
−
a
+
+
−
−
−
−
+
+
b
+
−
+
−
−
+
−
+
ab
+
+
+
−
+
−
−
−
c
+
−
−
+
+
−
−
+
ac
+
+
−
+
−
+
−
−
bc
+
−
+
+
−
−
+
−
abc
+
+
+
+
+
+
+
+
Μέσω του Πίνακα Αλγεβρικών Προσήμων μπορούν να υπολογιστούν οι επιδράσεις όλων των εμπλεκόμενων
παραγόντων, συμπεριλαμβανομένων όλων των αλληλεπιδράσεων. Έστω ότι το πείραμα εκτελείται με n επαναλήψεις. Τότε για την εύρεση κάθε επίδρασης θα συνδυαστούν τα πρόσημα κάθε στήλης του Πίνακα, από την
3η μέχρι την τελευταία στήλη, με τις αντίστοιχες θεραπείες της 1ης στήλης. Έτσι, οι επιδράσεις προκύπτουν
από τον γενικό τύπο της προηγούμενης ενότητας με f = 3:
A=
B=
C=
AB =
AC =
BC =
ABC =
−(1) + a − b + ab − c + ac − bc + abc
,
n23−1
−(1) − a + b + ab − c − ac + bc + abc
,
n23−1
−(1) − a − b − ab + c + ac + bc + abc
,
n23−1
+(1) − a − b + ab + c − ac − bc + abc
,
n23−1
+(1) − a + b − ab − c + ac − bc + abc
,
n23−1
+(1) + a − b − ab − c − ac + bc + abc
και
n23−1
−(1) + a + b − ab + c − ac − bc + abc
n23−1
με τα αντίστοιχα αθροίσματα τετραγώνων να δίνονται από τον τύπο
SSAk = n23−2 A2k
(9.8)
με Ak να είναι μία οποιαδήποτε από τις οκτώ επιδράσεις του προσδιορίστηκαν παραπάνω. Τέλος, συνδυάζοντας τα πρόσημα στη στήλη I με τη στήλη των θεραπειών, προκύπτει ο εκτιμητής του µ:
µ̂ =
1 + a + b + ab + c + ac + bc + abc
.
n23
9.1.3 Η γενική περίπτωση του 2f παραγοντικού πειράματος
Οι τύποι των δύο προηγουμένων ενοτήτων γενικεύονται για οποιονδήποτε αριθμό παραγόντων f . Αν για
παράδειγμα ο Ερευνητής επιθυμεί τη μελέτη των f παραγόντων A1 − Af , f > 1, τότε το άθροισμα τετρα-
242
ΠΕΙΡΑΜΑΤΑ f ΠΑΡΑΓΟΝΤΩΝ ΜΕ 2 ΕΠΙΠΕΔΑ
γώνων του παράγοντα Ak , k = 1, ..., f δίνεται από τον γενικό τύπο:
SSAk = n2f −2 A2k ,
(9.9)
με την ίδια την επίδραση Ak να δίνεται από το κατάλληλο τύπο Contrast με 2f όρους και κατάλληλα ορισμένες
θεραπείες W1 , ...W2f :
f
C=
2
X
ci W i
i=1
διαιρεμένο με τον συνολικό αριθμό μετρήσεων ανά επίπεδο:
Ak =
C
.
n2f −1
9.1.4 Το πρότυπο της παλινδρόμησης
Για τη μετάβαση στην Ανάλυση Παλινδρόμησης, στον Πίνακα των Αλγεβρικών Προσήμων αντιστοιχίζουμε
τους δύο παράγοντες A και B καθώς και την αλληλεπίδραση AB με τις μεταβλητές Xa = xa , Xb = xb και
Xab = xab , με τρόπο ώστε να οριστεί το μοντέλο παλινδρόμησης με σταθερό όρο ως εξής:
y = β0 + β1 xa + β2 xb + β3 xab + ε
ή εναλλακτικά:
y = β0 x0 + β1 xa + β2 xb + β3 xab + ε,
όπου X0 = x0 μία ψευδομεταβλητή που ισούται πάντα με τη μονάδα και αντιστοιχεί στο μοναδιαίο στοιχείο
I. Ο Πίνακας των μεταβλητών ισοδυναμεί με τον Πίνακα Αλγεβρικών Προσήμων με +1 αντί για (+) και −1
αντί για (−):
Πίνακας 9.6: Πίνακας Μεταβλητών Παλινδρόμησης στο 22 Παραγοντικό Πείραμα
Τιμές
I ≡ X0
A ≡ Xa
B ≡ Xb
≡ Xab
(1)
+1
−1
−1
+1
a
+1
+1
−1
−1
b
+1
−1
+1
−1
ab
+1
+1
+1
+1
Μεταβλητές
Σε καθεμία από τις 4 τιμές του Πίνακα (1η στήλη) που δεν είναι άλλες από τις θεραπείες του πειράματος,
αντιστοιχίζουμε τις μετρήσεις και καταλήγουμε σε ένα σύνολο δεδομένων ίσο με το γινόμενο του αριθμού θεραπειών και του αριθμού των επαναλήψεων n. Άρα, η ανάλυση παλινδρόμησης έχει n × 2f παρατηρήσεις.
Ο πιο κάτω πίνακας δίνει τις μεταβλητές της ανάλυσης παλινδρόμησης για το 23 παραγοντικό πείραμα. Παρατηρήστε ότι ο πίνακας δεν είναι άλλος από τον πίνακα αλγεβρικών προσήμων (Πίνακας 9.5) με τις στήλες
να αναφέρονται πλέον ως μεταβλητές (έχουν χρησιμοποιηθεί για ευκολία τα σύμβολα X0 , X1 , ..., X7 αντί
αντιστοίχως, των I, A, B, C, AB, AC, BC και ABC) και τα πρόσημα να έχουν αντικατασταθεί (το μεν
(+) με +1, το δε (−) με −1), όπως στην περίπτωση του 22 παραγοντικού πειράματος:
ΓΡΑΜΜΙΚΑ ΜΟΝΤΕΛΑ ΚΑΙ ΣΧΕΔΙΑΣΜΟΣ & ΑΝΑΛΥΣΗ ΠΕΙΡΑΜΑΤΩΝ ΜΕ ΕΦΑΡΜΟΓΕΣ ΣΕ R ΚΑΙ MINITAB
243
Πίνακας 9.7: Πίνακας Μεταβλητών Παλινδρόμησης στο 23 Παραγοντικό Πείραμα
Θεραπεία
X0
X1
X2
X3
X4
X5
X6
X7
(1)
1
−1
−1
−1
+1
+1
+1
−1
a
1
+1
−1
−1
−1
−1
+1
+1
b
1
−1
+1
−1
−1
+1
−1
+1
ab
1
+1
+1
−1
+1
−1
−1
−1
c
1
−1
−1
+1
+1
−1
−1
+1
ac
1
+1
−1
+1
−1
+1
−1
−1
bc
1
−1
+1
+1
−1
−1
+1
−1
abc
1
+1
+1
+1
+1
+1
+1
+1
Τα δύο επόμενα παραδείγματα εφαρμόζουν την Ανάλυση Παλινδρόμησης όπως περιγράφηκε παραπάνω, ώστε
να αναδειχθεί η σχέση με την Ανάλυση Διακύμανσης. Για την περίπτωση του 22 παραγοντικού πειράματος
χρησιμοποιούνται για σκοπούς αντιπαραβολής, τα δεδομένα του παραδείγματος που χρησιμοποιήθηκε νωρίτερα στην Ανάλυση Διακύμανσης.
Παράδειγμα 9.2. Για τα δεδομένα του Παραδείγματος (9.1) έχουμε τον εξής πίνακα για την ανάλυση παλινδρόμησης:
244
ΠΕΙΡΑΜΑΤΑ f ΠΑΡΑΓΟΝΤΩΝ ΜΕ 2 ΕΠΙΠΕΔΑ
Πίνακας 9.8: Πίνακας Δεδομένων - Ανάλυση Παλινδρόμησης - 22 Παραγοντικό με 4 επαναλήψεις
Τιμές
Y
A ≡ Xa
B ≡ Xb
≡ Xab
(1)
118.7
−1
−1
+1
(1)
116.9
−1
−1
+1
(1)
120.7
−1
−1
+1
(1)
112.6
−1
−1
+1
a
114.7
+1
−1
−1
a
115.5
+1
−1
−1
a
116.7
+1
−1
−1
a
119.2
+1
−1
−1
b
107.1
−1
+1
−1
b
107.5
−1
+1
−1
b
106.6
−1
+1
−1
b
105.9
−1
+1
−1
ab
124.0
+1
+1
+1
ab
125.1
+1
+1
+1
ab
120.3
+1
+1
+1
ab
124.5
+1
+1
+1
Μεταβλητές
Ακολουθώντας στο Minitab τη διαδρομή
Stat
Ê
Regression
Ê
Regression
Ê
Fit Regression Model
με τη μεταβλητή απόκρισης Y να καταχωρίζεται στα Responses και τις μεταβλητές Xa , Xb και Xab στις Continuous Variables. Η εκτιμήτρια εξίσωση παλινδρόμησης που προκύπτει είναι:
ŷijk = 116.00 + 4.00Xa − 0.875Xb + 4.35Xab ,
ενώ για τους εκτιμητές των συντελεστών παλινδρόμησης έχουμε τον εξής πίνακα:
Πίνακας 9.9: Συντελεστές Παλινδρόμησης - 22 Παραγοντικό Πείραμα
Όρος
Εκτιμητής
Τυπικό Σφάλμα
Ελεγχοσυνάρτηση t
p-value
Constant
116.00
0.572
202.84
0.000
A ≡ Xa
4.00
0.572
6.99
0.000
B ≡ Xb
−0.875
0.572
−1.53
0.152
AB ≡ Xab
4.35
0.572
7.61
0.000
ΓΡΑΜΜΙΚΑ ΜΟΝΤΕΛΑ ΚΑΙ ΣΧΕΔΙΑΣΜΟΣ & ΑΝΑΛΥΣΗ ΠΕΙΡΑΜΑΤΩΝ ΜΕ ΕΦΑΡΜΟΓΕΣ ΣΕ R ΚΑΙ MINITAB
245
Παρατηρώντας τα αποτελέσματα της Ανάλυσης Παλινδρόμησης διαπιστώνουμε ότι:
• η εκτιμήτρια του σταθερού όρου β0 ( Constant), της εκτιμήτριας συνάρτησης παλινδρόμησης ισούται με
116 και ταυτίζεται με την εκτιμήτρια του γενικού μέσου όρου µ̂, όπως είχε προσδιοριστεί από τη βασική
ανάλυση και τη Διπαραγοντική Ανάλυση Διακύμανσης,
• οι εκτιμητές των συντελεστών παλινδρόμησης β1 , β2 και β3 ισούνται με 4.0, −0.875 και 4.35 που ισούνται με το ήμισυ των επιδράσεων των A, B και AB, όπως είχαν προσδιοριστεί από τη βασική ανάλυση,
• οι p-values στον πιο πάνω πίνακα αφορούν τους ελέγχους H0 : βi = 0, έναντι H1 : βi ̸= 0, i = 1, 2, 3
και ταυτίζονται με τις p-values από τον Πίνακα ANOVA της Διπαραγοντικής Ανάλυσης Διακύμανσης.
Κατ΄ ουσίαν οι έλεγχοι μηδενικών επιδράσεων στην Ανάλυση Διακύμανσης είναι ταυτόσημοι με τους ελέγχους μη σημαντικών (δηλαδή μηδενικών) συντελεστών παλινδρόμησης, κάτι που είναι αναμενόμενο, αφού
αν ένας συντελεστής παλινδρόμησης είναι ίσος με το μηδέν, τότε η αντίστοιχη (ανεξάρτητη) μεταβλητή
παλινδρόμησης δεν συνεισφέρει στο πρότυπο παλινδρόμησης και θα πρέπει να αφαιρεθεί.
Λαμβάνοντας υπόψη όλα τα παραπάνω, θα μπορούσαμε να αναδιατυπώσουμε το πρότυπο παλινδρόμησης αξιοποιώντας τον συμβολισμό και τους τύπους των επιδράσεων των εμπλεκόμενων παραγόντων A, B και AB:
ŷijk = µ̂ +
B
AB
A
Xa + Xb +
Xab ,
2
2
2
όπου µ, A, και AB οι επιδράσεις, όπως δίνονται στους τύπους (9.1)−(9.4).
Παράδειγμα 9.3. Έστω ένα 23 παραγοντικό πείραμα με παράγοντες A ≡ X1 , B ≡ X2 και C ≡ X3 το οποίο
εκτελείται με δύο επαναλήψεις (ανά θεραπεία). Οι 16 μετρήσεις δίνονται στον Πίνακα Δεδομένων, κατωτέρω, όπου
X4 − X7 αντιπροσωπεύουν τις τέσσερις αλληλεπιδράσεις AB, AC, BC και ABC:
246
ΠΕΙΡΑΜΑΤΑ f ΠΑΡΑΓΟΝΤΩΝ ΜΕ 2 ΕΠΙΠΕΔΑ
Πίνακας 9.10: Πίνακας Δεδομένων στο 23 Παραγοντικό Πείραμα με n = 2 επαναλήψεις
Θεραπεία
Y
X1
X2
X3
X4
X5
X6
X7
(1)
59
−1
−1
−1
+1
+1
+1
−1
(1)
61
−1
−1
−1
+1
+1
+1
−1
a
74
+1
−1
−1
−1
−1
+1
+1
a
70
+1
−1
−1
−1
−1
+1
+1
b
50
−1
+1
−1
−1
+1
−1
+1
b
58
−1
+1
−1
−1
−1
+1
+1
ab
67
+1
+1
−1
+1
−1
−1
−1
ab
69
+1
+1
−1
−1
−1
+1
+1
c
54
−1
−1
+1
+1
−1
−1
+1
c
50
−1
−1
+1
−1
+1
−1
−1
ac
81
+1
−1
+1
−1
−1
+1
−1
ac
85
+1
−1
+1
−1
−1
+1
−1
bc
44
−1
+1
+1
−1
−1
+1
−1
bc
46
−1
+1
+1
−1
−1
+1
−1
abc
79
+1
+1
+1
+1
+1
+1
+1
abc
81
+1
+1
+1
−1
−1
+1
−1
Ακολουθώντας στο Minitab τη διαδρομή
Stat
Ê
Regression
Ê
Regression
Ê
Fit Regression Model
με τη μεταβλητή απόκρισης Y να καταχωρίζεται στα Responses και τις μεταβλητές x1 − x7 στις Continuous
Variables. Η εκτιμήτρια συνάρτηση παλινδρόμησης που προκύπτει είναι:
ŷijk = 64.25 + 11.50X1 − 2.50X2 + 0.75X3 + 0.75X4 + 5.00X5 + 0.00X6 + 0.25X7 ,
ενώ για τους εκτιμητές των συντελεστών παλινδρόμησης έχουμε:
ΓΡΑΜΜΙΚΑ ΜΟΝΤΕΛΑ ΚΑΙ ΣΧΕΔΙΑΣΜΟΣ & ΑΝΑΛΥΣΗ ΠΕΙΡΑΜΑΤΩΝ ΜΕ ΕΦΑΡΜΟΓΕΣ ΣΕ R ΚΑΙ MINITAB
247
Πίνακας 9.11: Συντελεστές Παλινδρόμησης - 23 Παραγοντικό Πείραμα
Όρος
Εκτιμητής
Τυπικό Σφάλμα
Ελεγχοσυνάρτηση t
p-value
Constant
64.25
0.707
90.86
0.000
A ≡ X1
11.50
0.707
16.26
0.000
B ≡ X2
−2.50
0.707
−3.54
0.008
C ≡ X3
0.75
0.707
1.06
0.320
AB ≡ X4
0.75
0.707
1.06
0.320
AC ≡ X5
5.00
0.707
7.07
0.000
BC ≡ X6
0.00
0.707
0.00
1.000
ABC ≡ X7
0.25
0.707
0.35
0.733
Αυτό που διαπιστώνεται από την ανάλυση παλινδρόμησης είναι ότι υπάρχουν μόνο δύο σημαντικές κύριες επιδράσεις, αυτές που αντιστοιχούν στους παράγοντες A και B ( p-values = 0.000 & 0.008 αντίστοιχα), και μόνο μία
σημαντική αλληλεπίδραση, αυτή μεταξύ των κύριων παραγόντων A και C ( p-value= 0.000). Λαμβάνοντας
υπόψη τα αποτελέσματα αυτά μπορούμε να προχωρήσουμε σε αναθεώρηση του προτύπου ώστε αυτό να περιλαμβάνει τις δύο κύριες επιδράσεις A(X1 ) και B(X2 ), την αλληλεπίδραση AC(X5 ) και αναγκαστικά την κύρια
επίδραση C(X3 ), αφού εμπλέκεται στην αλληλεπίδραση που έχει χαρακτηριστεί ως σημαντική. Τονίζεται ότι αν
επαναληφθεί η διαδικασία μόνο με τους πιο πάνω όρους/μεταβλητές, δεν πρόκειται να αλλάξουν οι εκτιμητές των
συγκεκριμένων συντελεστών παλινδρόμησης, με αποτέλεσμα η εκτιμήτρια συνάρτηση παλινδρόμησης να προκύπτει από την προηγούμενη, απομακρύνοντας τους μη σημαντικούς όρους:
ŷijk = 64.25 + 11.50X1 − 2.50X2 + 0.75X3 + 5.00X5 ,
ενώ για τους εκτιμητές των συντελεστών παλινδρόμησης έχουμε τροποποιήσεις όσον αφορά τα τυπικά σφάλματα,
τις τιμές των ελεγχοσυναρτήσεων και κατ’ επέκταση τις p-values. Αυτό οφείλεται στο γεγονός ότι η μεταβλητότητα που δεν δύναται να εξηγηθεί από το πρότυπο αυξάνεται, αφού σε αυτήν προστίθεται η μεταβλητότητα που
σχετιζόταν με καθέναν από τους όρους που απομακρύνθηκαν από το πρότυπο. Αντιστοίχως, επηρεάζονται οι βαθμοί ελευθερίας του σφάλματος και άρα μεταβάλλεται η τιμή του μέσου τετραγωνικού σφάλματος M SE, δηλαδή η
εκτιμήτρια της διασποράς του προτύπου παλινδρόμησης, και μεταβάλλονται όλες οι ελεγχοσυναρτήσεις των ελέγχων για τους συντελεστές παλινδρόμησης. Ο τροποποιημένος πίνακας φαίνεται στη συνέχεια:
Πίνακας 9.12: Συντελεστές Παλινδρόμησης - 23 Παραγοντικό Πείραμα (Τροποποιημένο)
Όρος
Εκτιμητής
Τυπικό Σφάλμα
Ελεγχοσυνάρτηση t
p-value
Constant
64.25
0.648
99.09
0.000
A ≡ X1
11.50
0.648
17.74
0.000
B ≡ X2
−2.50
0.648
−3.86
0.003
C ≡ X3
0.75
0.648
1.16
0.272
AC ≡ X5
5.00
0.648
7.71
0.000
Με βάση τα παραπάνω, στο συγκεκριμένο πείραμα οι επιδράσεις των κύριων παραγόντων θα δίνονται από το δι-
248
ΠΕΙΡΑΜΑΤΑ f ΠΑΡΑΓΟΝΤΩΝ ΜΕ 2 ΕΠΙΠΕΔΑ
πλάσιο των αντίστοιχων συντελεστών παλινδρόμησης, δηλαδή:
A = 23.00, B = −5.00 & C = 1.50
και με τη συνεισφορά της επίδρασης της αλληλεπίδρασης να ισούται με AC = 10.00.
Έχοντας τις εκτιμήσεις των επιδράσεων, ο Ερευνητής μπορεί να προσδιορίζει τα αθροίσματα τετραγώνων τα οποία
από τους τύπους (9.8) ή τον γενικό τύπο (9.9) με n = 2 και f = 3, είναι ίσα με:
SSA = 2 × 2 × A2 = 2116,
SSC = 2 × 2 × C 2 = 9 &
SSB = 2 × 2 × B 2 = 100,
SSAC = 2 × 2 × [AC]2 = 400.
Αξίζει να σημειωθεί ότι η συνολική μεταβλητότητα που εξηγείται/δικαιολογείται από το τροποποιημένο πρότυπο,
είναι ίση με 97.26% που είναι σχεδόν ίδια με τη μεταβλητότητα του αρχικού προτύπου (πριν την απομάκρυνση
των μη σημαντικών μεταβλητών) που ήταν ίση με 97.63%. Η παρατήρηση αυτή επιβεβαιώνει την ορθότητα της
επιλογής του Ερευνητή να απομακρύνει τις μη σημαντικές μεταβλητές των οποίων η συνεισφορά στο αρχικό πρότυπο ήταν, ομολογουμένως, μηδαμινή.
Άσκηση Αυτοαξιολόγησης
Για τα δεδομένα του προηγούμενου παραδείγματος για το 23 παραγοντικό πείραμα, να
προχωρήσετε στη βασική ανάλυση και να υπολογίσετε τις επιδράσεις των εμπλεκόμενων
επτά όρων. Στη συνέχεια, να εκτελέσετε μία πολυπαραγοντική Ανάλυση Διακύμανσης για
να επιβεβαιωθεί ότι τα αποτελέσματα συμφωνούν με αυτά της Ανάλυσης Διακύμανσης και
άρα να αποδειχτεί η ισοδυναμία των δύο τεχνικών στατιστικής ανάλυσης.
Σημείωση: Η πολυπαραγοντική ανάλυση διακύμανσης, η οποία θα συζητηθεί διεξοδικά στο
Κεφάλαιο 10, ακολουθεί τη μεθοδολογία της διπαραγοντικής και περιλαμβάνει όλες τις
κύριες επιδράσεις καθώς και όλες τις αλληλεπιδράσεις, με την προϋπόθεση ότι το πείραμα
εκτελείται με επανάληψη (όπως δηλαδή συμβαίνει στο προηγούμενο παράδειγμα).
9.2 Κλασματικά παραγοντικά πειράματα
Στην παρούσα ενότητα, η μελέτη επικεντρώνεται σε 2f παραγοντικά πειράματα με f > 1 παράγοντες με δύο
επίπεδα και 2f θεραπείες. Όπως είχε αναφερθεί και στην αρχή του κεφαλαίου, το πρόβλημα είναι αρκετά απλό
όταν ο αριθμός f των παραγόντων είναι σχετικά μικρός, 2, 3, ή 4. Όμως, το πρόβλημα καθίσταται ιδιαίτερα
πολύπλοκο όσο αυξάνεται ο αριθμός των παραγόντων f γιατί αυξάνεται σημαντικά ο αριθμός θεραπειών και
κατά συνέπεια ο χρόνος και το κόστος πειραματισμού. Η μελέτη γίνεται περισσότερο χρονοβόρα αν απαιτούνται επαναλήψεις ώστε να είναι δυνατή η μελέτη αλληλεπιδράσεων. Για την περίπτωση των n = 2 επαναλήψεων, στο 25 παραγοντικό πείραμα απαιτούνται 64 μετρήσεις, για το 26 απαιτούνται 128 και για το 210
απαιτούνται 2048. Οι τιμές αυτές καθιστούν απαγορευτική τη μελέτη του πλήρους παραγοντικού πειράματος για f ακόμα και ίσο με 4 ή με 5, με αποτέλεσμα ο Ερευνητής να καταφεύγει στα κλασματικά παραγοντικά
πειράματα όπου ο σχεδιασμός περιλαμβάνει ένα κατάλληλα επιλεγμένο υποσύνολο όλων των δυνατών συνδυασμών (θεραπειών) περιορίζοντας πολύ και τον χρόνο και το κόστος του πειράματος.
Τα Κλασματικά Παραγοντικά Πειράματα βασίζονται στις μισές (1/2) ή στο ένα τέταρτο (1/22 ) ή γενικά
στο (1/2p )-κλάσμα (για p > 1) των συνδυασμών (θεραπειών) που απαιτεί το Πλήρες Παραγοντικό Πείραμα και επιλέγονται με τρόπο ώστε να διασφαλίζονται η αξιολόγηση των κύριων επιδράσεων και ένας ικανοποιητικός αριθμός (αλλά όχι όλων) αλληλεπιδράσεων. Το (1/2p )-κλασματικό παραγοντικό πείραμα με f
ΓΡΑΜΜΙΚΑ ΜΟΝΤΕΛΑ ΚΑΙ ΣΧΕΔΙΑΣΜΟΣ & ΑΝΑΛΥΣΗ ΠΕΙΡΑΜΑΤΩΝ ΜΕ ΕΦΑΡΜΟΓΕΣ ΣΕ R ΚΑΙ MINITAB
249
παράγοντες συμβολίζεται με 2f −p . Το πιο σημαντικό στοιχείο στα κλασματικά παραγοντικά πειράματα είναι
η ορθή (επιδέξια) επιλογή του κατάλλληλου υποσυνόλου, από το συνολικό αριθμό συνδυασμών (θεραπειών),
που θα επιτρέψει στον Ερευνητή να μελετήσει τις σημαντικότερες επιδράσεις στις οποίες θα πρέπει να περιλαμβάνονται όλες οι κύριες επιδράσεις. Είναι παρατηρημένο ότι όσο αυξάνεται η τάξη της αλληλεπίδρασης
(με δύο, τρεις κ.ο.κ. παράγοντες) μειώνεται η σημαντικότητά της. Άρα, σε ένα πείραμα επιδιώκουμε τη μελέτη
των κύριων επιδράσεων και όσο περισσότερων αλληλεπιδράσεων, δίνοντας έμφαση κατά προτεραιότητα στις
αλληλεπιδράσεις 1ης τάξης (μεταξύ δύο παραγόντων), στη συνέχεια στις αλληλεπιδράσεις 2ης τάξης (δηλαδή
μεταξύ τριών παραγόντων), ακολούθως στις αλληλεπιδράσεις 3ης τάξης (δηλαδή μεταξύ τεσσάρων παραγόντων) κ.ο.κ.
Για να είναι λοιπόν δυνατή η μελέτη των διαφόρων ποσοτήτων, θα πρέπει οι σημαντικές για τον Ερευνητή
ποσότητες να μην συγχέονται μεταξύ τους. Ο όρος που χρησιμοποιείται είναι η Σύγχυση ( Confounding)
μεταξύ επιδράσεων. Για την αποφυγή του προβλήματος αυτού ο Ερευνητής επιδιώκει να αγνοήσει αλληλεπιδράσεις μεγάλης τάξης (κατά προτίμηση της μέγιστης δυνατής) ώστε να διασφαλίσει τη μέγιστη δυνατή
αξιολόγηση των κυριότερων επιδράσεων, συμπεριλαμβανομένων όλων των κύριων επιδράσεων και των αλληλεπιδράσεων μικρής ή μεσαίας τάξης. Η έννοια της σύγχυσης είναι άρρηκτα συνδεδεμένη με την έννοια της
Διακριτικής Ικανότητας ή Ανάλυσης ( Resolution), η οποία όσο μεγαλύτερη είναι τόσο λιγότερο συγχέονται
οι κυριότερες επιδράσεις. Οι δύο αυτές έννοιες θα συζητηθούν στην αμέσως επόμενη ενότητα ώστε να γίνει
κατανοητή η σημασία τους στους κλασματικούς παραγοντικούς σχεδιασμούς.
9.2.1 Σύγχυση και ανάλυση (διακριτική ικανότητα)
Για την κατανόηση της έννοιας της σύγχυσης θα δώσουμε εδώ προσοχή στο κλάσμα ενός δευτέρου (1/2)
δηλαδή στα παραγοντικά εκείνα πειράματα που επιλέγονται οι μισές από τις θεραπείες για την εκτέλεση του
πειράματος. Έτσι για την περίπτωση του 23 πειράματος που είχαμε συνολικά 8 θεραπείες, θα πρέπει να επιλεχθούν οι μισές, δηλαδή μόνο 4. Θυμίζουμε ότι ο πίνακας αλγεβρικών προσήμων για το 23 παραγοντικό
πείραμα με τρεις παράγοντες A, B και C, είναι:
Πίνακας 9.13: Πίνακας Αλγεβρικών Προσήμων στο 23 Παραγοντικό Πείραμα
Θεραπεία
I
A
B
C
AB
AC
BC
ABC
(1)
1
−
−
−
+
+
+
−
a
1
+
−
−
−
−
+
+
b
1
−
+
−
−
+
−
+
ab
1
+
+
−
+
−
−
−
c
1
−
−
+
+
−
−
+
ac
1
+
−
+
−
+
−
−
bc
1
−
+
+
−
−
+
−
abc
1
+
+
+
+
+
+
+
Ας επιλέξουμε για παράδειγμα να αγνοήσουμε τις 4 τελευταίες θεραπείες και να επικεντρωθούμε στις τέσσερις
πρώτες, δηλαδή από τον προηγούμενο πίνακα απομένει το πρώτο μισό:
250
ΠΕΙΡΑΜΑΤΑ f ΠΑΡΑΓΟΝΤΩΝ ΜΕ 2 ΕΠΙΠΕΔΑ
Πίνακας 9.14: Πίνακας Αλγεβρικών Προσήμων στο 23−1 Κλασματικό Παραγοντικό Πείραμα - 1η περίπτωση
Θεραπεία
I
A
B
C
AB
AC
BC
ABC
(1)
1
−
−
−
+
+
+
−
a
1
+
−
−
−
−
+
+
b
1
−
+
−
−
+
−
+
ab
1
+
+
−
+
−
−
−
Εναλλακτικά θα μπορούσαμε να επιλέξουμε τις 4 τελευταίες θεραπείες, οπότε από τον Πίνακα αλγεβρικών
προσήμων θα απέμενε το δεύτερο μισό:
Πίνακας 9.15: Πίνακας Αλγεβρικών Προσήμων στο 23−1 Κλασματικό Παραγοντικό Πείραμα - 2η περίπτωση
Θεραπεία
I
A
B
C
AB
AC
BC
ABC
c
1
−
−
+
+
−
−
+
ac
1
+
−
+
−
+
−
−
bc
1
−
+
+
−
−
+
−
abc
1
+
+
+
+
+
+
+
Δεν είναι δύσκολο να προσέξουμε ότι είτε τη μία επιλογή κάνουμε είτε την άλλη, για τον παράγοντα C οι
εκτελέσεις των πειραμάτων θα γίνουν στο ένα μόνο από τα δύο επίπεδά του, είτε στο (−) για την πρώτη
επιλογή κλάσματος είτε στο (+) για τη δεύτερη. Όποια και να είναι η προτίμησή μας, το σημαντικό είναι
ότι η μελέτη του κλασματικού αυτού πειράματος δεν θα βοηθήσει τον Ερευνητή να αποκομίσει μία πλήρη
εικόνα για τον παράγοντα C, αφού δεν θα έχει ούτε μία εκτέλεση του πειράματος στο ένα από τα δύο επίπεδα
του παράγοντα. Υπενθυμίζεται εδώ ότι η επίδραση ενός κύριου παράγοντα βασίζεται στη σύγκριση μεταξύ
των μετρήσεων όταν τα πειράματα εκτελούνται στο ένα του επίπεδο, και των μετρήσεων όταν τα πειράματα
εκτελούνται στο άλλο του επίπεδο. Αυτό είναι αδύνατον να συμβεί για τον παράγοντα C είτε επιλέξουμε την
πρώτη περίπτωση κλάσματος είτε τη δεύτερη. Το συμπέρασμα που εξάγεται από το παράδειγμα αυτό είναι
ότι η επιλογή του πρώτου ή του δεύτερου μισού, ή διαφορετικά των θεραπειών όπου ο C μετέχει με το χαμηλό του επίπεδο (ή των θεραπειών που μετέχει με το υψηλό του επίπεδο), δεν είναι η ενδεδειγμένη γιατί δεν
είναι δυνατή η αξιολόγηση του συγκεκριμένου παράγοντα. Κατ’ επέκταση, δεν είναι φρόνιμο να επιλέξουμε
μόνο τις θεραπείες που αντιστοιχούν στο χαμηλό επίπεδο οποιουδήποτε από τους κύριους παράγοντες της μελέτης. Άρα, ούτε τις τέσσερις θεραπείες που αντιστοιχούν στο χαμηλό επίπεδο του A ή του B ούτε όμως και
τις τέσσερις θεραπείες που αντιστοιχούν στο υψηλό επίπεδο του A ή του B, θα πρέπει να επιλέξει ο Ερευνητής.
Επανερχόμενοι στις δύο περιπτώσεις που χρησιμοποιούμε ως παραδείγματα, μπορούμε να προσέξουμε ότι
για μεν την πρώτη, ισχύει η σχέση:
I = −C
για δε τη δεύτερη, η σχέση:
I = C.
Πράγματι, το μοναδιαίο στοιχείο I προκύπτει είτε αν αλλάξουμε τα πρόσημα του C, στην 1η περίπτωση, είτε
αν τα αφήσουμε ίδια, στη δεύτερη. Είναι φανερό επίσης ότι είτε η μία περίπτωση επιλεχθεί είτε η άλλη, το
αποτέλεσμα είναι το ίδιο: δεν μπορεί να αξιολογηθεί ο παράγοντας C. Και στη μία και στην άλλη περίπτωση,
ΓΡΑΜΜΙΚΑ ΜΟΝΤΕΛΑ ΚΑΙ ΣΧΕΔΙΑΣΜΟΣ & ΑΝΑΛΥΣΗ ΠΕΙΡΑΜΑΤΩΝ ΜΕ ΕΦΑΡΜΟΓΕΣ ΣΕ R ΚΑΙ MINITAB
251
λέμε ότι το μοναδιαίο στοιχείο I συγχέεται με τη συγκεκριμένη παραγοντική επίδραση και η εξίσωση που
προκύπτει ονομάζεται προσδιορίζουσα εξίσωση. Η προσδιορίζουσα εξίσωση είναι η εξίσωση που καθορίζει την
παραγοντική επίδραση με την οποία συγχέεται το μοναδιαίο στοιχείο I. Έτσι, αν για παράδειγμα ο Ερευνητής
επιλέξει ως προσδιορίζουσα εξίσωση την:
I=A
αυτό σημαίνει ότι επιλέγει την παραγοντική επίδραση A να συγχέεται με την I και μάλιστα (λόγω του θετικού προσήμου) επιλέγει να εκτελέσει πείραμα με κλάσμα ενός δευτέρου χρησιμοποιώντας τις θεραπείες για
τις οποίες ο παράγοντας A είναι τοποθετημένος μόνο στο θετικό του επίπεδο. Αν το πράξει αυτό, τότε θεωρούμε ότι συνειδητά επιλέγει να μελετήσει το πείραμα, χωρίς όμως να δύναται να αξιολογήσει την επίδραση
του παράγοντα A.
Για να αναδείξουμε τη σημασία της σύγχυσης και της προσδιορίζουσας εξίσωσης, ας επιλέξουμε για τον κλασματικό παραγοντικό πείραμα εκείνες τις θεραπείες για τις οποίες η αλληλεπίδραση AC είναι θετική (αποφεύγοντας όλες τις κύριες επιδράσεις, αφού δεν είναι σοφό να επιλεχθούν με βάση τα προηγούμενα). Τότε θα
έχουμε τον εξής πίνακα:
Πίνακας 9.16: Πίνακας Αλγεβρικών Προσήμων στο 23 Παραγοντικό Πείραμα - 3η περίπτωση
Θεραπεία
I
A
B
C
AB
AC
BC
ABC
(1)
1
−
−
−
+
+
+
−
b
1
−
+
−
−
+
−
+
ac
1
+
−
+
−
+
−
−
abc
1
+
+
+
+
+
+
+
Στην 3η αυτή περίπτωση η προσδιορίζουσα είναι η εξίσωση
I = AC
(9.10)
και προφανώς ο Ερευνητής δεν δύναται να αξιολογήσει την αλληλεπίδραση AC, αφού αυτή μελετάται μόνο
στο ένα της επίπεδο. Παράλληλα μπορούμε να προσέξουμε ότι και οι τρεις κύριοι παράγοντες μελετώνται
και στο χαμηλό και στο υψηλό τους επίπεδο. Αν όμως προσέξουμε λίγο καλύτερα θα διαπιστώσουμε ότι οι
παράγοντες A και C δεν μελετώνται χιαστί, παρά μόνο στους συνδυασμούς επιπέδων (−) και (+). Άρα,
καταλήγουμε στο συμπέρασμα ότι η αξιολόγησή τους δεν είναι εφικτή ή με άλλα λόγια διαπιστώνουμε ότι οι
δύο αυτοί παράγοντες συγχέονται. Δηλαδή, αν και η προσδιορίζουσα μας έδινε την εντύπωση ότι συγχέεται η
αλληλεπίδραση AC με το I, ο πίνακας δείχνει ότι υπάρχει τουλάχιστον ακόμα μία σύγχυση που με πρώτη ματιά δεν ήταν ορατή, από την προσδιορίζουσα εξίσωση. Μάλιστα, αν προσέξει κανείς καλύτερα θα διαπιστώσει
ότι το ίδιο πρόβλημα αντιμετωπίζουν κι αλλά ζεύγη στηλών του Πίνακα, όπως για παράδειγμα οι στήλες που
αντιστοιχούν στα AB και BC. Αν η προσδιορίζουσα εξίσωση (9.10) πολλαπλασιαστεί (και τα δύο μέλη) με
A ή με B, τότε προκύπτουν οι παρακάτω εξισώσεις:
AI = AAC
& BI = BAC
που λόγω του ότι όταν μία στήλη πολλαπλασιάζεται με τον εαυτό της προκύπτει η στήλη του μοναδιαίου
στοιχείου (π.χ. A ∗ A = A2 = I), οι πιο πάνω δύο εξισώσεις γίνονται:
A=C
& B = ABC
252
ΠΕΙΡΑΜΑΤΑ f ΠΑΡΑΓΟΝΤΩΝ ΜΕ 2 ΕΠΙΠΕΔΑ
οι οποίες καταλήγουν να είναι ισοδύναμες με την αρχική εξίσωση (I = AC). Όπως στην αρχική εξίσωση ο
όρος στο αριστερό μέλος (το I) συγχέεται με τον όρο στο δεξί μέλος (το AC), έτσι και στις ισοδύναμες εξισώσεις που προέκυψαν, το αριστερό μέλος συγχέεται με το δεξί και έτσι επιβεβαιώνεται μέσω των εξισώσεων
η σύγχυση μεταξύ των A και C (A, C) και των B και ABC (B, ABC). Οι επιπρόσθετες αυτές εξισώσεις
είναι γνωστές ως παραλλαγές (aliases). Το σύνολο των παραλλαγών που προκύπτουν από μία προσδιορίζουσα
εξίσωση μπορεί να βρεθεί πολλαπλασιάζοντας τα μέλη της προσδιορίζουσας με καθεμία από τις κύριες επιδράσεις και τις αλληλεπιδράσεις του πειράματος. Έτσι, για την περίπτωση της προσδιορίζουσας εξίσωσης (9.10)
για το πρόβλημα με τρεις κύριες επιδράσεις (A, B και C) και τέσσερις αλληλεπιδράσεις (AB, AC, BC και
ABC), οι παραλλαγές δίνονται πιο κάτω. Προσέξτε ότι οι παραλλαγές εμφανίζονται εις διπλούν, με απλή
αντιμετάθεση του δεξιού με το αριστερό μέλος:
Πίνακας 9.17: Παραλλαγές στο 23−1 Παραγοντικό Πείραμα - Προσδιορίζουσα I = AC
I = AC
(I, AC)
A=C
(A, C)
B = ABC
(B, ABC)
C=A
(C, A)
AB = BC
(AB, BC)
AC = I
(AC, I)
ABC = B
(ABC, B)
Με βάση τις παραλλαγές που προέκυψαν, καταλήγουμε στο συμπέρασμα ότι ούτε η συγκεκριμένη επιλογή
κλάσματος είναι η ιδανικότερη, αφού παρατηρείται σύγχυση μεταξύ δύο κύριων επιδράσεων (πέραν των συγχύσεων που παρατηρούνται μεταξύ κύριων επιδράσεων και αλληλεπιδράσεων που όμως θα μπορούσαν να θεωρηθούν ελάσσονος σημασίας σε σχέση με αυτή μεταξύ των κύριων επιδράσεων A και C).
Η ιδανικότερη επιλογή θα ήταν τελικά η αλληλεπίδραση 2ης τάξης μεταξύ των A, B και C ή γενικότερα
η αλληλεπίδραση μέγιστης τάξης των εμπλεκόμενων παραγόντων, ανεξαρτήτως του πόσοι είναι. Για το αν θα
επιλεχθούν οι θεραπείες που αντιστοιχούν στο χαμηλό ή στο υψηλό επίπεδο, ο Ερευνητής μπορεί να επιλέξει
μία από τις δύο επιλογές με τρόπο τυχαίο. Είτε επιλέξει τη μία είτε την άλλη δεν έχει ουσιαστική σημασία, αφού
το διακύβευμα είναι το ίδιο. Έστω λοιπόν ότι επιλέγουμε τελικά την προσδιορίζουσα εξίσωση I = +ABC.
Τότε οι παραλλαγές δίνονται στον Πίνακα 9.18.
Πίνακας 9.18: Παραλλαγές στο 23−1 Παραγοντικό Πείραμα - 4η περίπτωση - Προσδιορίζουσα I = ABC
I = ABC
(I, ABC)
A = BC
(A, BC)
B = AC
(B, BC)
C = AB
(C, AB)
AB = C
(AB, C)
AC = B
(AC, B)
ABC = I
(ABC, I)
ΓΡΑΜΜΙΚΑ ΜΟΝΤΕΛΑ ΚΑΙ ΣΧΕΔΙΑΣΜΟΣ & ΑΝΑΛΥΣΗ ΠΕΙΡΑΜΑΤΩΝ ΜΕ ΕΦΑΡΜΟΓΕΣ ΣΕ R ΚΑΙ MINITAB
253
Το ότι η συγκεκριμένη περίπτωση είναι η ιδανικότερη, επιβεβαιώνεται από το σύνολο των παραλλαγών από
όπου προκύπτει ότι δεν υπάρχει καμία σύγχυση μεταξύ κύριων επιδράσεων. Οι μόνες συγχύσεις είναι μεταξύ
μίας κύριας επίδρασης και μίας αλληλεπίδρασης ή μεταξύ δύο αλληλεπιδράσεων.
Άσκηση Αυτοαξιολόγησης
Έστω το 23 παραγοντικό πείραμα με παράγοντες του A, B και C από το οποίο ζητείται να
κατασκευαστεί το 23−1 κλασματικό παραγοντικό πείραμα με τέτοιο τρόπο ώστε να μην
συγχέονται μεταξύ τους οι επιδράσεις των I, A, C και BC. Να δοθεί ο πίνακας αλγεβρικών
προσήμων.
Σημείωση: Αρκεί να διερευνηθεί η δυνατότητα σύγχυσης της I με καθεμία από τις
εναπομείνασες επιδράσεις του πειράματος, δηλαδή των , AC, AB και ABC, και να
επιλεχθεί εκείνη που δεν οδηγεί σε κάποια σύγχυση από τις αναφερόμενες στην εκφώνηση.
Το είδος της σύγχυσης και η δυνατότητα που έχει ένας σχεδιασμός να μην συγχέει κύριες επιδράσεις και αλληλεπιδράσεις, ονομάζεται διακριτική ικανότητα ή ανάλυση (resolution). Η διαβάθμιση της ανάλυσης είναι II,
III, IV και V με υψηλότερες τιμές να αντιστοιχούν σε καλύτερη διακριτική ικανότητα. Συγκεκριμένα:
• Η Ανάλυση II σημαίνει ότι οι κύριες επιδράσεις συγχέονται μεταξύ τους (αντίστοιχη της 3ης περίπτωσης που μελετήθηκε νωρίτερα με I = AC).
• Η Ανάλυση III σημαίνει ότι οι κύριες επιδράσεις δεν συγχέονται μεταξύ τους αλλά συγχέονται με
αλληλεπιδράσεις 1ης τάξης (αντίστοιχη της 4ης περίπτωσης που μελετήθηκε νωρίτερα με I = ABC).
• Η Ανάλυση IV σημαίνει ότι οι κύριες επιδράσεις δεν συγχέονται μεταξύ τους, αλλά ούτε με αλληλεπιδράσεις 1ης τάξης. Κάποιες αλληλεπιδράσεις 1ης τάξης συγχέονται με άλλες αλληλεπιδράσεις 1ης τάξης.
• Η Ανάλυση V σημαίνει ότι οι κύριες επιδράσεις καθώς και οι αλληλεπιδράσεις 1ης τάξης δεν συγχέονται
μεταξύ τους.
Σύμφωνα με τα παραπάνω:
• Η Ανάλυση II αξιοποιείται για την αξιολόγηση κάποιων, αλλά όχι όλων των κύριων επιδράσεων.
• Η Ανάλυση III αξιοποιείται για την αξιολόγηση όλων των κύριων επιδράσεων, αλλά όχι των αλληλεπιδράσεων 1ης τάξης.
• Η Ανάλυση IV αξιοποιείται για την αξιολόγηση όλων των κύριων επιδράσεων και κάποιων εκ των
αλληλεπιδράσεων 1ης τάξης.
• Η Ανάλυση V αξιοποιείται για την αξιολόγηση όλων των κύριων επιδράσεων και όλων των αλληλεπιδράσεων 1ης τάξης.
9.2.2 Κλάσματα ενός δευτέρου πλήρους τυχαιοποίησης
Ο σκοπός της ενότητας αυτής είναι η διαδικασία εύρεσης των θεραπειών ενός κλασματικού σχεδιασμού ενός
δευτέρου (1/2) και η μελέτη του μέσω της εφαρμογής της ανάλυσης διακύμανσης. Στο πρώτο παράδειγμα
παρουσιάζεται αναλυτικά η βηματική διαδικασία για την εύρεση των θεραπειών η οποία είναι πάντοτε εφαρμόσιμη, ενώ στο δεύτερο παρουσιάζεται μία ειδική βηματική διαδικασία στην ειδική περίπτωση που η προσδιορίζουσα αφορά την αλληλεπίδραση της μέγιστης τάξης.
254
ΠΕΙΡΑΜΑΤΑ f ΠΑΡΑΓΟΝΤΩΝ ΜΕ 2 ΕΠΙΠΕΔΑ
Παράδειγμα 9.4. Ζητείται η εύρεση των θεραπειών που θα χρησιμοποιηθούν σε ένα 24−1 κλασματικό παραγοντικό πείραμα όπου εμπλέκονται οι παράγοντες A, B, C και D, όταν η προσδιορίζουσα εξίσωση είναι η I =
BCD.
Παρατηρούμε ότι η προσδιορίζουσα που έχει επιλεχθεί δεν είναι η αλληλεπίδραση της μέγιστης τάξης και αναμένουμε ο κλασματικός σχεδιασμός να μην έχει τη μέγιστη δυνατή Ανάλυση.Όμως θα έχει μία ικανοποιητική Ανάλυση,
αφού η προσδιορίζουσα δεν βασίζεται σε κάποια κύρια επίδραση. Για την εύρεση του σχεδιασμού ακολουθούμε τα
παρακάτω βήματα.
1. Κατασκευάζουμε τον ημιτελή Πίνακα Αλγεβρικών Προσήμων όπου καταχωρίζονται:
α. οι θεραπείες του σχεδιασμού, η μία μετά την άλλη στην τυπική τους σειρά,
β. το μοναδιαίο στοιχείο I,
γ. όλες οι κύριες επιδράσεις A − D καθώς και
δ. μία ακόμα στήλη που αφορά την προσδιορίζουσα εξίσωση (BCD).
2. Για την εύρεση των προσήμων των I και A − D ακολουθούμε την υπόδειξη από τις θεραπείες της 1ης
στήλης.
3. Για την εύρεση των προσήμων της τελευταίας στήλης που αφορά την προσδιορίζουσα, κάνουμε τους πολλαπλασιασμούς μεταξύ των προσήμων στις στήλες των κύριων παραγόντων που εμπεριέχονται στην προσδιορίζουσα.
4. Επιλέγουμε στην τύχη είτε τα θετικά είτε τα αρνητικά πρόσημα στην τελευταία στήλη.
5. Προσδιορίζουμε όλες τις παραλλαγές πολλαπλασιάζοντας και τα δύο μέρη της προσδιορίζουσας διαδοχικά,
με κάθε επίδραση και κάθε αλληλεπίδραση 1ης τάξης. Οι παραλλαγές που θα προκύψουν επιτρέπουν τον
προσδιορισμό της Ανάλυσης του σχεδιασμού (II - V ).
Εφαρμόζοντας την πιο πάνω διαδικασία έχουμε τον εξής Πίνακα Αλγεβρικών Προσήμων:
ΓΡΑΜΜΙΚΑ ΜΟΝΤΕΛΑ ΚΑΙ ΣΧΕΔΙΑΣΜΟΣ & ΑΝΑΛΥΣΗ ΠΕΙΡΑΜΑΤΩΝ ΜΕ ΕΦΑΡΜΟΓΕΣ ΣΕ R ΚΑΙ MINITAB
255
Πίνακας 9.19: Πίνακας Αλγεβρικών Προσήμων - Προσδιορίζουσα I = BCD
Επίδραση
I
A
B
C
D
I = BCD
(1)
+
−
−
−
−
−
a
+
+
−
−
−
−
b
+
−
+
−
−
+
ab
+
+
+
−
−
+
c
+
−
−
+
−
+
ac
+
+
−
+
−
+
bc
+
−
+
+
−
−
abc
+
+
+
+
−
−
d
+
−
−
−
+
+
ad
+
+
−
−
+
+
bd
+
−
+
−
+
−
abd
+
+
+
−
+
−
cd
+
−
−
+
+
−
acd
+
+
−
+
+
−
bcd
+
−
+
+
+
+
abcd
+
+
+
+
+
+
Θεραπεία
από όπου επιλέγοντας π.χ. το αρνητικό πρόσημο στην τελευταία στήλη, καταλήγουμε στην εκτέλεση του πειράματος στις εξής θεραπείες:
256
ΠΕΙΡΑΜΑΤΑ f ΠΑΡΑΓΟΝΤΩΝ ΜΕ 2 ΕΠΙΠΕΔΑ
Πίνακας 9.20: Θεραπείες - Προσδιορίζουσα I = BCD
Επίδραση
I
A
B
C
D
BCD
(1)
1
−
−
−
−
−
a
1
+
−
−
−
−
bc
1
−
+
+
−
−
abc
1
+
+
+
−
−
bd
1
−
+
−
+
−
abd
1
+
+
−
+
−
cd
1
−
−
+
+
−
acd
1
+
−
+
+
−
Θεραπεία
ή απλούστερα στις θεραπείες:
Πίνακας 9.21: Θεραπείες - Προσδιορίζουσα I = BCD
Επίδραση
A
B
C
D
(1)
−
−
−
−
a
+
−
−
−
bc
−
+
+
−
abc
+
+
+
−
bd
−
+
−
+
abd
+
+
−
+
cd
−
−
+
+
acd
+
−
+
+
Θεραπεία
Πολλαπλασιάζοντας τα δύο μέλη της προσδιορίζουσας με τις κύριες επιδράσεις A − D και τις αλληλεπιδράσεις
1ης τάξης (AB, AC, AD, BC, BD και CD), προκύπτουν οι παραλλαγές του σχεδιασμού (εμφανίζονται εις
διπλούν):
ΓΡΑΜΜΙΚΑ ΜΟΝΤΕΛΑ ΚΑΙ ΣΧΕΔΙΑΣΜΟΣ & ΑΝΑΛΥΣΗ ΠΕΙΡΑΜΑΤΩΝ ΜΕ ΕΦΑΡΜΟΓΕΣ ΣΕ R ΚΑΙ MINITAB
257
Πίνακας 9.22: Παραλλαγές στο 24−1 Παραγοντικό Πείραμα - Προσδιορίζουσα I = BCD
I = BCD
(I, BCD)
A = ABCD
(A, ABCD)
B = CD
(B, CD)
C = BD
(C, BD)
D = BC
(D, BC)
AB = ACD
(AB, ACD)
AC = ABD
(AC, ABD)
AD = ABC
(AD, ABC)
BC = D
(BC, D)
BD = C
(BD, C)
CD = B
(CD, B)
Από τις παραλλαγές που προέκυψαν διαπιστώνεται ότι δεν υπάρχει σύγχυση μεταξύ των κύριων επιδράσεων αλλά
ούτε και των κύριων επιδράσεων με το μοναδιαίο στοιχείο. Υπάρχουν αλληλεπιδράσεις 1ης τάξης που συγχέονται
με κύριες επιδράσεις, αλλά υπάρχουν και κάποιες αλληλεπιδράσεις 1ης τάξης που δεν συγχέονται παρά μόνο με
αλληλεπιδράσεις μεγαλύτερης τάξης (AB, AC και AD). Συμπερασματικά η Ανάλυση του σχεδιασμού είναι III.
Πέρα από τη βηματική διαδικασία του προηγούμενου παραδείγματος η οποία είναι πάντοτε εφαρμόσιμη,
υπάρχει και μία ειδική βηματική διαδικασία στην ειδική περίπτωση που η προσδιορίζουσα αφορά την αλληλεπίδραση της μέγιστης τάξης. Αυτή η ειδική βηματική διαδικασία θα μπορούσε να εφαρμοστεί στο προηγούμενο παράδειγμα αν η προσδιορίζουσα ήταν η αλληλεπίδραση 3ης τάξης: I = ABCD. Για την εφαρμογή
της τεχνικής χρησιμοποιούμε το επόμενο παράδειγμα.
Παράδειγμα 9.5. Ζητείται η εύρεση των θεραπειών που θα χρησιμοποιηθούν σε ένα 25−1 κλασματικό παραγοντικό πείραμα όπου εμπλέκονται οι παράγοντες A, B, C, D και E, όταν η προσδιορίζουσα εξίσωση είναι η
I = ABCDE.
Παρατηρούμε ότι η προσδιορίζουσα που έχει επιλεχθεί είναι η αλληλεπίδραση της μέγιστης τάξης και αναμένουμε
ο κλασματικός σχεδιασμός να έχει τη μέγιστη δυνατή Ανάλυση. Επίσης, παρατηρούμε ότι αν πολλαπλασιαστούν
και τα δύο μέλη της προσδιορίζουσας με τον παράγοντα E, τότε είναι ισοδύναμη (παραλλαγή, alias) με την E =
ABCD. Για την εύρεση του σχεδιασμού ακολουθούμε την παρακάτω ειδική βηματική διαδικασία.
1. Κατασκευάζουμε τον ημιτελή Πίνακα Αλγεβρικών προσήμων όπου καταχωρίζονται:
α. οι θεραπείες του πλήρους παραγοντικού πειράματος 24 για τους παράγοντες A − D (δηλαδή όλων
πλην του τελευταίου, εδώ ο E), η μία μετά την άλλη στην τυπική τους σειρά,
β. όλες οι κύριες επιδράσεις A − D καθώς και
γ. μία ακόμα στήλη που αφορά την προσδιορίζουσα εξίσωση εκπεφρασμένη ως προς τον τελευταίο παράγοντα (E = ABCD).
2. Για την εύρεση των προσήμων των A − D ακολουθούμε την υπόδειξη από τις θεραπείες της 1ης στήλης.
258
ΠΕΙΡΑΜΑΤΑ f ΠΑΡΑΓΟΝΤΩΝ ΜΕ 2 ΕΠΙΠΕΔΑ
3. Για την εύρεση των προσήμων της τελευταίας στήλης που αφορά την προσδιορίζουσα, κάνουμε τους πολλαπλασιασμούς μεταξύ των προσήμων στις στήλες των κύριων παραγόντων A − D που εμπεριέχονται στην
προσδιορίζουσα όταν αυτή είναι εκπεφρασμένη ως προς τον τελευταίο παράγοντα E.
4. Επιλέγουμε στην τύχη είτε τα θετικά είτε τα αρνητικά πρόσημα στην τελευταία στήλη.
5. Καταγράφουμε σε μία πρόσθετη στήλη στο τέλος, τις θεραπείες του 25−1 που αφορούν το πείραμα.
6. Προσδιορίζουμε όλες τις παραλλαγές πολλαπλασιάζοντας το αριστερό μέρος της προσδιορίζουσας διαδοχικά
με κάθε επίδραση και κάθε αλληλεπίδραση 1ης τάξης. Οι παραλλαγές που θα προκύψουν επιτρέπουν τον
προσδιορισμό της Ανάλυσης του σχεδιασμού (II - V ).
Ακολουθώντας την ειδική διαδικασία προκύπτει ο πιο κάτω σχεδιασμός με 16 θεραπείες (από το σύνολο των 32
του πλήρους 25 παραγοντικού πειράματος).
Πίνακας 9.23: Πίνακας Αλγεβρικών Προσήμων - Προσδιορίζουσα I = ABCDE
Επίδραση
A
B
C
D
E = ABCD
Θεραπεία 25−1
(1)
−
−
−
−
+
e
a
+
−
−
−
−
a
b
−
+
−
−
−
b
ab
+
+
−
−
+
abe
c
−
−
+
−
−
c
ac
+
−
+
−
+
ace
bc
−
+
+
−
+
bce
abc
+
+
+
−
−
abc
d
−
−
−
+
−
d
ad
+
−
−
+
+
ade
bd
−
+
−
+
+
bde
abd
+
+
−
+
−
abd
cd
−
−
+
+
+
cde
acd
+
−
+
+
−
acd
bcd
−
+
+
+
−
bcd
abcd
+
+
+
+
+
abcde
4
Θεραπεία 2
Είναι εύκολο να προσέξει κανείς ότι αν πολλαπλασιαστούν τα πρόσημα και των πέντε παραγόντων A − E σε κάθε
γραμμή, το αποτέλεσμα θα είναι πάντοτε (+), όπως θα ανέμενε κανείς λαμβάνοντας υπόψη ότι η προσδιορίζουσα
είναι η I = ABCDE.
Αν και είναι απλό να προσδιοριστούν πρώτα οι παραλλαγές του σχεδιασμού και μετά η Ανάλυση, ο κανόνας για
ΓΡΑΜΜΙΚΑ ΜΟΝΤΕΛΑ ΚΑΙ ΣΧΕΔΙΑΣΜΟΣ & ΑΝΑΛΥΣΗ ΠΕΙΡΑΜΑΤΩΝ ΜΕ ΕΦΑΡΜΟΓΕΣ ΣΕ R ΚΑΙ MINITAB
259
τον προσδιορισμό της Ανάλυσης είναι ο εξής:
Για την περίπτωση του κλασματικού 2f −1 παραγοντικού πειράματος, με προσδιορίζουσα τη μέγιστη αλληλεπίδραση, η Ανάλυση (Διακριτική Ικανότητα) είναι ίση με τον αριθμό των παραγόντων f (σε λατινική γραφή).
Με βάση τον κανόνα, η Ανάλυση του σχεδιασμού είναι V , αφού ο αριθμός των εμπλεκόμενων παραγόντων είναι f = 5.
Άσκηση Αυτοαξιολόγησης
Για το προηγούμενο παράδειγμα του 25−1 κλασματικού παραγοντικού πειράματος, να
προσδιοριστούν οι παραλλαγές και να επιβεβαιωθεί ότι η Ανάλυση είναι V .
Άσκηση Αυτοαξιολόγησης
Για το 24 παραγοντικό πείραμα με παράγοντες του A, B, C και D ζητείται να κατασκευαστεί το
24−1 κλασματικό παραγοντικό πείραμα με προσδιορίζουσα εξίσωση την I = ABCD,
αξιοποιώντας της ειδική βηματική διαδικασία του προηγούμενου παραδείγματος.
Για τον κλασματικό 25−1 παραγοντικό σχεδιασμό με προσδιορίζουσα I = ABCDE, εκτελέστηκαν 16 πειράματα με τις μετρήσεις να έχουν καταχωριστεί στον επόμενο Πίνακα ο οποίος ταυτίζεται με τον Πίνακα (9.23):
260
ΠΕΙΡΑΜΑΤΑ f ΠΑΡΑΓΟΝΤΩΝ ΜΕ 2 ΕΠΙΠΕΔΑ
Πίνακας 9.24: Πίνακας Αλγεβρικών Προσήμων - Προσδιορίζουσα I = ABCDE
Επίδραση
A
B
C
D
= BCD
Θεραπεία 25−1
0.63
−
−
−
−
+
e
2.51
+
−
−
−
−
a
2.68
−
+
−
−
−
b
1.66
+
+
−
−
+
abe
2.06
−
−
+
−
−
c
4.02
+
−
+
−
+
ace
−2.09
−
+
+
−
+
bce
1.93
+
+
+
−
−
abc
6.79
−
−
−
+
−
d
6.47
+
−
−
+
+
ade
3.45
−
+
−
+
+
bde
5.68
+
+
−
+
−
abd
5.22
−
−
+
+
+
cde
9.38
+
−
+
+
−
acd
4.30
−
+
+
+
−
bcd
4.05
+
+
+
+
+
abcde
Y
η ανάλυση διακύμανσης για τον οποίο δίνει τα ακόλουθα αποτελέσματα:
Πίνακας 9.25: Πίνακας ANOVA - Παράδειγμα 25−1 Κλασματικό Παραγοντικό Πείραμα
Πηγή
Μεταβλητότητας
Βαθμοί
Ελευθερίας
Άθροισμα
Τετραγώνων
A
1
10.017
B
1
C
Μέσο
F
p-value
10.017
7.08
0.024
14.861
14.861
10.50
0.009
1
0.062
0.062
0.04
0.838
D
1
63.76
63.76
45.04
0.000
E
1
8.88
8.88
6.27
0.031
Σφάλματα
10
14.157
1.4157
−
−
Ολική
15
111.738
−
−
−
Άθροισμα
Τετραγώνων
ΓΡΑΜΜΙΚΑ ΜΟΝΤΕΛΑ ΚΑΙ ΣΧΕΔΙΑΣΜΟΣ & ΑΝΑΛΥΣΗ ΠΕΙΡΑΜΑΤΩΝ ΜΕ ΕΦΑΡΜΟΓΕΣ ΣΕ R ΚΑΙ MINITAB
261
Τα αποτελέσματα δείχνουν ότι ο παράγοντας C δεν είναι στατιστικώς σημαντικός ( p-value = 0.838), ενώ από τα
σφάλματα φαίνεται ότι υπάρχουν 10 βαθμοί ελευθερίας με 14.157 μονάδες μεταβλητότητας, που σημαίνει ότι ίσως
αξίζει τον κόπο να αξιοποιηθούν κάποιοι από τους βαθμούς ελευθερίας για να αναζητηθούν σημαντικές αλληλεπιδράσεις (χωρίς να απαιτηθούν επαναλήψεις, δηλαδή με n = 1). Οι αλληλεπιδράσεις θα πρέπει να αναζητηθούν
μεταξύ αυτών της 1ης τάξης και από αυτές, που είναι συνολικά 10, μπορούν να μελετηθούν το πολύ 9 ώστε να μείνει
έστω ένας βαθμός ελευθερίας για τα σφάλματα. Αν υποθέσουμε ότι οι αλληλεπιδράσεις που εμπεριέχουν τον παράγοντα E δεν περιλαμβάνονται σε αυτές που ενδιαφέρουν τον Ερευνητή, τότε μπορούμε να προχωρήσουμε στη
μελέτη των υπόλοιπων έξι αλληλεπιδράσεων 1ης τάξης (AB, AC, AD, BC, BD και CD) μαζί με τις πέντε
κύριες επιδράσεις. Ο Πίνακας ANOVA που προκύπτει είναι:
Πίνακας 9.26: Πίνακας ANOVA - 25−1 Κλασματικό Παραγοντικό Πείραμα με Αλληλεπιδράσεις
Πηγή
Μεταβλητότητας
Βαθμοί
Ελευθερίας
Άθροισμα
Τετραγώνων
A
1
10.017
B
1
C
Μέσο
F
p-value
10.017
7.08
0.018
14.861
14.861
10.50
0.009
1
0.062
0.062
0.04
0.776
D
1
63.76
63.76
45.04
0.001
E
1
8.88
8.88
6.27
0.022
B
1
0.456
0.456
0.68
0.457
AC
1
3.168
3.168
4.71
0.096
AD
1
0.065
0.065
0.10
0.771
BC
1
5.712
5.712
8.49
0.044
BD
1
1.782
1.782
2.65
0.179
CD
1
0.281
0.281
0.42
0.553
Σφάλματα
4
2.692
0.673
−
−
Ολική
15
111.738
−
−
−
Άθροισμα
Τετραγώνων
Τα αποτελέσματα δείχνουν ότι από στατιστική πλευρά, άξιζε τον κόπο η διερεύνηση των αλληλεπιδράσεων 1ης τάξης
από όπου διαπιστώθηκε ότι δύο αλληλεπιδράσεις που περιέχουν τον παράγοντα C είναι στατιστικώς σημαντικές (
p-values = 0.044 και 0.096) έστω και αν η δεύτερη είναι σημαντική σε 10% και όχι στο σύνηθες 5% επίπεδο
σημαντικότητας. Ταυτόχρονα, ο Ερευνητής καλείται να αξιολογήσει από πρακτική πλευρά, τη σημαντικότητα των
δύο αυτών αλληλεπιδράσεων που από τον πιο πάνω πίνακα φαίνεται ότι η συμβολή τους στη μεταβλητότητα είναι σχετικά περιορισμένη και αφορά ένα 8% της συνολικής μεταβλητότητας (3.168 + 5.712 μονάδες σε σύνολο
111.738). Με βάση αυτό το σκεπτικό ο Ερευνητής δύναται να επιλέξει τελικά να μην συμπεριλάβει τις αλληλεπιδράσεις αυτές στο τελικό μοντέλο και τότε να πρέπει να απομακρύνει από το μοντέλο και τον παράγοντα C που
θα διατηρούνταν μόνον εφόσον έμενε κάποια από τις συγκεκριμένες αλληλεπιδράσεις. Ακολουθώντας αυτή την
προσέγγιση το τελικό μοντέλο θα μπορούσε να περιέχει 4 μόνο παράγοντες, τους A, B, D και E και ο Πίνακας
ANOVA να πάρει την εξής μορφή:
262
ΠΕΙΡΑΜΑΤΑ f ΠΑΡΑΓΟΝΤΩΝ ΜΕ 2 ΕΠΙΠΕΔΑ
Πίνακας 9.27: Πίνακας ANOVA - 25−1 Κλασματικό Παραγοντικό Πείραμα - Σημαντικές Κύριες Επιδράσεις
Πηγή
Μεταβλητότητας
Βαθμοί
Ελευθερίας
Άθροισμα
Τετραγώνων
A
1
10.017
B
1
D
Μέσο
F
p-value
10.017
7.75
0.018
14.861
14.861
11.50
0.006
1
63.76
63.76
49.33
0.000
E
1
8.88
8.88
6.87
0.024
Σφάλματα
11
14.219
1.293
−
−
Ολική
15
111.738
−
−
−
Άθροισμα
Τετραγώνων
Για τους σκοπούς αυτής της ανάλυσης θα επιλέξουμε να κρατήσουμε το μοντέλο με 5 κύριες επιδράσεις και τις 6
αλληλεπιδράσεις, ώστε μέσω της Ανάλυσης Παλινδρόμησης να προσδιορίσουμε τις τιμές των επιδράσεών τους και
αυτό για να έχει στη διάθεσή του ο Ερευνητής την πλήρη εικόνα, τόσο όλων των κύριων επιδράσεων όσο και των
αλληλεπιδράσεων που συμπεριλήφθηκαν στη μελέτη:
Πίνακας 9.28: Εκτιμητές Συντελεστών Παλινδρόμησης & Επιδράσεων - 25−1 Κλασματικό Παραγοντικό
Πείραμα με Αλληλεπιδράσεις
Όρος
Εκτιμητής
Τυπικό Σφάλμα
Ελεγχοσυνάρτηση t
p-value
Επίδραση
µ
3.671
0.205
17.90
0.000
—
A
0.791
0.205
3.86
0.018
1.582
B
−0.964
0.205
−4.70
0.009
−1.928
C
−0.062
0.205
−0.30
0.776
−0.124
D
1.996
0.205
9.73
0.000
3.992
E
−0.745
0.205
−3.63
0.031
−1.490
B
−0.169
0.205
−0.82
0.457
−0.338
AC
0.445
0.205
2.17
0.096
0.890
AD
−0.164
0.205
−0.31
0.771
−0.328
BC
−0.598
0.205
−2.91
0.044
−1.196
BD
−0.334
0.205
−1.63
0.179
−0.668
CD
0.133
0.205
0.65
0.553
0.266
Από την τελευταία στήλη όπου οι συντελεστές παλινδρόμησης έχουν διπλασιαστεί ώστε να προσδιοριστούν οι επιδράσεις όλων των εμπλεκόμενων παραγόντων, διαπιστώνεται ότι η σημαντικότερη επίδραση οφείλεται στον παράγοντα D (3.992), με τον παράγοντα A να έρχεται δεύτερος σε σημαντικότητα (1.582).
ΓΡΑΜΜΙΚΑ ΜΟΝΤΕΛΑ ΚΑΙ ΣΧΕΔΙΑΣΜΟΣ & ΑΝΑΛΥΣΗ ΠΕΙΡΑΜΑΤΩΝ ΜΕ ΕΦΑΡΜΟΓΕΣ ΣΕ R ΚΑΙ MINITAB
263
9.2.3 Κλάσματα μικρότερα του ενός δευτέρου
Για τη μελέτη κλασματικών σχεδιασμών μικρότερων του ενός δευτέρου απαιτείται η μελέτη πέντε τουλάχιστον παραγόντων με δύο επίπεδα έκαστος. Αυτό οφείλεται στο γεγονός ότι χρειάζεται να είναι διαθέσιμοι
αρκετοί βαθμοί ελευθερίας για τη μελέτη τουλάχιστον των κύριων επιδράσεων του πειράματος. Είναι προφανές ότι αν υπήρχαν διαθέσιμοι μόνο τέσσερις παράγοντες δύο επιπέδων έκαστος, τότε το πλήρες παραγοντικό
θα είχε 16 θεραπείες, το κλάσμα ενός δευτέρου 8, ενώ το κλάσμα ενός τετάρτου μόνο 4 που δεν θα αρκούσαν
για να αξιολογηθούν οι 4 κύριες επιδράσεις, αφού οι συνολικοί βαθμοί ελευθερίας θα ήταν 4 − 1 = 3. Αντίθετα, με πέντε κατ’ ελάχιστον παράγοντες, το κλάσμα ενός τετάρτου θα είχε 25 /4 = 8 θεραπείες που αρκούν
για τη μελέτη των 5 κύριων επιδράσεων.
Τα κλάσματα ενός τετάρτου 2f −2 προκύπτουν όταν το πλήρες παραγοντικό διασπαστεί σε τέσσερα κλάσματα
(δηλαδή σε τέσσερα τέταρτα) από τα οποία επιλέγεται το ένα. Για τον σκοπό αυτό χρησιμοποιούνται δύο παραγοντικές επιδράσεις, έστω P1 και P2 , οι οποίες συνήθως επιλέγονται να είναι δύο αλληλεπιδράσεις μεγάλης
τάξης και στις οποίες βασίζονται οι προσδιορίζουσες εξισώσεις του σχεδιασμού με σύγχυση με το μοναδιαίο
στοιχείο I, με το θετικό ή το αρνητικό πρόσημο:
I = ±P1 & I = ±P2 .
Είναι χαρακτηριστικό ότι οι δύο πιο πάνω προσδιορίζουσες που αναφέρονται και ως γεννήτριες του σχεδιασμού,
καθορίζουν έμμεσα μία τρίτη προσδιορίζουσα που αναφέρεται ως γενικευμένη αλληλεπίδραση και προκύπτει
από τον πολλαπλασιασμό των δύο παραγοντικών επιδράσεων που έχουν χρησιμοποιηθεί στον κλασματικό
σχεδιασμό:
I = ±P1 P2
η οποία υπολογίζεται όταν πολλαπλασιαστούν οι P1 και P2 καθώς και τα πρόσημά τους.
Είναι σημαντικό να αναφερθεί ότι οι τρεις συνολικά προσδιορίζουσες εξισώσεις του κλασματικού σχεδιασμού
του ενός τετάρτου καθορίζουν μονοσήμαντα την ανάλυση (διακριτική ικανότητα) του σχεδιασμού. Πράγματι,
έχει δειχθεί ότι η διακριτική ικανότητα (ανάλυση) ενός 2f −2 κλασματικού σχεδιασμού ισούται με τον ελάχιστο
αριθμό συμβόλων που περιέχονται μεταξύ των τριών προσδιοριζουσών εξισώσεων.
Για την εύρεση όλων των παραλλαγών ( aliases), πολλαπλασιάζουμε καθεμία από τις τρεις προσδιορίζουσες
εξισώσεις με τις κύριες επιδράσεις και τις αλληλεπιδράσεις.
Παράδειγμα 9.6. Έστω ότι σε πείραμα 5 παραγόντων A − E έχουν επιλεχθεί ως γεννήτριες οι I = −ABC
και I = +CDE για τον σχεδιασμό κλασματικού παραγοντικού πειράματος ενός τετάρτου. Ζητούνται η τρίτη
προσδιορίζουσα, η ανάλυση και το σύνολο των παραλλαγών ( aliases) του πειράματος.
Εύκολα προκύπτει ότι η έμμεση, τρίτη προσδιορίζουσα, είναι η:
I = −ABCCDE = −ABC 2 DE = −ABIDE = ABDE
με αποτέλεσμα τα σύμβολα σε κάθε προσδιορίζουσα να είναι 3, 3 και 4 και άρα η διακριτική ικανότητα του σχεδιασμού να είναι ίση με III.
Για τον προσδιορισμό των παραλλαγών, πολλαπλασιάζουμε καταρχάς κάθε προσδιορίζουσα με κάθε κύρια επίδραση:
A = BC, B = AC, C = AB, D = ABCD, E = ABCE,
A = ACDE, B = BCDE, C = DE, D = CE, E = CD,
264
ΠΕΙΡΑΜΑΤΑ f ΠΑΡΑΓΟΝΤΩΝ ΜΕ 2 ΕΠΙΠΕΔΑ
και
A = BDE, B = ADE, C = ABCDE, D = ABE, E = ABD.
Ήδη από τις παραπάνω παραλλαγές διαπιστώνουμε ότι έχουν εντοπιστεί όχι μόνο οι παραλλαγές για την κάθε κύρια επίδραση αλλά και αρκετές από τις παραλλαγές για κάποιες αλληλεπιδράσεις 1ης τάξης (μεταξύ 2 παραγόντων).
Πράγματι, πιο πάνω έχουν καταγραφεί κάποιες παραλλαγές για τις αλληλεπιδράσεις AB, AC, BC, CD, CE
και DE. Σημειώνεται ότι οι παραλλαγές για κάθε επίδραση (κύρια ή αλληλεπίδραση) είναι περισσότερες από μία,
όπως άλλωστε φαίνεται από το προηγούμενο παράδειγμα όπου π.χ. η A συγχέεται με καθεμία από τις αλληλεπιδράσεις BC, BDE και ACDE. Πράγματι, οι παραλλαγές που προκύπτουν είναι τόσες όσες και οι προσδιορίζουσες
εξισώσεις.
Οι παραλλαγές για τις υπόλοιπες αλληλεπιδράσεις 1ης τάξης προκύπτουν πολλαπλασιάζοντας καταλλήλως κάποιες
από τις πιο πάνω εξισώσεις. Για παράδειγμα, οι παραλλαγές για την αλληλεπίδραση AD προκύπτουν αν πολλαπλασιαστούν με D οι τρεις παραλλαγές της κύριας επίδρασης A που έχουν ήδη εντοπιστεί (A = BC, A = ACDE
και A = BDE):
AD = BE, AD = BCD, & AD = ACE.
Το ίδιο αποτέλεσμα θα προκύψει αν επιλεχθούν οι τρεις παραλλαγές που αφορούν την κύρια επίδραση D και πολλαπλασιαστούν με A.
Άσκηση Αυτοαξιολόγησης
Έστω το 26−2 κλασματικό παραγοντικό πείραμα με παράγοντες A − F και γεννήτορες τις
εξισώσεις I = −ABCE και I = −ACDF . Ζητούνται η τρίτη προσδιορίζουσα, η ανάλυση
και το σύνολο των παραλλαγών (aliases) του πειράματος.
Mε τη χρήση του Minitab είναι δυνατόν να σχεδιαστεί ένα κλασματικό πείραμα και να προσδιοριστούν όλες οι
παραλλαγές. Η διαδικασία που θα πρέπει να ακολουθηθεί είναι η ακόλουθη:
Stat
Ê
DOE
Ê
Factorial
Ê
Create Factorial Design
με τους πιο συνήθεις σχεδιασμούς να αντιστοιχούν στις επιλογές 2-level factorial design (default generators) και
2-level factorial design (specify generators). Στην πρώτη περίπτωση, επιλέγεται αυτόματα ο βέλτιστος σχεδιασμός, δηλαδή με προσδιορίζουσα την αλληλεπίδραση μέγιστης τάξης, ενώ στη δεύτερη ο Ερευνητής καθορίζει την
προσδιορίζουσα (ή προσδιορίζουσες) που επιθυμεί να αξιοποιήσει. Στην πρώτη περίπτωση θα πρέπει στην επιλογή Designs να επιλεχθεί/τικαριστεί το κλάσμα για τον σχεδιασμό (π.χ. 1/2 ή 1/4) και στη δεύτερη να επιλεχθεί/τικαριστεί το Full Design και να καταχωριστούν οι προτεινόμενοι γεννήτορες, στην επιλογή Generators.
9.2.4 Σχεδιασμοί ομαδοποίησης
Πριν κλείσουμε το παρόν κεφάλαιο, θα κάνουμε μία σύντομη αναφορά σε σχεδιασμούς ομαδοποίησης. Το κλάσμα του ενός δευτέρου αποτελεί μία ειδική περίπτωση με 2 ομάδες (δηλαδή τα δύο κλάσματα από τα οποία
επιλέγεται τυχαία το ένα).
Όπως είδαμε στις προηγούμενες ενότητες, για την κατασκευή ενός 2f −1 κλασματικού σχεδιασμού έπρεπε να
επιλεχθεί μία προσδιορίζουσα εξίσωση, ενώ για την κατασκευή ενός 2f −2 κλασματικού σχεδιασμού έπρεπε
να επιλεχτούν δύο προσδιορίζουσες εξισώσεις ή γεννήτορες (από τις οποίες προέκυψε έμμεσα και μία τρίτη
προσδιορίζουσα, η γενικευμένη αλληλεπίδραση). Με βάση τα παραπάνω μπορούμε γενικά να πούμε ότι για
την κατασκευή ενός 2f −p κλασματικού σχεδιασμού απαιτούνται p προσδιορίζουσες εξισώσεις και ισοδύναμα,
p γεννήτορες.
ΓΡΑΜΜΙΚΑ ΜΟΝΤΕΛΑ ΚΑΙ ΣΧΕΔΙΑΣΜΟΣ & ΑΝΑΛΥΣΗ ΠΕΙΡΑΜΑΤΩΝ ΜΕ ΕΦΑΡΜΟΓΕΣ ΣΕ R ΚΑΙ MINITAB
265
Στην περίπτωση που υπάρχει δυνατότητα διαχωρισμού και διενέργειας πειραμάτων σε ομάδες, έστω 2p , απαιτούνται p γεννήτορες μαζί με τις γενικευμένες αλληλεπιδράσεις τους. Έτσι, αν έχουμε το κλάσμα ενός δευτέρου θα έχουμε p = 1 προσδιορίζουσα (γεννήτορα) με 21 = 2 ομάδες (τα 2 κλάσματα από τα οποία επιλέγεται το ένα). Αν έχουμε κλάσμα ενός τετάρτου θα έχουμε p = 2 γεννήτορες και 22 = 4 ομάδες (τα τέσσερα
κλάσματα/τέταρτα του σχεδιασμού από τα οποία επιλέγεται το ένα). Στην τελευταία περίπτωση παρατηρούμε
ότι ο συνολικός αριθμός προσδιοριζουσών (μαζί με τη γενικευμένη αλληλεπίδραση) είναι 22 − 1 = 3. Έτσι,
γενικά για 2p ομάδες απαιτούνται p γεννήτορες και 2p − 1 προσδιορίζουσες εξισώσεις.
Σημειώνεται πάντως ότι για την επιλογή κατάλληλων τέτοιων σχεδιασμών ομαδοποίησης οι οποίοι να έχουν
υψηλή ανάλυση, έχουν προταθεί ειδικοί σχεδιασμοί με τον καθένα να έχει συγκεκριμένη ανάλυση, συγκεκριμένες προσδιορίζουσες και συγκεκριμένες ομαδοποιήσεις που καλύπτουν την πλειονότητα των αναγκών του
Ερευνητή. Εδώ, δεν θα επεκταθούμε περαιτέρω στο θέμα αυτό, αφού μία τέτοια ανάλυση ειδικών σχεδιασμών
ομαδοποίησης ξεφεύγει από τους σκοπούς του παρόντος συγγράματος.
9.3 Εφαρμογές στο Minitab
1. Σε μία μονάδα παραγωγής εφαρμόζεται ποιοτικός έλεγχος για την αξιολόγηση της παραγωγής και
τον εντοπισμό σημαντικών παραγόντων δύο επιπέδων έκαστος (χαμηλό & υψηλό), που επιδρούν στη
μεταβλητή απόκρισης. Οι παράγοντες προς αξιολόγηση με τα επίπεδά τους (με το πρώτο να αντιστοιχεί στο χαμηλό και το δεύτερο στο υψηλό επίπεδο) είναι: A: % λιπαρών (20, 30), B : PH (7, 8),
C : Μοντέλο (Α1, A2), Θερμοκρασία (20, 30), D : % Υγρασία (50, 60). Το πείραμα γίνεται με 4
επαναλήψεις και στον Πίνακα Δεδομένων έχει χρησιμοποιηθεί το σύμβολο 1 για να δηλώσει το υψηλό
επίπεδο και το σύμβολο 2 για να δηλώσει το χαμηλό επίπεδο κάθε παράγοντα.
i. Ζητείται να μελετηθούν όλες οι κύριες επιδράσεις καθώς και όλες οι αλληλεπιδράσεις για τον
εντοπισμό εκείνων που έχουν στατιστικώς σημαντική επίδραση στη μεταβλητή απόκρισης Y .
ii. Μετά την κατάλληλη κωδικοποίηση των τιμών των επιπέδων των παραγόντων, να επαναληφθεί
η μελέτη με τη χρήση κατάλληλου προτύπου παλινδρόμησης.
iii. Να επαναληφθεί η μελέτη του ερωτήματος ( i) μόνο για τους στατιστικώς σημαντικούς παράγοντες (συμπεριλαμβανομένων των αλληλεπιδράσεων) και να εκτιμηθούν οι τιμές των αντίστοιχων επιδράσεων.
iv. Ο Ερευνητής έκρινε ότι τα πειράματα που αναγκάστηκε να εκτελέσει ήταν πολλά (64) και έτσι
επιθυμεί να αξιολογήσει τα κλασματικά παραγοντικά πειράματα για να πειστεί για την αποτελεσματικότητά τους ώστε να τα χρησιμοποιεί αντί των σχεδίων πλήρους τυχαιοποίησης. Για
τον σκοπό αυτό αποφασίζει να επιλέξει έναν κλασματικό παραγοντικό σχεδιασμό ενός δευτέρου
(που να επιτρέπει την αξιολόγηση των ίδιων όρων που αναδείχθηκαν σημαντικοί στο πλήρες παραγοντικό) και να συγκρίνει τα αποτελέσματα με αυτά του πλήρους παραγοντικού πειράματος.
1. Να επιλέξετε ως προσδιορίζουσα εξίσωση του κλάσματος ενός δευτέρου τη σχέση I =
−BCD. Να εξηγήσετε γιατί είναι δυνατή η αξιολόγηση των ίδιων όρων που αναδείχθηκαν σημαντικοί στα ερωτήματα (i) έως (iii) και να προβείτε σε συγκριτικό σχολιασμό των
αποτελεσμάτων. Να προσδιοριστεί η Ανάλυση (Resolution) του κλασματικού σχεδίου.
2. Να επαναλάβετε το ερώτημα (iv(1)) χρησιμοποιώντας ως προσδιορίζουσα την αλληλεπίδραση μέγιστης τάξης. Να προσδιοριστεί η Ανάλυση (Resolution) του κλασματικού σχεδίου.
266
ΠΕΙΡΑΜΑΤΑ f ΠΑΡΑΓΟΝΤΩΝ ΜΕ 2 ΕΠΙΠΕΔΑ
Πίνακας 9.29: Πίνακας Δεδομένων - Μονάδα Παραγωγής - n = 4 επαναλήψεις
Θεραπείες
A
B
C
D
Y
abcd
1
1
1
1
36.1, 20.2, 18.2, 33.4
abc
1
1
1
2
32.1, 39.7, 22.1, 27.5
a
1
2
2
2
18.0, 16.0, 24.8, 27.9
b
2
1
2
2
37.0, 34.0, 38.0, 39.0
d
2
2
2
1
35.4, 31.2, 28.1, 39.0
cd
2
2
1
1
33.0, 36.0, 33.0, 37.0
abd
1
1
2
1
18.0, 15.0, 19.0, 22.0
acd
1
2
1
1
33.7, 27.8, 34.5, 30.2
ab
1
1
2
2
18.0, 15.0, 16.0, 29.1
bd
2
1
2
1
35.7, 31.2, 40.0, 44.2
bc
2
1
1
2
44.0, 37.0, 40.0, 41.5
c
2
2
1
2
32.9, 40.0, 41.0, 38.1
bcd
2
1
1
1
33.0, 36.0, 33.0, 40.0
ad
1
2
2
1
17.0, 19.0, 16.0, 22.0
ac
1
2
1
2
35.0, 30.0, 33.0, 31.0
(1)
2
2
2
2
36.0, 35.0, 35.0, 40.0
Ȫ
Λύση
i. Το πρόβλημα είναι ένα 24 παραγοντικό πείραμα που περιλαμβάνει 24 = 16 δυνατούς συνδυασμούς (θεραπείες, αγωγές, πληθυσμούς) μεταξύ των επιπέδων των τεσσάρων παραγόντων
A, B, C και D, καθένας εκ των οποίων χρησιμοποιήθηκε 4 φορές, δηλαδή το πείραμα εκτελέστηκε με 4 επαναλήψεις ανά θεραπεία. Το σύνολο των πειραμάτων που εκτελέστηκαν, όπως
φαίνεται και από τον Πίνακα Δεδομένων, είναι 64.
Το κατάλληλο πρότυπο με αλληλεπίδραση για τη μελέτη είναι το
yijkl = µ + αi + βj + γk + δl + (αβ)ij + (αγ)ik + (αδ)il + (βγ)jk + (βδ)jl + (γδ)kl
+ (αβγδ)ijkl + (αβγ)ijk + (αβδ)ijl + (αγδ)ikl
(9.11)
+ (βγδ)jkl + ϵijklm , i, j, k, l = 1, 2, m = 1, ..., 4.
Σημειώνεται ότι αφού το πείραμα εκτελείται με επανάληψη, είναι δυνατή (και συστήνεται) η
μελέτη των αλληλεπιδράσεων όλων των τάξεων (όπως φαίνεται από το πρότυπο είναι συνολικά
11). Ακόμα και αν το πείραμα δεν γινόταν με επανάληψη, δηλαδή αν είχαν εκτελεστεί 16 μόνο
πειράματα (με 16 − 1 = 15 συνολικά βαθμούς ελευθερίας), θα μπορούσαν, επιπρόσθετα των 4
ΓΡΑΜΜΙΚΑ ΜΟΝΤΕΛΑ ΚΑΙ ΣΧΕΔΙΑΣΜΟΣ & ΑΝΑΛΥΣΗ ΠΕΙΡΑΜΑΤΩΝ ΜΕ ΕΦΑΡΜΟΓΕΣ ΣΕ R ΚΑΙ MINITAB
267
κύριων επιδράσεων, να μελετηθούν κάποιες αλληλεπιδράσεις που θα ενδιέφεραν τον Ερευνητή,
αλλά μόνο τόσες ώστε να περίσσευε τουλάχιστον ένας βαθμός ελευθερίας για τα σφάλματα ώστε
να μπορούν να πραγματοποιηθούν οι αναγκαίοι έλεγχοι του προτύπου.
Η μελέτη του προτύπου γίνεται στο Minitab μέσω της διαδρομής:
Stat
Ê
ANOVA
Ê
General Linear Model
Ê
Fit General Linear Model
με τη μεταβλητή απόκρισης Y να τίθεται στο Responses και τους παράγοντες A − D στα
Factors. Σημειώνεται ότι για την περίπτωση του προτύπου με αλληλεπίδραση, θα πρέπει στο
Model
να επιλεχθούν οι 4 παράγοντες και να τικαριστεί η επιλογή Interactions through order 4
ώστε να περιληφθούν στο μοντέλο όλες οι αλληλεπιδράσεις, ενώ στο Random/Nest θα πρέπει
να καθοριστεί το Type όλων των εμπλεκόμενων παραγόντων (εδώ είναι όλες Fixed με 2 ακριβώς
επίπεδα). Σημειώνεται ότι το Minitab με τον όρο order 4 θεωρεί τις αλληλεπιδράσεις με 4 παράγοντες και γενικά χρησιμοποιεί (όπως φαίνεται και στην επιλογή Model) τους όρους order 2, 3
και 4 για τις αλληλεπιδράσεις μεταξύ 2, 3 και 4 παραγόντων όταν στο παρόν εγχειρίδιο έχουμε
επιλέξει οι αντίστοιχες αλληλεπιδράσεις να αναφέρονται ως αλληλεπιδράσεις τάξης 1, 2 και 3. Τα
αποτελέσματα της Ανάλυσης Διακύμανσης είναι τα εξής:
Πίνακας 9.30: Πίνακας ANOVA - Μονάδα Παραγωγής
Από τα αποτελέσματα φαίνεται ότι εκτός από τον παράγοντα B, οι υπόλοιποι τρεις παράγοντες
είναι όλοι σημαντικοί ( p-values από 0.000 για τους A και C έως 0.046 για τον παράγοντα D).
Από την άλλη πλευρά, αν και οι περισσότερες αλληλεπιδράσεις δεν είναι στατιστικώς σημαντικές ( p-values από 0.260 για την αλληλεπίδραση BCD μέχρι 0.923 για την αλληλεπίδραση
μέγιστης τάξης), υπάρχουν δύο που μπορούν να θεωρηθούν στατιστικώς σημαντικές, δηλαδή
η αλληλεπίδραση AC με p-value 0.000 και η AB με p-value 0.075, που αν και δεν είναι σημαντική στο σύνηθες επίπεδο σημαντικότητας 5%, δεν μπορεί να αγνοηθεί και συστήνεται να
268
ΠΕΙΡΑΜΑΤΑ f ΠΑΡΑΓΟΝΤΩΝ ΜΕ 2 ΕΠΙΠΕΔΑ
συμπεριληφθεί σε οποιαδήποτε περαιτέρω μελέτη.
Έχοντας επιλέξει στα Results τα Default Coefficients, το Minitab δίνει τους εκτιμητές των συντελεστών:
Πίνακας 9.31: Συντελεστές ANOVA - Μονάδα Παραγωγής
Υπενθυμίζεται ότι λόγω των σχέσεων που συνδέουν τους συντελεστές, με το άθροισμά τους
ανά επίδραση να ισούται με το μηδέν, το Minitab δίνει ανά περίπτωση, όλους τους συντελεστές πλην ενός, ο υπολογισμός του οποίου προκύπτει από το άθροισμα όλων των υπολοίπων
με αντίθετο πρόσημο. Για παράδειγμα, αφού ο εκτιμητής για το επίπεδο 1 του παράγοντα A
είναι ίσος με A1 = −5.891 συμπεραίνουμε ότι ο εκτιμητής για το 2ο επίπεδο του ίδιου παράγοντα, είναι A2 = 5.891, ώστε το άθροισμα των δύο αυτών συντελεστών να ισούται με μηδέν. Αξίζει να παρατηρηθεί ότι ακόμα και για τους όρους των αλληλεπιδράσεων, το Minitab
καταγράφει μία μόνο τιμή (π.χ. για την αλληλεπίδραση μεταξύ A και B δίνεται μόνο η τιμή
d
(αβ)
11 = A ∗ B11 = −1.053). Αυτό συμβαίνει γιατί οι συντελεστές που αφορούν τις
αλληλεπιδράσεις αθροίζουν στο μηδέν ξεχωριστά για κάθε εμπλεκόμενο παράγοντα. Έτσι, για
παράδειγμα, για την αλληλεπίδραση μεταξύ των A και B προκύπτουν με βάση τον συντελεστή
ΓΡΑΜΜΙΚΑ ΜΟΝΤΕΛΑ ΚΑΙ ΣΧΕΔΙΑΣΜΟΣ & ΑΝΑΛΥΣΗ ΠΕΙΡΑΜΑΤΩΝ ΜΕ ΕΦΑΡΜΟΓΕΣ ΣΕ R ΚΑΙ MINITAB
269
A ∗ B11 = −1.053 (που δίνεται στο output), οι εξής εκτιμητές:
d
d
(αβ)
21 = A ∗ B21 = +1.053, (αβ)12 = A ∗ B12 = +1.053
d
& (αβ)
22 = A ∗ B22 = −1.053.
Αν ο Ερευνητής επιθυμεί να καταγραφούν στο output όλοι οι εκτιμητές, αρκεί στα Results να
επιλέξει το Full Set of Coefficients.
Επίσης, μπορούν να επιλεγούν στα Options οι όροι για τους οποίους επιθυμεί ο Ερευνητής να
καταγραφούν οι μέσες τιμές. Οι κλασικές επιλογές είναι για τις κύριες επιδράσεις, τις αλληλεπιδράσεις 1ης τάξης (ανά δύο) και όλους τους όρους του προτύπου, αν και υπάρχει και η δυνατότητα να επιλεχθούν συγκεκριμένοι όροι ( Specified Terms). Εδώ, έχει επιλεχθεί η περίπτωση
των κύριων επιδράσεων (Main Effects) που δίνει τα εξής αποτελέσματα:
Πίνακας 9.32: Μέσες Τιμές Επιπέδων - Μονάδα Παραγωγής
Tα αποτελέσματα της ανάλυσης υποδεικνύουν ότι θα πρέπει το ιδανικό πρότυπο να περιλαμβάνει τους παράγοντες A, C και D, τις αλληλεπιδράσεις AC και AB και αναγκαστικά τον
παράγοντα B, λόγω της σημαντικότητας της αλληλεπίδρασης AB, η οποία τον περιλαμβάνει. Επαναλαμβάνοντας την ίδια διαδικασία με προηγουμένως, και μόνο με αυτούς τους όρους
(επιλέγοντας κατάλληλα τις συγκεκριμένες μόνο αλληλεπιδράσεις στο Model), έχουμε τα πιο
κάτω αποτελέσματα:
Πίνακας 9.33: Πίνακας ANOVA - Σημαντικές Επιδράσεις - Μονάδα Παραγωγής
270
ΠΕΙΡΑΜΑΤΑ f ΠΑΡΑΓΟΝΤΩΝ ΜΕ 2 ΕΠΙΠΕΔΑ
Τα αποτελέσματα έχουν ελαφρώς διαφοροποιηθεί σε σχέση με προηγουμένως, όσον αφορά τις
τιμές της ελεγχοσυνάρτησης F (και κατ’ επέκταση τις p-values) και αυτό γιατί έχουν διαφοροποιηθεί το SSE και οι αντίστοιχοι βαθμοί ελευθερίας. Υπενθυμίζεται ότι αυτό έγινε λόγω
του ότι από το τελικό πρότυπο απομακρύνθηκαν όλοι οι όροι που βρέθηκαν στατιστικώς μη
σημαντικοί, με αποτέλεσμα τα αθροίσματα τετραγώνων που αντιστοιχούσαν σε αυτούς (και οι
αντίστοιχοι βαθμοί ελευθερίας) να προστεθούν στο αρχικό άθροισμα τετραγωνικών σφαλμάτων SSE (και τους αρχικούς βαθμούς ελευθερίας που αντιστοιχούσαν σε αυτό). Πράγματι, το
SSE από 1028.72 μονάδες και 48 βαθμούς ελευθερίας έγινε τώρα SSE = 1089.18 με 57
βαθμούς ελευθερίας. Ως αποτέλεσμα, ο εκτιμητής της διασποράς σ 2 από 21.43 στο αρχικό μοντέλο, μειώθηκε σε 19.11. Σημειώνεται ότι αν και το M SE μειώθηκε, οι p-values δεν βελτιώθηκαν (μειώθηκαν) και αυτό γιατί η κατανομή F βασίζεται τώρα σε 1 και 57 έναντι 1 και 48 βαθμούς ελευθερίας που αντιστοιχούσαν προηγουμένως. Παρατηρούμε ότι το Minitab καταγράφει
με σαφήνεια τη διαφοροποίηση μεταξύ του πλήρους παραγοντικού και εκείνου με τους σημαντικούς όρους. Πράγματι, η γραμμή του Πίνακα ANOVA με τίτλο Lack of Fit, αφορά ακριβώς τη
μεταβλητότητα και τους βαθμούς ελευθερίας αθροιστικά όλων των όρων που έχουν αποκλειστεί
από το τελικό πρότυπο. Η μαθηματική σχέση του τελικού μοντέλου είναι η εξής:
Θα πρέπει να τονιστεί ότι το πιο πάνω μοντέλο, όπως δίνεται στο output της διαδικασίας ANOVA
και τιτλοφορείται Regression Equation, μπορεί να χρησιμοποιηθεί για σκοπούς εκτίμησης της
μεταβλητής απόκρισης, αλλά αυτό θα πρέπει να γίνει λαμβάνοντας υπόψη τα επίπεδα των παραγόντων στα οποία θα εκτελεστεί το πείραμα για το οποίο επιθυμεί ο Ερευνητής την εκτίμηση
της μεταβλητής απόκρισης. Έτσι, για τον υπολογισμό της εκτίμησης ŷ θα πρέπει να χρησιμοποιηθούν μόνον οι όροι του μοντέλου που αντιστοιχούν στα επίπεδα των παραγόντων στα οποία
εκτελείται το πείραμα, δηλαδή θα πρέπει να χρησιμοποιηθούν μόνο οι όροι που αντιστοιχούν στη
συγκεκριμένη θεραπεία, ενώ όλοι οι υπόλοιποι πρέπει να αγνοηθούν. Για παράδειγμα, αν ζητείται η εκτίμηση ŷ1122 , όταν δηλαδή η θεραπεία είναι η ab με τους παράγοντες A και B στο υψηλό
(επίπεδο 1) και C και D στο χαμηλό επίπεδο (επίπεδο 2), τότε θα πρέπει να αγνοηθούν από το
πιο πάνω μοντέλο, όλοι οι όροι που περιλαμβάνουν τα A2, B2, C1 και D1 (στις αλληλεπιδράσεις τα επίπεδα καταγράφονται όλα μαζί στο τέλος, έτσι ο όρος A∗ C_12 αφορά το επίπεδο 1 του
A και στο επίπεδο 2 του C) και να χρησιμοποιηθούν μόνον οι υπόλοιποι, λαμβάνοντας υπόψη
μόνο την τιμή του συντελεστή χωρίς το συνοδεύον σύμβολο (A1, B1, C2 και D2):
ŷ1122 = 30.806 − 5.891 − 0.025 − 2.944 + 1.184 − 1.053 − 2.422 = 19.6563.
Η συγκεκριμένη τιμή μπορεί να επιβεβαιωθεί αν ο Ερευνητής ζητήσει να καταχωριστούν οι εκτιμώμενες τιμές της μεταβλητής απόκρισης, στο κεντρικό παράθυρο του Minitab, τικάροντας την
επιλογή Fits στο Storage.
ii. Για να επαναληφθεί η διαδικασία με τη χρήση ενός προτύπου παλινδρόμησης, απαιτείται η κατάλληλη κωδικοποίηση των επιπέδων των εμπλεκόμενων παραγόντων. Για την κωδικοποίηση θα
πρέπει να χρησιμοποιηθούν αποκλειστικά οι κωδικοί −1 και +1. Ο λόγος για τη συγκεκριμένη
κωδικοποίηση είναι ότι επιτρέπει τη σωστή αποτύπωση των αλληλεπιδράσεων στο πρότυπο (οι
οποίες εμπλέκονται στο μοντέλο ως ανεξάρτητες μεταβλητές), οι τιμές των οποίων προκύπτουν
με πολλαπλασιασμό των αντίστοιχων κωδικών των εμπλεκόμενων παραγόντων. Ακόμα και αν
δεν γίνει η ίδια αντιστοίχιση των αρχικών τιμών των επιπέδων με τις κωδικοποιημένες τιμές
ΓΡΑΜΜΙΚΑ ΜΟΝΤΕΛΑ ΚΑΙ ΣΧΕΔΙΑΣΜΟΣ & ΑΝΑΛΥΣΗ ΠΕΙΡΑΜΑΤΩΝ ΜΕ ΕΦΑΡΜΟΓΕΣ ΣΕ R ΚΑΙ MINITAB
271
(δηλαδή ακόμα και αν για όλους τους παράγοντες, το −1 αντιστοιχιστεί με το υψηλό και το 1
με το χαμηλό επίπεδο), τα αποτελέσματα θα είναι τα ίδια, με μόνη διαφορά ότι οι εκτιμητές των
επιδράσεων θα έχουν αντίθετα πρόσημα. Για να έχουμε τους ίδιους ακριβώς εκτιμητές (δηλαδή
με τα ίδια πρόσημα και όχι αντίθετα με το ερώτημα (α)) θα πρέπει να αντιστοιχιστεί το επίπεδο 1 για κάθε παράγοντα, με το υψηλό του επίπεδο, δηλαδή με τον κωδικό +1 (και να μην
αλλάξει η αρχική κωδικοποίηση) ενώ το επίπεδο 2 θα πρέπει να αντιστοιχιστεί με το χαμηλό επίπεδο, δηλαδή με τον κωδικό −1 (και να αλλάξει η κωδικοποίηση από 2 σε −1). Προφανώς, ο
Ερευνητής θα μπορούσε από την αρχή να έχει προβλέψει την ανάγκη μελέτης με το πρότυπο
παλινδρόμησης και να είχε εξαρχής προβεί σε αυτή την κωδικοποίηση. H αντιστοίχιση γίνεται
ακολουθώντας την πιο κάτω διαδρομή, δημιουργώντας 4 νέες στήλες/μεταβλητές στο κεντρικό
παράθυρο του Minitab:
Data
Ê
Recode
Ê
To Numeric
όπου θα πρέπει να καταχωριστούν στο Recode Values in the Following Columns: οι μεταβλητές/στήλες, οι τιμές των οποίων θα πρέπει να κωδικοποιηθούν. Επίσης, θα πρέπει να δηλωθεί
στο Method ο τρόπος με τον οποίο θα γίνει η κωδικοποίηση. Εδώ έχει χρησιμοποιηθεί η επιλογή
Recode Individual Values. Άλλες δημοφιλείς επιλογές είναι: Recode Ranges of Values για την αντικατάσταση εύρους τιμών με έναν κωδικό και Recode a Single Value για την κωδικοποίηση μίας
και μοναδικής τιμής (με όλες τις άλλες αμετάβλητες). Αυτή η τελευταία περίπτωση θα μπορούσε
να χρησιμοποιηθεί και στην παρούσα περίπτωση, αφού το επίπεδο 1 ουσιαστικά διατήρησε την
τιμή 1 και μετά την κωδικοποίηση, ενώ μόνο το επίπεδο 2 άλλαξε τιμή. Τέλος, είναι αναγκαίο να
δηλωθεί στο Storage το Location of the Recoded Columns, δηλαδή σε ποιο σημείο στο κεντρικό
παράθυρο θα καταχωριστούν οι νέες (κωδικοποιημένες) μεταβλητές. H ασφαλέστερη επιλογή
είναι At the End of the Current Worksheet ώστε να βρίσκονται στο ίδιο φύλλο εργασίας ( Worksheet) με όλες τις άλλες μεταβλητές, αλλά ταυτόχρονα να διατηρηθούν στο φύλλο εργασίας και οι
αρχικές μεταβλητές/στήλες, για μελλοντική χρήση. Η λιγότερο ασφαλής επιλογή είναι η In the
Original Columns γιατί τότε διαγράφονται τα αρχικά δεδομένα και αντικαθίστανται από τις νέες
(κωδικοποιημένες) τιμές. Οι νέες μεταβλητές διατηρούν το αρχικό τους όνομα με την προσθήκη
του όρου Recoded. Στην περίπτωσή μας, οι νέες μεταβλητές μετά την κωδικοποίηση των A-D,
ονομάζονται Recoded A - Recoded D. Η καταχώριση των νέων μεταβλητών στο κεντρικό
παράθυρο του Minitab συνοδεύεται και από το εξής output:
Πίνακας 9.34: Κωδικοποίηση Επιπέδων Παραγόντων - Μονάδα Παραγωγής
Μετά την ολοκλήρωση της κωδικοποίησης και τη δημιουργία των νέων μεταβλητών Recoded A
- Recoded D, εφαρμόζεται η διαδικασία παλινδρόμησης με τη διαδρομή
Stat
Ê
Regression
Ê
Regression
Ê
Fit Regression Model
272
ΠΕΙΡΑΜΑΤΑ f ΠΑΡΑΓΟΝΤΩΝ ΜΕ 2 ΕΠΙΠΕΔΑ
όπου στα Continuous Predictors θα πρέπει να επιλεχθούν οι νέες Recoded Μεταβλητές, ενώ στο
Model θα πρέπει να επιλεχθούν όλες οι αλληλεπιδράσεις μεταξύ δύο, τριών και τεσσάρων παραγόντων, δηλαδή 1ης , 2ης και 3ης τάξης ( Interactions through Order 4, όπως επιλέγει να τις
ονομάζει το Minitab). Tα αποτελέσματα είναι ταυτόσημα με αυτά της διαδικασίας ANOVA στο
ερώτημα (α) και οδηγούν στην ανάδειξη των ίδιων ακριβώς σημαντικών επιδράσεων και αλληλεπιδράσεων (όπου χρησιμοποιούνται οι νέες ονομασίες των μεταβλητών, με τον χαρακτηρισμό
Recoded). Στα αποτελέσματα, η μόνη διαφορά είναι ότι η διαδικασία Regression δίνει και τα βασικά στατιστικά χαρακτηριστικά των συντελεστών παλινδρόμησης (τυπικό σφάλμα, τιμές ελεγχοσυνάρτησης για τη σημαντικότητα των συντελεστών και τις αντίστοιχες p-values). Πιο κάτω
καταγράφονται τα χαρακτηριστικά των συντελεστών παλινδρόμησης για το αρχικό πλήρες παραγοντικό πείραμα:
Πίνακας 9.35: Συντελεστές Παλινδρόμησης - Μονάδα Παραγωγής
iii. Tο τελικό πρότυπο παλινδρόμησης το οποίο περιλαμβάνει μόνο τις σημαντικές επιδράσεις και
αλληλεπιδράσεις είναι το εξής:
Πίνακας 9.36: Συντελεστές Παλινδρόμησης - Σημαντικές Επιδράσεις - Μονάδα Παραγωγής
Υπενθυμίζεται ότι οι εκτιμητές των συντελεστών παραμένουν ίδιοι στο τελικό πρότυπο αλλά οι
λοιπές ποσότητες διαφοροποιούνται, έστω και ελαφρώς, λόγω του ότι το άθροισμα των τετραγωνικών σφαλμάτων SSE και οι βαθμοί ελευθερίας του, έχουν αλλάξει στο τελικό πρότυπο (όπως
ΓΡΑΜΜΙΚΑ ΜΟΝΤΕΛΑ ΚΑΙ ΣΧΕΔΙΑΣΜΟΣ & ΑΝΑΛΥΣΗ ΠΕΙΡΑΜΑΤΩΝ ΜΕ ΕΦΑΡΜΟΓΕΣ ΣΕ R ΚΑΙ MINITAB
273
αναφέρθηκε και προηγουμένως στον σχολιασμό των αποτελεσμάτων της Ανάλυσης Διακύμανσης). Στη συγκεκριμένη εφαρμογή παρατηρούμε μία αμυδρή διαφοροποίηση σε τρεις p-values
η οποία τυχαίνει να ενισχύει περαιτέρω τη σημαντικότητα των επιλεχθέντων όρων (δεν είναι
όμως απαραίτητο να συμβαίνει πάντα αυτό), αφού οι p-values για τον παράγοντα D (δηλαδή
Recoded D) και την αλληλεπίδραση A (δηλαδή Recoded AB) μειώθηκαν ελαφρώς από
0.046 και 0.075 σε 0.034 και 0.059 αντιστοίχως.
Σχετικά με τις εκτιμήτριες των επιδράσεων των παραγόντων A − D και των δύο σημαντικών
αλληλεπιδράσεων AB και AC, υπενθυμίζεται ότι αυτές προκύπτουν αν διπλασιαστούν οι εκτιμητές των συντελεστών παλινδρόμησης των αντίστοιχων όρων (είτε στο αρχικό είτε στο τελικό
προτεινόμενο πρότυπο παλινδρόμησης). Έτσι έχουμε:
A = 2 × (−5.891) = −11.782, B = −0.050, C = 5.888,
AB = −2.106 & AC = 4.844,
D = −2.368,
με τον εκτιμητή του γενικού μέσου όρου να δίνεται από τη σταθερά του προτύπου παλινδρόμησης:
µ̂ = 30.806.
Η μαθηματική σχέση του τελικού μοντέλου παλινδρόμησης είναι η εξής:
Αξίζει να αναφερθεί ότι αν και οι διαδικασίες της Ανάλυσης Διακύμανσης και Ανάλυσης Παλινδρόμησης για τα 2f παραγοντικά πειράματα οδηγούν στα ίδια ακριβώς αποτελέσματα, εφόσον
έχουν γίνει οι κατάλληλες κωδικοποιήσεις με τις τιμές −1 και +1, υπάρχει μία σημαντική διαφορά η οποία πρέπει να τύχει σχολιασμού. Η διαφορά αφορά τον τρόπο καταγραφής του προτύπου (είτε του αρχικού είτε του τελικού) στις δύο αυτές προσεγγίσεις και τον τρόπο που αυτό
μπορεί να αξιοποιηθεί για τον υπολογισμό των εκτιμώμενων τιμών της μεταβλητής απόκρισης.
Όπως είναι φανερό, η μαθηματική εξίσωση που προέκυψε πιο πάνω για το τελικό πρότυπο, από
την ανάλυση παλινδρόμησης, δεν είναι ίδια με αυτή που είχε προκύψει νωρίτερα μέσω της ανάλυσης διακύμανσης. Στην περίπτωση της παλινδρόμησης, για κάθε κύριο παράγοντα εμφανίζεται
μόνο ένας όρος (ενώ πριν υπήρχαν δύο) και για κάθε αλληλεπίδραση (από τις δύο που εμπλέκονται στο τελικό πρότυπο) εμφανίζεται και πάλι μόνο ένας όρος (ενώ πριν υπήρχαν τέσσερις).
Αυτή η διαφοροποίηση οφείλεται στη φιλοσοφία των δύο τεχνικών με την ανάλυση παλινδρόμησης να χαρακτηρίζει τόσο τις κύριες επιδράσεις όσο και τις αλληλεπιδράσεις ως ανεξάρτητες
μεταβλητές, με καθεμία να έχει δύο δυνατές τιμές (επιδέξια επιλεγμένες να είναι ίσες με −1 και
+1). Αυτό έχει ως αποτέλεσμα να πρέπει να εντοπιστεί ο συντελεστής παλινδρόμησης για κάθε
όρο ξεχωριστά, με τέτοιο τρόπο που θα προκύπτουν οι σωστές εκτιμήσεις της μεταβλητής απόκρισης για οποιονδήποτε συνδυασμό τιμών των ανεξάρτητων μεταβλητών. Έτσι, για να προκύψει στο πρότυπο παλινδρόμησης η εκτιμώμενη τιμή ŷ1122 = 19.6563 που είχε υπολογιστεί
νωρίτερα στο πρότυπο διακύμανσης, θα πρέπει στη πιο πάνω εξίσωση για τις έξι ανεξάρτητες
μεταβλητές, να χρησιμοποιηθούν οι εξής τιμές:
Recode A = 1, Recode B = 1, Recode C = −1, Recode D = −1
και
Recode A∗ Recode B = 1 × 1 = 1 & Recode A∗ Recode C = 1 × (−1) = −1.
274
ΠΕΙΡΑΜΑΤΑ f ΠΑΡΑΓΟΝΤΩΝ ΜΕ 2 ΕΠΙΠΕΔΑ
και έτσι να προκύψει ότι
ŷ1122 = 30.806 − (5.891 × 1) − (0.025 × 1) + (2.944 × (−1)) − (1.184 × (−1))
− (1.053 × 1) + (2.422 × (−1)) = 19.6563.
iv1. Στο τελευταίο μέρος της εφαρμογής ο Ερευνητής ζητάει να απλοποιήσει το πείραμα και να εκτελέσει ένα παραγοντικό πείραμα ενός δευτέρου έτσι ώστε αντί για τις συνολικά 16 θεραπείες να
μελετήσει μόνο τις μισές, με τέσσερις επαναλήψεις την καθεμία. Άρα, τελικά θα γίνουν 32 αντί
64 εκτελέσεις του πειράματος. Στόχος του είναι να μελετηθούν όλες οι κύριες επιδράσεις αλλά να
μπορέσει να αξιολογήσει και τις συγκεκριμένες αλληλεπιδράσεις που χαρακτηρίστηκαν προηγουμένως ως σημαντικές, δηλαδή τις αλληλεπιδράσεις AB και AC.
Αν και στην πράξη δεν είναι ποτέ δυνατόν να έχουμε μία τόσο σαφή εικόνα για τις σημαντικές αλληλεπιδράσεις, ο Ερευνητής εδώ, θέλει να πειστεί ότι υπάρχει κατάλληλος κλασματικός
σχεδιασμός ενός δευτέρου (2f −1 = 23 ) που να μπορεί να είναι εφάμιλλος του πλήρους παραγοντικού. Από τη θεωρία που έχει αναπτυχθεί νωρίτερα, γνωρίζουμε ότι οι αποτελεσματικότεροι
κλασματικοί σχεδιασμοί είναι αυτοί που έχουν την υψηλότερη Ανάλυση ( Resolution) και επίσης
γνωρίζουμε ότι ο αποτελεσματικότερος όλων είναι εκείνος που η προσδιορίζουσα εξίσωση βασίζεται στην αλληλεπίδραση της μέγιστης τάξης, δηλαδή για τη συγκεκριμένη εφαρμογή, την
αλληλεπίδραση τάξης 3 με τους τέσσερις παράγοντες, I = ABCD, χωρίς να έχει σημασία αν
θα επιλεχθεί (τυχαία) το θετικό ή το αρνητικό πρόσημο (εδώ θα επιλεχθεί το θετικό πρόσημο).
Βασιζόμενοι στη θεωρία, γνωρίζουμε ότι η Ανάλυση του συγκεκριμένου σχεδιασμού είναι ίση με
IV , δηλαδή ίση με τον αριθμό f = 4 των εμπλεκόμενων παραγόντων.
Εφαρμόζοντας την ειδική βηματική διαδικασία (βήματα 1 - 6), όπως ακριβώς περιγράφηκε στο
Παράδειγμα 9.5 της Ενότητας 9.2.2, αλλά με τέσσερις αντί πέντε παράγοντες, έχουμε:
Πίνακας 9.37: Πίνακας Αλγεβρικών Προσήμων - Μονάδα Παραγωγής - Προσδιορίζουσα I = ABCD
Επίδραση
A
B
C
D = ABC
Θεραπεία 24−1
(1)
−
−
−
−
(1)
a
+
−
−
+
ad
b
−
+
−
+
bd
ab
+
+
−
−
ab
c
−
−
+
+
cd
ac
+
−
+
−
ac
bc
−
+
+
−
bc
abc
+
+
+
+
abcd
3
Θεραπεία 2
Υπενθυμίζεται ότι με βάση τις θεραπείες του 23 κλάσματος, στην 1η στήλη τοποθετούνται οι
θεραπείες, στις 3 επόμενες τα πρόσημα που αντιστοιχούν στους παράγοντες A, B και C, ενώ η
στήλη για το D προκύπτει κάνοντας τον πολλαπλασιασμό των προσήμων με βάση την προσδιορίζουσα, όπως έχει καταγραφεί στη στήλη για τον παράγοντα D: I = ABCD → D =
ΓΡΑΜΜΙΚΑ ΜΟΝΤΕΛΑ ΚΑΙ ΣΧΕΔΙΑΣΜΟΣ & ΑΝΑΛΥΣΗ ΠΕΙΡΑΜΑΤΩΝ ΜΕ ΕΦΑΡΜΟΓΕΣ ΣΕ R ΚΑΙ MINITAB
275
ABC. Εύκολα μπορεί να διαπιστώσει κανείς ότι αν πολλαπλασιαστούν και τα τέσσερα πρόσημα των τεσσάρων παραγόντων στον πιο πάνω πίνακα, το αποτέλεσμα θα είναι συνέχεια θετικό και θα αντιστοιχεί στον μοναδιαίο όρο I, και άρα στην επιθυμητή προσδιορίζουσα εξίσωση
I = ABCD. Ο πιο πάνω πίνακας δίνει τις 8 θεραπείες στις οποίες θα πρέπει να εκτελεστεί το
24−1 κλάσμα του αρχικού πλήρους παραγοντικού πειράματος.
Mε τη χρήση του Minitab είναι δυνατόν να σχεδιαστεί το πιο πάνω κλασματικό πείραμα και να
προσδιοριστούν όλες οι παραλλαγές. Η διαδικασία που θα πρέπει να ακολουθηθεί είναι η ακόλουθη:
Stat
Ê
DOE
Ê
Factorial
Ê
Create Factorial Design
με την επιλογή 2-level factorial design (default generators) να επιλέγει αυτόματα τον βέλτιστο
σχεδιασμό, δηλαδή με προσδιορίζουσα την αλληλεπίδραση μέγιστης τάξης που εδώ είναι η I =
ABCD. Για την εύρεση του σχεδιασμού (δηλαδή τον καθορισμό των επιλεχθέντων θεραπειών)
θα πρέπει να επιλεχθεί η τιμή 4 για το Number of Factors, στην επιλογή Factors να επιβεβαιωθούν οι τιμές των δύο επιπέδων (−1 και 1), στην επιλογή Designs να επιλεχθεί/τικαριστεί το
κλάσμα για τον σχεδιασμό (εδώ θα επιλεχθεί η τιμή 1/2), στα Options να μην τικαριστεί η επιλογή Randomized Runs ώστε να καταχωριστούν οι θεραπείες με την κλασική σειρά, ενώ στο
ίδιο menu να μείνει τικαρισμένη η επιλογή Store Design in Worksheet ώστε στο ίδιο αρχείο να
δημιουργηθεί ένα νέο Worksheet για την καταχώριση των θεραπειών. Ο Ερευνητής θα πρέπει
χειροκίνητα, στο ίδιο Worksheet, να δημιουργήσει μία καινούρια στήλη για να καταχωρίσει τις
τιμές της μεταβλητής απόκρισης Y που αντιστοιχούν στις 8 θεραπείες/πειράματα που εκτελέστηκαν. Αν το πείραμα έχει γίνει με επανάληψη, θα πρέπει να προστεθούν τόσες γραμμές (σε
ομάδες των 8) όσες οι επαναλήψεις του πειράματος (για την εφαρμογή είναι 4). Εναλλακτικά,
μπορεί να επιλεχθεί στα Designs η τιμή 4 στο Number of Replicates for Corner Points.
Πίνακας 9.38: 24−1 Κλασματικός Σχεδιασμός - Προσδιορίζουσα I = ABCD
Το output δίνει όλα τα βασικά χαρακτηριστικά του σχεδιασμού με τον αριθμό επαναλήψεων, τον
αριθμό των εκτελέσεων του πειράματος, την Ανάλυση κλπ. Επίσης, δίνονται και οι παραλλαγές:
276
ΠΕΙΡΑΜΑΤΑ f ΠΑΡΑΓΟΝΤΩΝ ΜΕ 2 ΕΠΙΠΕΔΑ
Πίνακας 9.39: 24−1 Κλασματικός Σχεδιασμός - Παραλλαγές - Προσδιορίζουσα I = ABCD
Ο νέος Πίνακας Δεδομένων προκύπτει από τον αρχικό, διαγράφοντας τις θεραπείες που δεν
έχουν επιλεχθεί:
Πίνακας 9.40: Πίνακας Δεδομένων - Μονάδα Παραγωγής - 23 κλάσμα - Προσδιορίζουσα I = ABCD
Θεραπείες
A
B
C
D
Y
abcd
1
1
1
1
36.1, 20.2, 18.2, 33.4
cd
2
2
1
1
33.0, 36.0, 33.0, 37.0
ab
1
1
2
2
18.0, 15.0, 16.0, 29.1
bd
2
1
2
1
35.7, 31.2, 40.0, 44.2
bc
2
1
1
2
44.0, 37.0, 40.0, 41.5
ad
1
2
2
1
17.0, 19.0, 16.0, 22.0
ac
1
2
1
2
35.0, 30.0, 33.0, 31.0
(1)
2
2
2
2
36.0, 35.0, 35.0, 40.0
Ακολουθώντας τη συνήθη διαδρομή
Stat
Ê
ANOVA
Ê
General Linear Model
Ê
Fit General Linear Model
εάν αποπειραθούμε να απαιτήσουμε να περιληφθούν στο Model όλες οι αλληλεπιδράσεις, το
Minitab θα τρέξει τη διαδικασία λαμβάνοντας υπόψη μόνο τους όρους που μπορούν να μελετηθούν ανεξάρτητα. Πράγματι, λαμβάνοντας υπόψη τις συγχύσεις που προκύπτουν μεταξύ των
δύο όρων σε κάθε παραλλαγή (που προκύπτει από την προσδιορίζουσα που έχει επιλεχθεί),
αγνοείται και παραλείπεται από την ανάλυση ο ένας εκ των δύο όρων από κάθε ζεύγος παραλλαγών. Οι παραλλαγές όπως προέκυψαν πιο πάνω, μας επιτρέπουν να εκτιμήσουμε ανεξάρτητα
τους όρους στα αριστερά, δηλαδή τους A, B, C, D, AB, AC και AD, και ο όρος στα δεξιά
(που συγχέεται με τον όρο στα αριστερά κάθε παραλλαγής) παραλείπεται από την ανάλυση διακύμανσης. Οπότε, εάν στο μοντέλο περιληφθούν όλες οι κύριες επιδράσεις και όλες οι αλληλεπιδράσεις, η σχετική σημείωση στο ANOVA output θα λέει:
The following terms cannot be estimated and were removed:
ΓΡΑΜΜΙΚΑ ΜΟΝΤΕΛΑ ΚΑΙ ΣΧΕΔΙΑΣΜΟΣ & ΑΝΑΛΥΣΗ ΠΕΙΡΑΜΑΤΩΝ ΜΕ ΕΦΑΡΜΟΓΕΣ ΣΕ R ΚΑΙ MINITAB
277
B ∗ C, B ∗ D, C ∗ D, A ∗ B ∗ C, A ∗ B ∗ D, A ∗ C ∗ D, B ∗ C ∗ D, A ∗ B ∗ C ∗ D.
Εμείς προχωράμε επιλέγοντας στο μοντέλο μόνο τους όρους που γνωρίζουμε από την προηγούμενη διαδικασία ότι είναι σημαντικοί, δηλαδή: A, B, C και D καθώς και τις αλληλεπιδράσεις
AB και AC (αγνοούμε την αλληλεπίδραση AD, αφού αν και μπορεί να μελετηθεί, γνωρίζουμε
ότι δεν επιδρά στη μεταβλητή απόκρισης). Το αποτέλεσμα, το οποίο υπενθυμίζεται ότι βασίζεται
μόνο στις επιλεχθείσες (με βάση την προσδιορίζουσα εξίσωση) 32 μετρήσεις, είναι:
Πίνακας 9.41: 24−1 Κλασματικός Σχεδιασμός - ANOVA - Προσδιορίζουσα I = ABCD
Για σκοπούς σύγκρισης θα πρέπει να μελετηθούν οι στήλες του μέσου αθροίσματος τετραγώνων, οι τιμές της ελεγχοσυνάρτησης F και οι αντίστοιχες p-values. Ήδη από τις τιμές της F
διαπιστώνουμε ότι:
α. αν και οι τιμές για τους παράγοντες A και B έχουν μειωθεί, παραμένουν εξαιρετικά υψηλές
(61.21 και 11.09), με αποτέλεσμα να αποδεικνύεται ότι οι επιδράσεις και με τον κλασματικό σχεδιασμό είναι στατιστικώς σημαντικές με p-values 0.000 και 0.003 (ενώ ήταν και
οι δύο 0.000, στο πλήρες παραγοντικό),
β. η τιμή της F για τον παράγοντα D επίσης μειώθηκε από 4.70 σε 2.65 με αποτέλεσμα όμως
η p-value να μην μπορέσει να κρατηθεί κάτω από 10% (κατέληξε από 4.3% που ήταν προηγουμένως, 11.6%) και η επίδρασή της να θεωρείται πλέον ως στατιστικώς μη σημαντική,
γ. η τιμή της F για τον παράγοντα B ήταν και παρέμεινε εξαιρετικά χαμηλή ώστε να εξακολουθεί να θεωρείται ως μη σημαντικός ( p-value 0.669 από 0.964),
δ. οι τιμές της F για τις δύο αλληλεπιδράσεις που ήταν σχετικά μικρές (19.65 και 3.71),
μειώθηκαν και έγιναν 9.01 και 2.90 με αποτέλεσμα να αυξηθούν οι αντίστοιχες p-values
σε 0.006 και 0.101 (από 0.000 και 0.059), διατηρώντας τη μία αλληλεπίδραση σημαντική
και την άλλη οριακά σημαντική, σε επίπεδο σημαντικότητας 10%.
Με βάση όλες τις παραπάνω παρατηρήσεις και κυρίως τις τιμές των p-values, καταλήγουμε στο
συμπέρασμα ότι ο κλασματικός σχεδιασμός ήταν σε σημαντικό βαθμό αποτελεσματικός, με τους
τρεις σημαντικότερους όρους που είχαν αναδειχθεί από τον πλήρη παραγοντικό σχεδιασμό (τις
κύριες επιδράσεις A και C και την αλληλεπίδραση AC) να αναδεικνύονται και πάλι ως εξίσου
σημαντικοί, με ασήμαντες διαφοροποιήσεις ως προς τις p-values. Από την άλλη μεριά, παρατηρείται μία καθολική μείωση στις τιμές των ελεγχοσυναρτήσεων F , με αποτέλεσμα οι υπόλοιποι
δύο όροι που είχαν εντοπιστεί ως σημαντικοί (ο παράγοντας D και η αλληλεπίδραση AB) να
αποτυγχάνουν να αναδειχθούν και πάλι σημαντικοί. Πάντως, λόγω των αρκετά οριακών τιμών
των p-values, δεν θα αποτελούσε έκπληξη αν ο Ερευνητής επέλεγε να κρατήσει τους δύο αυτούς
όρους στο τελικό του μοντέλο (συμπεριλαμβάνοντας αναγκαστικά και τον παράγοντα B που αν
278
ΠΕΙΡΑΜΑΤΑ f ΠΑΡΑΓΟΝΤΩΝ ΜΕ 2 ΕΠΙΠΕΔΑ
και δεν είναι σημαντικός από μόνος του, εμπλέκεται σε μία οριακά σημαντική αλληλεπίδραση).
Όπως είναι αναμενόμενο, οι πιο πάνω διαφοροποιήσεις επιδρούν αναγκαστικά και στις τιμές
των συντελεστών του τελικού προτύπου που δίνονται από την επόμενη μαθηματική σχέση με τη
σημείωση ότι για την αντιστοίχιση με το αρχικό πρότυπο του πλήρους παραγοντικού, ο κωδικός
2 αντιστοιχεί στον κωδικό −1 και αυτό γιατί το Minitab, για την κατασκευή του σχεδίου και τον
προσδιορισμό των θεραπειών στο Create Factorial Design , βασίζεται στην κωδικοποίηση −1
και +1, εκτός εάν ο Ερευνητής απαιτήσει κάτι διαφορετικό στην επιλογή Factors:
iv2. Σχετικά με τον δεύτερο κλασματικό παραγοντικό σχεδιασμό που προτείνει ο Ερευνητής με προσδιορίζουσα εξίσωση την I = BCD, επαναλαμβάνουμε εδώ τις θεραπείες όπως είχαν προσδιοριστεί νωρίτερα στο Παράδειγμα 9.4:
Πίνακας 9.42: Θεραπείες - Μονάδα Παραγωγής - Προσδιορίζουσα I = BCD
Επίδραση
A
B
C
D
(1)
−
−
−
−
a
+
−
−
−
bc
−
+
+
−
abc
+
+
+
−
bd
−
+
−
+
abd
+
+
−
+
cd
−
−
+
+
acd
+
−
+
+
Θεραπεία
Από τις παραλλαγές που επίσης είχαν προσδιοριστεί σε εκείνο το παράδειγμα και παρατίθενται
στη συνέχεια, χωρίς να καταγράφονται εις διπλούν:
ΓΡΑΜΜΙΚΑ ΜΟΝΤΕΛΑ ΚΑΙ ΣΧΕΔΙΑΣΜΟΣ & ΑΝΑΛΥΣΗ ΠΕΙΡΑΜΑΤΩΝ ΜΕ ΕΦΑΡΜΟΓΕΣ ΣΕ R ΚΑΙ MINITAB
279
Πίνακας 9.43: Παραλλαγές στο 24−1 Παραγοντικό Πείραμα - Μονάδα Παραγωγής - Προσδιορίζουσα I =
BCD
I = BCD
(I, BCD)
A = ABCD
(A, ABCD)
B = CD
(B, CD)
C = BD
(C, BD)
D = BC
(D, BC)
AB = ACD
(AB, ACD)
AC = ABD
(AC, ABD)
AD = ABC
(AD, ABC)
παρατηρούμε ότι 3 κύριες επιδράσεις συγχέονται με αλληλεπιδράσεις 1ης τάξης (δηλαδή μεταξύ
2 παραγόντων) με αποτέλεσμα η Ανάλυση του σχεδιασμού να είναι ίση με III και φυσικά να μην
είναι δυνατή η αξιολόγηση των συγκεκριμένων αλληλεπιδράσεων, δηλαδή των BC, BD και
CD. Βεβαίως, η συγκεκριμένη προσδιορίζουσα εξυπηρετεί τους σκοπούς του Ερευνητή, αφού
επιτρέπει την ανεξάρτητη αξιολόγηση τόσο των τεσσάρων κύριων παραγόντων A − D όσο
και των αλληλεπιδράσεων AB, AC που τον ενδιαφέρουν, αλλά και της αλληλεπίδρασης AD
(που δεν τον ενδιαφέρει), όπως φαίνεται από τις τρεις τελευταίες παραλλαγές. Ταυτόχρονα, δεν
θα μπορέσουν να αξιολογηθούν οι όροι που βρίσκονται στα δεξιά της ισότητας στις πιο πάνω
παραλλαγές, κάτι που όμως δεν απασχολεί τον Ερευνητή, αφού οι συγκεκριμένοι όροι δεν τον
ενδιαφέρουν.
Με βάση τις πιο πάνω διαπιστώσεις, ο κλασματικός αυτός σχεδιασμός, αν και από άποψη Ανάλυσης είναι υποδεέστερος του προηγούμενου που βασίστηκε στην αλληλεπίδραση μέγιστης τάξης, δεν παύει να είναι κατάλληλος, και άρα αποτελεσματικός, για τους σκοπούς που καλείται να
εξυπηρετήσει. Φυσικά, από τη στιγμή που οι θεραπείες διαφέρουν από αυτές που χρησιμοποιήθηκαν προηγουμένως, αναμένουμε ότι τα αποτελέσματα δεν θα είναι ταυτόσημα με αυτά του
προηγούμενου κλασματικού σχεδιασμού, αν και αναμένονται να είναι ισοδύναμα σε αρκετά σημαντικό βαθμό, όσον αφορά τις συγκεκριμένες επιδράσεις που ενδιαφέρουν τον Ερευνητή.
Πριν προχωρήσουμε στην εφαρμογή της ανάλυσης διακύμανσης θα πρέπει να παρουσιαστεί ο
τρόπος κατασκευής του σχεδιασμού με τη βοήθεια του Minitab. Υπενθυμίζεται ότι ο σχεδιασμός που θα προκύψει είναι ένας 24−1 = 23 σχεδιασμός με 8 θεραπείες (το ήμισυ του 16).
Συνεπώς, το Minitab επιθυμεί να τον αντιμετωπίσει ως έναν 23 σχεδιασμό που αφορά 3 παράγοντες (A, B και C) και στον οποίο θα υπεισέλθει ένας τέταρτος (ο D), μέσω της προσδιορίζουσας εξίσωσης η οποία θα πρέπει να εκφραστεί ως προς τον τέταρτο αυτόν παράγοντα, δηλαδή
I = BCD → D = BC. Ακολουθούμε και πάλι τη διαδρομή
Stat
Ê
DOE
Ê
Factorial
Ê
Create Factorial Design
κάνοντας τις εξής ενέργειες:
– Στο Type of Design επιλέγουμε τη 2η επιλογή 2-level factorial (specify generators), αφού
πρόκειται να δώσουμε εμείς την προσδιορίζουσα εξίσωση.
280
ΠΕΙΡΑΜΑΤΑ f ΠΑΡΑΓΟΝΤΩΝ ΜΕ 2 ΕΠΙΠΕΔΑ
– Στο Number of Factors επιλέγουμε την τιμή 3, που αφορά τη δύναμη του 2 στο κλάσμα που
μας ενδιαφέρει (24−1 = 23 ). Υπενθυμίζεται ότι ο 4ος παράγοντας θα δοθεί μόνο μέσω της
προσδιορίζουσας εξίσωσης.
– Στα Designs επιλέγουμε το Full Design με την έννοια ότι ο σχεδιασμός θα έχει 23 = 8 θεραπείες και τρεις παράγοντες (ο 4ος υπεισέρχεται μέσω της προσδιορίζουσας). Εάν υπάρχουν
επαναλήψεις (εδώ υπάρχουν τέσσερις) αυτό μπορεί να καταχωριστεί στην επιλογή Number
of Replicates for Corner.
– Στα Designs θα πρέπει να επιλέξουμε επιπλέον τα Generators, όπου στο άνω τμήμα θα προσθέσουμε τους πρόσθετους παράγοντες (εδώ έχουμε μόνο έναν και έτσι θα καταχωρίσουμε
την προσδιορίζουσα εκπεφρασμένη ως προς τον έξτρα παράγοντα, δηλαδή D = BC).
Σημειώνεται ότι το κάτω τμήμα χρησιμεύει στην περίπτωση που εμπλέκεται στο πείραμα
μεταβλητή πλαισίου.
– Στα Factors μπορούμε να επιβεβαιώσουμε ότι εμφανίζονται τόσο οι αρχικοί τρεις παράγοντες όσο και ο τέταρτος που εισήλθε μέσω της προσδιορίζουσας (στα Generators).
– Στα Options δεν επιλέγουμε το Randomized Runs (στην περίπτωση της εφαρμογής έχουν
ήδη εκτελεστεί τα πειράματα) ενώ συστήνεται να παραμείνει τικαρισμένη η επιλογή Store
Design in Worksheet.
Οι θεραπείες του κλασματικού πειράματος καταχωρίζονται σε ένα νέο Worksheet με την κλασική
σειρά, ενώ στο output δίνονται τα βασικά στοιχεία του σχεδιασμού, δηλαδή ο αριθμός των παραγόντων, ο αριθμός των εκτελέσεων του πειράματος που ισούται με το γινόμενο του αριθμού
των θεραπειών και των επαναλήψεων, το κλάσμα (εδώ 1/2) καθώς και η Ανάλυση ( Resolution)
που εδώ είναι III.
Πίνακας 9.44: 24−1 Κλασματικός Σχεδιασμός - Προσδιορίζουσα I = BCD
Επίσης, στο output καταγράφονται η προσδιορίζουσα εξίσωση και οι παραλλαγές μέχρι k − 1
τάξης σε πείραμα με k συνολικά παράγοντες. Για να καταγραφούν όλες, δηλαδή και η k τάξης
(για τη συγκεκριμένη εφαρμογή μέχρι και 4ης τάξης), θα πρέπει στα Results, και συγκεκριμένα
στο Content of Alias Table, να επιλεχθεί η επιθυμητή τιμή k (για την εφαρμογή είναι η τιμή 4)
στο Interactions up through order:
ΓΡΑΜΜΙΚΑ ΜΟΝΤΕΛΑ ΚΑΙ ΣΧΕΔΙΑΣΜΟΣ & ΑΝΑΛΥΣΗ ΠΕΙΡΑΜΑΤΩΝ ΜΕ ΕΦΑΡΜΟΓΕΣ ΣΕ R ΚΑΙ MINITAB
281
Πίνακας 9.45: 24−1 Κλασματικός Σχεδιασμός - Παραλλαγές - Προσδιορίζουσα I = BCD
Παρατηρούμε ότι στο output υπάρχει σημείωση ( NOTE) η οποία εφιστά την προσοχή του
Ερευνητή στο γεγονός ότι υφίσταται σύγχυση μεταξύ κύριων επιδράσεων και αλληλεπιδράσεων
1ης τάξης, που φυσικά δικαιολογεί την Ανάλυση του σχεδιασμού (III).
Εφαρμόζουμε και πάλι τη διαδικασία για την κατασκευή του Πίνακα ANOVA και της μαθηματικής σχέσης του προτύπου και επιβεβαιώνουμε τη μεγάλου βαθμού ταύτιση των αποτελεσμάτων
των δύο επιλεχθέντων κλασματικών σχεδιασμών.
Πίνακας 9.46: 24−1 Κλασματικός Σχεδιασμός - ANOVA Προσδιορίζουσα I = BCD
Για σκοπούς μίας ένα προς ένα σύγκρισης, παρατίθεται χωρίς σχόλια, ο πιο κάτω πίνακας με τους
εκτιμητές και τις p-values για τη σημαντικότητα, τόσο για το πλήρες παραγοντικό (2η και 3η
στήλη) όσο και για τα δύο κλασματικά πειράματα (4η και 5η στήλη για το κλάσμα με Ανάλυση
IV και 6η και 7η για το κλάσμα με Ανάλυση III).
282
ΠΕΙΡΑΜΑΤΑ f ΠΑΡΑΓΟΝΤΩΝ ΜΕ 2 ΕΠΙΠΕΔΑ
Πίνακας 9.47: Συγκριτικός Πίνακας - Πλήρες Πείραμα και Κλασματικά Πειράματα
Πλήρες Πείραμα
Κλάσμα Ανάλυση IV
Κλάσμα Ανάλυση III
Θεραπεία
Εκτιμητής
p-value
Εκτιμητής
p-value
Εκτιμητής
p-value
Constant
30.806
−
30.863
−
31.466
−
A
−5.891
0.000
−6.555
0.000
−0.5947
0.000
B
0.025
0.964
0.363
0.669
0.347
0.654
C
2.944
0.000
2.788
0.003
2.853
0.001
D
−1.184
0.034
−1.362
0.116
−0.822
0.293
AB
−1.053
0.059
−1.425
0.101
−1.441
0.071
AC
2.422
0.000
2.512
0.006
2.578
0.002
9.4 Σχόλια και χρήσιμες σημειώσεις - Minitab
Στην ενότητα αυτή παρατίθενται για διευκόλυνση του αναγνώστη, χρήσιμες σημειώσεις και σχόλια αναφορικά με το Minitab για τα θέματα που μελετήθηκαν στο παρόν κεφάλαιο.
• Στο Minitab υπάρχει η δυνατότητα τροποποίησης της κατασκευής ενός σχεδίου που έχει δημιουργηθεί
από τη διαδρομή
Stat
Ê
DOE
Ê
Factorial
Ê
Create Factorial Design
Συγκεκριμένα, αν ο Ερευνητής επιλέξει τη διαδρομή
Stat
Ê
DOE
Ê
Modify Design
μπορεί μεταξύ άλλων να αλλάξει τους παράγοντες ( Modify Factors) είτε να αλλάξει τον αριθμό των
επαναλήψεων ( Replicate Design) είτε να επιλέξει την τυχαία σειρά για την εκτέλεση των πειραμάτων τικάροντας την επιλογή ( Randomize Design). Σημειώνεται ότι η τυχαία σειρά στην εκτέλεση
των πειραμάτων έχει ιδιαίτερη σημασία γιατί αυξάνεται η αξιοπιστία των αποτελεσμάτων, αφού με τον
τυχαίο τρόπο στη σειρά εκτέλεσης των πειραμάτων, περιορίζεται η επίδραση οποιωνδήποτε εξωγενών
παραγόντων (που εμπλέκονται στο πείραμα). Το Minitab επιλέγει με τρόπο τυχαίο και καταγράφει
τη σειρά με την οποία μπορούν να εκτελεστούν τα πειράματα από τον πειραματιστή. Αν οι μετρήσεις
έχουν ήδη συλλεχθεί, συνηθίζεται να μην κάνουμε τη συγκεκριμένη επιλογή στο Minitab, ώστε να καταχωρίζονται οι μετρήσεις με την κλασική σειρά (έστω και αν έχουν εκτελεστεί με τυχαία σειρά), για
καθαρά πρακτικούς λόγους.
9.5 Άλυτες ασκήσεις
1. Ερευνητής επιθυμεί να αξιολογήσει έξι (6) 2-σταθμικούς παράγοντες A − F , όσον αφορά την επίδρασή τους σε μία μεταβλητή απόκρισης. Για τον σκοπό αυτό επιλέγει κλασματικό παραγοντικό σχεδιασμό 26−2 , χωρίς επανάληψη, με γεννήτορες τις σχέσεις P = ACDE και Q = BCDF , ο οποίος
δίνει τα εξής 16 αποτελέσματα για τη μεταβλητή απόκρισης:
0, 0.25, −0.05, 0.3, 0.08, 0.33, −0.5, 0.26, 0.04, 0.29, −0.1, 0.31, 0.5, 0.54, 0.35, 0.6
ΓΡΑΜΜΙΚΑ ΜΟΝΤΕΛΑ ΚΑΙ ΣΧΕΔΙΑΣΜΟΣ & ΑΝΑΛΥΣΗ ΠΕΙΡΑΜΑΤΩΝ ΜΕ ΕΦΑΡΜΟΓΕΣ ΣΕ R ΚΑΙ MINITAB
283
i. Ζητείται η Ανάλυση ( Resolution) του σχεδιασμού.
ii. Ζητείται να προσδιοριστούν οι θεραπείες του σχεδιασμού και να αντιστοιχιστούν με τις μετρήσεις
που δίνονται στην εκφώνηση.
iii. Με τη χρήση του Πίνακα ANOVA να εντοπίσετε σε επίπεδο 10% ποιες είναι οι σημαντικές
κύριες επιδράσεις, αν θεωρήσετε ότι όλες οι αλληλεπιδράσεις είναι αμελητέες.
iv. Με βάση τα αποτελέσματα του Πίνακα ANOVA, ποιος είναι ο μέγιστος αριθμός αλληλεπιδράσεων που θα μπορούσατε να συμπεριλάβετε στη μελέτη; Αν έπρεπε να εντοπίσετε 6 αλληλεπιδράσεις 1ης τάξης (μεταξύ δύο παραγόντων) για να τις συμπεριλάβετε στη μελέτη του ερωτήματος ( iii), ποιες θα ήταν αυτές και ποια τα αποτελέσματα της μελέτης;
2. Ερευνητής επιθυμεί να αξιολογήσει πέντε (5) 2-σταθμικούς παράγοντες A − E, όσον αφορά την
επίδρασή τους σε μία μεταβλητή απόκρισης. Για τον σκοπό αυτό επιλέγει κλασματικό παραγοντικό
σχεδιασμό 25−1 , χωρίς επανάληψη, με προσδιορίζουσα τη σχέση AB = CDE, με τα εξής 16 αποτελέσματα για τη μεταβλητή απόκρισης:
0.46, 1.09, 1.72, 2.04, 0.46, 1.51, 2.04, 3.30, 0.88, 1.41, 1.83, 1.51, 0.67, 0.99, 1.20, 1.30
i. Ζητείται η Ανάλυση ( Resolution) του σχεδιασμού.
ii. Ζητείται να προσδιοριστούν οι θεραπείες του σχεδιασμού και να αντιστοιχιστούν με τις μετρήσεις
που δίνονται στην εκφώνηση.
iii. Με τη χρήση του Πίνακα ANOVA να εντοπίσετε σε επίπεδο 10% ποιες είναι οι σημαντικές
κύριες επιδράσεις, αν θεωρήσετε ότι όλες οι αλληλεπιδράσεις είναι αμελητέες.
iv. Με βάση τα αποτελέσματα του Πίνακα ANOVA, ποιος είναι ο μέγιστος αριθμός αλληλεπιδράσεων που θα μπορούσατε να συμπεριλάβετε στη μελέτη; Αν έπρεπε να εντοπίσετε 6 αλληλεπιδράσεις 1ης τάξης (μεταξύ δύο παραγόντων) για να τις συμπεριλάβετε στη μελέτη του ερωτήματος ( iii), ποιες θα ήταν αυτές και ποια τα αποτελέσματα της μελέτης;
v. Έστω ότι ο Ερευνητής θέλει να περιορίσει το κόστος πειραματισμού και εξετάζει το ενδεχόμενο
να αντικαταστήσει τον προηγούμενο σχεδιασμό με έναν 25−2 κλασματικό παραγοντικό σχεδιασμό με προσδιορίζουσες τις σχέσεις AB = CE και AB = D. Να προσδιορίσετε την Ανάλυση
του νέου σχεδιασμού και να σχολιάσετε αν συστήνετε (ή όχι) τον συγκεκριμένο σχεδιασμό και
γιατί.
3. Ερευνητής επιθυμεί τη μελέτη πέντε (5) 2-σταθμικών παραγόντων A, B, C, D και E με λιγότερες
από τις 32 δοκιμές που απαιτεί το πλήρες παραγοντικό πείραμα. Για τον σκοπό αυτό, μεταξύ περισσότερων προτάσεων, προκρίνει τις ακόλουθες:
Π1: Να εφαρμοστεί κλασματικός σχεδιασμός ενός δευτέρου, με γεννήτρια τη σχέση I = ABD.
Π2: Να εφαρμοστεί κλασματικός σχεδιασμός ενός δευτέρου, με όσο το δυνατόν μεγαλύτερο πλήθος
θεραπειών του να αντιστοιχεί σε κύριες επιδράσεις παραγόντων.
Π3: Να εφαρμοστεί κλασματικός σχεδιασμός ενός τετάρτου, με προσδιορίζουσες τις σχέσεις A =
CD και A = BE.
Για καθέναν από τους τρεις προτεινόμενους σχεδιασμούς:
i. Να κατασκευαστεί ο πίνακας σχεδιασμού και να δοθούν οι αντίστοιχες θεραπείες.
ii. Να προσδιοριστούν οι προσδιορίζουσες εξισώσεις καθώς και το σύνολο των παραλλαγών.
iii. Να προσδιοριστεί η Ανάλυση ( Resolution) και να καταταχτούν σε αύξουσα σειρά προτίμησης.
Να δικαιολογήσετε την απάντησή σας.
284
ΠΕΙΡΑΜΑΤΑ f ΠΑΡΑΓΟΝΤΩΝ ΜΕ 2 ΕΠΙΠΕΔΑ
Για τον σχεδιασμό που προτείνεται στο ερώτημα ( iii), να γίνει ο Πίνακας Διασποράς και να εντοπιστούν οι σημαντικές κύριες επιδράσειςτ αν δίνονται οι παρακάτω 16 μετρήσεις:
Πίνακας 9.48: Σύνολο Δεδομένων - Πέντε Παράγοντες
α/α
1
2
3
4
5
6
7
8
Μέτρηση
33785
26388.6
31622.6
26543.3
32388.8
27269.5
33059
26612.3
α/α
9
10
11
12
13
14
15
16
Μέτρηση
32388.8
27269.5
33059.1
25612.3
33785.3
26338.6
31662.6
26543.3
ΒΙΒΛΙΟΓΡΑΦΙΑ
[1] Βόντα, Φ., & Καραγρηγορίου, Α. (2012). Εφαρμοσμένη στατιστική ανάλυση & στοιχεία πιθανοτήτων.
Αθήνα: Εκδόσεις Παρασκήνιο.
[2] Δαμιανού, Χ., & Κούτρας, Μ. (1998). Εισαγωγή στη στατιστική, Μέρος ΙΙ. Αθήνα: Εκδόσεις Συμμετρία.
[3] Κουτρουβέλης, Ι. Α. (2015). Εφαρμοσμένες πιθανότητες και στατιστική για μηχανικούς και θετικούς επιστήμονες. Αθήνα: Εκδόσεις Gotsis.
[4] Κουτρουβέλης, Ι. Α. (2000). Προηγμένα εργαλεία και μέθοδοι για τον έλεγχο της ποιότητας, Τόμος Β,
Σχεδιασμός και Ανάλυση Πειραμάτων. Πάτρα: Ελληνικό Ανοικτό Πανεπιστήμιο.
[5] Κολυβά-Μαχαίρα, Φ., & Μπόρα-Σέντα, Ε. (1995). Στατιστική, θεωρία και εφαρμογές. Θεσσαλονίκη:
Εκδόσεις Ζήτη.
[6] Κουνιάς, Σ., Κολυβά-Μαχαίρα, Φ., Μπαγιάτης, Γ., & Μπόρα-Σέντα, Ε. (1985). Εισαγωγή στη στατιστική. Θεσσαλονίκη: Εκτύπωση Γιαχούδη-Γιαπούλη Ο.Ε.
[7] Κούτρας, Μ. Β., & Ευαγγελάρας, Χ. (2010). Ανάλυση παλινδρόμησης, θεωρία και εφαρμογές. Αθήνα:
Εκδόσεις Σταμούλη Α. Ε.
[8] Παπαδόπουλος, Γ. Κ. (2015). Εισαγωγή στις πιθανότητες και τη στατιστική. Αθήνα: Εκδόσεις Gutenberg.
[9] Παπαϊωάννου, Τ., & Λουκάς, Σ. (2002). Εισαγωγή στη στατιστική. Αθήνα: Εκδόσεις Σταμούλη Α. Ε.
[10] Φερεντίνος, Κ., Ζωγράφος, Κ., & Παπαϊωάννου, Τ. (2020). Εκτιμητική και έλεγχος υποθέσεων. Αθήνα:
Εκδόσεις Σταμούλη Α. Ε.
[11] Barker, T. B., & Milivojevich, A. (2016). Quality by experimental design. Routledge, Taylor and Francis Group.
[12] Blainey, P., Krzywinski, M., & Altman, N. (2014). Points of significance: replication. Nat Meth,
11(9), 879–880.
[13] Box, G. E. P., Hunter, W.G., & Hunter, J. S. (2005). Statistics for experimenters: design, innovation and
discovery (2nd ed.). John Wiley and Sons.
286
ΒΙΒΛΙΟΓΡΑΦΙΑ
[14] Box, G.E.P., Hunter, W.G., & Hunter, J.S. (1978). Statistics for experimenters. John Wiley and Sons.
[15] Field, A. (2021). Μία περιπέτεια στη στατιστική (Ε. Γάκη, Χ. Παρπούλα & Η. Σαντουρίδης, Επιμ.).
Αθήνα: Εκδόσεις Προπομπός.
[16] Hicks, C.R. (1997). Fundamental concepts in the design of experiments (4th ed.). John Wiley and Sons.
[17] Lawson, J. (2014). Design and analysis of experiments with R. Chapman and Hall/CRC.
[18] Martins, M.C.M., Caldana, C., Wolf, L.D., & de Abreu, L.G.F. (2018). The importance of experimental design, quality assurance, and control in plant metabolomics experiments. Methods Mol Biol.,
1778, 3-17. doi: 10.1007/978-1-4939-7819-9_1. PMID: 29761427
[19] Mitra, A. (2016). Fundamentals of quality control and improvement (4th ed.). John Wiley and Sons.
[20] Montgomery, D.C. (2013). Design and analysis of experiments (8th ed.). John Wiley and Sons.
[21] Witte, R.S., Witte, J. S., Ανδρουλάκης, Γ., & Κουνετάς, Κ. (2019). Στατιστική, ανάλυση δεδομένων με
τη χρήση R. Αθήνα: Εκδόσεις Κριτική.
ΚΕΦΑΛΑΙΟ 10
ΕΙΔΙΚΑ ΘΕΜΑΤΑ ΑΝΑΛΥΣΗΣ ΔΙΑΚΥΜΑΝΣΗΣ
Σύνοψη
Το παρόν κεφάλαιο παρουσιάζει ειδικά θέματα στην ανάλυση διακύμανσης, συμπεριλαμβανομένων των πειραμάτων με πολλούς παράγοντες ενδιαφέροντος, των τεχνικών μη παραμετρικής
ανάλυσης διακύμανσης και της ανάλυσης συνδιακύμανσης.
Προαπαιτούμενη γνώση
Το κεφάλαιο προϋποθέτει τη γνώση και την κατανόηση των προηγουμένων κεφαλαίων.
Προσδοκώμενα μαθησιακά αποτελέσματα
Μετά τη μελέτη του παρόντος κεφαλαίου ο αναγνώστης αναμένεται να:
• αναγνωρίζει πειράματα με πολλούς παράγοντες ενδιαφέροντος με ή χωρίς μεταβλητές πλαισίου,
• χρησιμοποιεί κατάλληλες τεχνικές της μη παραμετρικής στατιστικής και συγκεκριμένα τις μη
παραμετρικές μεθόδους ανάλυσης διακύμανσης των Kruskal-Wallis και Friedman για τη μελέτη πειραματικών σχεδιασμών που δεν δύνανται να μελετηθούν με παραμετρικές μεθόδους,
• εφαρμόζει την ανάλυση συνδιακύμανσης για τη μελέτη παραγόντων ενδιαφέροντος στην παρουσία συμμεταβλητών που δεν είναι δυνατόν να τεθούν υπό έλεγχο, κατά τον σχεδιασμό της
έρευνας.
Καραγρηγορίου, Α., & Καλλιγέρης, Ε. Ν. (�2023). «Γραμμικά Μοντέλα και Σχεδιασμός & Ανάλυση Πειραμάτων με Εφαρμογές
σε R και Minitab».
Αθήνα: Κάλλιπος, Ανοικτές Ακαδημαϊκές Εκδόσεις. http://dx.doi.org/10.57713/kallipos-70
Creative Commons Αναφορά Δημιουργού - Μη Εμπορική Χρήση - Παρόμοια Διανομή 4.0
288
ΕΙΔΙΚΑ ΘΕΜΑΤΑ ΑΝΑΛΥΣΗΣ ΔΙΑΚΥΜΑΝΣΗΣ
10.1 f - Παραγοντική ανάλυση διακύμανσης
Στο κεφάλαιο αυτό θα συνεχίσουμε τη μελέτη παραγοντικών πειραμάτων (σχεδιασμών) σχολιάζοντας σε συντομία τα f -παραγοντικά πειράματα, ενώ θα δώσουμε έμφαση στα παραγοντικά πειράματα f παραγόντων
με τρία επίπεδα έκαστος που θα μπορούσαν να θεωρηθούν γενίκευση των 2f παραγοντικών σχεδιασμών του
προηγούμενου κεφαλαίου. Τέλος, θα συζητηθεί η περίπτωση της μη παραμετρικής ανάλυσης διακύμανσης,
καθώς και της ανάλυσης συνδιακύμανσης.
Στη συνέχεια, παρατίθεται το πρότυπο τριών παραγόντων A, B και Γ με αλληλεπιδράσεις 1ου και 2ου βαθμού (δηλαδή μεταξύ δύο, καθώς και τριών παραγόντων), αλλά και χωρίς αλληλεπιδράσεις:
yijkl = µ + αi + βj + γk + (αβ)ij + (αγ)ik + (βγ)jk
+ (αβγ)ijk + ϵijkl , i = 1, ..., a, j = 1, ..., b, k = 1, ..., c, l = 1, ..., n,
και
yijkl = µ + αi + βj + γk + ϵijkl , i = 1, ..., a, j = 1, ..., b, k = 1, ..., c, l = 1, ..., n.
Με ανάλογο τρόπο μπορεί να διατυπωθεί το πρότυπο με f παράγοντες, f > 3. Η περίπτωση που παρουσιάζεται πιο πάνω είναι η περίπτωση ενός ισορροπημένου σχεδιασμού, δηλαδή με ίδιο αριθμό επαναλήψεων n,
ανά θεραπεία.
Στις περιπτώσεις εκείνες που το πείραμα με f > 2 παράγοντες, εκτελείται χωρίς επανάληψη (δηλαδή n =
1), είναι δυνατόν ο Ερευνητής να προβεί στη μελέτη κάποιων αλληλεπιδράσεων. Ένα πείραμα χωρίς αλληλεπίδραση είναι αδύνατον να αξιολογήσει όλες τις αλληλεπιδράσεις, και αυτό γιατί σε αυτή την περίπτωση θα
εξαντλούνταν όλοι οι διαθέσιμοι βαθμοί ελευθερίας και δεν θα έμεναν βαθμοί ελευθερίας για τα σφάλματα.
Σε τέτοιες περιπτώσεις, ο Ερευνητής μπορεί να συμπεριλάβει στο πείραμα την αξιολόγηση των αλληλεπιδράσεων 1ης τάξης και να αγνοήσει την αλληλεπίδραση της 2ης τάξης, η οποία θα παίξει τον ρόλο του σφάλματος.
Στην πράξη, είναι σύνηθες φαινόμενο στη θέση των σφαλμάτων να χρησιμοποιούνται οι όροι που αντιστοιχούν στις μεγαλύτερες τάξεις αλληλεπιδράσεων. Τέτοιες αλληλεπιδράσεις είναι δύσκολο και να ερμηνευθούν
και να αξιολογηθούν, αλλά και πολύ συχνά, έχουν μηδαμινή (έως και μηδενική) επίδραση στη μεταβλητή
απόκρισης, ώστε τελικά να είναι ανέξοδη (δηλαδή να μην αλλοιώνει την ανάλυση) η επιλογή του Ερευνητή
να τις θεωρήσει αμελητέες.
Ειδικά για την περίπτωση των 3f παραγοντικών πειραμάτων, θα πρέπει να σημειωθεί ότι θεωρούνται ιδιαίτερα πολύπλοκα, ακόμα και για σχετικά μικρό αριθμό παραγόντων f . Οι σχεδιασμοί αυτοί επιτρέπουν, πέραν
των συνήθων κύριων επιδράσεων (που εδώ αναφέρονται και ως γραμμικοί) και των συνήθων αλληλεπιδράσεων (μεταξύ των κύριων - εδώ γραμμικών επιδράσεων), να μελετηθούν και οι τετραγωνικοί όροι των κύριων
επιδράσεων, καθώς και οι αλληλεπιδράσεις μεταξύ γραμμικών και τετραγωνικών όρων. Έτσι, προκύπτουν οι
ακόλουθες επιδράσεις:
1. η κύρια επίδραση κάθε παράγοντα (με 2 βαθμούς ελευθερίας) που αναλύεται στον γραμμικό όρο και
στον τετραγωνικό όρο της κύριας επίδρασης με 1 βαθμό ελευθερίας για τον καθένα,
2. η αλληλεπίδραση της μορφής A × B μεταξύ κάθε ζεύγους κύριων επιδράσεων, έστω A και B (με 4
βαθμούς ελευθερίας), που αναλύεται σε τέσσερις όρους με 1 βαθμό ελευθερίας ο καθένας, δηλαδή:
α. η αλληλεπίδραση AL BL μεταξύ των γραμμικών όρων AL και BL των δύο παραγόντων ( L για
Linear),
ΓΡΑΜΜΙΚΑ ΜΟΝΤΕΛΑ ΚΑΙ ΣΧΕΔΙΑΣΜΟΣ & ΑΝΑΛΥΣΗ ΠΕΙΡΑΜΑΤΩΝ ΜΕ ΕΦΑΡΜΟΓΕΣ ΣΕ R ΚΑΙ MINITAB
289
β. η αλληλεπίδραση AS BS μεταξύ των τετραγωνικών όρων AS και BS των δύο παραγόντων ( S
για Square) και
γ. η αλληλεπίδραση AL BS και AS BL μεταξύ γραμμικού όρου του ενός και τετραγωνικού όρου
του άλλου παράγοντα.
Με την εφαρμογή κατάλληλου προτύπου παλινδρόμησης για το πρόβλημα, ο Ερευνητής συστήνεται να χρησιμοποιήσει την κωδικοποίηση −1, 0, +1 για την περιγραφή των τριών επιπέδων κάθε παράγοντα που αντιστοιχούν στο χαμηλό, μεσαίο και υψηλό επίπεδο για τον κάθε παράγοντα. Στην ειδική περίπτωση δύο παραγόντων (f = 2), αν ορίσουμε με x1 και x2 τους γραμμικούς όρους των δύο κύριων επιδράσεων, τότε
εκμεταλλευόμενοι την πιο πάνω κωδικοποίηση, οι τετραγωνικοί παράγοντες θα συμβολίζονται με x21 και x22 ,
ενώ οι τέσσερις αλληλεπιδράσεις θα συμβολίζονται με x1 x2 , x21 x22 , x1 x22 και x21 x2 . Έτσι, το μεν μοντέλο παλινδρόμησης θα δίνεται από τη σχέση:
y = β0 + β1 x1 + β2 x2 + β3 x21 + β4 x22 + β5 x1 x2 + β6 x21 x22 + β7 x1 x22 + β8 x21 x2 + ϵ
ενώ οι τιμές των 7 εμπλεκόμενων μεταβλητών παλινδρόμησης θα παίρνουν τιμές με βάση τους προφανείς
πολλαπλασιασμούς των τιμών (−1, 0, +1) των γραμμικών όρων.
Με βάση τα παραπάνω, τα αθροίσματα τετραγώνων μπορούν να αναλυθούν αναλόγως:
SSA = SSAS + SSAL , SSB = SSBS + SSBL ,
και
SSAB = SSAS BS + SSAL BL + SSAS BL + SSAL BS .
Παράδειγμα 10.1. Έστω 32 παραγοντικό πείραμα με τα εξής δεδομένα:
Πίνακας 10.1: Πίνακας Δεδομένων στο 32 Παραγοντικό Πείραμα με n = 1
y
x1
x2
x21
x22
x1 x2
x1 x22
x21 x2
x21 x22
40
−1
−1
+1
+1
+1
−1
−1
+1
370
0
−1
0
+1
0
0
0
0
680
+1
−1
+1
+1
−1
+1
−1
+1
130
−1
0
+1
0
0
0
0
0
350
0
0
0
0
0
0
0
0
740
+1
0
+1
0
0
0
0
0
100
−1
+1
+1
+1
−1
−1
+1
+1
325
0
+1
0
+1
0
0
0
0
770
+1
+1
+1
+1
+1
+1
+1
+1
Στις στήλες x1 και x2 καταγράφονται τα επίπεδα των δύο παραγόντων δημιουργώντας τις 9 θεραπείες του πειράματος, ενώ τα σύμβολα των υπόλοιπων στηλών προκύπτουν από τους πολλαπλασιασμούς των συμβόλων των
στηλών των παραγόντων x1 και x2 .
Σημειώνεται ότι επειδή έχουμε μία μόνο επανάληψη δεν είναι δυνατόν να μελετηθούν και οι 8 όροι του προτύπου παλινδρόμησης, αφού οι διαθέσιμοι βαθμοί ελευθερίας είναι n − 1 = 8 − 1 = 7. Επιπρόσθετα, για τον
290
ΕΙΔΙΚΑ ΘΕΜΑΤΑ ΑΝΑΛΥΣΗΣ ΔΙΑΚΥΜΑΝΣΗΣ
ίδιο λόγο, δεν είναι δυνατόν να γίνει ούτε η ανάλυση διακύμανσης με το πλήρες παραγοντικό δύο παραγόντων με
αλληλεπίδραση για τον ίδιο λόγο. Υπενθυμίζεται ότι κάθε παράγοντας έχει 2 βαθμούς ελευθερίας, ενώ η αλληλεπίδραση 4, με αποτέλεσμα να μην αρκούν οι διαθέσιμοι βαθμοί ελευθερίας ούτε για την ανάλυση διακύμανσης.
Σε τέτοιες περιπτώσεις, ο Ερευνητής επιλέγει κάποιες αλληλεπιδράσεις και εφαρμόζει την ανάλυση διακύμανσης
ή αντιστοίχως κάποιους όρους για να εφαρμόσει το μοντέλο παλινδρόμησης. Για εφαρμογή της μεθοδολογίας θα
θεωρήσουμε αμελητέες τις αλληλεπιδράσεις AS BS μεταξύ των τετραγωνικών όρων και τις AL BS και AS BL
μεταξύ κάθε γραμμικού με κάθε τετραγωνικό όρο και θα μελετήσουμε το απλοποιημένο μοντέλο:
y = β0 + β1 x1 + β2 x2 + β3 x21 + β4 x22 + β5 x1 x2 + ϵ
με αποτέλεσμα να αποδεσμεύσουμε 3 βαθμούς ελευθερίας για το σφάλμα. Ακολουθώντας τη διαδρομή
Stat
Ê
Regression
Ê
Regression
Ê
Fit Regression Model
μπορούμε να προσδιορίσουμε αφενός μεν τους συντελεστές παλινδρόμησης του πιο πάνω απλοποιημένου προτύπου
παλινδρόμησης, αφετέρου δε, τα αθροίσματα τετραγώνων των εμπλεκόμενων παραγόντων και των όρων που τα
συνθέτουν. Ο πίνακας για τους συντελεστές παλινδρόμησης είναι:
Πίνακας 10.2: Παλινδρόμηση - Εκτίμηση Συντελεστών - Παράδειγμα 32 Παραγοντικό Πείραμα
Όρος
Εκτιμητής
Τυπικό Σφάλμα
Ελεγχοσυνάρτηση t
p-value
β0
365.6
33.4
10.95
0.002
A
320.0
18.3
17.50
0.000
B
17.5
18.3
0.96
0.409
A2
61.7
31.7
1.95
0.147
B2
−25.8
31.7
−0.82
0.474
AB
7.5
22.4
0.33
0.760
Για τον προσδιορισμό των επιμέρους αθροισμάτων τετραγώνων, θα πρέπει στην πιο πάνω διαδρομή και στην επιλογή Options να επιλεχθεί το Sequential (type I) στο Sum of Squares for Tests ώστε να υπολογίζεται η πρόσθετη
συνεισφορά του τρέχοντος όρου όταν στο μοντέλο έχουν ήδη ενσωματωθεί μόνο οι προηγούμενοι όροι.
ΓΡΑΜΜΙΚΑ ΜΟΝΤΕΛΑ ΚΑΙ ΣΧΕΔΙΑΣΜΟΣ & ΑΝΑΛΥΣΗ ΠΕΙΡΑΜΑΤΩΝ ΜΕ ΕΦΑΡΜΟΓΕΣ ΣΕ R ΚΑΙ MINITAB
291
Πίνακας 10.3: Πίνακας ANOVA - Παλινδρόμηση - Παράδειγμα 32 Παραγοντικό Πείραμα
Πηγή
Μεταβλητότητας
Βαθμοί
Ελευθερίας
Άθροισμα
Τετραγώνων
A
1
614400
B
1
A2
Μέσο
F
p-value
614400
306.21
0.000
1837
18371
0.92
0.409
1
7606
7606
3.79
0.147
B2
1
1335
1335
0.67
0.474
AB
1
225
225
0.11
0.760
Σφάλματα
3
6019
2006
–
–
Ολική
8
631422
–
–
–
Άθροισμα
Τετραγώνων
Με βάση τα αποτελέσματα του Πίνακα ANOVA της ανάλυσης παλινδρόμησης έχουμε:
SSA = SSAL + SSAS = 614400 + 7606 = 622006,
SSB = SSBL + SSBS = 1837 + 1335 = 3172
αφού αθροίζουμε τη συνεισφορά γραμμικού και τετραγωνικού όρου για κάθε παράγοντα και:
SSAB = SSAS BS + SSAL BL + SSAS BL + SSAL BS = 0 + 225 + 0 + 0 = 225,
αφού μόνο η αλληλεπίδραση των γραμμικών όρων των κύριων παραγόντων μελετήθηκε και οι υπόλοιπες θεωρήθηκαν αμελητέες.
Για τη μελέτη του πλήρους πειράματος, αξιοποιώντας τόσο την ανάλυση παλινδρόμησης όσο και την ανάλυση
διακύμανσης, προχωρούμε τώρα στο επόμενο παράδειγμα το οποίο κάνει χρήση των δεδομένων του προηγουμένου παραδείγματος για το οποίο έχει γίνει μία ακόμα επανάληψη:
Παράδειγμα 10.2. Έστω 32 παραγοντικό πείραμα με 2 επαναλήψεις ανά θεραπεία, με τα εξής δεδομένα:
292
ΕΙΔΙΚΑ ΘΕΜΑΤΑ ΑΝΑΛΥΣΗΣ ΔΙΑΚΥΜΑΝΣΗΣ
Πίνακας 10.4: Πίνακας Δεδομένων στο 32 Παραγοντικό Πείραμα με n = 2 επαναλήψεις
y
x1
x2
x21
x22
x1 x2
x1 x22
x21 x2
x21 x22
40
−1
−1
+1
+1
+1
−1
−1
+1
370
0
−1
0
+1
0
0
0
0
680
+1
−1
+1
+1
−1
+1
−1
+1
130
−1
0
+1
0
0
0
0
0
350
0
0
0
0
0
0
0
0
740
+1
0
+1
0
0
0
0
0
100
−1
+1
+1
+1
−1
−1
+1
+1
325
0
+1
0
+1
0
0
0
0
770
+1
+1
+1
+1
+1
+1
+1
+1
70
−1
−1
+1
+1
+1
−1
−1
+1
270
0
−1
0
+1
0
0
0
0
740
+1
−1
+1
+1
−1
+1
−1
+1
140
−1
0
+1
0
0
0
0
0
350
0
0
0
0
0
0
0
0
670
+1
0
+1
0
0
0
0
0
80
−1
+1
+1
+1
−1
−1
+1
+1
330
0
+1
0
+1
0
0
0
0
750
+1
+1
+1
+1
+1
+1
+1
+1
Η διαδικασία στο Minitab για την ανάλυση παλινδρόμησης είναι ίδια με αυτήν του προηγούμενου παραδείγματος
και δίνει τα εξής αποτελέσματα, όσον αφορά τους συντελεστές παλινδρόμησης:
ΓΡΑΜΜΙΚΑ ΜΟΝΤΕΛΑ ΚΑΙ ΣΧΕΔΙΑΣΜΟΣ & ΑΝΑΛΥΣΗ ΠΕΙΡΑΜΑΤΩΝ ΜΕ ΕΦΑΡΜΟΓΕΣ ΣΕ R ΚΑΙ MINITAB
293
Πίνακας 10.5: Παλινδρόμηση - Εκτίμηση Συντελεστών - Παράδειγμα 32 Παραγοντικό Πείραμα
Όρος
Εκτιμητής
Τυπικό Σφάλμα
Ελεγχοσυνάρτηση t
p-value
β0
350.0
23.8
14.73
0.000
A
285.0
16.8
16.96
0.000
B
3.7
16.8
0.22
0.828
A2
70.0
29.1
2.41
0.040
B2
−26.2
29.1
−0.90
0.391
AB
3.7
11.9
0.32
0.759
AB 2
46.2
20.6
2.25
0.051
A2 B
17.5
20.6
0.85
0.417
A2 B 2
10.0
35.6
0.28
0.785
με τα επιμέρους αθροίσματα τετραγώνων να δίνονται στον πιο κάτω πίνακα:
Πίνακας 10.6: Πίνακας ANOVA Παλινδρόμηση - Παράδειγμα 32 Παραγοντικό Πείραμα
Πηγή
Μεταβλητότητας
Βαθμοί
Ελευθερίας
Άθροισμα
Τετραγώνων
A
1
1197008
B
1
A2
Μέσο
F
p-value
1197008
1060.08
0.000
2852
2852
2.53
0.146
1
23511
23511
20.82
0.001
B2
1
1534
15345
1.36
0.274
AB
1
113
113
0.10
0.759
AB 2
1
5704
5704
5.05
0.051
A2 B
1
817
8176
0.72
0.417
A2 B 2
1
89
89
0.08
0.785
Σφάλματα
9
10163
1129
–
–
Ολική
17
1241790
–
–
–
Άθροισμα
Τετραγώνων
Με βάση τα αποτελέσματα του Πίνακα ANOVA της ανάλυσης παλινδρόμησης έχουμε
SSA = SSAL + SSAS = 1197008 + 23511 = 1220519,
SSB = SSBL + SSBS = 2852 + 1534 = 4386
και
SSAB = SSAS BS + SSAL BL + SSAS BL + SSAL BS = 113 + 5704 + 817 + 89 = 6722
294
ΕΙΔΙΚΑ ΘΕΜΑΤΑ ΑΝΑΛΥΣΗΣ ΔΙΑΚΥΜΑΝΣΗΣ
τα οποία επιβεβαιώνονται αν εφαρμοστεί η ανάλυση διακύμανσης για το πλήρες παραγοντικό με αλληλεπίδραση
μέσω της διαδικασίας
Stat
Ê
ANOVA
Ê
General Linear Model
Ê
Fit General Linear Model
Πίνακας 10.7: Πίνακας ANOVA - Διπαραγοντική Ανάλυση με Αλληλεπίδραση - 32 Παραγοντικό Πείραμα
Πηγή
Μεταβλητότητας
Βαθμοί
Ελευθερίας
Άθροισμα
Τετραγώνων
A
2
1220519
B
2
AB
Μέσο
F
p-value
610260
540.45
0.000
4386
2193
1.94
0.199
4
6722
1681
1.49
0.284
Σφάλματα
9
10163
1129
–
–
Ολική
17
1241790
–
–
–
Άθροισμα
Τετραγώνων
Οι όποιες διαφορές οφείλονται σε στρογγυλοποιήσεις. Τα αποτελέσματα δείχνουν ότι με την Ανάλυση Παλινδρόμησης ο κάθε παράγοντας διασπάται σε γραμμικό και τετραγωνικό όρο (με έναν βαθμό ελευθερίας έκαστος) και
η αλληλεπίδραση διασπάται σε 4 όρους (επίσης με έναν βαθμό ελευθερίας έκαστος), κάτι που δεν υφίσταται στην
Ανάλυση Διακύμανσης όπου για κάθε παράγοντα οι δύο όροι εκπροσωπούνται από έναν μόνο όρο (με 2 βαθμούς
ελευθερίας) και η αλληλεπίδραση επίσης από έναν μόνο όρο (με 4 βαθμούς ελευθερίας). Το φαινόμενο αυτό δεν
παρατηρείται σε 2f πειράματα γιατί εκεί τόσο ο κάθε παράγοντας όσο και η κάθε αλληλεπίδραση έχουν έναν μόνο
βαθμό ελευθερίας, με αποτέλεσμα και στην Παλινδρόμηση και στη Διακύμανση να εκπροσωπούνται από έναν μόνο
όρο.
Στην περίπτωση που απαιτείται η μελέτη ενός 3f παραγοντικού πειράματος με περισσότερους από 3 παράγοντες,
αποφεύγεται η επανάληψη λόγω του μεγάλου πλήθους των δοκιμών που απαιτούνται. Σε αυτές τις περιπτώσεις,
ο Ερευνητής είναι υποχρεωμένος να υποθέσει ότι κάποιες μεγάλης τάξης αλληλεπιδράσεις είναι αμελητέες και να
τις χρησιμοποιήσει για να παίξουν τον ρόλο του σφάλματος. Όταν τα επίπεδα είναι ισαπέχοντα, τότε η διάσπαση
μπορεί να γίνει με 2 όρους για κάθε κύρια επίδραση, τη γραμμική και την τετραγωνική με 1 βαθμό ελευθερίας
έκαστος, με 4 όρους για κάθε αλληλεπίδραση πρώτης τάξης (πάλι με 1 βαθμό ελευθερίας έκαστος) σε 8 όρους για
κάθε αλληλεπίδραση δεύτερης τάξης (πάλι με 1 βαθμό ελευθερίας έκαστος). Η περαιτέρω μελέτη τέτοιων σχεδίων
ξεφεύγει από τους σκοπούς του παρόντος συγγράμματος.
10.2 Μη παραμετρική ανάλυση διακύμανσης
Στην ενότητα αυτή θα μελετηθούν οι δύο κλασικότερες και δημοφιλέστερες μη παραμετρικές μέθοδοι ανάλυσης διακύμανσης για τις περιπτώσεις εκείνες που δεν είναι δυνατόν να εφαρμοστούν οι παραμετρικές μέθοδοι,
συνήθως λόγω παραβίασης των προϋποθέσεων της ανάλυσης διακύμανσης. Η μέθοδος Kruskal-Wallis είναι η
μη παραμετρική μέθοδος που αντιστοιχεί στη μονοπαραγοντική ανάλυση διακύμανσης, και η μέθοδος Friedman αυτή που αντιστοιχεί στο σχέδιο τυχαιοποιημένων πλήρων ομάδων (μεταβλητές πλαισίου).
Ο έλεγχος Kruskal-Wallis ([9]) είναι μη παραμετρική διαδικασία που μπορεί να εφαρμοστεί για τη σύγκριση
δύο ή περισσότερων πληθυσμών με βάση αντίστοιχα ανεξάρτητα δείγματα. Στην απλή περίπτωση, των δύο
ΓΡΑΜΜΙΚΑ ΜΟΝΤΕΛΑ ΚΑΙ ΣΧΕΔΙΑΣΜΟΣ & ΑΝΑΛΥΣΗ ΠΕΙΡΑΜΑΤΩΝ ΜΕ ΕΦΑΡΜΟΓΕΣ ΣΕ R ΚΑΙ MINITAB
295
πληθυσμών, ο έλεγχος εκφυλίζεται στον έλεγχο των Mann-Whitney ([11]) και τον ισοδύναμο έλεγχο Wilcoxon
([18]). Στην απλή αυτή περίπτωση, ζητείται η σύγκριση δύο πληθυσμών, δηλαδή κατά πόσο οι συναρτήσεις
κατανομής τους είναι ίσες ή όχι. Αν μάλιστα θεωρηθεί ότι η συναρτησιακή μορφή των δύο κατανομών είναι
ίδια, ο έλεγχος ανάγεται σε έλεγχο των διαμέσων:
H0 : medianx = mediany
vs
H1 : medianx ̸= mediany .
Εναλλακτικά, θα μπορούσε να μελετηθεί και ο μονόπλευρος έλεγχος όπου μία από τις δύο διαμέσους είναι
μεγαλύτερη από την άλλη.
Οι έλεγχοι αυτοί βασίζονται όχι στις τιμές των μετρήσεων αλλά στις τάξεις (βαθμούς, ranks) των μετρήσεων
που είναι διαθέσιμες από τους δύο πληθυσμούς όταν έχουν διαταχθεί (όλες μαζί) σε αύξουσα σειρά. Αν οι πληθυσμοί είναι ίσοι (ίδιοι), τότε αναμένουμε ο μέσος όρος των τάξεων των μετρήσεων από τον έναν πληθυσμό να
ταυτίζονται (να είναι πάρα πολύ κοντά) με τον μέσο των τάξεων των μετρήσεων του άλλου πληθυσμού. Αντίθετα, αν για παράδειγμα, ο μέσος των τάξεων του ενός πληθυσμού είναι πολύ μικρός και ο μέσος των τάξεων
του άλλου πολύ μεγάλος σημαίνει ότι οι μετρήσεις από τον πρώτο πληθυσμό είναι πολύ μικρές συγκρινόμενες
με τις μετρήσεις του δεύτερου, και άρα η κατανομή που αντιστοιχεί στις μικρές μετρήσεις είναι αριστερότερα
από ότι η κατανομή των μεγάλων μετρήσεων. Ο έλεγχος συχνά και ιδιαιτέρως στην περίπτωση συμμετρικών
κατανομών (όπου η μέση τιμή και η διάμεσος ταυτίζονται), ισοδυναμεί με τον έλεγχο της σύγκρισης των μέσων.
Οι δημοφιλέστεροι έλεγχοι στη βιβλιογραφία για τη σύγκριση δύο πληθυσμών, οι οποίοι είναι ισοδύναμοι,
είναι των Wilcoxon και Mann-Whitney. Από την άλλη πλευρά, η πειραματική κατάσταση που αντιστοιχεί
στην περίπτωση k ≥ 2 ανεξαρτήτων τυχαίων δειγμάτων από k πληθυσμούς ή θεραπείες, και για την περίπτωση που ο έλεγχος ισοδυναμεί με έλεγχο των σύγκρισης μέσων, ο σχεδιασμός καθίσταται αντίστοιχος του
πλήρως τυχαιοποιημένου πειραματικού σχεδιασμού.
Έστω xi1 , ..., xini οι μετρήσεις από τον i πληθυσμό, i = 1, ..., k και R (xij ) η τάξη ( rank) της j μέτρησης
από τον i πληθυσμό, i = 1, ..., k, j = 1, ..., ni . Παρατηρούμε ότι αν το συνολικό μέγεθος δείγματος είναι
n = n1 + ... + nk , τότε οι τάξεις που ανατίθενται είναι όλοι οι ακέραιοι 1, 2, ..., n − 1, n.
P
Αν Ri = j R (xij ) το άθροισμα των τάξεων των μετρήσεων από τον πληθυσμό i και R̄i = Ri /ni ο
αντίστοιχος μέσος των τάξεων των μετρήσεων από τον πληθυσμό i, τότε αν η μηδενική υπόθεση είναι ορθή,
αναμένεται ότι όλοι οι μέσοι των R1 , ..., Rk θα είναι ίσοι ή έστω πολύ κοντά:
R2
Rk
R1
≈
≈ ... ≈
.
n1
n2
nk
Παρατηρώντας ότι:
X
Ri =
X
n(n + 1)
(n + 1)
&
R̄i =
2
2
προκύπτει ότι:
(n + 1)
Ri
=
ni
2
και κατά συνέπεια αναμένεται:
X Ri
Ri (n + 1)
n+1
−
≈0→
−
ni
2
ni
2
i
2
≈ 0.
Στην πιο πάνω ιδέα βασίστηκαν οι Kruskal & Wallis και πρότειναν τη στατιστική ελεγχοσυνάρτηση:
k
X
12
1
K −W =
n(n + 1) i=1 ni
Ri n + 1
−
ni
2
2
.
296
ΕΙΔΙΚΑ ΘΕΜΑΤΑ ΑΝΑΛΥΣΗΣ ΔΙΑΚΥΜΑΝΣΗΣ
Εναλλακτικά, χρησιμοποιείται η ελεγχοσυνάρτηση:
k
X
12
Ri2
K −W =
− 3(n + 1).
n(n + 1) i=1 ni
Όπως αναφέρθηκε και νωρίτερα, τιμές κοντά στο μηδέν ισοδυναμούν με αποδοχή της ταύτισης των δύο κατανομών (και άρα των μέσων/διαμέσων τους), ενώ μεγάλες τιμές οδηγούν στην απόρριψη της μηδενικής
υπόθεσης.
Επειδή η εύρεση της κατανομής της ελεγχοσυνάρτησης K − W είναι πολύπλοκη, ακόμα και για σχετικά
μικρές τιμές των k και n, έχει προταθεί μία προσέγγιση με βάση το Κεντρικό Οριακό Θεώρημα, σύμφωνα με
την οποία:
Ri − ERi
√
≈ N (0, 1)
V arRi
έτσι ώστε:
!
X Ri − ERi 2
√
≈ χ2k−1 .
V arRi
i
P
P
Σημειώνεται ότι για τους ακεραίους 1, 2, ...n ισχύει ότι i Ri = n(n+1)/2 και i Ri2 = n(n+1)(2n+
1)/6). Όμως τότε είναι εύκολο να δειχθεί ότι αν ισχύει η μηδενική υπόθεση της ταύτισης των πληθυσμών
(μέσων/διαμέσων), έχουμε ότι:
E (Ri ) = ni
n+1
2
& V ar (Ri ) = ni
(n + 1)(n − ni )
.
12
Με βάση τα παραπάνω οι Kruskal και Wallis έδειξαν ότι κάτω από τη μηδενική υπόθεση της ταύτισης των
πληθυσμών, ισχύει ότι:
k
X
1
ni (n + 1)
12
Ri −
K −W =
n(n + 1) i=1 ni
2
!2
≈ χ2k−1 .
Σημειώνεται ότι σε περίπτωση που έχουμε ταυτίσεις ( ties), δηλαδή αν έχουμε μετρήσεις που ταυτίζονται,
τότε η τάξη της καθεμίας ισούται με τον μέσο όρο των τάξεων που θα αντιστοιχούσαν στις μετρήσεις αυτές,
αν δεν ταυτίζονταν. Έτσι για παράδειγμα, αν όλες οι μετρήσεις από δύο δείγματα μπαίνουν σε αύξουσα σειρά
και προκύπτει το σύνολο μετρήσεων 5, 6, 6, 7, 8, 8, 8, 9, 10, 12, τότε αφενός μεν διαπιστώνεται ότι οι τάξεις
που θα πρέπει να χρησιμοποιηθούν είναι οι ακέραιοι από το 1 έως το 10, αφετέρου δε, οι τάξεις 2 και 3 πρέπει
να χρησιμοποιηθούν για τις δύο μετρήσεις που είναι ίσες με 6 ενώ οι τάξεις 5, 6 και 7 για τις μετρήσεις που
είναι ίσες με 8. Στην περίπτωση αυτή, ανατίθεται σε κάθε μέτρηση ίση με 6 η τάξη 2.5 (δηλαδή ο μέσος των
τάξεων 2 και 3 που θα τους ανατίθεντο αν οι μετρήσεις δεν ήταν ίσες) και η τάξη 6 σε κάθε μέτρηση ίση με την
τιμή 8.
Παράδειγμα 10.3. ([9]) Ένα εργοστάσιο έχει τρεις γραμμές παραγωγής από τις οποίες επιλέγονται δείγματα
προϊόντων μεγέθους n1 = 5, n2 = 3 και n3 = 4 και ζητείται να διερευνηθεί αν παρατηρούνται διαφορές μεταξύ
των τριών επιπέδων του παράγοντα ενδιαφέροντος (γραμμή παραγωγής).
ΓΡΑΜΜΙΚΑ ΜΟΝΤΕΛΑ ΚΑΙ ΣΧΕΔΙΑΣΜΟΣ & ΑΝΑΛΥΣΗ ΠΕΙΡΑΜΑΤΩΝ ΜΕ ΕΦΑΡΜΟΓΕΣ ΣΕ R ΚΑΙ MINITAB
297
Πίνακας 10.8: Πίνακας Δεδομένων - Παράδειγμα Kruskal - Wallis
Επίπεδο 1
Επίπεδο 2
Επίπεδο 3
340
339
347
345
333
343
330
344
349
342
–
355
338
–
–
Οι τάξεις για το δείγμα που προκύπτει από τη συνένωση των δειγμάτων των τριών γραμμών παραγωγής μαζί,
φαίνονται στον πιο κάτω πίνακα:
Πίνακας 10.9: Πίνακας Δεδομένων και Τάξεων - Παράδειγμα Kruskal - Wallis
Επίπεδο 1
Τάξη 1
Επίπεδο 2
Τάξη 2
Επίπεδο 3
Τάξη 3
340
5
339
4
347
10
345
9
333
2
343
7
330
1
344
8
349
11
342
6
–
–
355
12
338
3
–
–
–
–
Αθροίζοντας κάθετα την καθεμία από τις στήλες των τάξεων (ανά επίπεδο του παράγοντα) προκύπτει το άθροισμα
και ο μέσος των τάξεων ανά επίπεδο:
R1 = 24, R2 = 14, R3 = 40, R̄1 = 4.8, R̄2 = 4.7, R̄1 = 10.3,
από όπου ήδη διαφαίνεται ότι το τελευταίο επίπεδο (Επίπεδο 3) παρουσιάζει σημαντικά μεγαλύτερο μέσο όρο τάξεων από τα άλλα δύο.
Η σχετική διαδικασία στο Minitab είναι η ακόλουθη:
Stat
Ê
Nonparametrics
Ê
Kruskal-Wallis
όπου στο Response τοποθετείται η μεταβλητή απόκρισης και στο Factor ο παράγοντας ενδιαφέροντος.
Ο Πίνακας αποτελεσμάτων του ελέγχου δίνει τα ακόλουθα:
Πίνακας 10.10: Αποτελέσματα Ελέγχου Kruskal-Wallis
Βαθμοί Ελευθερίας
Ελεγχοσυνάρτηση
p-value
2
5.66
0.059
298
ΕΙΔΙΚΑ ΘΕΜΑΤΑ ΑΝΑΛΥΣΗΣ ΔΙΑΚΥΜΑΝΣΗΣ
Παρατηρούμε ότι αν και στο σύνηθες 5% επίπεδο σημαντικότητας η μηδενική υπόθεση γίνεται δεκτή, σε οποιοδήποτε επίπεδο άνω του 5.9% η μηδενική απορρίπτεται και άρα δεν ταυτίζονται οι διάμεσοι των τριών επιπέδων. Ήδη
από τους μέσους των τάξεων που έχουν καταγραφεί παραπάνω (τους οποίους δίνει και το output του Minitab), ο
Ερευνητής έχει μία σημαντική βεβαιότητα ότι η διαφοροποίηση οφείλεται αποκλειστικά στο τρίτο επίπεδο όπου
παρατηρούνται οι υψηλότερες μετρήσεις και κατ’ επέκταση, οι υψηλότερες τάξεις. Σημειώνεται ότι είναι εφικτό να
γίνουν πολλαπλές συγκρίσεις εάν ο Ερευνητής επιθυμεί να εντοπίσει το επίπεδο στο οποίο οφείλεται η στατιστικώς
σημαντική διαφορά.
Ο έλεγχος του Friedman είναι μία μη παραμετρική διαδικασία, αντίστοιχη του σχεδίου τυχαιοποιημένων πλήρων ομάδων. Στην περίπτωση αυτή, η διαδικασία υπολογισμού της στατιστικής συνάρτησης είναι η εξής:
1. Σε κάθε ομάδα j, j = 1, ..., b οι μετρήσεις των θεραπειών κατατάσσονται σε αύξουσα σειρά και αντιστοιχίζονται με την τάξη τους, Ri1 , Ri2 , ...Rib , i = 1, ..., k.
2. Αθροίζονται οι τάξεις για κάθε θεραπεία, Ri. =
Pb
j=1
Rij για κάθε θεραπεία i = 1, ..., k.
3. Υπολογίζεται η στατιστική συνάρτηση του Friedman από τον τύπο:
F =
k
X
12
R2 − 3b(k + 1)
bk(k + 1) i=1 i.
η οποία κάτω από τη μηδενική υπόθεση της ταύτισης των κατανομών των k πληθυσμών (επιπέδων ή
θεραπειών) ακολουθεί τη χ2 κατανομή με k − 1 βαθμούς ελευθερίας.
Εάν η μηδενική υπόθεση απορρίπτεται (και άρα δεν ταυτίζονται οι κατανομές των θεραπειών), ο Ερευνητής
μπορεί να χρησιμοποιήσει μία τεχνική αντίστοιχη των πολλαπλών συγκρίσεων του Tukey για τη σύγκριση
των μέσων των τάξεων των θεραπειών. Η μέθοδος αυτή είναι οι Πολλαπλές Συγκρίσεις Nemenyi ([15]) όπου
η διαφορά των μέσων τάξεων των θεραπειών, ανά δύο, δηλαδή η διαφορά:
|R̄i1 , − R̄i2 . | =
συγκρίνεται με την τιμή:
Ri1 . Ri2 .
−
b
b
s
k(k + 1)
,
12b
όπου q∞,k;α είναι το 100(1 − α)% ποσοστημόριο της κατανομής του τυποποιημένου εύρους για το οποίο
αντί του ∞ επιλέγεται συνήθως μία πάρα πολύ μεγάλη τιμή, π.χ. μερικές χιλιάδες.
q∞,k;α
Παράδειγμα 10.4. ([7]) Ζητείται μη παραμετρική μελέτη για την αξιολόγηση ενός παράγοντα A με τέσσερις
στάθμες (1, 2, 3 και 4) ως προς μεταβλητή πλαισίου με τέσσερις επίσης στάθμες (1, 2, 3 και 4). Οι 16 μετρήσεις
καταγράφονται στον επόμενο Πίνακα:
Πίνακας 10.11: Δεδομένα - Παράδειγμα Friedman
Επίπεδα Μεταβλητής
Πλαισίου
1
2
3
4
1
11
10
9
10
2
1
5
4
3
3
6
8
9
8
4
4
6
7
4
Επίπεδα Παράγοντα
ΓΡΑΜΜΙΚΑ ΜΟΝΤΕΛΑ ΚΑΙ ΣΧΕΔΙΑΣΜΟΣ & ΑΝΑΛΥΣΗ ΠΕΙΡΑΜΑΤΩΝ ΜΕ ΕΦΑΡΜΟΓΕΣ ΣΕ R ΚΑΙ MINITAB
299
Η σχετική διαδικασία στο Minitab είναι η ακόλουθη:
Stat
Ê
Nonparametrics
Ê
Friedman
όπου στο Response καταχωρίζεται η μεταβλητή απόκρισης, στο Treatment ο παράγοντας ενδιαφέροντος και στο
Blocks η μεταβλητή πλαισίου. Το output του Minitab δίνει καταρχήν έναν περιγραφικό πίνακα αναφορικά με τις
τάξεις ανά στάθμη (επίπεδο):
Πίνακας 10.12: Περιγραφικά Χαρακτηριστικά - Παράδειγμα Friedman
Επίπεδα Παράγοντα
n
Διάμεσος
Άθροισμα Τάξεων
1
4
10.00
15.50
2
4
3.50
4.00
3
4
8.00
12.50
4
4
5.50
8.00
Σύνολο
16
6.75
–
Η τιμή της ελεγχοσυνάρτησης Friedman ισούται με 11.47 με p-value = 0.009 που σημαίνει ότι δεν γίνεται δεκτή η μηδενική υπόθεση και άρα παρατηρούνται διαφορές μεταξύ των επιπέδων του παράγοντα A σε οποιοδήποτε
επίπεδο σημαντικότητας επιλέξει ο Ερευνητής, μεγαλύτερο από 0.009 ή χρησιμοποιώντας το λεκτικό του output
απορρίπτεται η υπόθεση ότι All Treatment Effects Are Zero.
Πίνακας 10.13: Αποτελέσματα Ελέγχου Friedman
Σημειώνεται ότι ο Ερευνητής θα μπορούσε να πιθανολογήσει το αποτέλεσμα αφενός μεν από τον Πίνακα Δεδομένων και τον Πίνακα των Περιγραφικών Χαρακτηριστικών του output, αφετέρου δε, σχεδιάζοντας το θηκόγραμμα
(boxplot) για τα τέσσερα επίπεδα του παράγοντα A.
300
ΕΙΔΙΚΑ ΘΕΜΑΤΑ ΑΝΑΛΥΣΗΣ ΔΙΑΚΥΜΑΝΣΗΣ
Σχήμα 10.1: Boxplot Friedman
10.3 Ανάλυση συνδιακύμανσης
Στην ενότητα αυτή θα μελετηθεί η ανάλυση συνδιακύμανσης ( Analysis of Covariance, ANCOVA) όπου
συνδυάζονται η ανάλυση παλινδρόμησης και η ανάλυση διακύμανσης. Η μέθοδος αυτή χρησιμοποιείται όταν
υπεισέρχεται στο πρόβλημα της ανάλυσης διακύμανσης μία μεταβλητή της οποίας η μεταβλητότητα δεν είναι
δυνατόν να τεθεί υπό έλεγχο κατά τον σχεδιασμό, αλλά είναι δυνατόν να αξιολογηθεί και να αδρανοποιηθεί,
αν αντιμετωπιστεί ως μία ανεξάρτητη μεταβλητή σε ένα μοντέλο παλινδρόμησης. Η ανεξάρτητη μεταβλητή
ή συμμεταβλητή (covariate) ή (concomitant), υπεισέρχεται στο πρότυπο διακύμανσης ως πρόσθετος όρος,
η συνεισφορά του οποίου μετριέται μέσω ενός συντελεστή παλινδρόμησης.
Το πρόβλημα παραμένει το ίδιο όπως και στα προηγούμενα κεφάλαια, δηλαδή εξετάζεται αν διαφοροποιούνται οι μέσοι όροι της εξαρτημένης μεταβλητής μεταξύ των επιπέδων ενός παράγοντα ενδιαφέροντος (ή και
περισσότερων) αφού προηγουμένως έχει τεθεί υπό έλεγχο (δηλαδή έχει αφαιρεθεί) η επίδραση μίας τρίτης
μεταβλητής ή συμμεταβλητής (ή και περισσότερων), η οποία δύναται να προβλέψει (σε κάποιο βαθμό) τη
μεταβλητή απόκρισης μέσω κάποιας συναρτησιακής σχέσης που συνήθως είναι η γραμμική σχέση, όπως αποτυπώνεται σε ένα μοντέλο παλινδρόμησης. Ουσιαστικά με την ανάλυση συνδιακύμανσης διορθώνονται οι
μέσοι όροι των επιπέδων, ανάλογα με την επίδραση της συμμεταβλητής στη μεταβλητή απόκρισης.
Οι δημοφιλέστερες περιπτώσεις εφαρμογής της ανάλυσης συνδιακύμανσης που θα συζητηθούν στην παρούσα ενότητα, είναι αυτές που αφορούν τη μονοπαραγοντική ανάλυση διακύμανσης και το σχέδιο τυχαιοποιημένων πλήρων ομάδων (μεταβλητές πλαισίου).
10.3.1 Ανάλυση συνδιακύμανσης σε πλήρως τυχαιοποιημένο σχεδιασμό
Όπως έχουμε αναφέρει, το βασικό πρότυπο διακύμανσης κατά έναν παράγοντα με k επίπεδα και n μετρήσεις
ανά επίπεδο/θεραπεία, δίνεται από τον τύπο:
yij = µ + ai + ε∗ij , i = 1, ..., k, j = 1, ..., n.
Αν τώρα μία ανεξάρτητη (συνεχής) μεταβλητή (συμμεταβλητή, covariate ή concomitant) x επιδρά γραμμικά στη μεταβλητή απόκρισης, αυτή μπορεί να υπεισέλθει στο μοντέλο μέσω ενός γραμμικού όρου κατά τα
ΓΡΑΜΜΙΚΑ ΜΟΝΤΕΛΑ ΚΑΙ ΣΧΕΔΙΑΣΜΟΣ & ΑΝΑΛΥΣΗ ΠΕΙΡΑΜΑΤΩΝ ΜΕ ΕΦΑΡΜΟΓΕΣ ΣΕ R ΚΑΙ MINITAB
301
πρότυπα της ανάλυσης παλινδρόμησης:
yij = µ + ai + βxij + εij
ή για σκοπούς υπολογιστικής ευκολίας μέσω ενός γραμμικού όρου της διαφοράς της xij από τον μέσο της,
έστω x̄.. :
yij = µ + ai + β(xij − x̄.. ) + εij ,
(10.1)
P
όπου xij = xij /(nk) η τιμή x της μεταβλητής X που αντιστοιχεί στην τιμή yij της μεταβλητής απόκρισης Y και x̄.. ο δειγματικός μέσος των xij .
Εάν πράγματι η συμμεταβλητή X επιδρά στην Y , τότε προφανώς το δεύτερο πρότυπο είναι καταλληλότερο
από το πρώτο. Επιπλέον, η μεταβλητότητα της Y που απομένει ανερμήνευτη (και καταχωρίζεται ως σφάλμα)
θα είναι μικρότερη σε σχέση με το πρώτο μοντέλο και άρα τα αποτελέσματα με το μοντέλο ANCOVA θα είναι
εγκυρότερα. Η ANCOVA μπορεί να θεωρηθεί ότι είναι η Ανάλυση Διακύμανσης ( ANOVA) για την ποσότητα yij − β (xij − x̄..) .
Οι προϋποθέσεις της ανάλυσης συνδιακύμανσης είναι ίδιες με αυτές της ανάλυσης διακύμανσης και κατά συνέπεια, θεωρώντας ότι τα σφάλματα είναι ανεξάρτητες τυχαίες μεταβλητές, τέτοιες ώστε ε ∼ N (0, σ 2 ),
έχουμε:
E (Yij ) = µ + ai + β (xij − x̄.. ) & V ar (Yij ) = σ 2
και άρα:
Yij ∼ N µ + ai + β (xij − x̄.. ) , σ 2 .
Σημειώνεται ότι η γραμμικότητα στο πρότυπο (10.1) δεν αποτελεί προϋπόθεση, αφού οποιουδήποτε βαθμού πολυωνυμική συναρτησιακή σχέση μεταξύ των μεταβλητών Y και X είναι δυνατόν να ενσωματωθεί στο
πρότυπο ANCOVA, όπως στο πιο κάτω πρότυπο όπου η σχέση είναι τετραγωνική:
yij = µ + ai + β (xij − x̄..) + γ (xij − x̄.. )2 + εij ,
ενώ εφικτή είναι και η αξιοποίηση περισσότερων της μίας συμμεταβλητών, όπως στην πιο κάτω σχέση που
υπεισέρχονται δύο συμμεταβλητές, οι x1 και η x2 :
yij = µ + ai + β1 x1ij − x̄1.. + β2 x2ij − x̄2.. + εij .
Τα πρότυπα ANCOVA μπορούν να μελετηθούν είτε με τη χρήση k − 1 δεικτριών μεταβλητών ( indicators)
και τη χρήση του προτύπου παλινδρόμησης είτε με τη χρήση του προτύπου διακύμανσης με κατάλληλη τροποποίηση των αθροισμάτων τετραγώνων ώστε να αδρανοποιηθεί η μεταβλητότητα που οφείλεται στη συμμεταβλητή x. H τελευταία είναι αυτή που θα περιγραφεί στην παρούσα ενότητα όπου θεωρούμε τη γενική
περίπτωση με ni μετρήσεις ανά θεραπεία/πληθυσμό, i = 1, ..., k.
Έστω τα συνήθη αθροίσματα τετραγώνων ξεχωριστά για τα Y = y:
SST Oy =
X
(yij − ȳ.. )2
(10.2)
i,j
SSRy =
X
(ȳi. − ȳ.. )2 =
i,j
SSEy =
X
ni (ȳi. − ȳ.. )2
(10.3)
i
X
i,j
(yij − ȳi. )2
(10.4)
302
ΕΙΔΙΚΑ ΘΕΜΑΤΑ ΑΝΑΛΥΣΗΣ ΔΙΑΚΥΜΑΝΣΗΣ
και για τα x:
SST Ox =
SSRx =
X
(xij − x̄.. )2
i,j
(x̄i. − x̄.. )2 =
i,j
SSEx =
P
X
P
P
X
X
(10.5)
ni (x̄i. − x̄.. )2
(xij − x̄i. )2
(10.7)
i,j
όπου ȳi. = j yij /ni , x̄i. = j xij /ni , ȳ.. = i,j yi,j /(ni k) και x̄.. =
το άθροισμα του γινομένου ( product) των X και Y :
SP T Ox =
X
(10.6)
i
P
i,j
xi,j /(ni k). Τέλος, ορίζουμε
(xij − x̄.. ) (yij − ȳ.. ) .
(10.8)
i,j
To SP T O είναι εύκολο να δειχθεί ότι διασπάται σε δύο όρους, το άθροισμα το οφειλόμενο στις θεραπείες (
Treatment Sum of Products):
SP R =
X
(xi. − x̄.. ) (yi. − ȳ.. ) =
i,j
X
ni (xi. − x̄.. ) (yi. − ȳ.. )
(10.9)
i
και το άθροισμα των σφαλμάτων του γινομένου ( Error Sum of Products) :
SP E =
X
(xij − x̄i. ) (yij − ȳj. )
(10.10)
i,j
έτσι ώστε:
SP T O = SP R + SP E.
Ο Πίνακας ANOVA παρουσιάζει πιο κάτω τόσο τα αθροίσματα τετραγώνων των X, των Y και του γινομένου τους (XY ), όσο και τα Τροποποιημένα Αθροίσματα AdSS ( Adjusted Sum of Squares) τα οποία
έχουν τροποποιηθεί για να απομονώσουν (δηλαδή να αδρανοποιήσουν) την επίδραση της συμμεταβλητής
X. Ο Πίνακας περιλαμβάνει ακόμα τους Τροποποιημένους βαθμούς ελευθερίας Ad β.ε και τα Τροποποιημένα Μέσα Τετράγωνα AdM S. Για περισσότερες λεπτομέρειες, ο αναγνώστης παραπέμπεται στο βιβλίο των
Neter, Wasserman & Kutner (Κεφάλαιο 23, [16]).
Πίνακας 10.14: Πίνακας ANCOVA
Πηγή
Μεταβλητότητας
SS (y)
SS (x)
SS (xy)
β.ε.
AdSS
Ad β.ε.
AdM S
Θεραπείες
SSRy
SSRx
SP R
k−1
SSRadj
k−1
M SRadj
Σφάλματα
SSEy
SSEx
SP E
n−k
SSEadj
n−k−1
M SEadj
Σύνολο
SST Oy
SST Ox
SP T O
n−1
SST Oadj
n−2
—
Ο πιο πάνω Πίνακας αντιπροσωπεύει τον Πίνακα ANCOVA για την Ανάλυση Συνδιακύμανσης, όπου n το
πλήθος των μετρήσεων,
SST Oadj = SST Oy −
(SP E)2
(SP T O)2
, SSEadj = SSEy −
& SSRadj = SST Oadj −SSEadj .
SST Ox
SSEx
Όπως φαίνεται από την τροποποίηση ( adjustment), οι συνολικοί βαθμοί ελευθερίας έχουν μειωθεί κατά έναν
(1) λόγω του ότι έχει αδρανοποιηθεί η συμμεταβλητή και πλέον είναι n − 2, ενώ κατά έναν (1) έχουν μειωθεί
ΓΡΑΜΜΙΚΑ ΜΟΝΤΕΛΑ ΚΑΙ ΣΧΕΔΙΑΣΜΟΣ & ΑΝΑΛΥΣΗ ΠΕΙΡΑΜΑΤΩΝ ΜΕ ΕΦΑΡΜΟΓΕΣ ΣΕ R ΚΑΙ MINITAB
303
και οι βαθμοί ελευθερίας του σφάλματος (n − k − 1), ενώ εκείνοι που αντιστοιχούν στις θεραπείες παραμένουν προφανώς, ίσοι με k − 1.
Όπως είναι αναμενόμενο η διαφορά μεταξύ της αρχικής συνολικής μεταβλητότητας SST Oy και της τροποποιημένης συνολικής μεταβλητότητας SST Oadj , δίνει τη μεταβλητότητα που εξηγείται (οφείλεται) στη
συμμεταβλητή x:
SS(x) = SST Oy − SST Oadj
που από την πρώτη από τις προηγούμενες εξισώσεις ισούται με:
SS(x) = SST Oy − SST Oadj
(SP T O)2
=
.
SST Ox
Ο έλεγχος μηδενικών επιδράσεων από τον παράγοντα ενδιαφέροντος, δηλαδή:
H0 : α1 = ... = αk = 0 vs H1 : όχι η H0
μελετάται από το πηλίκο των τροποποιημένων μέσων αθροισμάτων τετραγώνων, από την τελευταία στήλη
του Πίνακα ANOVA:
M SRadj
F =
M SEadj
που κάτω από τη μηδενική υπόθεση ακολουθεί την κατανομή F με k − 1 και n − k − 1 βαθμούς ελευθερίας
και με τη μηδενική υπόθεση να απορρίπτεται σε επίπεδο σημαντικότητας α όταν:
F =
M SRadj
> Fk−1,n−k−1;α .
M SEadj
Σημειώνεται ότι ο εκτιμητής του συντελεστή παλινδρόμησης β διαφοροποιείται ανάλογα με το κατά πόσο η
μηδενική υπόθεση των μηδενικών επιδράσεων του παράγοντα είναι αληθής ή όχι. Έτσι, αν η μηδενική υπόθεση
ισχύει και άρα αi = 0, i = 1..., k, τότε ο εκτιμητής του συντελεστή β είναι ο συνήθης εκτιμητής ελαχίστων
τετραγώνων στο πρότυπο παλινδρόμησης μεταξύ των Y και X:
P
β̂ =
i,j
(xij − x̄.. ) (yij − ȳ.. )
SP T O
.
=
P
2
SST Ox
i,j (xij − x̄.. )
Αν πάλι τα αi είναι διαφορετικά ανά επίπεδο (και άρα οι επιδράσεις του παράγοντα είναι στατιστικώς σημαντικές), τότε ο εκτιμητής του κοινού συντελεστή παλινδρόμησης για όλα τα επίπεδα είναι:
P
β̂ =
i,j
(xij − x̄i. ) (yij − ȳi. )
SP E
=
.
P
2
SSEx
i,j (xij − x̄i. )
(10.11)
Ο συγκεκριμένος εκτιμητής μπορεί να θεωρηθεί ως ο μέσος όρος με βάρη, των εκτιμητών των συντελεστών
παλινδρόμησης που θα προέκυπταν αν για κάθε επίπεδο i ξεχωριστά, εφαρμοζόταν ένα μοντέλο παλινδρόμησης. Πράγματι, σε εκείνη την περίπτωση το εξωτερικό άθροισμα ως προς i στη σχέση (10.11), δεν θα υφίστατο και άρα ο εκτιμητής του συντελεστή παλινδρόμησης για το i επίπεδο του παράγοντα ενδιαφέροντος
θα ήταν:
P
(xij − x̄i. ) (yij − ȳi. )
.
β̂i = j P
2
j (xij − x̄i. )
Είναι εύκολο να διαπιστωθεί ότι αν wi =
P
j
(xij − x̄i. )2 τότε:
P
i
wi β̂i
= β̂.
i wi
P
304
ΕΙΔΙΚΑ ΘΕΜΑΤΑ ΑΝΑΛΥΣΗΣ ΔΙΑΚΥΜΑΝΣΗΣ
Παράδειγμα 10.5. Τα δεδομένα αφορούν τις πωλήσεις Y με παράγοντα ενδιαφέροντος την προωθητική καμπάνια (με 3 διαφορετικούς τρόπους προώθησης του προϊόντος) και με συμμεταβλητή τις πωλήσεις x την τελευταία
περίοδο, πριν την έναρξη της προωθητικής καμπάνιας. Τα δεδομένα (y, x) προέρχονται από το βιβλίο των Neter,
Wasserman & Kutner [16] και δίνονται για 5 σημεία πώλησης ανά τύπο προώθησης του προϊόντος (1, 2 & 3):
Πίνακας 10.15: Πίνακας Δεδομένων - Πωλήσεις
Θεραπεία
1
2
3
y
38
43
24
x
21
34
23
y
39
38
32
x
26
26
29
y
36
38
31
x
22
29
30
y
45
27
21
x
28
18
16
y
33
34
28
x
19
25
29
Επανάληψη
Για την εφαρμογή της ανάλυσης συνδιακύμανσης εφαρμόζεται στο Minitab η ίδια διαδικασία που ακολουθείται για
την ανάλυση διακύμανσης, αξιοποιώντας ταυτόχρονα την επιλογή Covariates :
Stat
Ê
ANOVA
Ê
General Linear Model
Ê
Fit General Linear Model
όπου στα Responses τοποθετείται η μεταβλητή απόκρισης, στα Factors ο παράγοντας ενδιαφέροντος και στα Covariates η συμμεταβλητή x. Τα αποτελέσματα συμπεριλαμβανομένων των αρχικών και των τροποποιημένων αθροισμάτων, όπως παρουσιάστηκαν νωρίτερα στην παρούσα ενότητα, δίνονται στον πιο κάτω πίνακα (δεν περιλαμβάνονται στο output του Minitab):
Πίνακας 10.16: Πίνακας ANCOVA - Πωλήσεις
Πηγή
Μεταβλητότητας
SS (y)
SS (x)
SS (xy)
β.ε.
AdSS
Ad β.ε.
AdM S
Θεραπείες
338.8
26.8
−37.4
2
417.151
2
208.575
Σφάλματα
307.6
333.2
299.4
12
38.571
11
3.506
Σύνολο
646.4
360.0
262.0
14
455.722
13
—
Όσον αφορά το Minitab, το output είναι το εξής:
ΓΡΑΜΜΙΚΑ ΜΟΝΤΕΛΑ ΚΑΙ ΣΧΕΔΙΑΣΜΟΣ & ΑΝΑΛΥΣΗ ΠΕΙΡΑΜΑΤΩΝ ΜΕ ΕΦΑΡΜΟΓΕΣ ΣΕ R ΚΑΙ MINITAB
305
Πίνακας 10.17: Πίνακας ANCOVA - Πωλήσεις
Πηγή
Μεταβλητότητας
Βαθμοί
Ελευθερίας
Άθροισμα
Τετραγώνων
x
1
269.029
A
2
Σφάλματα
Ολική
Μέσο
F
p-value
269.029
76.72
0.000
417.151
208.575
59.48
0.000
11
38.571
3.506
–
–
14
646.400
–
–
–
Άθροισμα
Τετραγώνων
και συνοδεύεται από τον πίνακα των εκτιμητών των συντελεστών του προτύπου, δηλαδή:
Πίνακας 10.18: Συντελεστές Προτύπου - Πωλήσεις
Συντελεστής
Εκτιμητής
Τυπικό
Σφάλμα
Ελεγχοσυνάρτηση
p-value
µ̂
11.34
2.61
4.34
0.001
β̂
0.899
0.103
8.76
0.000
â1
6.017
0.708
8.50
0.000
â2
0.942
0.699
1.35
0.205
Από τον προηγούμενο πίνακα προκύπτει ότι:
µ̂ = 11.34, β̂ = 0.899, α̂1 = 6.017, α̂2 = 0.942 & α̂3 = −6.959
με το τελευταίο να προκύπτει λόγω της συνθήκης του προτύπου διακύμανσης, σύμφωνα με την οποία οι επιδράσεις
P
πρέπει να ικανοποιούν τη σχέση αi = 0.
Τα αποτελέσματα της ανάλυσης οδηγούν στο συμπέρασμα ότι τόσο η συμμεταβλητή όσο και τα επίπεδα του παράγοντα ενδιαφέροντος, έχουν στατιστικά σημαντική επίδραση στη μεταβλητή απόκρισης (με p-value = 0.000
και τα δύο σύμφωνα με τον παραπάνω Πίνακα ANOVA). Σημειώνεται ότι η ανάλυση συνδιακύμανσης επιτρέπει
και τη μελέτη της αλληλεπίδρασης μεταξύ της συμμεταβλητής x και του παράγοντα ενδιαφέροντος, που όμως στην
περίπτωση αυτή, εάν μελετηθεί θα διαπιστωθεί ότι δεν είναι στατιστικά σημαντικός, στα συνήθη επίπεδα σημαντικότητας.
Συμπερασματικά, τα πρότυπα για κάθε επίπεδο του παράγοντα ενδιαφέροντος θα έχουν κοινή κλίση (δηλαδή συντελεστή β) όσον αφορά το μέρος που σχετίζεται με την ανάλυση παλινδρόμησης, αλλά διαφορετικό μέσο (µ+αi )
όσον αφορά το τμήμα που σχετίζεται με την ανάλυση διακύμανσης με τις εκτιμήτριες εξισώσεις για τις εκτιμήσεις
των yij να δίνονται από τους τύπους:
(1) :
(2) :
(3) :
αντίστοιχα για τα επίπεδα 1, 2 και 3.
ŷ = 17.35 + 0.899x,
ŷ = 12.28 + 0.899x,
ŷ = 4.38 + 0.899x
306
ΕΙΔΙΚΑ ΘΕΜΑΤΑ ΑΝΑΛΥΣΗΣ ΔΙΑΚΥΜΑΝΣΗΣ
10.3.2 Ανάλυση συνδιακύμανσης με έναν παράγοντα και μεταβλητή πλαισίου
Το πρότυπο ANCOVA που χρησιμοποιήθηκε πιο πάνω, μπορεί να γενικευτεί ώστε να περιλαμβάνει και μία
μεταβλητή πλαισίου (ομάδα) O με m επίπεδα. Στην περίπτωση αυτή, το πρότυπο παίρνει τη μορφή:
yijk = µ + ai + oj + β (xijk − x̄... ) + εijk , i = 1, ..., k, j = 1..., m, k = 1, ..., n,
(10.12)
όπου oj η επίδραση του επιπέδου j της μεταβλητής πλαισίου O. Στην περίπτωση αυτή, στον Πίνακα ANOVA
του προηγούμενου προτύπου, οι όροι που αφορούν τις θεραπείες προκύπτουν από τον συνδυασμό του παράγοντα ενδιαφέροντος, έστω A, και της μεταβλητής πλαισίου O, έτσι ώστε:
SSRy = SSAy + SSOy , SSRx = SSAx + SSOx & SP R = SP A + SP O,
με τους τύπους να είναι αντίστοιχοι με αυτούς του προηγούμενου προτύπου, με μόνη διαφορά ότι τα αθροίσματα, όπως και οι δείκτες όλων των όρων, είναι ως προς i, j και k.
Το πρόβλημα μπορεί να γενικευτεί και περαιτέρω με τη συμπερίληψη και δεύτερου παράγοντα ενδιαφέροντος
(είτε αντί είτε συμπληρωματικά της μεταβλητής πλαισίου) όπου υπεισέρχεται και η μελέτη της αλληλεπίδρασης των δύο παραγόντων. Στη γενικότερη αυτή περίπτωση, το πρότυπο συνδιακύμανσης δύο παραγόντων
A και B με αλληλεπίδραση (AB) και μία μεταβλητή πλαισίου , έχει τα εξής αθροίσματα τετραγώνων:
Πίνακας 10.19: Πίνακας Αθροισμάτων Τετραγώνων - ANCOVA (2 παράγοντες, αλληλεπίδραση, 1 ομάδα)
Πηγή
Μεταβλητότητας
SS (y)
SS (x)
SS (xy)
Βαθμοί
Ελευθερίας
A
SSAy
SSAx
SP A
k−1
B
SSBy
SSBx
SP B
b−1
AB
SSABy
SSABx
SP AB
(k − 1)(b − 1)
O
SSOy
SSOx
SP O
m−1
Σφάλματα
SSEy
SSEx
SP E
n − kbm
Σύνολο
SST Oy
SST Ox
SP T O
n−1
Η μελέτη του προτύπου αυτού έχει σημαντική πολυπλοκότητα και ο αναγνώστης παραπέμπεται στο βιβλίο
των Neter, Wasserman & Kutner [16] για περισσότερες πληροφορίες.
ΒΙΒΛΙΟΓΡΑΦΙΑ
[1] Κουτρουβέλης, Ι.Α. (2000). Προηγμένα εργαλεία και μέθοδοι για τον έλεγχο της ποιότητας, Τόμος Β,
Σχεδιασμός και Ανάλυση Πειραμάτων. Πάτρα: Ελληνικό Ανοικτό Πανεπιστήμιο.
[2] Κούτρας, Μ.Β., & Ευαγγελάρας, Χ. (2010). Ανάλυση παλινδρόμησης, θεωρία και εφαρμογές. Αθήνα:
Εκδόσεις Σταμούλη Α. Ε.
[3] Barker, T.B., & Milivojevich, A. (2016). Quality by experimental design. Routledge, Taylor and Francis Group.
[4] Blainey, P., Krzywinski, M., & Altman, N. (2014). Points of significance: replication. Nat Meth, 11:
879-880.
[5] Box, G.E.P., Hunter, W.G., & Hunter, J.S. (2005). Statistics for experimenters: design, innovation and
discovery (2nd ed.). John Wiley and Sons.
[6] Box, G.E.P., Hunter, W.G., & Hunter, J.S. (1978). Statistics for experimenters. John Wiley and Sons.
[7] Friedman, M. (1937). The use of ranks to avoid the assumption of normality implicit in the analysis
of variance. J. Amer. Statist. Assoc., 32, 675-701.
[8] Hicks, C.R. (1997). Fundamental concepts in the design of experiments (4th ed.). John Wiley and Sons.
[9] Kruskal, W.H., & Wallis, W.A. (1952). Use of ranks in one-criterion variance analysis. Journal of the
American Statistical Association, 47(260), 583-621.
[10] Lawson, J. (2014). Design and analysis of experiments with R. Chapman and Hall/CRC.
[11] Mann, H.B., & Whitney, D.R. (1947). On a test of whether one of two random variables is stochastically larger than the other. Annals of Mathematical Statistics, 18(1), 50-60.
[12] Martins, M.C.M., Caldana, C., Wolf, L.D., & de Abreu, L.G.F. (2018). The importance of experimental design, quality assurance, and control in plant metabolomics experiments. Methods Mol Biol.,
1778, 3-17. doi: 10.1007/978-1-4939-7819-9_1. PMID: 29761427
[13] Mitra, A. (2016). Fundamentals of quality control and improvement (4th ed.). John Wiley and Sons.
308
ΒΙΒΛΙΟΓΡΑΦΙΑ
[14] Montgomery, D.C. (2013). Design and analysis of experiments (8th ed.). John Wiley and Sons.
[15] Nemenyi, P.B. (1963). Distribution-free multiple comparisons (PhD thesis). Princeton University.
[16] Neter, J., Wasserman, W., & Kutner, M.H. (1990). Applied linear statistical models. Burr Ridge, Illinois: Irwin.
[17] Pohlert, T. (2014). The pairwise multiple comparison of mean ranks package (PMCMR).
[18] Wilcoxon, F. (1945). Individual comparisons by ranking methods. Biometrics Bulletin, 1(6), 80-83.
ΚΕΦΑΛΑΙΟ 11
ΕΙΣΑΓΩΓΗ ΣΤΑ ΓΕΝΙΚΕΥΜΕΝΑ ΓΡΑΜΜΙΚΑ ΜΟΝΤΕΛΑ
Σύνοψη
Το παρόν κεφάλαιο παρουσιάζει εξειδικευμένα θέματα στην ανάλυση παλινδρόμησης, συμπεριλαμβανομένων των μη γραμμικών και γενικευμένων γραμμικών μοντέλων, του δίτιμου λογιστικού
καθώς και του Poisson μοντέλου παλινδρόμησης.
Προαπαιτούμενη γνώση
Το κεφάλαιο προϋποθέτει τη γνώση και κατανόηση των προηγουμένων κεφαλαίων.
Προσδοκώμενα μαθησιακά αποτελέσματα
Μετά τη μελέτη του παρόντος κεφαλαίου ο αναγνώστης αναμένεται να:
• αναγνωρίζει και να μελετά μη γραμμικά μοντέλα,
• αναγνωρίζει και να μελετά γενικευμένα γραμμικά πρότυπα,
• διεξάγει ελέγχους καλής προσαρμογής,
• αναγνωρίζει και να μελετά το δίτιμο λογιστικό μοντέλο παλινδρόμησης,
• αναγνωρίζει και να μελετά το Poisson μοντέλο παλινδρόμησης,
• έχει μία βασική αντίληψη για τα γραμμικά και τα γενικευμένα γραμμικά μεικτά μοντέλα.
Καραγρηγορίου, Α., & Καλλιγέρης, Ε. Ν. (�2023). «Γραμμικά Μοντέλα και Σχεδιασμός & Ανάλυση Πειραμάτων με Εφαρμογές
σε R και Minitab».
Αθήνα: Κάλλιπος, Ανοικτές Ακαδημαϊκές Εκδόσεις. http://dx.doi.org/10.57713/kallipos-70
Creative Commons Αναφορά Δημιουργού - Μη Εμπορική Χρήση - Παρόμοια Διανομή 4.0
310
ΕΙΣΑΓΩΓΗ ΣΤΑ ΓΕΝΙΚΕΥΜΕΝΑ ΓΡΑΜΜΙΚΑ ΜΟΝΤΕΛΑ
11.1 Εισαγωγή
Το 1972, οι Nelder και Wedderburn [14] ανέπτυξαν έναν μηχανισμό ο οποίος στόχευε στην αντικατάσταση
της έως τότε (ευρέως) χρησιμοποιούμενης τεχνικής εκτίμησης παραμέτρων των Newton και Raphson [16].
Ο λόγος για τα Γενικευμένα Γραμμικά Μοντέλα (ΓΓΜ), τα οποία θα αναλυθούν στο παρόν κεφάλαιο και αποτελούν ουσιαστικά την ευθεία γενίκευση των γραμμικών μοντέλων που συζητήθηκαν στα πρώτα έξι κεφάλαια
του παρόντος συγγράμματος.
11.2 Το μη γραμμικό μοντέλο
11.2.1 Γενικό πρότυπο
Το μη γραμμικό μοντέλο αποτελεί επέκταση του γραμμικού, καθώς επιτρέπει συναρτησιακές μορφές διαφορετικές από αυτή της ευθείας. Ορίζεται ως:
yi = f Xi′ , β∼ + ϵi ,
i = 1, ..., n,
(11.1)
όπου yi η i-τιμή της τυχαίας μεταβλητής Yi , Xi′ η i-οστή γραμμή του πίνακα σχεδιασμού και f Xi′ , β∼ μία
μη γραμμική συνάρτηση ως προς το p-διάστατο διάνυσμα παραμέτρων β∼ .
Οι υποθέσεις, που διέπουν τα σφάλματα του μη γραμμικού μοντέλου, είναι όμοιες με αυτές του γραμμικού:
i.i.d.
ϵi ∼
από όπου προκύπτει ότι:
i.i.d.
Yi ∼
0, σ 2 ,
f Xi′ , β∼ , σ 2 .
Για τη διενέργεια στατιστικών ελέγχων, ορίζουμε την κανονική ως την κατανομή των τυχαίων σφαλμάτων:
i.i.d.
ϵi ∼ N 0, σ 2 .
11.2.2 Εκτίμηση παραμέτρων μη γραμμικού μοντέλου
Για την εκτίμηση των παραμέτρων του μοντέλου της (11.1) θα γίνει χρήση της γνωστής μεθόδου των ελαχίστων τετραγώνων. Συγκεκριμένα, θέλουμε να ελαχιστοποιήσουμε την ποσότητα:
min Q β∼ = min
β
β
∼
∼
= min
β
∼
n
X
(yi − E (i ))2
i=1
n X
i=1
yi − f Xi′ , β∼
2
.
Οι ΕΕΤ του μη γραμμικού μοντέλου προκύπτουν από την επίλυση των εξισώσεων:
∂Q β∼
∂βj
= −2
n X
i=1
⇔
n X
i=1
Είναι φανερό ότι η ποσότητα
yi − f Xi′ , β∼
yi − f Xi′ , β∼
∂f (Xi′ ,β )
∼
∂βj
∂f Xi′ , β∼
∂βj
∂f Xi′ , β∼
∂βj
=0
= 0,
j = 1, ..., p.
είναι συνάρτηση του β∼ και άρα για τον υπολογισμό των εκτιμητριών
β̂∼ θα πρέπει γίνει χρήση επαναληπτικών (αριθμητικών) μεθόδων. Για περισσότερες πληροφορίες, ο ενδιαφερόμενος αναγνώστης παραπέμπεται στην [1].
ΓΡΑΜΜΙΚΑ ΜΟΝΤΕΛΑ ΚΑΙ ΣΧΕΔΙΑΣΜΟΣ & ΑΝΑΛΥΣΗ ΠΕΙΡΑΜΑΤΩΝ ΜΕ ΕΦΑΡΜΟΓΕΣ ΣΕ R ΚΑΙ MINITAB
311
11.3 Πρότυπο γενικευμένου γραμμικού μοντέλου
Ένα ΓΓΜ ορίζεται από ένα σύνολο ανεξάρτητων τυχαίων μεταβλητών από μία κατανομή, της οποίας η πυκνότητα ανήκει στην εκθετική οικογένεια κατανομών (11.2.) Τα ΓΓΜ έχουν χρησιμοποιηθεί ως επί το πλείστον
σε περιπτώσεις όπου οι παρατηρήσεις είναι συνεχείς. Όμως, το γεγονός αυτό δεν σημαίνει ότι δεν επιτρέπεται η χρήση τους σε περιπτώσεις όπου οι παρατηρήσεις είναι διακριτές. Για παράδειγμα, αν υποθέσουμε
την τυχαία μεταβλητή Y = {έκβαση μίας διεργασίας}, τότε αυτή μπορεί να έχει δύο δυνατές εκβάσεις
{1 (υπό έλεγχο), 0 (εκτός ελέγχου)}. Βάσει των προαναφερθέντων, σε αντίθεση με τα γραμμικά μοντέλα,
στα ΓΓΜ ο Ερευνητής μπορεί να θεωρήσει διάφορες κατανομές για την εξαρτημένη μεταβλητή Y , όπως Κανονική, Διωνυμική, Poisson και Πολυωνυμική.
Η μορφή ενός ΓΓΜ είναι όμοια με αυτή της (11.1), με τη διαφορά ότι η ποσότητα f Xi′ , β∼ είναι απαραιτήτως γραμμική ως προς τις παραμέτρους. Έτσι λοιπόν, η κατασκευή ενός ΓΓΜ προϋποθέτει τη γνώση:
1. της κατανομής των δεδομένων,
2. της συνάρτησης του μέσου (ο οποίος θα μοντελοποιηθεί ως γραμμικός συνδυασμός των επεξηγηματικών μεταβλητών),
3. των επεξηγηματικών μεταβλητών.
Ας υποθέσουμε ένα τυχαίο διάνυσμα ανεξάρτητων παρατηρήσεων y∼ = (y1 , ..., yn )′ από μία κατανομή με
πυκνότητα η οποία ανήκει στην εκθετική οικογένεια:
i.i.d.
Yi = yi ∼ fYi (yi ),
όπου
i = 1, ..., n,
)
(
yi γi − b (γi )
− c (yi , τ ) ,
fYi (yi ) = exp
τ2
(11.2)
με γi να εξαρτάται από την αναμενόμενη τιμή των Yi , τ η παράμετρος κλίμακας (scale parameter) και b, c
αυθαίρετες συναρτήσεις.
Η μορφή, στην οποία παρουσιάζεται η fYi (yi ) στην (11.2), ονομάζεται κανονική μορφή.
Παράδειγμα 11.1. Έστω ότι έχουμε στη διάθεσή μας ανεξάρτητες τυχαίες μεταβλητές y1 , ..., yn από κανονική
κατανομή, και θέλουμε να φέρουμε τη μορφή της συνάρτησης πυκνότητας πιθανότητας σε αυτή της σχέσης (11.2):
(
(yi −µi )2
yi µi − 12 µ2i
1
1
1 yi2
2
fYi (yi ) = √
−
log
2πσ
+
e− 2σ2 = exp
σ2
2
2 σ2
2πσ 2
!)
.
Στόχος μας είναι η διερεύνηση, και εν συνεχεία η αναγνώριση της όποιας σύνδεσης μπορεί να υπάρχει μεταξύ
της μέσης τιμής της εκάστοτε κατανομής και των διαφόρων επεξηγηματικών μεταβλητών. Το εργαλείο το
οποίο επιτυγχάνει το παραπάνω δεν είναι άλλο από την επονομαζόμενη συνάρτηση σύνδεσης (link function).
Η τελευταία αποτελεί μία συνάρτηση, έστω g, της αναμενόμενης τιμής µi των Yi και ορίζεται ως:
g (µi ) = Xi′ β∼ ,
(11.3)
όπου Xi′ είναι η i-οστή γραμμή του πίνακα σχεδιασμού και β∼ το διάνυσμα των παραμέτρων του μοντέλου υπό
εξέταση.
Όπως προδίδει και η μορφή της, η συνάρτηση σύνδεσης αποτελεί την έκφραση της μέσης τιμής των Yi , µi ,
και κατ’ επέκταση των παραμέτρων της κατανομής, ως γραμμική συνάρτηση (ως προς τις παραμέτρους) των
επεξηγηματικών μεταβλητών Xi .
312
ΕΙΣΑΓΩΓΗ ΣΤΑ ΓΕΝΙΚΕΥΜΕΝΑ ΓΡΑΜΜΙΚΑ ΜΟΝΤΕΛΑ
Πίνακας 11.1: Στοιχεία κανονικής μορφής γνωστών κατανομών
b (γi )
τ2
n log (1 + epi )
1
γi
Κατανομή
pi
1−pi
c (yi , τ )
log n
yi
Bin (n, pi )
log
N B (α, pi )
log (1 − pi )
P (λi )
log (λi )
λi
1
log(yi !)
Gamma (α, β)
−β
α log (β)
1
−α log (yi ) + log yi + log Γ (α)
N (µi , σ 2 )
µi
1 2
µ
2 i
σ2
−α log
1−epi
epi
1
log
1
2
yi −1
α−1
log 2πσ 2 +
2
1 yi
2 σ2
11.3.1 Εκτιμητής μέγιστης πιθανοφάνειας
Βασιζόμενοι στη σχέση (11.2), η μορφή της log-πιθανοφάνειας δίνεται από τον τύπο:
l = log L =
n
X
i=1
!
n
X
yi γi − b (γi )
c (yi , τ ) .
−
τ2
i=1
Για την εύρεση των εξισώσεων μεγίστης πιθανοφάνειας, και κατ’ επέκταση των αντίστοιχων εκτιμητών, θα
χρειαστούμε μερικές χρήσιμες ταυτότητες, όπως αυτές απορρέουν από τις σχέσεις:
∂ log fYi (yi )
E
∂γi
και
∂ log fYi (yi )
V ar
∂γi
!
!
=0
(11.4)
!
∂ 2 log fYi (yi )
= −E
.
∂γi2
(11.5)
Αρχικά, εφαρμόζουμε τη σχέση (11.2) στις (11.4) και (11.5), αντίστοιχα:

E
yi −

∂b(γi )
∂γi 
2
τ
=0
(11.6)
ΓΡΑΜΜΙΚΑ ΜΟΝΤΕΛΑ ΚΑΙ ΣΧΕΔΙΑΣΜΟΣ & ΑΝΑΛΥΣΗ ΠΕΙΡΑΜΑΤΩΝ ΜΕ ΕΦΑΡΜΟΓΕΣ ΣΕ R ΚΑΙ MINITAB
313
Πίνακας 11.2: Συνήθεις συναρτήσεις σύνδεσης γνωστών κατανομών
Συνάρτηση σύνδεσης (g(µi ))
Κατανομή
Μέση τιμή (µi )
B(pi )
pi
P (λi )
λi
log (λi )
Λογαριθμική (log)
N (µi , σ 2 )
µi
µi
Ταυτοτική (Identity)
Gamma (αi , β)
αi β
1
αi β
Αμοιβαία (Reciprocal)
log
pi
1−pi
Ονομασία
logit
ή ισοδύναμα
E (yi ) = µi =
και

V ar 

yi −
∂b(γi )
∂γi 
2
τ
∂b(γi )
.
∂γi
(11.7)
!
1 ∂ 2 b(γi )
= −E − 2
.
τ ∂γi2
(11.8)
Εφαρμόζοντας τη σχέση (11.7) στη σχέση (11.8):
y i − µi
V ar
τ2
ή ισοδύναμα
V ar (yi ) = τ 2
=
1 ∂ 2 b(γi )
τ 2 ∂γi2
∂ 2 b(γi )
≡ τ 2 v (µi ) .
∂γi2
2
b(γi )
καλείται συνάρτηση διασποράς (variance function), καθώς εκφράζει τον
Η ποσότητα v (µi ) = ∂ ∂γ
2
i
τρόπο με τον οποίο η διασπορά των παρατηρήσεων yi εξαρτάται από τον αντίστοιχο μέσο τους.
Τέλος, δύο ακόμη χρήσιμες ταυτότητες είναι οι εξής:
∂γi
=
∂µi
∂µi
∂γi
!−1
=
∂ 2 b (γi )
γi2
!−1
= v (µi )−1 .
(11.9)
314
ΕΙΣΑΓΩΓΗ ΣΤΑ ΓΕΝΙΚΕΥΜΕΝΑ ΓΡΑΜΜΙΚΑ ΜΟΝΤΕΛΑ
Χρησιμοποιώντας τον κανόνα αλυσίδας και τη σχέση (11.3):
∂µi
∂µi ∂g(µi )
=
=
∂β∼
∂g(µi ) ∂β∼
∂g(µi )
∂µi
!−1
∂Xi′ β∼
∂β∼
=
∂g(µi )
∂µi
!−1
Xi′ .
(11.10)
Έχοντας θεσπίσει όλα τα βασικά εργαλεία, μπορούμε να προχωρήσουμε στον υπολογισμό των εξισώσεων μεγίστης πιθανοφάνειας για το β∼ .
!
n
n
X
∂l
∂ X
yi γi − b (γi )
=
−
c (yi , τ )
∂β∼
∂β∼ i=1
τ2
i=1

!

n
∂γ
1 X
∂b(γi ) ∂γi 
yi i −
= 2
τ i=1
∂β∼
∂γi ∂β∼
=
n
1 X
∂γi
(yi − µi )
2
τ i=1
∂β∼
n
∂γi ∂µi
1 X
(yi − µi )
= 2
τ i=1
∂µi ∂β∼
n
1 X
(yi − µi )
= 2
Xi′
τ i=1 v(µi )gµ (µi )
−1
2 (µ )
wi =(v(µi )gµ
i )
====
n
1 X
(yi − µi )wi gµ (µi )Xi′ .
2
τ i=1
(11.11)
Γράφοντας τη σχέση (11.11) σε όρους πινάκων:
1
∂l
),
= 2 X′ W∆(y∼ − µ
∼
∂β∼
τ
(11.12)
όπου W = {d:diagonal wi } και ∆ = {d gµ (µi )}, οι εξισώσεις μεγίστης πιθανοφάνειας (συχνά αναφερόμενες ως κανονικές ή εκτιμητικές εξισώσεις) δίνονται από τον τύπο:
X′ W∆y∼ = X′ W∆µ
.
∼
(11.13)
Το πρόβλημα στις παραπάνω εξισώσεις έγκειται στο γεγονός ότι οι ποσότητες W, ∆ και µ
αποτελούν (συνήθως)
∼
μη γραμμικές συναρτήσεις του β∼ και άρα δεν μπορεί να δοθεί η λύση τους σε αναλυτική/κλειστή μορφή. Για
τον λόγο αυτό, υπάρχουν υπολογιστικές (ή αριθμητικές ή επαναληπτικές) μέθοδοι/αλγόριθμοι, π.χ. ExpectationMaximization, Fisher Scoring, Newton-Raphson, κ.α., οι οποίες συντελούν στην εύρεση των β̂∼ .
Για περισσότερες πληροφορίες επί των υπολογιστικών μεθόδων και των λύσεων της (11.13), ο ενδιαφερόμενος αναγνώστης παραπέμπεται στο βιβλίο των McCulloch και Searle [11].
11.4 Έλεγχος υποθέσεων και διαστήματα εμπιστοσύνης - Ο έλεγχος κατά Wald
11.4.1 Λ - τεστ λόγου πιθανοφανειών
Η κλασική φιλοσοφία των τεστ λόγου πιθανοφανειών (likelihood ratio tests) βασίζεται στη σύγκριση των
μεγιστοποιημένων τιμών της log - πιθανοφάνειας υπό την H0 (ή αλλιώς τους περιορισμούς) και όχι υπό την
H0 , αντίστοιχα. Εάν η απόκλιση μεταξύ των δύο προκυπτουσών τιμών είναι μεγάλη, τότε η H0 απορρίπτεται.
ΓΡΑΜΜΙΚΑ ΜΟΝΤΕΛΑ ΚΑΙ ΣΧΕΔΙΑΣΜΟΣ & ΑΝΑΛΥΣΗ ΠΕΙΡΑΜΑΤΩΝ ΜΕ ΕΦΑΡΜΟΓΕΣ ΣΕ R ΚΑΙ MINITAB
315
Στην περίπτωση που υπάρχουν πολλαπλές (άγνωστες) παράμετροι, τότε συνήθως επικεντρωνόμαστε σε ένα
′
υποσύνολο αυτών. Έστω θ∼′ = θ∼1 , θ∼2 άγνωστες παράμετροι και έστω ότι το ενδιαφέρον μας επικεντρώνεται γύρω από το διάνυσμα παραμέτρων θ∼1 . Μπορεί το θ∼2 να είναι και αυτό άγνωστο, δεν αποτελεί όμως το
διάνυσμα παραμέτρων ενδιαφέροντος και άρα χαρακτηρίζεται ως οχληρό διάνυσμα παραμέτρων (nuisance
parameter vector).
Έστω ότι μας ενδιαφέρει η διενέργεια του ελέγχου:
H0 : θ∼1 = θ∼10
(11.14)
Σε αυτό το σημείο εγείρεται το εξής ερώτημα: «Αφού κάτω από την H0 η τιμή του θ∼1 είναι ίση με θ∼10 , η τιμή
του θ∼2 υπό την H0 με τι θα ισούται;» Λόγω του ότι το θ∼2 είναι οχληρό διάνυσμα παραμέτρων, θα πρέπει κάτω
από την H0 να εκτιμηθεί από τον αντίστοιχο ΕΜΠ θ̂∼20 (υπό την υπόθεση ότι θ∼1 = θ∼10 ).
Η Λ - στατιστική συνάρτηση ελέγχου της (11.14) ορίζεται ως:
L (υπό την H0 )
−2 log Λ = −2 log
L (όχι υπό την H0 )

= −2 log 
L θ∼10 , θ̂∼20
L θ̂∼1 , θ̂∼2
!


= −2 log L θ∼10 , θ̂∼20 − log L θ̂∼1 , θ̂∼2
= −2 l θ∼10 , θ̂∼20 − l θ̂∼1 , θ̂∼2
προσεγγιστικά
∼ χ2ν ,
(11.15)
όπου θ̂∼1 και θ̂∼2 οι ΕΜΠ, κάτω από τον συνολικό παραμετρικό χώρο, των θ∼1 και θ∼2 , αντίστοιχα και ν η διάσταση του θ∼1 .
Η H0 απορρίπτεται εάν:
−2 log Λ > χ2ν,1−α .
Αξίζει να σημειωθεί ότι το −2, που εμφανίζεται στη Λ - στατιστική συνάρτηση, εξυπηρετεί στη σύγκλιση της
τελευταίας, στην κατανομή χ2ν [15].
11.4.2 Έλεγχος κατά Wald
Μια εναλλακτική προσέγγιση ελέγχου από αυτή της Λ - συνάρτησης, είναι η χρήση της ασυμπτωτικής κανονικότητας του ΕΜΠ. Από τις ασυμπτωτικές ιδιότητες των ΕΜΠ [9] είναι γνωστό ότι:
θ̂∼ ∼ AN θ∼, (I (θ∼))−1 ,
όπου I (θ∼) = E
∂l ∂l
∂θ
∂θ′
∼ ∼
= −E
∂2l
∂θ
∂θ′
∼ ∼
ο πίνακας πληροφορίας κατά Fisher.
Εάν υποθέσουμε για ακόμη μία φορά ότι θ∼′ =
ρεί να γραφεί ως:
′
θ∼1 , θ∼2 , τότε ο πίνακας πληροφορίας κατά Fisher μπο"
#
I
I
I (θ∼) = 11 12 ,
I21 I22
με αποτέλεσμα η ασυμπτωτική διασπορά του θ̂∼1 να έχει ως εξής:
var+∞ θ̂∼1 = I11 − I12 I−1
22 I21
−1
.
316
ΕΙΣΑΓΩΓΗ ΣΤΑ ΓΕΝΙΚΕΥΜΕΝΑ ΓΡΑΜΜΙΚΑ ΜΟΝΤΕΛΑ
Για τον έλεγχο της (11.14), η στατιστική συνάρτηση ελέγχου κατά Wald ορίζεται ως:
W = θ̂∼1 − θ∼10
′ var+∞ θ̂∼1
−1 προσεγγιστικά
θ̂∼1 − θ∼10 ∼ χ2ν ,
όπου ν η διάσταση του θ∼1 .
Η H0 απορρίπτεται εάν:
W > χ2ν,1−α .
Βάσει των παραπάνω, προκύπτει ότι τόσο το Λ - τεστ λόγου πιθανοφανειών όσο και το τεστ κατά Wald, έχουν
την ίδια οριακή κατανομή και είναι ικανά να ελέγξουν τις ίδιες υποθέσεις. Ποιες λοιπόν οι διαφορές μεταξύ
των δύο και πότε το ένα υπερέχει του άλλου; Όταν το μέγεθος του δείγματος είναι μεγάλο και η απόκλιση
από την H0 δεν είναι εξαιρετικά μεγάλη, τότε τα δύο τεστ δίνουν πανομοιότυπα αποτελέσματα [2]. Όταν
όμως το μέγεθος του δείγματος είναι μικρό και η απόκλιση από την H0 μεγάλη, τότε εκεί υπερέχει το Λ - τεστ
λόγου πιθανοφανειών [3, 10]. Βέβαια αν και τα παραπάνω αποτελούν εμπειρικά ευρήματα, δεν καθίσταται
απαγορευτική η χρήση του τεστ κατά Wald, τουναντίον! Το τελευταίο έχει ένα σημαντικό (υπολογιστικό)
πλεονέκτημα έναντι του Λ - τεστ λόγου πιθανοφανειών, καθώς δεν προϋποθέτει τον υπολογισμό του θ̂∼20 .
11.4.3 Σύνολα εμπιστοσύνης
Τα τεστ που συζητήθηκαν στην προηγούμενη ενότητα μπορούν να χρησιμοποιηθούν για την κατασκευή
ασυμπτωτικών συνόλων εμπιστοσύνης (asymptotic confindence sets) για το διάνυσμα παραμέτρων θ∼1 :
• Σύνολο εμπιστοσύνης για το θ∼1 βάσει του Λ - τεστ λόγου πιθανοφανειών:
− 2 l θ∼1 , θ̂∼2,1 − l θ̂∼1 , θ̂∼2
≤ χ2ν,1−α ,
(11.16)
όπου θ̂∼2,1 ο ΕΜΠ του θ∼2 για κάθε τιμή του θ∼1 στο σύνολο.
• Σύνολο εμπιστοσύνης για το θ∼1 βάσει του τεστ κατά Wald:
θ̂∼1 − θ∼1
′ var+∞ θ̂∼1
−1 θ̂∼1 − θ∼1 ≤ χ2ν,1−α .
(11.17)
Συγκρίνοντας τα δύο σύνολα εμπιστοσύνης (11.16) και (11.17), αντίστοιχα, παρατηρούμε ότι το υπολογιστικό κόστος που επέρχεται με τη χρήση του πρώτου, είναι μεγαλύτερο από αυτό του Wald. Παρόλα αυτά, η
απόδοση του διαστήματος εμπιστοσύνης βάσει του Λ - τεστ λόγου πιθανοφανειών, φαίνεται να είναι μεγαλύτερη στην περίπτωση μικρών δειγμάτων.
11.5 Έλεγχοι καλής προσαρμογής
Όπως στα γραμμικά, έτσι και στα γενικευμένα γραμμικά μοντέλα, κρίνεται απαραίτητη η αξιολόγηση της
καλής προσαρμογής (στατιστικής σημαντικότητας) του εκάστοτε υπό εξέταση μοντέλου. Οι τεχνικές που
ακολουθούν είναι μερικές από τις γνωστότερες και ευρέως χρησιμοποιούμενες που εξυπηρετούν τον σκοπό
αυτό.
11.5.1 Deviance
Στο γραμμικό μοντέλο παλινδρόμησης, ο έλεγχος σημαντικότητας του μοντέλου διενεργείται μέσω του Πίνακα ANOVA. Συγκεκριμένα, αφού γίνει διάσπαση της ολικής μεταβλητότητας (SSTO) σε δύο τμήματα:
ΓΡΑΜΜΙΚΑ ΜΟΝΤΕΛΑ ΚΑΙ ΣΧΕΔΙΑΣΜΟΣ & ΑΝΑΛΥΣΗ ΠΕΙΡΑΜΑΤΩΝ ΜΕ ΕΦΑΡΜΟΓΕΣ ΣΕ R ΚΑΙ MINITAB
317
(1) στη μεταβλητότητα που οφείλεται στην παλινδρόμηση (SSR) και (2) στη μεταβλητότητα που οφείλεται
στα σφάλματα (SSE), έπειτα κατασκευάζεται η στατιστική συνάρτηση ελέγχου:
Pn
i=1
F =
Pn
(παρατηρήσεις (yi )−κέντρο παρατηρήσεων (ȳ))2 − i=1 (παρατηρήσεις−εκτιμώμενες τιμές (ŷi ))2
#ανεξάρτητων μεταβλητών−1
Pn
(παρατηρήσεις (yi )−εκτιμώμενες τιμές (ŷi ))2
μέγεθος δείγματος−#ανεξάρτητων μεταβλητών
i=1
=
SST O−SSE
p−1
SSE
n−p
n − p SST O − SSE
p−1
SSE
SST O − SSE
∝
.
SSE
=
(11.18)
Στην πραγματικότητα, η παραπάνω στατιστική συνάρτηση ελέγχου αποτυπώνει το αποτέλεσμα της σύγκρισης παρατηρούμενων (yi ) και εκτιμώμενων (ŷi ) τιμών υπό δύο διαφορετικά μοντέλα/εκδοχές:
• Μοντέλο 1 (υπό την H0 : β1 = β2 = ... = βp−1 = 0)
Στον αριθμητή της (11.18), γίνεται η υπόθεση ότι καμία από τις X1 , ..., Xp−1 δεν συνεισφέρει στατιστικώς σημαντικά, με αποτέλεσμα το μοντέλο να παίρνει τη μορφή:
ŷi = β̂0 = ȳ.
(11.19)
Στην περίπτωση αυτή, τα ŷi = ȳ και SSE ισούνται με τη συνολική μεταβλητότητα SSTO. Εάν συμπεριληφθούν οι X1 , ..., Xp−1 στο μοντέλο (11.19), τότε οποιαδήποτε μείωση επέλθει στην τιμή του
SSE θα οφείλεται στο γεγονός ότι θα υπάρχει τουλάχιστον ένα βi το οποίο θα είναι διάφορο του μηδενός (δηλαδή στην παλινδρόμηση). Το προαναφερθέν δεν είναι άλλο από το SSR το οποίο βασίζεται σε
τετραγωνικές αποκλίσεις και χρησιμοποιείται για τη σύγκριση των yi και ŷi = ȳ:
SSR = SST O − SSE =
n
X
(yi − ȳ)2 −
i=1
n
X
(yi − ŷi )2 .
i=1
Τουλάχιστον ένα από τα βi ,
• Μοντέλο 2 υπό την H1 :
i = 1, ..., p − 1, διαφορετικό του 0
!
Ο παρονομαστής της σχέσης (11.18) δομείται από όλες τις διαθέσιμες ανεξάρτητες μεταβλητές X1 , ..., Xp−1
και άρα η μορφή του μοντέλου είναι η εξής:
ŷi = β̂0 + β̂1 Xi1 + ... + β̂p−1 Xip−1 .
Το στατιστικό για τη σύγκριση yi και ŷi , βασίζεται στην τετραγωνική τους απόσταση και δεν είναι
άλλο από το:
n
SSE =
X
(yi − ŷi )2 .
i=1
Την παραπάνω φιλοσοφία μπορούμε να τη μεταφέρουμε και στην περίπτωση των γενικευμένων γραμμικών
μοντέλων, με τη σημαντική διαφορά ότι οι όποιες συγκρίσεις γίνονται στη βάση της log - πιθανοφάνειας.
Θέλουμε να εφαρμόσουμε τον έλεγχο:
H0 : Όχι καλή προσαρμογή μοντέλου
vs
H1 : Καλή προσαρμογή μοντέλου.
(11.20)
318
ΕΙΣΑΓΩΓΗ ΣΤΑ ΓΕΝΙΚΕΥΜΕΝΑ ΓΡΑΜΜΙΚΑ ΜΟΝΤΕΛΑ
Η στατιστική συνάρτηση ελέγχου της (11.20) ορίζεται ως:
L (εξεταζόμενο μοντέλο υπό την H0 )
G = −2 log
L (εξεταζόμενο μοντέλο υπό την H1 )
!
προσεγγιστικά
∼ χ2df1 −df0 ,
(11.21)
όπου dfk , k = 0, 1 οι βαθμοί ελευθερίας υπό την H0 και H1 , αντίστοιχα.
Η μηδενική υπόθεση απορρίπτεται εάν:
G > χ2df1 −df0 ,1−α .
Έστω τώρα ότι στη σχέση (11.21) διαιρούμε αριθμητή και παρονομαστή με την πιθανοφάνεια του κορεσμένου μοντέλου:
 L(εξεταζόμενο μοντέλο υπό την H ) 
0
G=
L(κορεσμένο μοντέλο)
−2 log  L(εξεταζόμενο μοντέλο υπό την H1 ) 
L(κορεσμένο μοντέλο)
!
!
L (εξεταζόμενο μοντέλο υπό την H0 )
L (εξεταζόμενο μοντέλο υπό την H1 )
= −2 log
+ 2 log
L (κορεσμένο μοντέλο)
L (κορεσμένο μοντέλο)
(11.22)
= DH0 − DH1 .
H ποσότητα
!
DHk
L (εξεταζόμενο μοντέλο υπό την Hk )
= −2 log
, k = 0, 1,
L (κορεσμένο μοντέλο)
(11.23)
ονομάζεται Deviance (Απόκλιση) και αποτελεί τον «πρωταγωνιστή» της (11.21).
Σχόλιο: Πολλές φορές η ποσότητα DH0 αναφέρεται ως μηδενική απόκλιση (null deviance), ενώ η ποσότητα DH1 ως απόκλιση καταλοίπων (residual deviance).
Με τον όρο «κορεσμένο (saturated) μοντέλο», εννοούμε εκείνο το μοντέλο το οποίο έχει μία ξεχωριστή παράμετρο για κάθε παρατήρηση του συνόλου δεδομένων. Ως απόρροια του προαναφερθέντος, το κορεσμένο
μοντέλο:
1) έχει την «τέλεια» προσαρμογή και
2) ανάμεσα σε όλα τα πιθανά γενικευμένα γραμμικά μοντέλα για την περιγραφή του υπό εξέταση προβλήματος, είναι εκείνο που επιτυγχάνει τη μεγαλύτερη τιμή στη συνάρτηση πιθανοφάνειας.
Έτσι, το στατιστικό της (11.23) μετρά την απόκλιση (deviance) του υπό εξέταση μοντέλου από το ιδεατό
(κορεσμένο).
ΓΡΑΜΜΙΚΑ ΜΟΝΤΕΛΑ ΚΑΙ ΣΧΕΔΙΑΣΜΟΣ & ΑΝΑΛΥΣΗ ΠΕΙΡΑΜΑΤΩΝ ΜΕ ΕΦΑΡΜΟΓΕΣ ΣΕ R ΚΑΙ MINITAB
319
Πίνακας 11.3: Πιθανοφάνεια κορεσμένου γενικευμένου γραμμικού μοντέλου κάτω από διάφορες κατανομές
Κατανομή
Πιθανοφάνεια κορεσμένου μοντέλου
Qn
B (pi = yi )
yi ={0,1}
i=1
yiyi (1 − yi )1−yi ==== 1
Qn
Bin (n, pi = yi )
n
yi
i=1
Qn
N B (α, pi = yi )
i=1
e−
P (λi = yi )
yiyi (1 − yi )n−yi
α+yi −1
yi
yiα (1 − yi )yi
Pn
Qn
i=1
N (µi = yi , σ 2 )
yi
y
yi i
i=1 yi !
√ 1
2πσ 2
n
11.5.2 χ2 - έλεγχοι καλής προσαρμογής
Οι χ2 - έλεγχοι καλής προσαρμογής αποτελούν τεχνικές οι οποίες αναπτύχθηκαν αποκλειστικά για την περίπτωση της λογιστικής παλινδρόμησης (Υποκεφάλαιο 11.6) και για ομαδοποιημένες παρατηρήσεις. Ένα από
τα ιδιαίτερα χαρακτηριστικά των ελέγχων αυτών, είναι ότι έχουν αντίστροφη H0 και H1 σε σχέση με αυτή
του G τεστ. Συγκεκριμένα, αντί της (11.20) έχουμε:
H0 : Καλή προσαρμογή μοντέλου vs H1 : Όχι καλή προσαρμογή μοντέλου.
Όπως γίνεται αντιληπτό, είναι πλέον θεμιτή η μη απόρριψη της H0 .
Δύο από τους γνωστότερους ελέγχους αποτελούν αυτοί του Pearson και των Hosmer & Lemeshow, οι οποίοι
και θα συζητηθούν παρακάτω.
11.5.2.1 Ο έλεγχος κατά Pearson
Έστω yi ανεξάρτητες τυχαίες μεταβλητές από Bin(ni , pi ), i = 1, ..., n. O χ2 - έλεγχος καλής προσαρμογής
κατά Pearson ορίζεται ως:
n
X
(Πi − Ai )2
X2 =
,
(11.24)
Δi
i=1
όπου Π οι Παρατηρούμενες τιμές (yi ), Α οι Αναμενόμενες (ni pi ) και Δ οι Διασπορές (ni pi (1 − pi )).
Αντικαθιστώντας στην (11.24) προκύπτει:
(yi − ni pi )
=
i=1 ni pi (1 − pi )
n
X
2
n
X
i=1
ni
yi − ni
g (µi )
e
1+eg(µi )
eg(µi )
1+eg(µi )
1−
2
g (µi )
e
1+eg(µi )
προσεγγιστικά
∼ χ2n .
(11.25)
Στην περίπτωση που τα pi είναι άγνωστα, και άρα χρήζουν εκτίμησης, τότε η (11.25) γράφεται ως:
(yi − ni p̂i )2 προσεγγιστικά 2
∼ χn−p .
i=1 ni p̂i (1 − p̂i )
n
X
όπου p το πλήθος των άγνωστων παραμέτρων β∼ προς εκτίμηση.
(11.26)
320
ΕΙΣΑΓΩΓΗ ΣΤΑ ΓΕΝΙΚΕΥΜΕΝΑ ΓΡΑΜΜΙΚΑ ΜΟΝΤΕΛΑ
11.5.2.2 Ο έλεγχος κατά Hosmer και Lemeshow
Στην περίπτωση όπου οι παρατηρήσεις yi αποτελούν ανεξάρτητες τυχαίες μεταβλητές από Bernoulli κατανομή με παράμετρο pi (B(pi )), i = 1, ..., n, (και άρα κάθε i-ομάδα περιέχει ni = 1 παρατήρηση), οι
ελεγχοσυναρτήσεις D και X 2 δεν μπορούν να χρησιμοποιηθούν, καθώς δεν ισχύει η ασυμπτωτική θεωρία.
Για την αντιμετώπιση του προαναφερθέντος περιορισμού, οι Hosmer και Lemeshow [7] βασιζόμενοι στη
φιλοσοφία της X 2 ελεγχοσυνάρτησης, πρότειναν τον ομώνυμο έλεγχο καλής προσαρμογής.
Η βασική ιδέα του Hosmer-Lemeshow ελέγχου είναι η ομαδοποίηση των παρατηρήσεων σε g (συνήθως
10) το πλήθος ομάδες οι οποίες δημιουργούνται ως εξής:
1. Υπολογίζουμε τις εκτιμώμενες πιθανότητες p̂i για καθεμία από τις παρατηρήσεις yi :
p̂i =
yi
,
n
i = 1, ..., n.
2. Διατάσσουμε τις p̂i , σε αύξουσα σειρά.
3. Κατασκευάζουμε την πρώτη ομάδα με τις yi που αντιστοιχούν στο χαμηλότερο g% των p̂i . Η δεύτερη
ομάδα κατασκευάζεται από τις yi που αντιστοιχούν στο αμέσως επόμενο χαμηλότερο g% των p̂i , κ.ο.κ.
Έχοντας τις ομάδες στη διάθεσή μας, οι οποίες αποτελούνται από 0 και 1, υπολογίζουμε την ελεγχοσυνάρτηση:
2
XHL
=
g X
1
X
i=1 j=0
Πij − Α̂ij
Δ̂ij
2
∼ χ2g−2 ,
όπου Πi0 το πλήθος των Παρατηρούμενων μηδενικών στην i-οστή ομάδα, Πi1 το πλήθος των Παρατηρούμενων άσων στην i-οστή ομάδα, Αi0 ο Αναμενόμενος αριθμός μηδενικών στην i-οστή ομάδα, Αi1 ο Αναμενόμενος αριθμός άσων στην i-οστή ομάδα, Δi0 η Διασπορά των μηδενικών στην i-οστή ομάδα και Δi1 η διασπορά
των άσων στην i-οστή ομάδα.
Πώς να επιλέξω το πλήθος των ομάδων, g;
Η επιλογή του g δεν βασίζεται σε κάποια συγκεκριμένη μεθοδολογία παρά μόνο σε εμπειρικά ευρήματα, όπως
αυτά προέκυψαν από τις προσομοιώσεις που διενήργησαν οι Hosmer και Lemeshow. Συγκεκριμένα, ακολουθούμε τον κανόνα g > p, όπου p το πλήθος των άγνωστων παραμέτρων του υπό εξέταση μοντέλου, παρόλο
που αυτό δεν αναφέρεται σε κανένα εγχειρίδιο ή στατιστικό πακέτο.
Βέβαια, ο παραπάνω κανόνας δεν πρέπει να ακολουθείται «κατά γράμμα», καθώς ενέχει δύο σημαντικές πα2
γίδες οι οποίες και αποτελούν αδυναμίες του XHL
ελέγχου:
1. Η επιλογή μικρού g θα οδηγήσει σε μικρότερη πιθανότητα εντοπισμού λανθασμένης συναρτησιακής
μορφής του μοντέλου. Αντιθέτως, η επιλογή μεγάλης τιμής για το g ελλοχεύει τον κίνδυνο δημιουργίας ομάδων με εξαιρετικά μικρό πλήθος παρατηρήσεων, γεγονός που θα δυσκολέψει στην απόφαση
σχετικά με το εάν οι διαφορές μεταξύ Π και Α υφίστανται λόγω τυχαιότητας ή λόγω λανθασμένης συναρτησιακής μορφής του μοντέλου.
2. Για δεδομένο δείγμα, μία αλλαγή στην τιμή του g μπορεί να επηρεάσει σημαντικά στην απόφαση σχετικά με το εάν το υπό εξέταση μοντέλο προσαρμόζεται καλά στα δεδομένα.
ΓΡΑΜΜΙΚΑ ΜΟΝΤΕΛΑ ΚΑΙ ΣΧΕΔΙΑΣΜΟΣ & ΑΝΑΛΥΣΗ ΠΕΙΡΑΜΑΤΩΝ ΜΕ ΕΦΑΡΜΟΓΕΣ ΣΕ R ΚΑΙ MINITAB
321
11.5.3 Ψευδο-συντελεστής προσδιορισμού R2
Σε αντίθεση με τα γραμμικά μοντέλα στα οποία οι παράμετροι εκτιμώνται μέσω των ελαχίστων τετραγώνων,
στα γενικευμένα γραμμικά οι παράμετροι εκτιμώνται μέσω της μεγίστης πιθανοφάνειας. Ως απόρροια του
προαναφερθέντος, η χρήση του συντελεστή προσδιορισμού R2 δεν ενδείκνυται στην περίπτωση των γενικευμένων γραμμικών μοντέλων, καθώς αυτός βασίζεται εξ ολοκλήρου σε αθροίσματα τετραγώνων της εξαρτημένης μεταβλητής. Έχουν προταθεί διάφορες εκδοχές του R2 (Efron [5], Cox και Snell [4], Nagelkerke
[13] κ.ά.) ως επέκταση του κλασικού R2 στην κλάση των γενικευμένων γραμμικών μοντέλων, χωρίς όμως να
καταφέρνει κάποια να αποτελέσει την ακριβή γενίκευσή του. Για τον λόγο αυτό, τα R2 που αφορούν τα γενικευμένα γραμμικά μοντέλα αναφέρονται στη βιβλιογραφία ως ψευδο-R2 (pseudo-R2 ) και δεν έχουν ουδεμία
σχέση με κάποιον συντελεστή συσχέτισης.
Ανάμεσα στα πιο διαδεδομένα ψευδο-R2 , είναι αυτό που προτάθηκε από τον McFadden [12]:
2
RM
cF adden = 1 −
DH1
,
DH0
2
0 ≤ RM
cF adden ≤ 1.
(11.27)
2
2
Το RM
cF adden τείνει να έχει τιμές αρκετά μικρότερες από αυτές του R . Είναι χαρακτηριστικό ότι σύμφωνα με
τον McFadden, τιμές μεταξύ 0.2 και 0.4, υποδεικνύουν «εξαιρετική προσαρμογή» του μοντέλου. Επιπλέον,
από τη δομή του είναι βασισμένο σε αποκλίσεις, γεγονός που καθιστά την ερμηνεία του αρκετά διαφορετική
από αυτή του R2 . Συγκεκριμένα, τιμές πλησίον της μονάδος υποδηλώνουν ότι το πλήρες (υπό εξέταση) μοντέλο είναι καλύτερο από κορεσμένο, και το ανάποδο.
Αξίζει να παρατηρήσουμε ότι στη σχέση (11.27), η ποσότητα DH1 παίζει τον ρόλο του SSE στην περίπτωση του κλασικού R2 , ενώ η ποσότητα DH0 τον ρόλο του SST O.
11.6 Το δίτιμο λογιστικό μοντέλο παλινδρόμησης
Στη γραμμική παλινδρόμηση μας ενδιέφερε η επίδραση μίας ή περισσότερων ανεξάρτητων μεταβλητών X
πάνω σε μία συνεχή εξαρτημένη μεταβλητή Y. Υπάρχει όμως μία πληθώρα περιπτώσεων όπου μας ενδιαφέρει
η μελέτη της επίδρασης μίας ή περισσότερων ανεξάρτητων μεταβλητών πάνω σε μία διακριτή εξαρτημένη μεταβλητή. Εάν τα πιθανά αποτελέσματα/εκβάσεις της εξαρτημένης μεταβλητής είναι δύο (έστω 1: “επιτυχία”
και 0: “αποτυχία”), η καταλληλότερη τεχνική μελέτης της σχέσης μεταξύ ανεξάρτητης/των και εξαρτημένης
μεταβλητής είναι αυτή της δίτιμης λογιστικής παλινδρόμησης (binary logistic regression), η οποία αποτελεί
μία από τις δημοφιλέστερες ειδικές περιπτώσεις Γενικευμένων Γραμμικών Μοντέλων. Παραδείγματα δίτιμων
εκβάσεων είναι: η κατάσταση της υγείας ενός ασθενούς (“Επιδείνωση” ή “Όχι επιδείνωση”), η εθνικότητα
(“Έλληνας” ή “Όχι Έλληνας”), το φύλο (“Αρσενικό” ή “Θηλυκό”), η κατάσταση ενός προϊόντος από μία
γραμμή παραγωγής προϊόντων (“Αποδεκτή” ή “Όχι Αποδεκτή”) κ.ο.κ.
Έστω λοιπόν η Bernoulli τυχαία μεταβλητή:
(Y )
Y = I{“επιτυχία”} =

1,
“επιτυχία”
,
0, “αποτυχία”
(11.28)
με E (Y ) = p, V ar (Y ) = p(1 − p) και p, p ∈ (0, 1), η πιθανότητα επιτυχίας.
Επιπλέον, έστω το πολλαπλό γραμμικό μοντέλο με:
E y∼ = pi = Xi′ β∼ = β0 +
p−1
X
i=1
βi Xi .
(11.29)
322
ΕΙΣΑΓΩΓΗ ΣΤΑ ΓΕΝΙΚΕΥΜΕΝΑ ΓΡΑΜΜΙΚΑ ΜΟΝΤΕΛΑ
Ο τρόπος με τον οποίο ορίσαμε στη σχέση (11.28) την εξαρτημένη μεταβλητή y, επιφέρει ένα ιδιαιτέρως
σοβαρό πρόβλημα στην (11.29). Συγκεκριμένα, το αριστερό μέλος έχει ως πεδίο τιμών το (0, 1) ενώ το δεξί
το R. Θα πρέπει, λοιπόν, να βρεθεί ένας επιδέξιος τρόπος ώστε τα δύο μέλη να αποκτήσουν το ίδιο πεδίο τιμών.
Αρχικά, θα πρέπει να αντικαταστήσουμε την πιθανότητα επιτυχίας p με μία ανάλογη αυτής. Μια παραπλήσια
έννοια με αυτή της πιθανότητας, είναι τα λεγόμενα odds τα οποία ορίζονται ως:
P (“επιτυχίας”)
p
p
= =
.
P (“αποτυχίας”)
q
1−p
Το πλεονέκτημα των odds σε σχέση με την κλασική πιθανότητα p, είναι ότι ενώ έχουν παρόμοια ερμηνεία με
το τελευταίο, έχουν πεδίο τιμών το διάστημα (0, +∞).
Το πρώτο βήμα διόρθωσης του προβλήματος έγινε καθώς η (11.29) έχει μετατραπεί σε:
pi
= Xi′ β∼ .
1 − pi
Για την πλήρη επίλυση του προβλήματος, θα εφαρμόσουμε τον μετασχηματισμό του λογαρίθμου στα odds
ώστε να μεταβούμε από το (0, +∞) στο R.
Άρα, η σχέση (11.29) έχει πάρει πλέον τη μορφή:
pi
log
1 − pi
!
= Xi′ β∼ = g (µi ) .
(11.30)
Η ποσότητα στο αριστερό μέλος της σχέσης (11.30):
!
pi
log
,
1 − pi
ονομάζεται logit - μετασχηματισμός και αποτελεί τη συνάρτηση σύνδεσης (βλ. (11.3)) της Bernoulli με τις
ανεξάρτητες μεταβλητές του μοντέλου (11.29).
Για τον υπολογισμό της πιθανότητας επιτυχίας, αρκεί να λύσουμε την (11.30) ως προς pi :
′
E(y∼) = pi =
eXi ∼β
′
1 + eXi ∼β
=
eg(µi )
.
1 + eg(µi )
(11.31)
11.6.1 Εκτίμηση παραμέτρων
Για την εκτίμηση των παραμέτρων του μοντέλου (logit) θα χρησιμοποιηθεί η τεχνική της μέγιστης πιθανοφάνειας (Ενότητα 11.3.1).
Η συνάρτηση πιθανοφάνειας δίνεται από τη σχέση:
L β∼ =
n
Y
i=1
fYi (yi ) =
n
Y
yi
pi (1 − pi )1−yi .
(11.32)
i=1
Αξίζει να παρατηρήσουμε ότι στη σχέση (11.32) μπορεί η άγνωστη παράμετρος να είναι το pi , όμως αυτό
είναι άρρηκτα συνδεδεμένο με τα β∼ (βλ. (11.30)):
l=
n
X
i=1
(yi log (pi ) + (1 − yi ) log (1 − pi ))
ΓΡΑΜΜΙΚΑ ΜΟΝΤΕΛΑ ΚΑΙ ΣΧΕΔΙΑΣΜΟΣ & ΑΝΑΛΥΣΗ ΠΕΙΡΑΜΑΤΩΝ ΜΕ ΕΦΑΡΜΟΓΕΣ ΣΕ R ΚΑΙ MINITAB
=
n
X
i=1
pi
yi log
1 − pi
n από (11.30) και (11.31) X
====
=
(yi (g (µi ))) −
i=1
!
+ log (1 − pi )
yi (g (µi )) − log 1 + eg(µi )
i=1
n
X
!
323
n X
log 1 + eg(µi )
.
(11.33)
i=1
Επόμενο βήμα, η παραγώγιση της (11.33) ως προς β∼ :
!
n
n X
∂l
∂ X
=
(yi (g (µi ))) −
log 1 + eg(µi )
.
∂β∼
∂β∼ i=1
i=1
(11.34)
Οι εξισώσεις (11.34) είναι υπερβατικές και έτσι η λύση τους δεν μπορεί να δοθεί σε κλειστή μορφή. Αντ’ αυτού,
θα πρέπει να γίνει χρήση υπολογιστικών μεθόδων, όπως αναφέρθηκε και στο τέλος της Ενότητας 11.3.1.
11.6.2 Ερμηνεία συντελεστών δίτιμου λογιστικού μοντέλου παλινδρόμησης
Αφού προσδιοριστούν οι εκτιμητές β̂∼ , των β∼ , θα πρέπει να ερμηνευτούν με ιδιαίτερη προσοχή. Η ερμηνεία
τους διαφέρει σημαντικά από αυτή που συναντάμε στην περίπτωση του γραμμικού μοντέλου παλινδρόμησης.
• β̂0 : Εκφράζει τα εκτιμώμενα log-odds “επιτυχίας”, όταν όλες οι ανεξάρτητες μεταβλητές είναι ίσες με
το 0.
Εναλλακτικά, εκφράζει την πιθανότητα μέσω της σχέσης p =
όταν όλες οι ανεξάρτητες μεταβλητές είναι ίσες με το 0.
eβ0
,
1+eβ0
βλ. (11.30) εμφάνισης “επιτυχίας”,
• β̂i , i = 1, ..., p − 1: Οι ανεξάρτητες μεταβλητές Xi μπορεί να είναι είτε ποσοτικές είτε κατηγορικές.
Ανάλογα με το είδος τους, αλλά και το πρόσημο του συντελεστή β̂i , δίνεται και η αντίστοιχη ερμηνεία
του.
Το παράδειγμα που ακολουθεί είναι χαρακτηριστικό για τον τρόπο ερμηνείας των συντελεστών β̂i .
Παράδειγμα 11.2. Έστω ότι θέλουμε να μελετήσουμε εάν η ηλικία και το κάπνισμα συμβάλλουν σημαντικά στη νόσηση ενός ατόμου από μία συγκεκριμένη ασθένεια.
Για τον παραπάνω σκοπό εξήχθη τυχαίο δείγμα 20 ατόμων και προέκυψε το παρακάτω εκτιμώμενο μοντέλο:
!
p̂i
= −2.1597 + 0.0268xi1 + 0.38xi2 , i = 1, ..., 20,
log
1 − p̂i
όπου:
• y = Νόσηση =
(y)
I{Ναι}

1,
=
Ναι
,
0, Όχι
• X1 = Ηλικία,
(X )
2
• X2 = Καπνιστής = I{Ναι}
=

1,
Ναι
.
0, Όχι
Παρατηρούμε ότι η πρώτη ανεξάρτητη μεταβλητή (Ηλικία) είναι ποσοτική, ενώ η δεύτερη (Καπνιστής)
κατηγορική. Έτσι, η προσέγγιση στην ερμηνεία του β̂1 θα είναι διαφορετική από ότι για του β̂2 .
324
ΕΙΣΑΓΩΓΗ ΣΤΑ ΓΕΝΙΚΕΥΜΕΝΑ ΓΡΑΜΜΙΚΑ ΜΟΝΤΕΛΑ
- β̂1 : Εάν η μεταβλητή “Ηλικία” αυξηθεί κατά ένα έτος, τότε τα odds νόσησης (αυτό δηλαδή που ορίσαμε ως “επιτυχία” στη συγκεκριμένη μελέτη) του i-οστού ατόμου θα αυξηθούν κατά e0.0268 − 1 =
1.026 − 1 = 0.026, δεδομένου ότι η μεταβλητή “Καπνιστής” παραμένει σταθερή.
Σχόλιο 1: Στην περίπτωση όπου η τιμή του β̂1 ήταν −0.0268, τότε η ερμηνεία του θα είχε ως εξής:
Εάν η μεταβλητή “Ηλικία” αυξηθεί κατά ένα έτος, τότε τα odds νόσησης (αυτό δηλαδή που ορίσαμε
ως “επιτυχία” στη συγκεκριμένη μελέτη) του i-οστού ατόμου θα μειωθούν κατά 1 − e−0.0268 =
1 − 0.974 = 0.026, δεδομένου ότι η μεταβλητή “Καπνιστής” παραμένει σταθερή.
- β̂2 : Αφού ο συντελεστής β̂2 έχει θετικό πρόσημο η ερμηνεία του είναι η εξής:
Εάν το i-οστό άτομο είναι καπνιστής, τότε έχει e0.38 − 1 = 1.46 − 1 = 0.46 φορές περισσότερα
odds νόσησης συγκριτικά με έναν μη καπνιστή, δεδομένου ότι η μεταβλητή “Ηλικία” παραμένει σταθερή.
Σχόλιο 2: Στην περίπτωση που η τιμή του β̂2 ήταν ίση με −0.38, τότε η ερμηνεία του θα είχε ως
εξής:
Εάν το i-οστό άτομο είναι καπνιστής, τότε έχει 1−e−0.38 = 1−0.68 = 0.32 φορές λιγότερα odds
νόσησης συγκριτικά με έναν μη καπνιστή, δεδομένου ότι η μεταβλητή “Ηλικία” παραμένει σταθερή.
Από τον τρόπο με τον οποίο δόθηκαν οι ερμηνείες των συντελεστών στο παραπάνω παράδειγμα, φαίνεται ότι η μοναδιαία αύξηση στην τιμή της ανεξάρτητης μεταβλητής Xi σχετίζεται άμεσα με μία πολλαπλασιαστική αλλαγή, μέσω του eβi , στα odds “επιτυχίας” του υπό εξέταση γεγονότος.
Πράγματι, έστω:
και
′
′
X
∼ = (X1 , X2 , ...Xk−1 , Xk , Xk+1 , ..., Xp )
′
′
X̃
∼ = (X1 , X2 , ...Xk−1 , Xk + 1, Xk+1 , ..., Xp ) .
Ουσιαστικά, η X̃
∼ είναι όσο και η X
∼ , με τη μόνη διαφορά ότι ο k-οστός όρος της πρώτης είναι αυξημένος κατά μία μονάδα.
Έστω επίσης:
′
′
p=
eX∼ ∼β
′
1 + eX∼ ∼β
και p̃ =
eX̃∼ ∼β
′
1 + eX̃∼ ∼β
.
Υπολογίζοντας τον λόγο των odds (odds ratio) έχουμε:
p̃
1−p̃
p
1−p
log
=e
p̃
1−p̃
p
1−p
p̃
p
= elog( 1−p̃ )−log( 1−p )
′
′
= eX̃∼ ∼β −X∼ ∼β
αφού διαφέρουν μόνο στον
k-οστό όρο
====
e(Xk +1)βk −Xk βk = eβk
ΓΡΑΜΜΙΚΑ ΜΟΝΤΕΛΑ ΚΑΙ ΣΧΕΔΙΑΣΜΟΣ & ΑΝΑΛΥΣΗ ΠΕΙΡΑΜΑΤΩΝ ΜΕ ΕΦΑΡΜΟΓΕΣ ΣΕ R ΚΑΙ MINITAB
⇔
p̃
p
= eβk
.
1 − p̃
1−p
325
(11.35)
Η σχέση (11.35) υποδεικνύει ότι τα odds να συμβεί “επιτυχία” στην τιμή Xk + 1 ισούνται με eβk
φορές τα odds να συμβεί “επιτυχία” στην τιμή Xk .
11.7 Το Poisson μοντέλο παλινδρόμησης
Υπάρχουν περιπτώσεις όπου εξαρτημένη μεταβλητή περιέχει δεδομένα τα οποία αποτελούν απαρίθμηση (count)
ή συχνότητα (frequency) εμφάνισης ενός χαρακτηριστικού/συμβάντος/περιστατικού/γεγονότος. Μερικά
χαρακτηριστικά παραδείγματα είναι ο αριθμός των φορών που χτύπησε το τηλέφωνο ενός τηλεφωνικού κέντρου, το πλήθος των κρουσμάτων ενός ιού στον πληθυσμό κλπ. Τέτοιου είδους μεταβλητές μοντελοποιούνται
συνήθως από την Poisson κατανομή (ενίοτε και από την Αρνητική Διωνυμική) γύρω και από την οποία θα
επικεντρωθεί η συζήτησή μας στην παρούσα ενότητα.
Έστω Y1 , ..., Yn ανεξάρτητες τυχαίες μεταβλητές από κατανομή Poisson με συνάρτηση μάζας πιθανότητας:
e−λi λyi i (yi )
fYi (yi ) =
I + ,
yi ! {Z }
i = 1, ..., n,
με λi > 0.
H παράμετρος λi δύναται να αντιπροσωπεύει είτε τον μέσο αριθμό εμφάνισης ενός γεγονότος είτε τον ρυθμό
εμφάνισής του. Για παράδειγμα, αν τα Yi αποτελούν πλήθος ατυχημάτων στην Εγνατία οδό για τον μήνα
Δεκέμβριο, τότε το λi αντιπροσωπεύει τον μέσο αριθμό ατυχημάτων. Αν όμως τα Yi αποτελούν πλήθος ατυχημάτων στην Εγνατία οδό ανά 1000 οχήματα για τον μήνα Δεκέμβριο, τότε το λi αντιπροσωπεύει τον ρυθμό
με τον οποίο συμβαίνουν τα ατυχήματα.
Έστω το πολλαπλό γραμμικό μοντέλο με:
E (y) = λi = Xi′ β∼ .
(11.36)
Παρατηρούμε ότι στην (11.36) υφίσταται παρόμοιο πρόβλημα με αυτό που είχε δημιουργηθεί και στην (11.29).
Το δεξί μέλος δεν τηρεί τον περιορισμό λi > 0. Για την επίλυση του προαναφερθέντος προβλήματος, θα
εφαρμοστεί ο μετασχηματισμός του Νεπέριου λογαρίθμου στη μέση τιμή λi , με αποτέλεσμα το μοντέλο της
(11.36) να μετατρέπεται σε:
log(λi ) = Xi′ β∼ = g (µi ) .
(11.37)
Η ποσότητα:
log(λi ),
αποτελεί τη συνάρτηση σύνδεσης της Poisson με τις ανεξάρτητες μεταβλητές του μοντέλου (11.36).
Λύνοντας την (11.37) ως προς λi έχουμε τελικά:
′
λi = eXi ∼β = eg(µi ) .
(11.38)
11.7.1 Εκτίμηση παραμέτρων
Η συνάρτηση πιθανοφάνειας δίνεται από τη σχέση:
L β∼ =
n
Y
i=1
fYi (yi ) =
n
Y
e−λi λyi i
i=1
yi !
.
(11.39)
326
ΕΙΣΑΓΩΓΗ ΣΤΑ ΓΕΝΙΚΕΥΜΕΝΑ ΓΡΑΜΜΙΚΑ ΜΟΝΤΕΛΑ
Λογαριθμίζοντας την (11.39):
l=
n
X
(−λi +
i=1
n από (11.38) X
yi log (λi ) − log (yi !))
−eg(µi ) + yi g (µi ) − log (yi !) .
====
(11.40)
i=1
Προφανώς, σε αυτό το σημείο η (11.40) θα πρέπει, αφού πρώτα παραγωγισθεί ως προς β∼ και τεθεί ίση με το
μηδέν, να λυθεί ως προς β∼ . Όπως και στην περίπτωση του δίτιμου λογιστικού μοντέλου παλινδρόμησης, έτσι
και εδώ, οι προκύπτουσες εξισώσεις είναι υπερβατικές, και ως αποτέλεσμα οι λύσεις τους δίνονται κάνοντας
χρήση αριθμητικών μεθόδων.
11.7.2 Ερμηνεία συντελεστών Poisson μοντέλου παλινδρόμησης
Η ερμηνεία των συντελεστών του Poisson μοντέλου παλινδρόμησης, είναι όμοια με αυτή του δίτιμου λογιστικού. Η μόνη διαφορά έγκειται στο γεγονός ότι πλέον δεν μιλάμε για τα odds εμφάνισης ενός γεγονότος,
αλλά για τα odds του μέσου αριθμού ή του ρυθμού εμφάνισης ενός γεγονότος.
11.7.3 Poisson μοντέλο παλινδρόμησης με αντιστάθμιση
Υπάρχουν περιπτώσεις όπου το μέγεθος του δείγματος πρέπει να ληφθεί υπόψη στο Poisson μοντέλο παλινδρόμησης. Για παράδειγμα, έστω Yi το πλήθος των ατόμων που θέλουν να αγοράσουν ένα συγκεκριμένο
smartphone. Σε μία τέτοια περίπτωση, η E (Yi ) = λi θα αποτελεί συνάρτηση δύο παραγόντων: (1) του
πλήθους των διαθέσιμων τεμαχίων του συγκεκριμένου smartphone από την εταιρεία παραγωγής, ni και (2)
μερικών ανεξάρτητων μεταβλητών οι οποίες συνδέονται με το λi μέσω της (11.38), όπως η ηλικία των αγοραστών, η απήχηση της εταιρείας στη γεωγραφική περιοχή ζήτησης, η ημερομηνία πρώτης κυκλοφορίας του
smartphone κ.ά.
Η ποσότητα:
θi = ni λi ,
(11.41)
ονομάζεται αντισταθμισμένη παράμετρος της Poisson.
Λογαριθμίζοντας την ποσότητα (11.41):
log (θi ) = log (ni ) + log (λi )
από (11.37)
==== log (ni ) + Xi′ β∼ ,
(11.42)
παρατηρούμε ότι η προσθήκη του ni ισοδυναμεί με τη συμπερίληψη μίας ακόμα ανεξάρτητης μεταβλητής
(log (ni )) στο μοντέλο, της οποίας όμως ο συντελεστής είναι μονάδα και άρα δεν χρήζει εκτίμησης. Άρα, η
προσέγγιση για την εκτίμηση των παραμέτρων του μοντέλου (11.42) είναι ίδια με αυτή που περιγράφηκε
πρωτύτερα στην παρούσα ενότητα.
Η ποσότητα log (ni ) ονομάζεται αντιστάθμιση (offset) και εμφανίζεται σε ποικίλα Γενικευμένα Γραμμικά
Μοντέλα πέραν του Poisson.
ΓΡΑΜΜΙΚΑ ΜΟΝΤΕΛΑ ΚΑΙ ΣΧΕΔΙΑΣΜΟΣ & ΑΝΑΛΥΣΗ ΠΕΙΡΑΜΑΤΩΝ ΜΕ ΕΦΑΡΜΟΓΕΣ ΣΕ R ΚΑΙ MINITAB
327
11.8 Επεκτάσεις
11.8.1 Γραμμικά μεικτά μοντέλα
Στα γραμμικά μοντέλα, είχαμε υποθέσει ότι τόσο ο πίνακας σχεδιασμού Xi όσο και οι συντελεστές παλινδρόμησης β∼ θεωρούνται σταθερά (fixed). Υπάρχουν όμως περιπτώσεις, όπως αυτή των συσχετισμένων παρατηρήσεων, όπου χρειάζεται να υποθέσουμε ότι κάποιοι από τους συντελεστές παλινδρόμησης είναι τυχαίοι
(random). Για παράδειγμα, σε ιατρικές μελέτες οι παρατηρήσεις συχνά συλλέγονται από τα ίδια υποκείμενα
σε διαφορετικές περιόδους. Είναι λοιπόν λογικό να υποθέσουμε ότι παρατηρήσεις που προέρχονται από το
ίδιο υποκείμενο είναι πολύ πιθανό να συσχετίζονται, ειδικά όταν αυτές λαμβάνονται ανά τακτά χρονικά διαστήματα. Για τον λόγο αυτό, χρειαζόμαστε γραμμικά μοντέλα τα οποία συνδυάζουν ταυτόχρονα σταθερούς
και τυχαίους συντελεστές παλινδρόμησης. Τα μοντέλα αυτά ονομάζονται γραμμικά μεικτά μοντέλα (linear
mixed models).
Για τον καθορισμό της συνάρτησης σύνδεσης ενός γραμμικού μεικτού μοντέλου (ΓΜΜ), θα πρέπει να ορίσουμε τη δεσμευμένη κατανομή των παρατηρήσεων yi , δοθέντος των τυχαίων επιδράσεων, έστω :
id
∼ Nn µ
, σ 2 In .
Y∼ |u
∼
∼
Η συνάρτηση σύνδεσης δίνεται από την ακόλουθη σχέση:
g (µi ) = Xi′ β∼ + Zi′ ,
(11.43)
όπου Xi′ η i-οστή γραμμή του πίνακα σχεδιασμού για τις σταθερές επιδράσεις, β∼ το διάνυσμα των παραμέτρων
το
των σταθερών επιδράσεων, Zi′ η i-οστή γραμμή του πίνακα σχεδιασμού για τις τυχαίες επιδράσεις και u
∼
iid
2
διάνυσμα των παραμέτρων των τυχαίων επιδράσεων, με u
∼ N (0, σu ).
∼
11.8.2 Γενικευμένα γραμμικά μεικτά μοντέλα
Τα γενικευμένα γραμμικά μικτά μοντέλα (generalized linear mixed models) αποτελούν μία ισχυρή κατηγορία στατιστικών μοντέλων που συνδυάζουν τα χαρακτηριστικά των ΓΓΜ και των ΓΜΜ. Είναι ικανά να διαχειριστούν, πέραν της κανονικής, ένα ευρύ φάσμα κατανομών απόκρισης. Παρόλο που δεν αποδίδουν πάντοτε
ικανοποιητικά, υπάρχει πληθώρα περιπτώσεων που χρησιμοποιούνται, καθώς είναι γρήγορα και το κυριότερο,
ευέλικτα, αφού μπορούν να χειριστούν πολύπλοκες περιπτώσεις, όπως αυτή των μηδενο-διογκωμένων (zeroinflated) αποκρίσεων.
Η δεσμευμένη κατανομή των παρατηρήσεων, δοθέντος των τυχαίων επιδράσεων ορίζεται ως:
id
Y∼ |u
∼ µ
, σ 2 In .
∼
∼
Η μορφή της συνάρτησης σύνδεσης του γενικευμένου γραμμικού μεικτού μοντέλου (ΓΓΜΜ) είναι όμοια με
αυτή της σχέσης (11.43) με τη διαφορά πλέον ότι η κατανομή των παρατηρήσεων καθώς και των παραμέτρων των τυχαίων επιδράσεων, δεν είναι πλέον (απαραίτητα) η κανονική.
Για περισσότερες πληροφορίες πάνω στα ΓΜΜ και τα ΓΓΜΜ, ο αναγνώστης παραπέμπεται στο βιβλίο του
Jiang [8].
11.9 Εφαρμογές στην R
1. Το αρχείο ch11ex1.xlsx περιέχει δεδομένα από μελέτη η οποία διεξήχθη μεταξύ 1958 και 1970 στο
University of Chicago’s Billings Hospital [6] και αφορά ασθενείς που χειρουργήθηκαν για καρκίνο
328
ΕΙΣΑΓΩΓΗ ΣΤΑ ΓΕΝΙΚΕΥΜΕΝΑ ΓΡΑΜΜΙΚΑ ΜΟΝΤΕΛΑ
του μαστού.
Αν:
Y = Κατάσταση επιβίωσης ασθενούς μετά το χειρουργείο [1 (επιβίωσε από 5 έτη και πάνω), 0
(επιβίωσε λιγότερο από 5 έτη)],
X1 = Ηλικία ασθενούς τη στιγμή του χειρουργείου (σε έτη) και
X2 = Πλήθος θετικών μασχαλιαίων λεμφαδένων που ανιχνεύτηκαν.
i. Να προσαρμοστεί κατάλληλο μοντέλο γραμμικής παλινδρόμησης και να ερμηνευθούν οι τιμές
των συντελεστών.
ii. Nα γίνει έλεγχος καλής προσαρμογής του μοντέλου βάσει του G τεστ (α = 5%).
iii. Να επαναληφθεί το ερώτημα (ii) κάνοντας χρήση του στατιστικού Hosmer-Lemeshow.
iv. Να υπολογιστεί ο ψευδο-συντελεστής προσδιορισμού του M cF adden.
v. Να ελεγχθεί η στατιστική σημαντικότητα των συντελεστών του μοντέλου (α = 5%).
vi. Να εκτιμηθεί η πιθανότητα επιβίωσης από 5 έτη και πάνω, ενός ασθενούς ηλικίας 29 ετών, με
26 διαγεγνωσμένους μασχαλιαίους λεμφαδένες.
vii. Να γίνει ο έλεγχος:
H0 : β0 = β2 = 0
vs
H1 : Όχι η H0 .
Ȫ
Λύση
Εισαγωγή δεδομένων & δημιουργία μεταβλητών
library(readxl)
data <‐ read_xlsx('ch11ex1.xlsx')
X1 <‐ data$X1
X2 <‐ data$X2
Y <‐ data$Y
i. Στο πρόβλημα υπό εξέταση, η μεταβλητή απόκρισης είναι δίτιμη (1 και 0), με αποτέλεσμα το
καταλληλότερο μοντέλο παλινδρόμησης να είναι το δίτιμο λογιστικό. Για την προσαρμογή ενός
οποιουδήποτε γενικευμένου γραμμικού μοντέλου στην R, κάνουμε χρήση της εντολής glm [stats].
Είναι πολύ σημαντικό να ορίσουμε την κατανομή της Y , ώστε να «καταλάβει» η R ποια συνάρτηση σύνδεσης θα πρέπει να θεωρήσει. Εδώ, χρειαζόμαστε τη logit συνάρτηση σύνδεσης και άρα
στο όρισμα family γράφουμε binomial (δεν υπάρχει η επιλογή bernoulli).
Δημιουργία δίτιμου λογιστικού μοντέλου παλινδρόμησης
genlm <‐ glm(Y ~ X1 + X2, family = binomial) # Αν είχαμε π.χ. Poisson
παλινδρόμηση, τότε θα θέταμε family = poisson
summary(genlm)
ΓΡΑΜΜΙΚΑ ΜΟΝΤΕΛΑ ΚΑΙ ΣΧΕΔΙΑΣΜΟΣ & ΑΝΑΛΥΣΗ ΠΕΙΡΑΜΑΤΩΝ ΜΕ ΕΦΑΡΜΟΓΕΣ ΣΕ R ΚΑΙ MINITAB
329
> summary(genlm)
Call:
glm(formula = Y ~ X1 + X2, family = binomial)
Coefficients:
Estimate Std. Error z value Pr(>|z|)
(Intercept)
2.4629
0.7064
3.49 0.00049
X1
‐0.0197
0.0127
‐1.55 0.12144
X2
‐0.0883
0.0198
‐4.46 8.3e‐06
Null deviance: 353.69
Residual deviance: 328.31
AIC: 334.3
on 305
on 303
degrees of freedom
degrees of freedom
Number of Fisher Scoring iterations: 4
Το εκτιμώμενο μοντέλο δίνεται από τη σχέση:
p̂i
log
1 − p̂i
!
= 2.4629 − 0.0197xi1 − 0.0883xi2 ,
i = 1, ..., 306.
Ερμηνεία συντελεστών παλινδρόμησης:
• β̂1 : Εάν η ηλικία του ατόμου που χειρουργήθηκε για καρκίνο του μαστού αυξηθεί κατά ένα
έτος, τότε τα odds επιβίωσής του από 5 έτη και πάνω θα μειωθούν κατά 1 − e−0.0197 =
1 − 0.9805 = 0.0195, δεδομένου ότι το πλήθος των μασχαλιαίων λεμφαδένων που ανιχνεύτηκαν παραμείνει σταθερό.
• β̂2 : Εάν το πλήθος των μασχαλιαίων λεμφαδένων που ανιχνεύτηκαν σε ένα άτομο που χειρουργήθηκε για καρκίνο του μαστού αυξηθεί κατά ένα, τότε τα odds επιβίωσής του από 5
έτη και πάνω θα μειωθούν κατά 1 − e−0.0883 = 1 − 0.9155 = 0.0845, δεδομένου ότι η
ηλικία παραμείνει σταθερή.
ii. Θέλουμε να εφαρμόσουμε τον ακόλουθο έλεγχο:
H0 : Όχι καλή προσαρμογή μοντέλου
vs
H1 : Καλή προσαρμογή μοντέλου.
To εν λόγω ερώτημα δύναται να προσεγγιστεί με ποικίλους τρόπους. Δύο εξ αυτών είναι οι ακόλουθοι:
Τρόπος 1ος
Στα αποτελέσματα του ερωτήματος (ii) εμφανίζονται οι ποσότητες Null και Residual deviance.
Από την αφαίρεση των δύο, θα προκύψει η τιμή της ελεγχοσυνάρτησης G (βλ. (11.22)).
G = Null Deviance − Residual Deviance = 353.69 − 328.31 = 25.38.
Τρόπος 2ος
Στα γενικευμένα γραμμικά μοντέλα, δεν υφίσταται η έννοια του Πίνακα ANOVA. Αντ’ αυτού,
330
ΕΙΣΑΓΩΓΗ ΣΤΑ ΓΕΝΙΚΕΥΜΕΝΑ ΓΡΑΜΜΙΚΑ ΜΟΝΤΕΛΑ
υπάρχει ο Πίνακας Ανάλυσης Απόκλισης (Analysis of Deviance Table), ο οποίος περιέχει όλες
τις απαραίτητες πληροφορίες για τον υπολογισμό του G. Εφαρμόζοντας την εντολή anova
[stats] πάνω στο genlm, θα προκύψει ο Πίνακας Ανάλυσης Απόκλισης. Η R είναι αρκετά
«έξυπνη» ώστε να καταλάβει ότι πρόκειται περί γενικευμένου γραμμικού μοντέλου και να μην
εκτυπώσει τον Πίνακα ANOVA.
Εξαγωγή Πίνακα Ανάλυσης Απόκλισης
deviance.table <‐ anova(genlm)
deviance.table
> deviance.table
Analysis of Deviance Table
Model: binomial , link: logit
Response: Y
Terms added sequentially (first to last)
Df Deviance Resid. Df Resid. Dev
NULL
305
354
X1
1
1.41
304
352
X2
1
23.97
303
328
Αθροίζοντας τα στοιχεία της στήλης “ Deviance Resid.” προκύπτει η τιμή του G.
G = 1.41 + 23.97 = 25.38.
Υπολογισμός χ22;0.95
qchisq(.95, 2)
> qchisq(.95, 2)
[1] 5.9915
Αφού G = 25.38 > 5.9915 = χ22;0.95 , απορρίπτεται η H0 και άρα το μοντέλο φαίνεται να
έχει καλή προσαρμογή στα δεδομένα.
iii. Ο έλεγχος Hosmer-Lemeshow προσφέρεται μέσω της εντολής
hoslem.test [ResourceSelection].
Υπολογισμός Hosmer-Lemeshow στατιστικού
library(ResourceSelection)
hl <‐ hoslem.test(Y, genlm$fitted.values)
hl
> hl
Hosmer and Lemeshow goodness of fit (GOF) test
data: Y, genlm$fitted.values
X‐squared = 8.2, df = 8, p‐value = 0.41
ΓΡΑΜΜΙΚΑ ΜΟΝΤΕΛΑ ΚΑΙ ΣΧΕΔΙΑΣΜΟΣ & ΑΝΑΛΥΣΗ ΠΕΙΡΑΜΑΤΩΝ ΜΕ ΕΦΑΡΜΟΓΕΣ ΣΕ R ΚΑΙ MINITAB
331
Αφού p-value = 0.41 > 0.05 = α, δεν απορρίπτεται η H0 και άρα (όπως είναι λογικό)
καταλήγουμε στο ίδιο συμπέρασμα με αυτό του G τεστ.
iv. Η εντολή PseudoR2 [DescTools] εκτός του M cF adden, παρέχει μία πληθώρα ψευδο-R2
στατιστικών.
Υπολογισμός Hosmer-Lemeshow στατιστικού
library(DescTools)
PseudoR2(genlm, which = "McFadden") # Εάν θέλαμε π.χ. το
R2 τότε θα θέταμε which = "CoxSnell"
Cox‐Snell
> PseudoR2(genlm, which = "McFadden")
McFadden
0.071751
2
Λόγω του ότι η τιμή του RM
cF adden (7.175%) είναι αρκετά μικρή, καταλήγουμε (με κάποια
επιφύλαξη) ότι το υπό εξέταση μοντέλο δεν είναι πολύ καλύτερο του κορεσμένου.
v. Θέλουμε να εφαρμόσουμε τον ακόλουθο έλεγχο:
H0 : βi = 0
vs
H1 : βi ̸= 0,
i = 0, 1, 2.
Για ακόμη μία φορά, θα χρειαστεί να ανατρέξουμε στα αποτελέσματα του ερωτήματος (i) καθώς εκεί, και συγκεκριμένα στη στήλη “ Pr(>|z|)”, βρίσκονται οι p-values του ελέγχου κατά
W ald για καθέναν από τους τρεις συντελεστές. Παρατηρούμε ότι, εκτός του συντελεστή β1 ,
οι υπόλοιποι εμφανίζουν p-values πολύ μικρότερες του α = 5% (αλλά και από οποιοδήποτε
σύνηθες επίπεδο σημαντικότητας) και άρα χαρακτηρίζονται ως στατιστικά σημαντικοί.
Από τα παραπάνω, συμπεραίνουμε ότι από τις X1 (Ηλικία ασθενούς τη στιγμή του χειρουργείου (σε έτη)) και X2 (Πλήθος θετικών μασχαλιαίων λεμφαδένων που ανιχνεύτηκαν), μόνο η
X2 επηρεάζει σημαντικά τα odds επιβίωσης του ασθενούς από 5 έτη και πάνω.
vi. Ορίζουμε το διάνυσμα X = (1, 29, 26). Η ζητούμενη πιθανότητα δίνεται από τη σχέση:
X ′ β̂
p̂ =
e
1+e
∼
X ′ β̂
.
∼
Υπολογισμός p̂
X = c(1, 29, 26)
phat = exp(t(X) %*% genlm$coefficients) / (1 + exp(t(X) %*%
genlm$coefficients))
> phat
[,1]
[1,] 0.4005
Άρα, p̂ = 0.4005.
vii. Ο έλεγχος θα διενεργηθεί μέσω του W ald′ s τεστ, ο οποίος προσφέρεται μέσω της εντολής
wald.test [aod].
332
ΕΙΣΑΓΩΓΗ ΣΤΑ ΓΕΝΙΚΕΥΜΕΝΑ ΓΡΑΜΜΙΚΑ ΜΟΝΤΕΛΑ
Διενέργεια Wald′ s τεστ
library(aod)
wald.test(b = coef(genlm),
Sigma = vcov(genlm),
Terms = c(1,3)) # Στο διάνυσμα γράφουμε τη θέση που έχει ο
κάθε συντελεστής υπό εξέταση μέσα στο μοντέλο. Έτσι, εάν
μας ενδιέφερε ο αντίστοιχος έλεγχος για τους συντελεστές
π.χ. β0 και β1 , τότε θα γράφαμε Terms=c(1,2)
Wald test:
‐‐‐‐‐‐‐‐‐‐
Chi‐squared test:
X2 = 26.2, df = 2, P(> X2) = 2.1e‐06
Αφού η p-value είναι (πολύ) μικρότερη από το α = 5%, η H0 απορρίπτεται.
ΒΙΒΛΙΟΓΡΑΦΙΑ
[1] Καρώνη, Χ., & Οικονόμου, Π. (2017). Στατιστικά μοντέλα παλινδρόμησης: Με χρήση M initab και R
(2η έκδ.). Αθήνα: Συμεών.
[2] Bishop, Y.M., Fienberg, S.E., & Holland, P.W. (1975). Discrete multivariate analysis. Massachusetts:
The M.I.T. Press, Cambridge.
[3] Cox, D.R., & Hinkley, D.V. (1974). Theoretical statistics (1st ed.). Chapman and Hall/CRC.
[4] Cox, D.R., & Snell, E.J. (1989). The analysis of binary data (2nd ed.). London: Chapman and Hall.
[5] Efron, B. (1978). Regression and ANOVA with zero-one data: Measures of residual variation. Journal of the American Statistical Association, 73, 113-121.
[6] Haberman, S.J. (1976). Generalized residuals for log-linear models. Boston: Proceedings of the 9th
International Biometrics Conference, 104-122.
[7] Hosmer, D.W. & Lemeshow, S. (1980). A goodness-of-fit tests for the multiple logistic regression
model. Communications in Statistics, 9(10), 1043-1069.
[8] Jiang, J. (2007). Linear and generalized linear mixed models and their applications. Springer Series in
Statistics.
[9] Lehmann, E.L. (1983). Theory of point estimation. Wiley.
[10] McCullagh, P., & Nelder, J.A. (1989). Generalized linear models, (2nd ed.). Chapman and Hall.
[11] McCulloch, C.E., & Searle, S.R. (2001). Generalized, linear, and mixed models (Wiley Series in Probability and Statistics) (1st ed.). Wiley-Interscience.
[12] McFadden, D. (1974). Conditional logit analysis of qualitative choice behavior. In P. Zarembka
(Ed.), Frontiers in Econometrics, 105-142, Academic Press.
[13] Nagelkerke, N.J.D. (1991). A note on a general definition of the coefficient of determination.
Biometrika, 78(3), 691-692.
334
ΒΙΒΛΙΟΓΡΑΦΙΑ
[14] Nelder, J.A., & Wedderburn R.W.M. (1972). Generalized linear models. Journal of the Royal Statistical Society. Series A (General), 135(3), 370-84.
[15] Wilks, S.S. (1938). The large-sample distribution of the likelihood ratio for testing composite hypotheses. The Annals of Mathematical Statistics, 9(1), 60-62.
[16] Ypma, T.J. (1995). Historical development of the Newton-Raphson method. SIAM Review, 37(4),
531-551.
ΠΑΡΑΡΤΗΜΑΤΑ
ΠΑΡΑΡΤΗΜΑ Α
ΑΠΑΝΤΗΣΕΙΣ ΑΣΚΗΣΕΩΝ ΑΥΤΟΑΞΙΟΛΟΓΗΣΗΣ
Α.1 Άσκηση Αυτοαξιολόγησης Κεφάλαιο 2
Κατά την αξιολόγηση των συντελεστών παλινδρόμησης σε ένα πρότυπο παλινδρόμησης είτε αυτό είναι απλό
γραμμικό είτε πολλαπλό, ο Ερευνητής θα πρέπει εκ των προτέρων να επιλέξει το σφάλμα τύπου I το οποίο
επιτρέπει στον εαυτό του, ανάλογα με το πρόβλημα που έχει κληθεί να μελετήσει. Το σφάλμα αυτό γνωστό
και ως επίπεδο σημαντικότητας α, είναι σχεδόν πάντα μικρότερο από 10%, με πιο συνήθεις τιμές τις 5% και
1%.
Στους ελέγχους υποθέσεων, τόσο για τους συντελεστές παλινδρόμησης όσο και για οποιοδήποτε άλλο χαρακτηριστικό του υπό εξέταση φαινομένου, συστήνεται η εύρεση της p-value και αυτό γιατί ο καθορισμός
της επιτρέπει στον Ερευνητή να γνωρίζει το εύρος των τιμών του επιπέδου σημαντικότητας α όπου η υπό
εξέταση μηδενική υπόθεση απορρίπτεται, δηλαδή το διάστημα [p-value, 1] καθώς και το εύρος των τιμών
του α όπου η υπό εξέταση μηδενική υπόθεση γίνεται δεκτή, δηλαδή το διάστημα [0, p-value).
Για να έχουν καταλήξει οι δύο Ερευνητές σε διαφορετικό συμπέρασμα, η τιμή του α που επέλεξε ο Ερευνητής Α (ο οποίος δέχθηκε ότι η κλίση είναι μηδέν και άρα αποδέχθηκε τη μηδενική υπόθεση) είναι εντός του
διαστήματος [0, p-value), σε αντίθεση με τον Ερευνητή Β που η τιμή του α που εκείνος επέλεξε (ο οποίος
απέρριψε τη μηδενική υπόθεση, ότι η κλίση είναι 0) είναι εντός του διαστήματος [p-value, 1].
Α.2 Άσκηση Αυτοαξιολόγησης Κεφάλαιο 3
Όπως αναφέρθηκε και στην απάντηση της Άσκησης Αυτοαξιολόγησης του Κεφαλαίου 2, αν το επίπεδο σημαντικότητας είναι μικρότερο από την τιμή της p-value, δηλαδή ανήκει στο διάστημα [0, p-value), ο Ερευνητής
θα πρέπει να αποδεχτεί τη μηδενική υπόθεση, η οποία στην περίπτωση της ανάλυσης παλινδρόμησης ισοδυναμεί με απομάκρυνση από το πρότυπο, της συγκεκριμένης ανεξάρτητης μεταβλητής.
338
ΑΠΑΝΤΗΣΕΙΣ ΑΣΚΗΣΕΩΝ ΑΥΤΟΑΞΙΟΛΟΓΗΣΗΣ
Στην πράξη, ο Ερευνητής δεν θα πρέπει να ακολουθεί και να τηρεί ευλαβικά τους γενικούς κανόνες χωρίς
κριτική σκέψη. Στη συγκεκριμένη περίπτωση, θα πρέπει να τονιστεί ότι η τιμή της p-value είναι πολύ οριακή
και θα ήταν φρόνιμο να επανεξεταστεί το θέμα είτε επαναλαμβάνοντας το πείραμα με νέα δεδομένα είτε αυξάνοντας τον αριθμό των πειραμάτων, ώστε να διαπιστωθεί αν η νέα p-value θα μετακινηθεί προς τη μία ή την
άλλη κατεύθυνση. Η ασφαλέστερη απόφαση είναι η περαιτέρω διερεύνηση του θέματος. Σημειώνεται ότι αν ο
Ερευνητής επιλέξει μία τιμή του επιπέδου σημαντικότητας από 6% και άνω (αντί του 5%) θα πρέπει να πάρει
την αντίθετη απόφαση και να διατηρήσει τη μεταβλητή στο πρότυπο (βλ. απάντηση Άσκησης Αυτοαξιολόγησης Κεφαλαίου 2). Μια τέτοια απόφαση συχνά συνδέεται τόσο με τη σοβαρότητα του προβλήματος υπό
εξέταση, όσο και με θέματα περιορισμένων πόρων (π.χ. η μέτρηση της συγκεκριμένης ανεξάρτητης μεταβλητής έχει μεγάλο κόστος ή η χρηματοδότηση της έρευνας είναι περιορισμένη) ή περιορισμένου χρόνου (π.χ. η
μέτρηση της συγκεκριμένης μεταβλητής είναι χρονοβόρα ή η χρονική περίοδος της μελέτης έχει λήξει).
Α.3 Άσκηση Αυτοαξιολόγησης Κεφάλαιο 4
Όπως έχει αναφερθεί, είναι πολύ σημαντικό, προτού γίνει η ανάλυση των δεδομένων και εξαχθούν τα οποιαδήποτε συμπεράσματα, να διερευνηθεί η καταλληλότητα/ορθότητα του προτύπου που έχει επιλεγεί. Για τον
σκοπό αυτό, υπάρχουν τόσο γραφικές όσο και στατιστικές τεχνικές οι οποίες βασίζονται στα σφάλματα, κάτι
που είναι αναμενόμενο, αφού οι προϋποθέσεις των προτύπων παλινδρόμησης αφορούν αποκλειστικά τα σφάλματα εi .
Όπως γνωρίζουμε, το σφάλμα ή διαταρακτικός όρος δεν είναι παρατηρήσιμο και άρα τα εi δεν είναι διαθέσιμα στον Ερευνητή ώστε αυτός να προβεί στην ανάλυσή τους. Ο Ερευνητής αναγκαστικά πρέπει να αναζητήσει τις τιμές εκείνες που προσεγγίζουν (εκτιμούν) τις πραγματικές αλλά άγνωστες τιμές εi . Για τον σκοπό
αυτό προβαίνει στη στατιστική ανάλυση (ωσάν να πληρούνται οι προϋποθέσεις) και υπολογίζει τα κατάλοιπα
(residuals) μέσω του τύπου εˆi = yi − ŷi , τα οποία στη συνέχεια τα χρησιμοποιεί ως εκτιμήτριες τιμές
των αγνώστων σφαλμάτων και προχωρά στη λεγόμενη ανάλυση καταλοίπων. Με άλλα λόγια, τα κατάλοιπα
μπορούν να θεωρηθούν σαν τα παρατηρηθέντα σφάλματα, σε αντιδιαστολή με τα άγνωστα (πραγματικά)
σφάλματα. Συμπερασματικά, πάντοτε στην ανάλυση παλινδρόμησης ο Ερευνητής διεκπεραιώνει τη στατιστική ανάλυση χωρίς στην πραγματικότητα να γνωρίζει αν αυτή είναι η ενδεδειγμένη. Πάντως, αν πράγματι
η συγκεκριμένη ανάλυση δεν είναι η ενδεδειγμένη, τότε τα κατάλοιπα που θα προκύψουν δεν θα αποτελούν
αξιόπιστες εκτιμήσεις των άγνωστων σφαλμάτων και η ανάλυση καταλοίπων θα οδηγήσει στο συμπέρασμα
ότι τουλάχιστον κάποιες από τις προϋποθέσεις παραβιάζονται και άρα το πρότυπο δεν είναι το ενδεδειγμένο.
Α.4 Άσκηση Αυτοαξιολόγησης Κεφάλαιο 5 - Ενότητα 5.4
Για την επίλυση του προβλήματος θα πρέπει να προσδιοριστεί η μορφή της πιθανοφάνειας για δείγμα μεγέθους
n από την κατανομή N (µ, σ 2 ). Αξιοποιώντας τους δειγματικούς εκτιμητές µ̂p και σ̂p2 της μέσης τιμής µ και
σ 2 αντίστοιχα για το πρότυπο διάστασης p, προκύπτει ότι
−2 log L̂ = −n log σ̂p2 − n log(2π) −
n
2
με τους 2 τελευταίους όρους να μπορούν να αγνοηθούν, αφού δεν σχετίζονται με το υπό εξέταση, κάθε φορά,
μοντέλο. Άρα, η ελαχιστοποίηση του AIC ισοδυναμεί με την ελαχιστοποίηση της ποσότητας
AICp = −n log σ̂p2 + 2p.
Ομοίως για το κριτήριο BIC.
ΓΡΑΜΜΙΚΑ ΜΟΝΤΕΛΑ ΚΑΙ ΣΧΕΔΙΑΣΜΟΣ & ΑΝΑΛΥΣΗ ΠΕΙΡΑΜΑΤΩΝ ΜΕ ΕΦΑΡΜΟΓΕΣ ΣΕ R ΚΑΙ MINITAB
339
Α.5 Άσκηση Αυτοαξιολόγησης Κεφάλαιο 5 - Ενότητα 5.5
Από τους τύπους των δύο κριτηρίων, διαπιστώνεται ότι η ταύτιση προκύπτει στην περίπτωση του απλού γραμμικού μοντέλου, δηλαδή όταν p = 1.
Α.6 Άσκηση Αυτοαξιολόγησης Κεφάλαιο 7
Τα πολλαπλά διαστήματα εμπιστοσύνης Tukey είναι τόσα όσοι οι συνδυασμοί ανά δύο, των εμπλεκόμενων
επιπέδων του παράγοντα ενδιαφέροντος. Από την άλλη πλευρά, ο αριθμός των πολλαπλών διαστημάτων εμπιστοσύνης Dunnett ισούται με τον αριθμό των επιπέδων του παράγοντα ενδιαφέροντος, μείον ένα, αφού κάθε
επίπεδο συγκρίνεται με το συγκεκριμένο επίπεδο που ενδιαφέρει τον Ερευνητή. Άρα, αν σε μία μελέτη ο παράγοντας
ενδιαφέροντος έχει k επίπεδα, τότε ο συνολικός αριθμός των πολλαπλών διαστημάτων Tukey ισούται
με k2 , ενώ ο συνολικός αριθμός των πολλαπλών διαστημάτων Dunnett ισούται με k − 1.
Α.7 Άσκηση Αυτοαξιολόγησης Κεφάλαιο 8
Στην πρώτη στήλη του 3 × 3 Λατινικού Τετραγώνου, μπορούν να τοποθετηθούν 6 διαφορετικοί συνδυασμοί
των A, B και C, ήτοι (A, B, C), (A, C, B), (B, C, A), (B, A, C), (C, A, B) και (C, B, A). Για καθέναν
από τους 6 αυτούς συνδυασμούς προκύπτουν 2 Λατινικά Τετράγωνα, με το δεύτερο σε σχέση με το πρώτο, να
έχει αντιμετατεθειμένες τις δύο τελευταίες στήλες (2η και 3η ). Υπενθυμίζεται ότι η ανάθεση των A, B και C
στις 2 τελευταίες στήλες γίνεται με τέτοιο τρόπο ώστε κάθε σύμβολο/γράμμα να εμφανίζεται μία μόνο φορά
σε κάθε γραμμή και κάθε στήλη του 3 × 3 Λατινικού Τετραγώνου. Τα δύο Λατινικά Τετράγωνα, όταν στην
πρώτη στήλη του τετραγώνου αντιστοιχεί ο συνδυασμός A, B, C, είναι τα ακόλουθα:
Πίνακας Α.1: 3 × 3 Σχέδιο Λατινικού Τετραγώνου 1η περίπτωση
Επίπεδα Μεταβλητής
Πλαισίου 2
ΟΟ1
ΟΟ2
ΟΟ3
O1
A
B
C
O2
B
C
A
O3
C
A
B
Επίπεδα Μεταβλητής
Πλαισίου 1
340
ΑΠΑΝΤΗΣΕΙΣ ΑΣΚΗΣΕΩΝ ΑΥΤΟΑΞΙΟΛΟΓΗΣΗΣ
Πίνακας Α.2: 3 × 3 Σχέδιο Λατινικού Τετραγώνου 2η περίπτωση
Επίπεδα Μεταβλητής
Πλαισίου 2
ΟΟ1
ΟΟ2
ΟΟ3
O1
A
C
B
O2
B
A
C
O3
C
B
A
Επίπεδα Μεταβλητής
Πλαισίου 1
Ομοίως για καθέναν από τους άλλους πέντε συνδυασμούς των A, B και C.
Α.8 Άσκηση Αυτοαξιολόγησης Κεφάλαιο 9 - Ενότητα 9.1
Εφαρμόζοντας τους τύπους για τον υπολογισμό των επιδράσεων, προκύπτουν τα εξής:
µ̂ = 64.25, A = 11.50, B = −2.50, C = 0.75, AB = 0.75, AC = 5.0, BC = 0.00, ABC = 0.25.
Ακολουθώντας τη συνήθη διαδικασία στο Minitab, δηλαδή
Stat
Ê
ANOVA
Ê
General Linear Model
Ê
Fit General Linear Model
μπορούμε να δημιουργήσουμε τον Πίνακα Ανάλυσης Διασποράς για το πρότυπο με τρεις σταθερούς παράγοντες και τις αλληλεπιδράσεις τους. Ο Πίνακας ANOVA συνοδεύεται και από τον πίνακα των συντελεστών
παλινδρόμησης που ταυτίζεται με αυτόν που δίνει το πρότυπο παλινδρόμησης και γι’ αυτό δεν επαναλαμβάνεται εδώ.
Πίνακας Α.3: Πίνακας ANOVA - Παράδειγμα 23 Παραγοντικό Πείραμα με n = 2 επαναλήψεις
Πηγή
Μεταβλητότητας
Βαθμοί
Ελευθερίας
Άθροισμα
Τετραγώνων
A
1
2116
B
1
C
Μέσο
F
p-value
2166
264.5
0.000
100
100
12.5
0.008
1
9
9
1.12
0.320
AB
1
9
9
1.13
0.320
AC
1
400
400
50
0.000
BC
1
0
0
0
1.000
ABC
1
1
1
0.13
0.733
Σφάλματα
8
64
8
−
−
Ολική
15
2699
−
−
−
Άθροισμα
Τετραγώνων
ΓΡΑΜΜΙΚΑ ΜΟΝΤΕΛΑ ΚΑΙ ΣΧΕΔΙΑΣΜΟΣ & ΑΝΑΛΥΣΗ ΠΕΙΡΑΜΑΤΩΝ ΜΕ ΕΦΑΡΜΟΓΕΣ ΣΕ R ΚΑΙ MINITAB
341
Α.9 Άσκηση Αυτοαξιολόγησης Κεφάλαιο 9 - Ενότητα 9.2.1
Αφού δεν είναι επιτρεπτή η σύγχυση μεταξύ των I, A, C και BC, συνεπάγεται ότι θα πρέπει να αναζητηθεί
η προσδιορίζουσα εξίσωση μεταξύ των I = B, I = AB, I = AC και I = ABC.
Με απλή διερεύνηση των παραλλαγών, διαπιστώνεται άμεσα ότι η πρώτη επιλογή οδηγεί (πολλαπλασιάζοντας
και τα δύο μέρη της προσδιορίζουσας με C) στη σύγχυση των C και BC (C = BC). Με τον ίδιο τρόπο,
η τρίτη περίπτωση οδηγεί στη σύγχυση των A και C, αφού πολλαπλασιάζοντας με A και τα δύο μέλη της
προσδιορίζουσας, προκύπτει ότι A = C. Η τελευταία περίπτωση οδηγεί στην παραλλαγή A = BC
(πολλαπλασιάζοντας με A και τα δύο μέλη της προσδιορίζουσας). H επιθυμητή προσδιορίζουσα είναι η I =
AB η οποία δεν αποτελεί ιδανική αλλά μάλλον αναγκαστική επιλογή, αφού οδηγεί στη σύγχυση των κύριων
επιδράσεων A και B (πολλαπλασιάζοντας με A προκύπτει ότι A = B), με αποτέλεσμα ο προτεινόμενος
σχεδιασμός να έχει Ανάλυση ίση με II.
Α.10 Άσκηση Αυτοαξιολόγησης Κεφάλαιο 9 - Ενότητα 9.2.2 - 1η Άσκηση
Για την εύρεση των παραλλαγών, πολλαπλασιάζουμε τα δύο μέλη της προσδιορίζουσας (I = ABCDE)
με καθεμία κύρια επίδραση και στη συνέχεια με κάθε αλληλεπίδραση 1ης τάξης (μεταξύ 2 παραγόντων). Οι
παραλλαγές που προκύπτουν είναι A = BCDE, B = ACDE, C = ABDE, D = ABCE και
E = ABCD για τις κύριες επιδράσεις, και AB = CDE, AC = BDE, AD = BCE, AE = BCD,
BC = ADE, BD = ACE, BE = ACD, CD = ABE, CE = ABD και DE = ABC για τις αλληλεπιδράσεις 1ης τάξης. Τα αποτελέσματα δείχνουν ότι τόσο οι κύριες επιδράσεις όσο και οι αλληλεπιδράσεις
1ης τάξης δεν συγχέονται μεταξύ τους και άρα ικανοποιείται ο ορισμός της Ανάλυσης V .
Α.11 Άσκηση Αυτοαξιολόγησης Κεφάλαιο 9 - Ενότητα 9.2.2 - 2η Άσκηση
Από τη στιγμή που η προσδιορίζουσα είναι η αλληλεπίδραση μέγιστης τάξης (όπου εμπλέκονται όλοι οι παράγοντες), εφαρμόζεται η ειδική βηματική διαδικασία και ο πίνακας που προκύπτει δίνεται κατωτέρω:
Επίδραση
A
B
C
D = BC
Θεραπεία 24−1
(1)
−
−
−
−
(1)
a
+
−
−
+
ad
b
−
+
−
+
bd
ab
+
+
−
−
ab
c
−
−
+
+
cd
ac
+
−
+
−
ac
bc
−
+
+
−
bc
abc
+
+
+
+
abcd
3
Θεραπεία 2
342
ΑΠΑΝΤΗΣΕΙΣ ΑΣΚΗΣΕΩΝ ΑΥΤΟΑΞΙΟΛΟΓΗΣΗΣ
Α.12 Άσκηση Αυτοαξιολόγησης Κεφάλαιο 9 - Ενότητα 9.2.3
Για την εύρεση της τρίτης προσδιορίζουσας απαιτείται ο πολλαπλασιασμός των δύο βασικών προσδιοριζουσών
(γεννητόρων):
I = (−ABCE) × (−ACDF ) = A2 BC 2 DEF = BDEF.
Αφού ο ελάχιστος αριθμός συμβόλων/γραμμάτων στις τρεις προσδιορίζουσες είναι τέσσερα (4), η Ανάλυση
του σχεδιασμού είναι ίση με IV .
Για τις παραλλαγές, κάθε προσδιορίζουσα θα πρέπει να πολλαπλασιαστεί με κάθε κύρια επίδραση και στη
συνέχεια με κάθε αλληλεπίδραση 1ης τάξης. Οι συγκεκριμένες παραλλαγές θα δώσουν μία σαφή εικόνα για
τις βασικές συγχύσεις και θα επιβεβαιωθεί ότι κάποιες αλληλεπιδράσεις 1ης τάξης θα συγχέονται με άλλες
αλληλεπιδράσεις 1ης τάξης (κάτι που θα συμφωνεί με την Ανάλυση του σχεδιασμού). Οι παραλλαγές που
αφορούν τις κύριες επιδράσεις είναι:
(A = BCE), (B = ACE), (C = ABE), (D = ABCDE), (E = ABC), (F = ABCEF ),
(A = CDF ), (B = ABCDF ), (C = ADF ), (D = ACF ), (E = ACDEF ), (F = ACD),
(A = ABDEF ), (B = DEF ), (C = BCDEF ), (D = BEF ), (E = BDF ) & (F = BDE).
ΕΙΣΑΓΩΓΗ ΣΤΟ MINITAB
Το στατιστικό πακέτο Minitab δημιουργήθηκε το 1972 και χρησιμοποιείται, ως επί το πλείστον, από στατιστικούς για την ανάλυση και παρουσίαση δεδομένων. Παρακάτω παρουσιάζονται οι βασικές πτυχές της
έκδοσης 19.0, συνοδευόμενες από χρήσιμα στιγμιότυπα.
Α.13 Λήψη και Εγκατάσταση
Για να γίνει λήψη του Minitab, θα χρειαστεί να μεταβούμε στην ιστοσελίδα www.minitab.com. Εκεί θα βρούμε
δύο επιλογές, μία δωρεάν δοκιμαστική έκδοση (διαρκείας 30 ημερών) και μία έκδοση με (επί πληρωμή) άδεια
χρήσης. Αφού κατεβάσουμε το αρχείο, πατάμε διπλό αριστερό κλικ επάνω του και ακολουθούμε τις σχετικές
οδηγίες εγκατάστασης.
Α.14 Διεπαφή χρήστη
Η διεπαφή χρήστη (user interface) του Minitab είναι σχετικά απλή και χωρίζεται σε 4 βασικά τμήματα:
• Γραμμή εργαλειών (Toolbar): Γίνεται (σχεδόν) όλη η διαχείριση του Minitab (π.χ. εισαγωγή και
επεξεργασία δεδομένων, στατιστική ανάλυση, δημιουργία διαγραμμάτων κ.ά.).
• Φύλλο εργασίας (Worksheet): Εμφανίζονται οι τιμές (σε στήλες) των εκάστοτε μεταβλητών υπό
εξέταση.
• Περιοχή αποτελεσμάτων (Output area): Εμφανίζονται τα αποτελέσματα της όποιας ανάλυσης.
• Περιηγητής (Navigator): Εμφανίζονται οι ονομασίες των τεχνικών ανάλυσης που έχουν διενεργηθεί.
344
ΕΙΣΑΓΩΓΗ ΣΤΟ MINITAB
Α.15 Γραμμή εργαλειών
Η γραμμή εργαλειών αποτελεί τον «πυρήνα» του Minitab, καθώς από εκεί γίνεται όλη η διαχείρισή του. Παρακάτω, παρουσιάζονται (συνοπτικά) οι 6 βασικές καρτέλες File, Edit, Data, Calc, Stat και Graph.
Α.15.1 File
Στην καρτέλα File δίνονται επιλογές που σχετίζονται, ανάμεσα σε άλλα, με τη δημιουργία νέων Minitab projects, φύλλων εργασίας καθώς και εισαγωγή δεδομένων.
Τα πιο χρήσιμα...
• New: Δημιουργία νέου project ή φύλλου εργασίας.
• Open: Εισαγωγή δεδομένων από αρχείο τύπου minitab, excel ή text.
• Save Project: Αποθήκευση project.
• Print: Εκτύπωση περιοχής αποτελεσμάτων.
• Options: Παραμετροποίηση Minitab (π.χ. γλώσσα).
• Recent Files: Άνοιγμα προσφάτως επεξεργασμένων projects.
ΓΡΑΜΜΙΚΑ ΜΟΝΤΕΛΑ ΚΑΙ ΣΧΕΔΙΑΣΜΟΣ & ΑΝΑΛΥΣΗ ΠΕΙΡΑΜΑΤΩΝ ΜΕ ΕΦΑΡΜΟΓΕΣ ΣΕ R ΚΑΙ MINITAB
Α.15.2 Edit
Στην καρτέλα Edit παρέχονται επιλογές που αφορούν τα κελιά του φύλλου εργασιών (π.χ. διαγραφή, αντιγραφή, επικόλληση κ.ά.).
Τα πιο χρήσιμα...
• Undo/Redo: Αναίρεση βήματος προς τα πίσω/εμπρός.
• Clear Cells: Εκκαθάριση στοιχείων στα επιλεγμένα κελιά.
• Copy/Cut/Paste Cells: Αντιγραφή/Αποκοπή/Επικόλληση επιλεγμένων κελιών.
Α.15.3 Data
Στην καρτέλα Data θα βρούμε οτιδήποτε αφορά τη χειραγώγηση των δεδομένων
στο φύλλο εργασίας (π.χ. Αντιστροφή στηλών, Ταξινόμηση, Επανακωδικοποίηση
κ.ά.).
Τα πιο χρήσιμα...
• Merge Worksheets: Συγχώνευση φύλλων εργασίας.
• Transpose Columns: Αντιστροφή στηλών.
• Sort: Ταξινόμηση δεδομένων.
• Recode: Επανακωδικοποίηση μεταβλητών.
• Change Data Type: Αλλαγή τύπου δεδομένων.
Α.15.4 Calc
Οτιδήποτε αφορά υπολογισμούς (π.χ. αθροιστική συνάρτηση κατανομής, παραγωγή τυχαίων τιμών, Πίνακες κ.ά.), θα το βρούμε στην καρτέλα Calc.
Τα πιο χρήσιμα...
• Calculate: Υπολογισμός συναρτήσεων (π.χ. τριγωνομετρικών, εκθετικών, κ.α.)
• Random Data: Παραγωγή τυχαίων τιμών από μία πληθώρα διακριτών και
συνεχών κατανομών.
• Probability Distributions: Υπολογισμός αθροιστικής συνάρτησης,
αντίστροφης συνάρτησης και συνάρτησης πιθανότητας.
• Matrices: Υπολογισμοί πινάκων (π.χ. αντίστροφος, ανάστροφος, ιδιοτιμές, κ.ά.).
345
346
ΕΙΣΑΓΩΓΗ ΣΤΟ MINITAB
Α.15.5 Stat
Η καρτέλα Stat περιέχει τεχνικές και μεθόδους περιγραφικής στατιστικής και
στατιστικής συμπερασματολογίας (περιγραφικά χαρακτηριστικά, ανάλυση παλινδρόμησης, ανάλυση διακύμανσης, στατιστικός έλεγχος ποιότητας κ.ά.).
Τα πιο χρήσιμα...όλα!
Α.15.6 Graph
Στην καρτέλα Graph, συναντάμε οτιδήποτε αφορά τη γραφική ανάλυση των δεδομένων (π.χ. διάγραμμα διασποράς, ιστόγραμμα, ραβδόγραμμα κ.ά.).
Τα πιο χρήσιμα...
• Scatterplot: Δημιουργία διαγράμματος διασποράς.
• Histogram: Δημιουργία ιστογράμματος.
• Boxplot: Δημιουργία θηκογράμματος.
• Bar Chart: Δημιουργία ραβδογράμματος.
• Pie Chart: Δημιουργία γραφήματος πίτας.
• Time Series Plot: Δημιουργία διαγράμματος χρονοσειράς.
Α.16 Φύλλο εργασίας
Τα δεδομένα που εισάγονται είτε χειροκίνητα είτε μέσω κάποιου αρχείου, εμφανίζονται στο φύλλο εργασίας
σε μορφή στηλών. Έτσι, τα δεδομένα της πρώτης μεταβλητής καταχωρίζονται στη στήλη C1, της δεύτερης
στη στήλη C2 κ.ο.κ. Αξίζει να παρατηρήσουμε ότι, ενώ όλες οι γραμμές έχουν αρίθμηση, η πρώτη (με γκρίζο
φόντο) δεν έχει. Αυτό συμβαίνει γιατί τα κελιά της πρώτης γραμμής αποτελούν τα ονόματα των εκάστοτε
μεταβλητών.
ΓΡΑΜΜΙΚΑ ΜΟΝΤΕΛΑ ΚΑΙ ΣΧΕΔΙΑΣΜΟΣ & ΑΝΑΛΥΣΗ ΠΕΙΡΑΜΑΤΩΝ ΜΕ ΕΦΑΡΜΟΓΕΣ ΣΕ R ΚΑΙ MINITAB
Κάνοντας δεξί κλικ πάνω σε οποιαδήποτε στήλη, εμφανίζονται διάφορες επιλογές,
εκ των οποίων άξιες σχολιασμού είναι οι ακόλουθες:
• Find and Replace: Εύρεση και αντικατάσταση μίας ποσότητας.
• Sort Columns: Ταξινόμηση στηλών.
• Cell Properties: Ιδιότητες κελιών, όπως σχολιασμός, καθαρισμός κ.ά.
• Column Properties: Ιδιότητες στηλών, όπως περιγραφή, πλάτος κ.ά.
• Formulas: Καταχώριση εξίσωσης.
347
348
ΕΙΣΑΓΩΓΗ ΣΤΟ MINITAB
ΠΑΡΑΡΤΗΜΑ Β
ΕΓΚΑΘΙΣΤΩΝΤΑΣ ΤΗΝ R ΚΑΙ ΤΟ R-STUDIO
Η (στατιστική) γλώσσα προγραμματισμού R έκανε την εμφάνισή της περί τα μέσα του 1993 και την τελευταία
δεκαετία αποτελεί ένα από τα κυρίαρχα, αν όχι το κυρίαρχο, εργαλεία στατιστικής ανάλυσης. Οι κυριότεροι
λόγοι που την καθιστούν ελκυστική, τόσο στον ακαδημαϊκό χώρο όσο και στον ιδιωτικό τομέα είναι: (1) η ταχύτητά της στην εκτέλεση εντολών σχετικών με τη στατιστική ανάλυση και (2) το γεγονός ότι είναι δωρεάν.
Β.1 Λήψη και Εγκατάσταση
Η διεπαφή χρήστη (user interface, UI) της R είναι σχετικά απλή και κάπως «αφιλόξενη» προς τον χρήστη
και ως εκ τούτου είθισται να δουλεύουμε πάνω σε κάποιο Ενσωματωμένο Αναπτυξιακό Περιβάλλον (Integrated Development Environment, IDE). Το πιο γνωστό IDE για την R, είναι το R-Studio χωρίς όμως να
σημαίνει ότι δεν υπάρχουν και άλλα IDEs (π.χ. Atom, Eclipse, Visual Studio Code κ.ά.).
Για τη λήψη και την ορθή εγκατάσταση των R και R-Studio, ακολουθούμε την εξής διαδικασία:
Βήμα 1o : Μεταβαίνουμε στον ιστότοπο https://cran.r-project.org και κατεβάζουμε την τελευταία
διαθέσιμη έκδοση της R για το λειτουργικό μας σύστημα (π.χ. Windows). Αφού εντοπίσουμε το αρχείο
που κατεβάσαμε, πατάμε επάνω του διπλό κλικ και προχωράμε στην εγκατάστασή του.
Βήμα 2o : Μεταβαίνουμε στον ιστότοπο https://www.rstudio.com/products/rstudio/download/
και κατεβάζουμε την τελευταία διαθέσιμη έκδοση του R-Studio για το λειτουργικό μας σύστημα (π.χ.
Mac OS). Αφού εντοπίσουμε το αρχείο που κατεβάσαμε, πατάμε επάνω του διπλό κλικ και προχωράμε
στην εγκατάστασή του.
Β.2 Η διεπαφή χρήστη του R-Studio
Η διεπαφή χρήστη (user interface) του R-Studio απαρτίζεται από 3 βασικά τμήματα:
350
ΕΓΚΑΘΙΣΤΩΝΤΑΣ ΤΗΝ R ΚΑΙ ΤΟ R-STUDIO
Σχήμα Β.1: Διεπαφή χρήστη Minitab
• Console: Τυπώνονται τα αποτελέσματα του κώδικα που εκτελέσαμε.
• Environment: Εμφανίζονται οι τιμές των μεταβλητών οι οποίες ορίστηκαν κατά τη διάρκεια συγγραφής/εκτέλεσης του κώδικά μας.
• Files/Plots/Packages: Εύρεση αρχείων στον υπολογιστή μας/Εμφάνιση γραφημάτων του κώδικα
που εκτελέσαμε (αν υπάρχουν)/Εγκατάσταση πακέτων.
Για περισσότερες πληροφορίες σχετικά με την ανάπτυξη κώδικα στην R, ο ενδιαφερόμενος αναγνώστης
παραπέμπεται στα βιβλία:
• Ντζούφρας, Ι., & Καρλής, Δ. (2015). Εισαγωγή στον προγραμματισμό και στη στατιστική ανάλυση με
R [Προπτυχιακό εγχειρίδιο]. Κάλλιπος, Ανοικτές Ακαδημαϊκές Εκδόσεις. http://hdl.handle.n
et/11419/2601
• Φουσκάκης, Δ. (2021). Ανάλυση δεδομένων με χρήση της R (2η έκδ.). Αθήνα: Εκδόσεις Τσότρας.
• Field, A., Miles, J., & Field, Z. (2012). Discovering Statistics Using R (1st ed.). SAGE Ltd.
ΠΙΝΑΚΕΣ ΠΟΣΟΣΤΙΑΙΩΝ ΣΗΜΕΙΩΝ
Πίνακας Β.1: Διακριτές κατανομές
Κατανομή
Συμβολισμός
(X ∼ (·))
Συνάρτηση
(Μάζας)
Πιθανότητας
(fX (x))
Bernoulli
B(p), p ∈ (0, 1)
px(1 − p)1−xI{0,1}
Διωνυμική
Bin(n, p), n ∈ N, p ∈ (0, 1)
Γεωμετρική
Geo(p), p ∈ (0, 1)
Αρνητική Διωνυμική N B(α, p), α ∈ N, p ∈ (0, 1)
Poisson
P (λ), λ > 0
(x)
n x
x p (1
(x)
− p)n−x I{0,1,2,...}
(x)
p(1 − p)xI{Z+}
n+x−1 α
p (1
x
(x)
− p)xI{Z+}
e−λ λx (x)
x! I{Z+ }
Ροπογεννήτρια
(mX (t))
Μέση Τιμή Διασπορά
(E(X)) (V ar(X))
p
p(1 − p)
(1 − p) + pet
np
np(1 − p)
((1 − p) + pet )
1−p
p
1−p
p2
α(1−p)
p
α(1−p)
p2
λ
λ
n
p
1−(1−p)et , για t
1−p α
t
1−pe
< − log(1 − p)
για t < − log p
exp [λ(et − 1)]
Πίνακας Β.2: Συνεχείς κατανομές
Κατανομή
Συμβολισμός
(X ∼ (·))
Συνάρτηση
Πυκνότητας
Πιθανότητας
(fX (x))
Μέση Τιμή
(E(X))
Διασπορά
(V ar(X))
Εκθετική
Exp(λ), n ∈ N, p ∈ (0, 1)
1 − λx (x)
I[0,+∞)
λe
λ
λ2
(1 − tλ)−1, για t <
1
λ
Γάμμα
Gamma(α, β), α, β ∈ (0, +∞)
xα−1 e β (x)
β α Γ(α) I(0,+∞)
αβ
αβ 2
(1 − tβ)−α , για t <
1
β
Κανονική
N (µ, σ ) , µ ∈ R, σ > 0
IR
µ
σ2
eµt+σ
Χι-τετράγωνο
Xn2, n ∈ N
x 2 −1 e− 2 (x)
I
n
2 2 Γ( n2 ) (0,+∞)
n
2n
Student’s t
2
2
tn, n ∈ N
−x
(x−µ)2
√ 1 e− 2σ2
2πσ 2
n
Γ( n+1 ) √ 2 n
1
nπΓ( 2 )
(x)
x
+
x2
n
− n+1
2
(x)
IR
Fn,m, n, m ∈ N
n 2 2 −1
Γ( n+m
2 )( m ) x
n
Γ( n2 )Γ( m
2 )(1+ m x)
n+m
2
(x)
I(0,+∞)
2 t2
2
exp [λ(et − 1)]
0
n
n−2 , για n
m
m−2
2m2 (n+m−2)
, για m
n(m−2)2 (m−4)
n n
F
Ροπογεννήτρια
(mX (t))
>1
−
>4
−
354
ΠΙΝΑΚΕΣ ΠΟΣΟΣΤΙΑΙΩΝ ΣΗΜΕΙΩΝ
Z
Φ (zα ) = P (Z ≤ zα ) = 1 − α
0
za
+∞
Πίνακας Β.3: Αθροιστική συνάρτηση τυπικής κανονικής κατανομής
z
0
0.1
0.2
0.3
0.4
0.5
0.6
0.7
0.8
0.9
1
1.1
1.2
1.3
1.4
1.5
1.6
1.7
1.8
1.9
2
2.1
2.2
2.3
2.4
2.5
2.6
2.7
2.8
2.9
3
3.1
3.2
3.3
3.4
3.5
3.6
3.7
3.8
3.9
0
0.5000
0.5398
0.5793
0.6179
0.6554
0.6915
0.7257
0.7580
0.7881
0.8159
0.8413
0.8643
0.8849
0.9032
0.9192
0.9332
0.9452
0.9554
0.9641
0.9713
0.9772
0.9821
0.9861
0.9893
0.9918
0.9938
0.9953
0.9965
0.9974
0.9981
0.9987
0.9990
0.9993
0.9995
0.9997
0.9998
0.9998
0.9999
0.9999
1.0000
0.01
0.5040
0.5438
0.5832
0.6217
0.6591
0.6950
0.7291
0.7611
0.7910
0.8186
0.8438
0.8665
0.8869
0.9049
0.9207
0.9345
0.9463
0.9564
0.9649
0.9719
0.9778
0.9826
0.9864
0.9896
0.9920
0.9940
0.9955
0.9966
0.9975
0.9982
0.9987
0.9991
0.9993
0.9995
0.9997
0.9998
0.9998
0.9999
0.9999
1.0000
0.02
0.5080
0.5478
0.5871
0.6255
0.6628
0.6985
0.7324
0.7642
0.7939
0.8212
0.8461
0.8686
0.8888
0.9066
0.9222
0.9357
0.9474
0.9573
0.9656
0.9726
0.9783
0.9830
0.9868
0.9898
0.9922
0.9941
0.9956
0.9967
0.9976
0.9982
0.9987
0.9991
0.9994
0.9995
0.9997
0.9998
0.9999
0.9999
0.9999
1.0000
0.03
0.5120
0.5517
0.5910
0.6293
0.6664
0.7019
0.7357
0.7673
0.7967
0.8238
0.8485
0.8708
0.8907
0.9082
0.9236
0.9370
0.9484
0.9582
0.9664
0.9732
0.9788
0.9834
0.9871
0.9901
0.9925
0.9943
0.9957
0.9968
0.9977
0.9983
0.9988
0.9991
0.9994
0.9996
0.9997
0.9998
0.9999
0.9999
0.9999
1.0000
0.04
0.5160
0.5557
0.5948
0.6331
0.6700
0.7054
0.7389
0.7704
0.7995
0.8264
0.8508
0.8729
0.8925
0.9099
0.9251
0.9382
0.9495
0.9591
0.9671
0.9738
0.9793
0.9838
0.9875
0.9904
0.9927
0.9945
0.9959
0.9969
0.9977
0.9984
0.9988
0.9992
0.9994
0.9996
0.9997
0.9998
0.9999
0.9999
0.9999
1.0000
0.05
0.5199
0.5596
0.5987
0.6368
0.6736
0.7088
0.7422
0.7734
0.8023
0.8289
0.8531
0.8749
0.8944
0.9115
0.9265
0.9394
0.9505
0.9599
0.9678
0.9744
0.9798
0.9842
0.9878
0.9906
0.9929
0.9946
0.9960
0.9970
0.9978
0.9984
0.9989
0.9992
0.9994
0.9996
0.9997
0.9998
0.9999
0.9999
0.9999
1.0000
0.06
0.5239
0.5636
0.6026
0.6406
0.6772
0.7123
0.7454
0.7764
0.8051
0.8315
0.8554
0.8770
0.8962
0.9131
0.9279
0.9406
0.9515
0.9608
0.9686
0.9750
0.9803
0.9846
0.9881
0.9909
0.9931
0.9948
0.9961
0.9971
0.9979
0.9985
0.9989
0.9992
0.9994
0.9996
0.9997
0.9998
0.9999
0.9999
0.9999
1.0000
0.07
0.5279
0.5675
0.6064
0.6443
0.6808
0.7157
0.7486
0.7794
0.8078
0.8340
0.8577
0.8790
0.8980
0.9147
0.9292
0.9418
0.9525
0.9616
0.9693
0.9756
0.9808
0.9850
0.9884
0.9911
0.9932
0.9949
0.9962
0.9972
0.9979
0.9985
0.9989
0.9992
0.9995
0.9996
0.9997
0.9998
0.9999
0.9999
0.9999
1.0000
0.08
0.5319
0.5714
0.6103
0.6480
0.6844
0.7190
0.7517
0.7823
0.8106
0.8365
0.8599
0.8810
0.8997
0.9162
0.9306
0.9429
0.9535
0.9625
0.9699
0.9761
0.9812
0.9854
0.9887
0.9913
0.9934
0.9951
0.9963
0.9973
0.9980
0.9986
0.9990
0.9993
0.9995
0.9996
0.9997
0.9998
0.9999
0.9999
0.9999
1.0000
0.09
0.5359
0.5753
0.6141
0.6517
0.6879
0.7224
0.7549
0.7852
0.8133
0.8389
0.8621
0.8830
0.9015
0.9177
0.9319
0.9441
0.9545
0.9633
0.9706
0.9767
0.9817
0.9857
0.9890
0.9916
0.9936
0.9952
0.9964
0.9974
0.9981
0.9986
0.9990
0.9993
0.9995
0.9997
0.9998
0.9998
0.9999
0.9999
0.9999
1.0000
ΓΡΑΜΜΙΚΑ ΜΟΝΤΕΛΑ ΚΑΙ ΣΧΕΔΙΑΣΜΟΣ & ΑΝΑΛΥΣΗ ΠΕΙΡΑΜΑΤΩΝ ΜΕ ΕΦΑΡΜΟΓΕΣ ΣΕ R ΚΑΙ MINITAB
tn
P (T > tn;α ) = α
0
tn;a
+∞
Πίνακας Β.4: Ποσοστιαία σημεία tn;α
α
n
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
0.1
0.05
0.025
0.01
0.005
3.0777
1.8856
1.6377
1.5332
1.4759
1.4398
1.4149
1.3968
1.3830
1.3722
1.3634
1.3562
1.3502
1.3450
1.3406
1.3368
1.3334
1.3304
1.3277
1.3253
1.3232
1.3212
1.3195
1.3178
1.3163
1.3150
1.3137
1.3125
1.3114
1.3104
6.3138
2.9200
2.3534
2.1318
2.0150
1.9432
1.8946
1.8595
1.8331
1.8125
1.7959
1.7823
1.7709
1.7613
1.7531
1.7459
1.7396
1.7341
1.7291
1.7247
1.7207
1.7171
1.7139
1.7109
1.7081
1.7056
1.7033
1.7011
1.6991
1.6973
12.7062
4.3027
3.1824
2.7764
2.5706
2.4469
2.3646
2.3060
2.2622
2.2281
2.2010
2.1788
2.1604
2.1448
2.1314
2.1199
2.1098
2.1009
2.0930
2.0860
2.0796
2.0739
2.0687
2.0639
2.0595
2.0555
2.0518
2.0484
2.0452
2.0423
31.8205
6.9646
4.5407
3.7469
3.3649
3.1427
2.9980
2.8965
2.8214
2.7638
2.7181
2.6810
2.6503
2.6245
2.6025
2.5835
2.5669
2.5524
2.5395
2.5280
2.5176
2.5083
2.4999
2.4922
2.4851
2.4786
2.4727
2.4671
2.4620
2.4573
63.6567
9.9248
5.8409
4.6041
4.0321
3.7074
3.4995
3.3554
3.2498
3.1693
3.1058
3.0545
3.0123
2.9768
2.9467
2.9208
2.8982
2.8784
2.8609
2.8453
2.8314
2.8188
2.8073
2.7969
2.7874
2.7787
2.7707
2.7633
2.7564
2.7500
40
60
80
100
1.3031
1.2958
1.2922
1.2901
1.6839
1.6706
1.6641
1.6602
2.0211
2.0003
1.9901
1.9840
2.4233
2.3901
2.3739
2.3642
2.7045
2.6603
2.6387
2.6259
200
500
1.2858
1.2832
1.6525
1.6479
1.9719
1.9647
2.3451
2.3338
2.6006
2.5857
+∞
1.2816
1.6449
1.9600
2.3263
2.5758
355
356
ΠΙΝΑΚΕΣ ΠΟΣΟΣΤΙΑΙΩΝ ΣΗΜΕΙΩΝ
Xn2
P X 2 > x2n;α = α
0
+∞
x2n;α
2
Πίνακας Β.5: Ποσοστιαία σημεία Xn;α
α
n
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
0.995
0.99
0.975
0.95
0.9
0.1
0.05
0.025
0.01
0.005
7.8794
10.5966
12.8382
14.8603
16.7496
18.5476
20.2777
21.9550
23.5894
25.1882
26.7568
28.2995
29.8195
31.3193
32.8013
34.2672
35.7185
37.1565
38.5823
39.9968
41.4011
42.7957
44.1813
45.5585
46.9279
48.2899
49.6449
50.9934
52.3356
53.6720
55.0027
56.3281
57.6484
58.9639
60.2748
61.5812
62.8833
64.1814
65.4756
66.7660
6.6349
9.2103
11.3449
13.2767
15.0863
16.8119
18.4753
20.0902
21.6660
23.2093
24.7250
26.2170
27.6882
29.1412
30.5779
31.9999
33.4087
34.8053
36.1909
37.5662
38.9322
40.2894
41.6384
42.9798
44.3141
45.6417
46.9629
48.2782
49.5879
50.8922
52.1914
53.4858
54.7755
56.0609
57.3421
58.6192
59.8925
61.1621
62.4281
63.6907
5.0239
7.3778
9.3484
11.1433
12.8325
14.4494
16.0128
17.5345
19.0228
20.4832
21.9200
23.3367
24.7356
26.1189
27.4884
28.8454
30.1910
31.5264
32.8523
34.1696
35.4789
36.7807
38.0756
39.3641
40.6465
41.9232
43.1945
44.4608
45.7223
46.9792
48.2319
49.4804
50.7251
51.9660
53.2033
54.4373
55.6680
56.8955
58.1201
59.3417
3.8415
5.9915
7.8147
9.4877
11.0705
12.5916
14.0671
15.5073
16.9190
18.3070
19.6751
21.0261
22.3620
23.6848
24.9958
26.2962
27.5871
28.8693
30.1435
31.4104
32.6706
33.9244
35.1725
36.4150
37.6525
38.8851
40.1133
41.3371
42.5570
43.7730
44.9853
46.1943
47.3999
48.6024
49.8018
50.9985
52.1923
53.3835
54.5722
55.7585
2.7055
4.6052
6.2514
7.7794
9.2364
10.6446
12.0170
13.3616
14.6837
15.9872
17.2750
18.5493
19.8119
21.0641
22.3071
23.5418
24.7690
25.9894
27.2036
28.4120
29.6151
30.8133
32.0069
33.1962
34.3816
35.5632
36.7412
37.9159
39.0875
40.2560
41.4217
42.5847
43.7452
44.9032
46.0588
47.2122
48.3634
49.5126
50.6598
51.8051
0.0158
0.2107
0.5844
1.0636
1.6103
2.2041
2.8331
3.4895
4.1682
4.8652
5.5778
6.3038
7.0415
7.7895
8.5468
9.3122
10.0852
10.8649
11.6509
12.4426
13.2396
14.0415
14.8480
15.6587
16.4734
17.2919
18.1139
18.9392
19.7677
20.5992
21.4336
22.2706
23.1102
23.9523
24.7967
25.6433
26.4921
27.3430
28.1958
29.0505
0.0039
0.1026
0.3518
0.7107
1.1455
1.6354
2.1673
2.7326
3.3251
3.9403
4.5748
5.2260
5.8919
6.5706
7.2609
7.9616
8.6718
9.3905
10.1170
10.8508
11.5913
12.3380
13.0905
13.8484
14.6114
15.3792
16.1514
16.9279
17.7084
18.4927
19.2806
20.0719
20.8665
21.6643
22.4650
23.2686
24.0749
24.8839
25.6954
26.5093
0.0010
0.0506
0.2158
0.4844
0.8312
1.2373
1.6899
2.1797
2.7004
3.2470
3.8157
4.4038
5.0088
5.6287
6.2621
6.9077
7.5642
8.2307
8.9065
9.5908
10.2829
10.9823
11.6886
12.4012
13.1197
13.8439
14.5734
15.3079
16.0471
16.7908
17.5387
18.2908
19.0467
19.8063
20.5694
21.3359
22.1056
22.8785
23.6543
24.4330
0.0002
0.0201
0.1148
0.2971
0.5543
0.8721
1.2390
1.6465
2.0879
2.5582
3.0535
3.5706
4.1069
4.6604
5.2293
5.8122
6.4078
7.0149
7.6327
8.2604
8.8972
9.5425
10.1957
10.8564
11.5240
12.1981
12.8785
13.5647
14.2565
14.9535
15.6555
16.3622
17.0735
17.7891
18.5089
19.2327
19.9602
20.6914
21.4262
22.1643
0.0000
0.0100
0.0717
0.2070
0.4117
0.6757
0.9893
1.3444
1.7349
2.1559
2.6032
3.0738
3.5650
4.0747
4.6009
5.1422
5.6972
6.2648
6.8440
7.4338
8.0337
8.6427
9.2604
9.8862
10.5197
11.1602
11.8076
12.4613
13.1211
13.7867
14.4578
15.1340
15.8153
16.5013
17.1918
17.8867
18.5858
19.2889
19.9959
20.7065
Fn,m
P (F > Fn,m;0.1 ) = 0.1
+∞
Fn,m;0.1
0
1
2
3
4
5
6
7
8
9
10
12
15
20
24
30
40
60
120
+∞
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
39.8635
49.5000
53.5932
55.8330
57.2401
58.2044
58.9060
59.4390
59.8576
60.1950
60.4727
60.7052
60.9028
61.0727
61.2203
61.3499
61.4644
61.5664
61.6579
61.7403
8.5263
9.0000
9.1618
9.2434
9.2926
9.3255
9.3491
9.3668
9.3805
9.3916
9.4006
9.4081
9.4145
9.4200
9.4247
9.4289
9.4325
9.4358
9.4387
9.4413
5.5383
5.4624
5.3908
5.3426
5.3092
5.2847
5.2662
5.2517
5.2400
5.2304
5.2224
5.2156
5.2098
5.2047
5.2003
5.1964
5.1929
5.1898
5.1870
5.1845
4.5448
4.3246
4.1909
4.1072
4.0506
4.0097
3.9790
3.9549
3.9357
3.9199
3.9067
3.8955
3.8859
3.8776
3.8704
3.8639
3.8582
3.8531
3.8485
3.8443
4.0604
3.7797
3.6195
3.5202
3.4530
3.4045
3.3679
3.3393
3.3163
3.2974
3.2816
3.2682
3.2567
3.2468
3.2380
3.2303
3.2234
3.2172
3.2117
3.2067
3.7759
3.4633
3.2888
3.1808
3.1075
3.0546
3.0145
2.9830
2.9577
2.9369
2.9195
2.9047
2.8920
2.8809
2.8712
2.8626
2.8550
2.8481
2.8419
2.8363
3.5894
3.2574
3.0741
2.9605
2.8833
2.8274
2.7849
2.7516
2.7247
2.7025
2.6839
2.6681
2.6545
2.6426
2.6322
2.6230
2.6148
2.6074
2.6008
2.5947
3.4579
3.1131
2.9238
2.8064
2.7264
2.6683
2.6241
2.5893
2.5612
2.5380
2.5186
2.5020
2.4876
2.4752
2.4642
2.4545
2.4458
2.4380
2.4310
2.4246
3.3603
3.0065
2.8129
2.6927
2.6106
2.5509
2.5053
2.4694
2.4403
2.4163
2.3961
2.3789
2.3640
2.3510
2.3396
2.3295
2.3205
2.3123
2.3050
2.2983
3.2850
2.9245
2.7277
2.6053
2.5216
2.4606
2.4140
2.3772
2.3473
2.3226
2.3018
2.2841
2.2687
2.2553
2.2435
2.2330
2.2237
2.2153
2.2077
2.2007
3.1765
2.8068
2.6055
2.4801
2.3940
2.3310
2.2828
2.2446
2.2135
2.1878
2.1660
2.1474
2.1313
2.1173
2.1049
2.0938
2.0839
2.0750
2.0670
2.0597
3.0732
2.6952
2.4898
2.3614
2.2730
2.2081
2.1582
2.1185
2.0862
2.0593
2.0366
2.0171
2.0001
1.9853
1.9722
1.9605
1.9501
1.9407
1.9321
1.9243
2.9747
2.5893
2.3801
2.2489
2.1582
2.0913
2.0397
1.9985
1.9649
1.9367
1.9129
1.8924
1.8745
1.8588
1.8449
1.8325
1.8214
1.8113
1.8022
1.7938
2.9271
2.5383
2.3274
2.1949
2.1030
2.0351
1.9826
1.9407
1.9063
1.8775
1.8530
1.8319
1.8136
1.7974
1.7831
1.7703
1.7587
1.7483
1.7388
1.7302
2.8807
2.4887
2.2761
2.1422
2.0492
1.9803
1.9269
1.8841
1.8490
1.8195
1.7944
1.7727
1.7538
1.7371
1.7223
1.7090
1.6970
1.6862
1.6763
1.6673
2.8354
2.4404
2.2261
2.0909
1.9968
1.9269
1.8725
1.8289
1.7929
1.7627
1.7369
1.7146
1.6950
1.6778
1.6624
1.6486
1.6362
1.6249
1.6146
1.6052
2.7911
2.3933
2.1774
2.0410
1.9457
1.8747
1.8194
1.7748
1.7380
1.7070
1.6805
1.6574
1.6372
1.6193
1.6034
1.5890
1.5760
1.5642
1.5534
1.5435
2.7478
2.3473
2.1300
1.9923
1.8959
1.8238
1.7675
1.7220
1.6842
1.6524
1.6250
1.6012
1.5803
1.5617
1.5450
1.5300
1.5164
1.5039
1.4926
1.4821
2.7055
2.3026
2.0838
1.9449
1.8473
1.7741
1.7167
1.6702
1.6315
1.5987
1.5705
1.5458
1.5240
1.5046
1.4871
1.4714
1.4570
1.4439
1.4318
1.4206
40
60
120
62.5291
62.7943
63.0606
9.4662
9.4746
9.4829
5.1597
5.1512
5.1425
3.8036
3.7896
3.7753
3.1573
3.1402
3.1228
2.7812
2.7620
2.7423
2.5351
2.5142
2.4928
2.3614
2.3391
2.3162
2.2320
2.2085
2.1843
2.1317
2.1072
2.0818
1.9861
1.9597
1.9323
1.8454
1.8168
1.7867
1.7083
1.6768
1.6433
1.6407
1.6073
1.5715
1.5732
1.5376
1.4989
1.5056
1.4672
1.4248
1.4373
1.3952
1.3476
1.3676
1.3203
1.2646
1.2951
1.2400
1.1686
ΓΡΑΜΜΙΚΑ ΜΟΝΤΕΛΑ ΚΑΙ ΣΧΕΔΙΑΣΜΟΣ & ΑΝΑΛΥΣΗ ΠΕΙΡΑΜΑΤΩΝ ΜΕ ΕΦΑΡΜΟΓΕΣ ΣΕ R ΚΑΙ MINITAB
+∞
63.3281
9.4912
5.1337
3.7607
3.1050
2.7222
2.4708
2.2926
2.1592
2.0554
1.9036
1.7551
1.6074
1.5327
1.4564
1.3769
1.2915
1.1926
1.0000
357
Πίνακας Β.6: Ποσοστιαία σημεία Fn,m;0.1
m
n
358
Fn,m
ΠΙΝΑΚΕΣ ΠΟΣΟΣΤΙΑΙΩΝ ΣΗΜΕΙΩΝ
P (F > Fn,m;0.05 ) = 0.05
+∞
Fn,m;0.05
0
Πίνακας Β.7: Ποσοστιαία σημεία Fn,m;0.05
m
1
2
3
4
5
6
7
8
9
10
12
15
20
24
30
40
60
120
+∞
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
161.4476
199.5000
215.7073
224.5832
230.1619
233.9860
236.7684
238.8827
240.5433
241.8817
242.9835
243.9060
244.6898
245.3640
245.9499
246.4639
246.9184
247.3232
247.6861
248.0131
18.5128
19.0000
19.1643
19.2468
19.2964
19.3295
19.3532
19.3710
19.3848
19.3959
19.4050
19.4125
19.4189
19.4244
19.4291
19.4333
19.4370
19.4402
19.4431
19.4458
10.1280
9.5521
9.2766
9.1172
9.0135
8.9406
8.8867
8.8452
8.8123
8.7855
8.7633
8.7446
8.7287
8.7149
8.7029
8.6923
8.6829
8.6745
8.6670
8.6602
7.7086
6.9443
6.5914
6.3882
6.2561
6.1631
6.0942
6.0410
5.9988
5.9644
5.9358
5.9117
5.8911
5.8733
5.8578
5.8441
5.8320
5.8211
5.8114
5.8025
6.6079
5.7861
5.4095
5.1922
5.0503
4.9503
4.8759
4.8183
4.7725
4.7351
4.7040
4.6777
4.6552
4.6358
4.6188
4.6038
4.5904
4.5785
4.5678
4.5581
5.9874
5.1433
4.7571
4.5337
4.3874
4.2839
4.2067
4.1468
4.0990
4.0600
4.0274
3.9999
3.9764
3.9559
3.9381
3.9223
3.9083
3.8957
3.8844
3.8742
5.5914
4.7374
4.3468
4.1203
3.9715
3.8660
3.7870
3.7257
3.6767
3.6365
3.6030
3.5747
3.5503
3.5292
3.5107
3.4944
3.4799
3.4669
3.4551
3.4445
5.3177
4.4590
4.0662
3.8379
3.6875
3.5806
3.5005
3.4381
3.3881
3.3472
3.3130
3.2839
3.2590
3.2374
3.2184
3.2016
3.1867
3.1733
3.1613
3.1503
5.1174
4.2565
3.8625
3.6331
3.4817
3.3738
3.2927
3.2296
3.1789
3.1373
3.1025
3.0729
3.0475
3.0255
3.0061
2.9890
2.9737
2.9600
2.9477
2.9365
4.9646
4.1028
3.7083
3.4780
3.3258
3.2172
3.1355
3.0717
3.0204
2.9782
2.9430
2.9130
2.8872
2.8647
2.8450
2.8276
2.8120
2.7980
2.7854
2.7740
4.7472
3.8853
3.4903
3.2592
3.1059
2.9961
2.9134
2.8486
2.7964
2.7534
2.7173
2.6866
2.6602
2.6371
2.6169
2.5989
2.5828
2.5684
2.5554
2.5436
4.5431
3.6823
3.2874
3.0556
2.9013
2.7905
2.7066
2.6408
2.5876
2.5437
2.5068
2.4753
2.4481
2.4244
2.4034
2.3849
2.3683
2.3533
2.3398
2.3275
4.3512
3.4928
3.0984
2.8661
2.7109
2.5990
2.5140
2.4471
2.3928
2.3479
2.3100
2.2776
2.2495
2.2250
2.2033
2.1840
2.1667
2.1511
2.1370
2.1242
4.2597
3.4028
3.0088
2.7763
2.6207
2.5082
2.4226
2.3551
2.3002
2.2547
2.2163
2.1834
2.1548
2.1298
2.1077
2.0880
2.0703
2.0543
2.0399
2.0267
4.1709
3.3158
2.9223
2.6896
2.5336
2.4205
2.3343
2.2662
2.2107
2.1646
2.1256
2.0921
2.0630
2.0374
2.0148
1.9946
1.9765
1.9601
1.9452
1.9317
4.0847
3.2317
2.8387
2.6060
2.4495
2.3359
2.2490
2.1802
2.1240
2.0772
2.0376
2.0035
1.9738
1.9476
1.9245
1.9037
1.8851
1.8682
1.8529
1.8389
4.0012
3.1504
2.7581
2.5252
2.3683
2.2541
2.1665
2.0970
2.0401
1.9926
1.9522
1.9174
1.8870
1.8602
1.8364
1.8151
1.7959
1.7784
1.7625
1.7480
3.9201
3.0718
2.6802
2.4472
2.2899
2.1750
2.0868
2.0164
1.9588
1.9105
1.8693
1.8337
1.8026
1.7750
1.7505
1.7285
1.7085
1.6904
1.6739
1.6587
3.8415
2.9957
2.6049
2.3719
2.2141
2.0986
2.0096
1.9384
1.8799
1.8307
1.7886
1.7522
1.7202
1.6918
1.6664
1.6435
1.6228
1.6038
1.5865
1.5705
40
60
120
251.1432
252.1957
253.2529
19.4707
19.4791
19.4874
8.5944
8.5720
8.5494
5.7170
5.6877
5.6581
4.4638
4.4314
4.3985
3.7743
3.7398
3.7047
3.3404
3.3043
3.2674
3.0428
3.0053
2.9669
2.8259
2.7872
2.7475
2.6609
2.6211
2.5801
2.4259
2.3842
2.3410
2.2043
2.1601
2.1141
1.9938
1.9464
1.8963
1.8920
1.8424
1.7896
1.7918
1.7396
1.6835
1.6928
1.6373
1.5766
1.5943
1.5343
1.4673
1.4952
1.4290
1.3519
1.3940
1.3180
1.2214
+∞
254.3144
19.4957
8.5264
5.6281
4.3650
3.6689
3.2298
2.9276
2.7067
2.5379
2.2962
2.0658
1.8432
1.7330
1.6223
1.5089
1.3893
1.2539
1.0000
n
Fn,m
P (F > Fn,m;0.025 ) = 0.025
+∞
Fn,m;0.025
0
m
2
3
4
5
6
7
8
9
10
12
15
20
24
30
40
60
120
+∞
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
647.7890
799.5000
864.1630
899.5833
921.8479
937.1111
948.2169
956.6562
963.2846
968.6274
973.0252
976.7079
979.8368
982.5278
984.8668
986.9187
988.7331
990.3490
991.7973
993.1028
38.5063
39.0000
39.1655
39.2484
39.2982
39.3315
39.3552
39.3730
39.3869
39.3980
39.4071
39.4146
39.4210
39.4265
39.4313
39.4354
39.4391
39.4424
39.4453
39.4479
17.4434
16.0441
15.4392
15.1010
14.8848
14.7347
14.6244
14.5399
14.4731
14.4189
14.3742
14.3366
14.3045
14.2768
14.2527
14.2315
14.2127
14.1960
14.1810
14.1674
12.2179
10.6491
9.9792
9.6045
9.3645
9.1973
9.0741
8.9796
8.9047
8.8439
8.7935
8.7512
8.7150
8.6838
8.6565
8.6326
8.6113
8.5924
8.5753
8.5599
10.0070
8.4336
7.7636
7.3879
7.1464
6.9777
6.8531
6.7572
6.6811
6.6192
6.5678
6.5245
6.4876
6.4556
6.4277
6.4032
6.3814
6.3619
6.3444
6.3286
8.8131
7.2599
6.5988
6.2272
5.9876
5.8198
5.6955
5.5996
5.5234
5.4613
5.4098
5.3662
5.3290
5.2968
5.2687
5.2439
5.2218
5.2021
5.1844
5.1684
8.0727
6.5415
5.8898
5.5226
5.2852
5.1186
4.9949
4.8993
4.8232
4.7611
4.7095
4.6658
4.6285
4.5961
4.5678
4.5428
4.5206
4.5008
4.4829
4.4667
7.5709
6.0595
5.4160
5.0526
4.8173
4.6517
4.5286
4.4333
4.3572
4.2951
4.2434
4.1997
4.1622
4.1297
4.1012
4.0761
4.0538
4.0338
4.0158
3.9995
7.2093
5.7147
5.0781
4.7181
4.4844
4.3197
4.1970
4.1020
4.0260
3.9639
3.9121
3.8682
3.8306
3.7980
3.7694
3.7441
3.7216
3.7015
3.6833
3.6669
6.9367
5.4564
4.8256
4.4683
4.2361
4.0721
3.9498
3.8549
3.7790
3.7168
3.6649
3.6209
3.5832
3.5504
3.5217
3.4963
3.4737
3.4534
3.4351
3.4185
6.5538
5.0959
4.4742
4.1212
3.8911
3.7283
3.6065
3.5118
3.4358
3.3736
3.3215
3.2773
3.2393
3.2062
3.1772
3.1515
3.1286
3.1081
3.0896
3.0728
6.1995
4.7650
4.1528
3.8043
3.5764
3.4147
3.2934
3.1987
3.1227
3.0602
3.0078
2.9633
2.9249
2.8915
2.8621
2.8360
2.8128
2.7919
2.7730
2.7559
5.8715
4.4613
3.8587
3.5147
3.2891
3.1283
3.0074
2.9128
2.8365
2.7737
2.7209
2.6758
2.6369
2.6030
2.5731
2.5465
2.5228
2.5014
2.4821
2.4645
5.7166
4.3187
3.7211
3.3794
3.1548
2.9946
2.8738
2.7791
2.7027
2.6396
2.5865
2.5411
2.5019
2.4677
2.4374
2.4105
2.3865
2.3648
2.3452
2.3273
5.5675
4.1821
3.5894
3.2499
3.0265
2.8667
2.7460
2.6513
2.5746
2.5112
2.4577
2.4120
2.3724
2.3378
2.3072
2.2799
2.2554
2.2334
2.2134
2.1952
5.4239
4.0510
3.4633
3.1261
2.9037
2.7444
2.6238
2.5289
2.4519
2.3882
2.3343
2.2882
2.2481
2.2130
2.1819
2.1542
2.1293
2.1068
2.0864
2.0677
5.2856
3.9253
3.3425
3.0077
2.7863
2.6274
2.5068
2.4117
2.3344
2.2702
2.2159
2.1692
2.1286
2.0929
2.0613
2.0330
2.0076
1.9846
1.9636
1.9445
5.1523
3.8046
3.2269
2.8943
2.6740
2.5154
2.3948
2.2994
2.2217
2.1570
2.1021
2.0548
2.0136
1.9773
1.9450
1.9161
1.8900
1.8663
1.8447
1.8249
5.0239
3.6889
3.1161
2.7858
2.5665
2.4082
2.2875
2.1918
2.1136
2.0483
1.9927
1.9447
1.9027
1.8656
1.8326
1.8028
1.7759
1.7515
1.7291
1.7085
40
60
120
1005.5981
1009.8001
1014.0202
39.4729
39.4812
39.4896
14.0365
13.9921
13.9473
8.4111
8.3604
8.3092
6.1750
6.1225
6.0693
5.0125
4.9589
4.9044
4.3089
4.2544
4.1989
3.8398
3.7844
3.7279
3.5055
3.4493
3.3918
3.2554
3.1984
3.1399
2.9063
2.8478
2.7874
2.5850
2.5242
2.4611
2.2873
2.2234
2.1562
2.1460
2.0799
2.0099
2.0089
1.9400
1.8664
1.8752
1.8028
1.7242
1.7440
1.6668
1.5810
1.6141
1.5299
1.4327
1.4835
1.3883
1.2684
+∞
1018.2583
39.4979
13.9021
8.2573
6.0153
4.8491
4.1423
3.6702
3.3329
3.0798
2.7249
2.3953
2.0853
1.9353
1.7867
1.6371
1.4821
1.3104
1.0000
359
1
n
ΓΡΑΜΜΙΚΑ ΜΟΝΤΕΛΑ ΚΑΙ ΣΧΕΔΙΑΣΜΟΣ & ΑΝΑΛΥΣΗ ΠΕΙΡΑΜΑΤΩΝ ΜΕ ΕΦΑΡΜΟΓΕΣ ΣΕ R ΚΑΙ MINITAB
Πίνακας Β.8: Ποσοστιαία σημεία Fn,m;0.025
360
Fn,m
ΠΙΝΑΚΕΣ ΠΟΣΟΣΤΙΑΙΩΝ ΣΗΜΕΙΩΝ
P (F > Fn,m;0.01 ) = 0.01
+∞
Fn,m;0.01
0
Πίνακας Β.9: Ποσοστιαία σημεία Fn,m;0.01
m
1
2
3
4
5
6
7
8
9
10
12
15
20
24
30
40
60
120
+∞
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
4052.1807
4999.5000
5403.3520
5624.5833
5763.6496
5858.9861
5928.3557
5981.0703
6022.4732
6055.8467
6083.3168
6106.3207
6125.8647
6142.6740
6157.2846
6170.1012
6181.4348
6191.5287
6200.5756
6208.7302
98.5025
99.0000
99.1662
99.2494
99.2993
99.3326
99.3564
99.3742
99.3881
99.3992
99.4083
99.4159
99.4223
99.4278
99.4325
99.4367
99.4404
99.4436
99.4465
99.4492
34.1162
30.8165
29.4567
28.7099
28.2371
27.9107
27.6717
27.4892
27.3452
27.2287
27.1326
27.0518
26.9831
26.9238
26.8722
26.8269
26.7867
26.7509
26.7188
26.6898
21.1977
18.0000
16.6944
15.9770
15.5219
15.2069
14.9758
14.7989
14.6591
14.5459
14.4523
14.3736
14.3065
14.2486
14.1982
14.1539
14.1146
14.0795
14.0480
14.0196
16.2582
13.2739
12.0600
11.3919
10.9670
10.6723
10.4555
10.2893
10.1578
10.0510
9.9626
9.8883
9.8248
9.7700
9.7222
9.6802
9.6429
9.6096
9.5797
9.5526
13.7450
10.9248
9.7795
9.1483
8.7459
8.4661
8.2600
8.1017
7.9761
7.8741
7.7896
7.7183
7.6575
7.6049
7.5590
7.5186
7.4827
7.4507
7.4219
7.3958
12.2464
9.5466
8.4513
7.8466
7.4604
7.1914
6.9928
6.8400
6.7188
6.6201
6.5382
6.4691
6.4100
6.3590
6.3143
6.2750
6.2401
6.2089
6.1808
6.1554
11.2586
8.6491
7.5910
7.0061
6.6318
6.3707
6.1776
6.0289
5.9106
5.8143
5.7343
5.6667
5.6089
5.5589
5.5151
5.4766
5.4423
5.4116
5.3840
5.3591
10.5614
8.0215
6.9919
6.4221
6.0569
5.8018
5.6129
5.4671
5.3511
5.2565
5.1779
5.1114
5.0545
5.0052
4.9621
4.9240
4.8902
4.8599
4.8327
4.8080
10.0443
7.5594
6.5523
5.9943
5.6363
5.3858
5.2001
5.0567
4.9424
4.8491
4.7715
4.7059
4.6496
4.6008
4.5581
4.5204
4.4869
4.4569
4.4299
4.4054
9.3302
6.9266
5.9525
5.4120
5.0643
4.8206
4.6395
4.4994
4.3875
4.2961
4.2198
4.1553
4.0999
4.0518
4.0096
3.9724
3.9392
3.9095
3.8827
3.8584
8.6831
6.3589
5.4170
4.8932
4.5556
4.3183
4.1415
4.0045
3.8948
3.8049
3.7299
3.6662
3.6115
3.5639
3.5222
3.4852
3.4523
3.4228
3.3961
3.3719
8.0960
5.8489
4.9382
4.4307
4.1027
3.8714
3.6987
3.5644
3.4567
3.3682
3.2941
3.2311
3.1769
3.1296
3.0880
3.0512
3.0183
2.9887
2.9620
2.9377
7.8229
5.6136
4.7181
4.2184
3.8951
3.6667
3.4959
3.3629
3.2560
3.1681
3.0944
3.0316
2.9775
2.9303
2.8887
2.8519
2.8189
2.7892
2.7624
2.7380
7.5625
5.3903
4.5097
4.0179
3.6990
3.4735
3.3045
3.1726
3.0665
2.9791
2.9057
2.8431
2.7890
2.7418
2.7002
2.6632
2.6301
2.6003
2.5732
2.5487
7.3141
5.1785
4.3126
3.8283
3.5138
3.2910
3.1238
2.9930
2.8876
2.8005
2.7274
2.6648
2.6107
2.5634
2.5216
2.4844
2.4511
2.4210
2.3937
2.3689
7.0771
4.9774
4.1259
3.6490
3.3389
3.1187
2.9530
2.8233
2.7185
2.6318
2.5587
2.4961
2.4419
2.3943
2.3523
2.3148
2.2811
2.2507
2.2230
2.1978
6.8509
4.7865
3.9491
3.4795
3.1735
2.9559
2.7918
2.6629
2.5586
2.4721
2.3990
2.3363
2.2818
2.2339
2.1915
2.1536
2.1194
2.0885
2.0604
2.0346
6.6349
4.6052
3.7816
3.3192
3.0173
2.8020
2.6393
2.5113
2.4073
2.3209
2.2477
2.1847
2.1299
2.0815
2.0385
2.0000
1.9652
1.9336
1.9048
1.8783
40
60
120
6286.7821
6313.0301
6339.3913
99.4742
99.4825
99.4908
26.4108
26.3164
26.2211
13.7454
13.6522
13.5581
9.2912
9.2020
9.1118
7.1432
7.0567
6.9690
5.9084
5.8236
5.7373
5.1156
5.0316
4.9461
4.5666
4.4831
4.3978
4.1653
4.0819
3.9965
3.6192
3.5355
3.4494
3.1319
3.0471
2.9595
2.6947
2.6077
2.5168
2.4923
2.4035
2.3100
2.2992
2.2079
2.1108
2.1142
2.0194
1.9172
1.9360
1.8363
1.7263
1.7628
1.6557
1.5330
1.5923
1.4730
1.3246
+∞
6365.8644
99.4992
26.1252
13.4631
9.0204
6.8800
5.6495
4.8588
4.3105
3.9090
3.3608
2.8684
2.4212
2.2107
2.0062
1.8047
1.6006
1.3805
1.0000
n
ΓΡΑΜΜΙΚΑ ΜΟΝΤΕΛΑ ΚΑΙ ΣΧΕΔΙΑΣΜΟΣ & ΑΝΑΛΥΣΗ ΠΕΙΡΑΜΑΤΩΝ ΜΕ ΕΦΑΡΜΟΓΕΣ ΣΕ R ΚΑΙ MINITAB
Πίνακας Β.10: Ποσοστιαία σημεία Kolmogorov-Smirnov Dn (α)
α
n
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
0.1
0.05
0.025
0.01
0.005
0.9000
0.6838
0.5648
0.4927
0.4470
0.4104
0.3815
0.3583
0.3391
0.3226
0.3083
0.2958
0.2847
0.2748
0.2659
0.2578
0.2504
0.2436
0.2373
0.2316
0.2262
0.2212
0.2165
0.2120
0.2079
0.2040
0.2003
0.1968
0.1935
0.1903
0.1873
0.1844
0.1817
0.1791
0.1766
0.1742
0.1719
0.1697
0.1675
0.1655
0.9500
0.7764
0.6360
0.5652
0.5094
0.4680
0.4361
0.4096
0.3875
0.3687
0.3524
0.3382
0.3255
0.3142
0.3040
0.2947
0.2863
0.2785
0.2714
0.2647
0.2586
0.2528
0.2475
0.2424
0.2377
0.2332
0.2290
0.2250
0.2212
0.2176
0.2141
0.2108
0.2077
0.2047
0.2018
0.1991
0.1965
0.1939
0.1915
0.1891
0.9750
0.8419
0.7076
0.6239
0.5633
0.5193
0.4834
0.4543
0.4300
0.4092
0.3912
0.3754
0.3614
0.3489
0.3376
0.3273
0.3180
0.3094
0.3014
0.2941
0.2872
0.2809
0.2749
0.2693
0.2640
0.2591
0.2544
0.2499
0.2457
0.2417
0.2379
0.2342
0.2308
0.2274
0.2242
0.2212
0.2183
0.2154
0.2127
0.2101
0.9900
0.9000
0.7846
0.6889
0.6272
0.5774
0.5384
0.5065
0.4796
0.4566
0.4367
0.4192
0.4036
0.3897
0.3771
0.3657
0.3553
0.3457
0.3369
0.3287
0.3210
0.3139
0.3073
0.3010
0.2952
0.2896
0.2844
0.2794
0.2747
0.2702
0.2660
0.2619
0.2580
0.2543
0.2507
0.2473
0.2440
0.2409
0.2379
0.2349
0.9950
0.9293
0.8290
0.7342
0.6685
0.6166
0.5758
0.5418
0.5133
0.4889
0.4677
0.4490
0.4325
0.4176
0.4042
0.3920
0.3809
0.3706
0.3612
0.3524
0.3443
0.3367
0.3295
0.3229
0.3166
0.3106
0.3050
0.2997
0.2947
0.2899
0.2853
0.2809
0.2768
0.2728
0.2690
0.2653
0.2618
0.2584
0.2552
0.2521
> 40
√
1.07/ n
√
1.22/ n
√
1.36/ n
√
1.52/ n
√
1.63/ n
361
Download