Uploaded by Berna Sirman

0 0 0 R ile temel istatistik ders notlari

advertisement
See discussions, stats, and author profiles for this publication at: https://www.researchgate.net/publication/340084804
R YAZILIMI İLE UYGULAMALI TEMEL İSTATİSTİK DERS NOTLARI
Presentation · January 2019
DOI: 10.13140/RG.2.2.29204.45442
CITATIONS
READS
0
2,648
4 authors, including:
Ecevit Eyduran
Hakan Duman
Igdir Üniversitesi
Igdir Üniversitesi
231 PUBLICATIONS 1,530 CITATIONS
25 PUBLICATIONS 2 CITATIONS
SEE PROFILE
SEE PROFILE
Cem Tırınk
Igdir Üniversitesi
33 PUBLICATIONS 132 CITATIONS
SEE PROFILE
Some of the authors of this publication are also working on these related projects:
Comparison of Bootstrap Aggregating Multivariate Adaptive Regression Splines (Bagging MARS) and Multivariate Adaptive Regression Splines (MARS) in predictive
performance for regression type problems View project
Statistical Applications with R Program (R Programla Dilinde İstatistik Uygulamaları) View project
All content following this page was uploaded by Hakan Duman on 21 March 2020.
The user has requested enhancement of the downloaded file.
R YAZILIMI LE UYGULAMALI TEMEL
STAT ST K DERS NOTLARI
EYDURAN, Ecevit
DUMAN, Hakan†
Serkan ÖZTÜRK§
TIRINK, Cem‡
Kasım 20, 2019
Contents
1 Temel kavramlar
3
2 Sorular
2.1 A ırlı ı 900-925 gr arasında de i en konserve kutularının C vitamini ortalaması
µ = 60gr ve standart sapması ‡ = 4 oldu u bilinmektedir. Buna göre; . . . .
2.2 A a ıdaki X basit seri için ortalama, standart sapma, tepe de eri, varyans,
kareler toplamı, geometrik ortalama, regresyon, korelasyon, ortanca de er ve
varyasyon katsayısını hesaplayınız. . . . . . . . . . . . . . . . . . . . . . . . .
2.3 X kesikli rassal de i kenine ili kin bilgiler a a ıda özetlenmi tir. . . . . . . .
2.4 Bir populasyondaki insanların = 0.6’sının sigara içti i bilinmektedir. Rastgele seçilen 8 ki iden; . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
2.5 3000 ki ilik bir köyde 126 ya ına kadar ya ama olasılı ı p=0.002 oldu una göre;
2.6 Bir hastalı a yakalanan insanların ortalama iyile me oranının 0,30 oldu u
rapor edilmi tir. Söz konusu hastalı a yakalanan insanların iyile me oranını
arttırmak amacıyla geli tirilen yeni bir antibiyotik, hastanedeki 1000 hastaya
uygulanmı , hastaların 3/5’inin iyile ti i görülmü tür. . . . . . . . . . . . . .
2.7 Bir hastalı a yakalanan insanların ortalama iyile me süresinin 80 gün, standart
sapmasının 10 oldu u bildirilmi tir. Bu hastalı a yakalanan insanların iyile me
sürelerini kısaltmak amacıyla geli tirilen yeni bir ilaç, rastgele seçilen 64 hastaya
uygulanmı , ortalama iyile me süresinin 75 gün oldu u kaydedilmi tir. “Yeni
geli tirilen bu ilacın, iyile me süresinde herhangi de i iklik yapıp yapmama
durumunu test ediniz. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
5
5
8
11
12
13
15
16
Prof.Dr. I dır Universitesi letme Fakültesi - Sayısal Yöntemler Anabilim Dalı (ecevit@eyduran@igdir.e
du.tr)
†
Ö r. Gör. I dır Universitesi I dır Meslek Yüksekokulu (hknd1977@gmail.com)
‡
Ar . Gör. I dır Universitesi Ziraat Fakültesi - Biyometri ve Genetik Anabilim Dalı
§
Ziraat Müh.
1
2.8
2.9
2.10
2.11
2.12
2.13
2.14
2.15
2.16
2.17
2.18
2.19
2.20
2.21
2.22
2.23
X rassal de i keninin ortalaması 60, varyansı 64 olmak üzere normal da ılım
göstermektedir. P (60 < X < U ) = 0.400 oldu una göre “U” kaçtır. . . . . .
X poisson da ılmı bir de i ken oldu una göre P (6) = 0.1220, e≠µ = 0.00033 ,
n = 10000 ise olasılı ını hesaplayınız. . . . . . . . . . . . . . . . . . . . . .
A a ıdaki bo lukları doldurunuz. . . . . . . . . . . . . . . . . . . . . . . . .
Bir yerle im merkezinde sigara içme oranının 0.30 oldu u bilinmektedir. Sigara
kullanımı azaltmak amacıyla tedaviye ba vuran 500 hastadan, 356’sının sigarayı
bıraktı ı gözlendi ine göre, “uygulanan tedavi yönteminin sigarayı bırakmada
etkili olmu tur” görü üne katılır mısınız? . . . . . . . . . . . . . . . . . . . .
Bir su fabrikasında üretilen suların 0.5 lt oldu u bilinmektedir. Fabrikanın
standartlara uygun üretim yapıp yapmadı ını denetlemek isteyen bir Gıda
Mühendisi rasgele 16 adet su i esini tartmı ve bunların ortalamalarının 0.46,
standart sapmalarının 0.05 oldu u belirlenmi tir. Fabrikanın standartlara
uygun üretim yaptı ını ileri sürebilir misiniz? . . . . . . . . . . . . . . . . . .
Haftalık bir derginin sayılarında ortalama 5 yazım hatası bulunmaktadır.
Bu derginin gelecek yazısında hiç yazım hatası bulunmaması olasılı ı kaçtır?
( pucu= Poisson Da ılımı) . . . . . . . . . . . . . . . . . . . . . . . . . . . .
Bir su fabrikasında üretilen suların 0.5 lt, varyansın 0.1 oldu u bilinmektedir.
Fabrikanın standartlara uygun üretim yapıp yapmadı ını denetlemek isteyen
bir Gıda Mühendisi rasgele 16 adet su i esini tartmı ve elde edilen sonuçları
a a ıdaki gibi kaydetmi tir. Fabrikanın standartlardan daha dü ük üretim
yaptı ını ileri sürebilir misiniz? . . . . . . . . . . . . . . . . . . . . . . . . .
Antrenman yöntemine göre performans sonuçları a a ıdaki iki yönlü tabloda
özetlenmi tir. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
Bir dersten e itim alan ö rencilerin e itim öncesi ve sonrası ba arı durumları
a a ıdaki iki yönlü tabloda sunulmu tur. . . . . . . . . . . . . . . . . . . . .
X ve Y gibi iki özellik için elde edilen sonuçlar a a ıda özetlenmi tir. Buna
göre korelasyon (rxy ) ve regresyon (byx ) katsayılarını hesaplayınız. . . . . . .
ki sürekli de i kene ili kin Sx = 4.Sy ve rxy = 0.90 gibi bir ili ki vardır. Buna
göre bY X , bX Y ve isabet derecesini hesaplayınız. . . . . . . . . . . . . . . .
Tesadüf parselleri deneme deseninde yürütülen bir çalı mada üç farklı türün
(Ahududu, Bö ürtlen ve Çilek) antioksidan kapasitelerinin kar ıla tırılması
istenmektedir. Varyans analizi tablosunu olu turunuz ( pucu= F testi). . . .
Akkaraman ve Merinos ırklarına ili kin gebelik oranı verileri a a ıda verilmi tir.
Buna göre gebelik oranı bakımından Merinos ırkı koyunların Akkaraman
ırkından üstün oldu u söylenebilir mi? . . . . . . . . . . . . . . . . . . . . .
Akkaraman ve Merinos ırklarına ili kin canlı a ırlık verileri a a ıda verilmi tir.
Buna göre canlı a ırlık bakımından Merinos ırkı koyunların Akkaraman ırkından üstün oldu u söylenebilir mi? . . . . . . . . . . . . . . . . . . . . . . . .
Be tansiyon hastasına yeni bir tansiyon ilacı uygulanmı elde edilen sonuçlar
a a ıda verilmi tir. Buna göre uygulanan yeni ilacın tansiyonu dü ürücü
etkisinin oldu unu söyleyebilir misiniz? . . . . . . . . . . . . . . . . . . . . .
Koyunlarda canlı a ırlık (X) ve gö üs çevresi (Y) arasında rXY = 0.85 korelasyon bulunmu tur. Buna göre, bu korelasyon katsayısının istatistiksel olarak
önemli olup olmadı ını test ediniz (n=42). . . . . . . . . . . . . . . . . . . .
2
17
18
18
19
20
22
23
24
25
26
28
29
31
32
35
36
2.24 Dört birey için X ve Y gibi iki özellik arasında Y = 3.12 + 1.2X gibi ili kinin
oldu u belirlenmi tir. HKO = 0.860 ve X özelli ine ait standart sapmanın
S = 2.99 oldu u bilindi ine göre bY X = 1.2 katsayısının istatistiksel olarak
önemli olup olmadı ını test ediniz. . . . . . . . . . . . . . . . . . . . . . . . .
1
37
Temel kavramlar
Populasyon (Population) : Teorik olarak sınırsız sayıda bireyden olu an toplulu a denir
Örnek (Sample) : Populasyondan belirli tekniklerle çekilen sınırlı sayıda bireyden olu an
toplulu a denir
Sürekli De i ken (Quantitative=Continous=Measurable variable) : Tanımlı oldu u
bir sayı do rusunda hemen hemen her noktada ya da sonsuz sayıda de er alabilen de i kenlerdir. Bu de i kenler ölçülebilen ve tartılabilen de i kenlerdir. Örn: boy, kilo, süt verimi
vb.
Kesikli De i ken (Qualitative=Discontinous=Discrete=Grouped variable) :
Tanımlı oldu u bir sayı do rusunda sadece tam sayı noktalarında sınırlı sayıda de er alabilen
de i kenlerdir. Örn: Cinsiyet (erkek ve kız), Kan grubu (A, B, AB, ve O) vb.
Ortanca De er (Median): Veri setini küçükten büyü e sıradıktan sonra veri setini iki e it
parçaya bölen en ortadaki de erdir.
Parametre (Parameter): Populasyondan hesaplanan µ, ‡, gibi karakteristik de erlere
denir. Parametre de erleri Yunan (Grek) alfabeleri ile gösterilir.
Korelasyon (Pearson Correlation Coefficient) : ki sürekli de i ken arasındaki do rusal
ili kinin yönü ve derecesi hakkında bilgi veren katsayıdır. Korelasyon katsayısı -1 ile +1
arasında de er almaktadır.
Regresyon (Regression Coefficient=Slope) : Ba ımsız de i kenin kendi biriminden 1
br artmasına kar ılık, ba ımlı de i kende meydana gelen ortalama de i im konusunda bilgi
veren katsayıya denir. Bu katsayının tanım aralı ı (≠Œ, +Œ) olarak belirlenmi tir.
Kalitatif Özellik (Qualitative=Discontinous=Discrete=Grouped Characteristic)
: Tanımlı oldu u bir sayı do rusunda sadece tam sayı noktalarında sınırlı sayıda de er alabilen
de i kenlerdir. Örn: Cinsiyet (erkek ve kız), Kan grubu (A, B, AB, ve O), Göz rengi (Siyah,
Kahverengi, Ela ve Ye il) vb.
Kantitatif Özellik (Quantitative=Continous=Measurable Characteristic) :
Tanımlı oldu u bir sayı do rusunda hemen hemen her noktada ya da sonsuz sayıda de er
alabilen de i kenlerdir. Bu de i kenler ölçülebilen ve tartılabilen de i kenlerdir. Örn: boy,
kilo, süt verimi vb.
Sıralı De i ken (Ordinal variable): Sahip oldu u (sınırlı sayıdaki) kategorilerin seviyeleri
arasında önem düzeyi açısından farklılık yani hiyerar i olan de i kenlerdir. Kategorileri temsil
eden rakam ya da semboller birbirlerine olan üstünlü ü ya da önem derecesini ifade etmektedir.
3
Örn: Likert tipi ölçekler (Hiç, Az, Orta Çok, En çok), E itim düzeyi ( lkokul (1), Ortaokul
(2), Lise (3), Üniversite (4)), Yumurta kalitesi (az, orta, çok) vb.
Hiç
Az
Orta Çok En Çok
1
2
3
4
5
Deneme Hatası (Experimental error): Aynı muameleye maruz bırakılan deney üniteleri
arasındaki (grup içi) farklılı a denir.
Tekerrür (Replicate=Replication): Aynı muameleye maruz bırakılan deney ünitesi adedine denir.
Hipotez (Hypothesis):
iddialara denir.
ncelenen populasyonların parametrelerine ili kin ileri sürülen
Paralel (Parallel): Ölçüm do rulu unu artırmak amacıyla aynı deney ünitesinden alınan
birden fazla ölçüme denir.
Blok (Block): Deneme materyalini olu turan alt gruplara denir. Her alt grubun kendi
içinde homojen oldu u varsayılır. Örn: Hayvanların ya grupları (2, 3, 4 ve 5), a açların ya
grupları (genç, orta ve ya lı), bir tarla denemesinde kullanılan farklı yapıdaki araziler (Killi,
Tınlı ve Killi-Tınlı) birer blok olarak dü ünülebilir.
statistik (Statistics): Bir özellik bakımından bir örnekte bulunan bireylerin sahip oldu u
ölçüm de erlerinden hesaplanan de ere denir. Örnekten hesaplanan de erlerin hepsi birer
istatistik olup, örnekten örne e farklılık göstermektedir. Bir istatistik, popülasyonun bir
nokta tahminidir.
simsel De i ken (Nominal variable): Sahip oldu u (sınırlı sayıdaki) kategorilerin seviyeleri arasında önem düzeyi açısından farklılık olmayan de i kenlerdir. Örn: Cinsiyet
(Erkek, Kız), Kan grubu (A, B, AB, O) vb.
Faktör (Factor): Üzerinde durulan ba ımlı de i keni etkileyebilen ve en az iki seviyesi olan
kesikli de i kene denir.
Kovaryet (Covariate): Üzerinde durulan ba ımlı de i keni etkileyebilen sürekli de i kene
denir. Deneme hatasının azaltılması bakımından kovaryet alınması önerilir.
4
2
Sorular
2.1
2.1.1
A ırlı ı 900-925 gr arasında de i en konserve kutularının C
vitamini ortalaması µ = 60gr ve standart sapması ‡ = 4 oldu u
bilinmektedir. Buna göre;
C vitamininin 70 gr’dan az olma ihtimali nedir?
0.100
y
0.075
A
0.050
B
0.025
0.000
50
55
60
65
70
x
Yukarıdaki normal da ılım e risinden istenilen alanın A+B oldu u görülmektedir. Da ılım
e risinin altında kalan alanın yarısının (B alanı) % 50 oldu u görülmektedir. A alanını
bulabilmek için X=70’e kar ılık gelen z de erinin bulunması gerekir. Unutulmamalıdır ki
S.N.D. tablosu merkez ile herhangi bir nokta arasında kalan e ri alanını vermektedir.
z=
X ≠µ
‡
(1)
Formül (1) yardımıyla z = 70≠60
= 2.5 hesap edilir. z = 2.5 için S.N.D. tablosundaki de er
4
A = 0.4938 yani %49.38 alanını verir.
Cevap: A + B = 0.4939 + 0.50 = 0.99.38 = %99.38
Uzun R çözümü a ıda verilmi tir:
5
x <- 70 # istenilen üst sınır
m <- 60 # ortalama
std <- 4 # standart sapma
z <- (x-m)/std # z skoru = 2.5
z
## [1] 2.5
a <- pnorm(q=z) # z-skoruna göre toplam alan
a
## [1] 0.9937903
# veya kısaca a a ıdaki ekilde tek komutlada hesaplanabilir.
pnorm(q = 70, mean = 60, sd = 4)
## [1] 0.9937903
• pnorm komutu verilen de erlere göre da ılım e risi altında kalan alanı hesaplar. q
argümanına alanı hesaplanması istenilen örneklem de er girilir (70). Populasyonun
ortalaması mean argümanına yazılır (60). Son olarak da populasyonun standart sapması
sd argümanına yazılarak komut çalı tırılır. Bu komuta sadece q de eri girilirse, komut
girilen de eri z skoru olarak algılar ve normal da ılım üzerinden hesaplama yapar.
6
2.1.2
C vitamininin 40 ile 80 gr arasında olma ihtimali nedir?
0.100
y
0.075
A
0.050
B
0.025
0.000
50
60
70
80
x
Formül (1)’dan yaralanılarak z1 =
X≠µ
‡
=
40≠60
4
z1 = ≠5’e kar ılık gelen alan S1 = %50
z2 =
X≠µ
‡
=
80≠60
4
= ≠5 de eri hesaplanır.
=5
z2 = 5’e kar ılık gelen alan S2 = %50
S1 + S2 = %50 + %50 = %100
Aslında z Ø 3.9 ise alan direk %50 alınabilir.
R çözümü
diff(pnorm(q = c(40,80) ,mean = 60,sd=4))
## [1] 0.9999994
• diff() fonksiyonu iki de er arasındaki farkı almaktadır.
• pnorm() fonksiyonu normal da ılım için q argümanında verilen de er veya de erlerin
alanını hesaplamaktadır. mean argümanına ortalama yazılırken, sd argumanına populasyonun standart sapması yazılmalıdır. E er mean ve sd argumanları girilmez ise q
de erine z skorları verilerek hesaplama yapılabilir.
7
2.1.3
C vitamini bakımından en yüksek % 5’lik gruptaki en dü ük içerik kaç
gr’dır?
0.4
0.3
y
C=%5
A=%50
0.2
B=%45
0.1
0.0
1.654
−2
0
2
x
%95’in z-skoru tablodan 1.645 olarak bulunur. Yine Formül (1)’dan yaralanılır.
z = 1.645 =
x≠60
4
x = 60 + (1.645 ◊ 4) = 66.58
R çözümü:
qnorm(p = .95,mean = 60,sd = 4)
## [1] 66.57941
• qnorm komutu p argumanında verilen alana, mean argumanındaki ortalama ve sd
argümanındaki standart sapmaya göre en dü ük noktanın de erini hesaplar.
2.2
A a ıdaki X basit seri için ortalama, standart sapma, tepe
de eri, varyans, kareler toplamı, geometrik ortalama, regresyon, korelasyon, ortanca de er ve varyasyon katsayısını
hesaplayınız.
5
6
7
7
8
8
7
Tepe de eri: 7 (Bir seride en fazla tekrarlanan de er)
Ortalama (X̄):
X̄ =
X̄ =
5+6+7+7+8+7
6
q
Xi
n
(2)
= 6.667
Kareler Toplamı (SS):
SS =
n
ÿ
i=1
(Xi ≠ X̄)2
(3)
SS = (5≠6.667)2 +(6≠6.667)2 +(7≠6.667)2 +(7≠6.667)2 +(8≠6.667)2 +(7≠6.667)2 = 5.3333
Standart Sapma (S):
S=
S=
Ò
5.3333
6≠1
= 1.0328
ı̂ ÿ
ı n
ı
(Xi
ı
Ù i=1
≠ X̄)2
n≠1
=
Û
SS
n≠1
(4)
Varyans(S 2 ):
S2 =
n
ÿ
i=1
(Xi ≠ X̄)2
n≠1
=
SS
n≠1
(5)
S 2 = 1.03282 = 1.0667 Ortanca de er (Median) bir seriyi olu turan gözlem de erleri küçükten
büyü e sıralandı ında veri setini iki e it parçaya bölen de ere denir.
veri
sira
5
1
6
2
7
3
7
4
7
5
8
6
Medyanın bulundu u nokta n+1
ile bulunur. 6+1
= 3.5 de eri 3 ile 4 tam de erleri arasındadır.
2
2
Ortanca de er 3. ve 4. Sıradaki gözlem de erinin ortalamasına e ittir. OD = 7+7
= 7
2
Çalı ılan bir veri setinde çok yüksek ya da dü ük (outlier) gözlemlerin olması durumunda,
zamana ba lı de i kenlerin olması durumunda (tavuklarda cinsi olgunluk ya ı, bebeklerde di
çıkarma ya ı vb.), aritmetik ortalama yerine ortanca de erinin kullanılması önerilir.
Varyans Katsayısı (CV ):
CV =
S
◊ 100
X̄
9
(6)
CV =
1.0328
6.66667
= 15.49
Geometrik Ortalama (GM ):
GM = (
GM =
Ô
6
n
Ÿ
1
)n
(7)
i=1
5 ◊ 6 ◊ 7 ◊ 7 ◊ 8 ◊ 7 = 6.596
Tek seri için regresyon ve korelasyon hesaplanamaz
R çözümü:
a <- c(5,6,7,7,8,7) # veriler için a vektörü olu turuldu
max(a) # tepe noktası
## [1] 8
mean(a) # ortalama
## [1] 6.666667
sum((a-mean(a))ˆ2) #kareler toplamı
## [1] 5.333333
sd(a) #standart sapma
## [1] 1.032796
var(a) #varyans
## [1] 1.066667
median(a) #medyan
## [1] 7
sd(a)/mean(a)*100 #varyans katsayısı
## [1] 15.49193
prod(a)ˆ(1/6) # geometrik ortalama
## [1] 6.595548
######## Toplu hesaplama
DescTools::Desc(a,plotit=FALSE)
## -----------------------------------------------------------------------------## a (numeric)
##
##
length
n
NAs unique
0s
mean meanCI
10
##
##
##
##
##
##
##
##
##
##
##
##
##
##
##
##
##
1
2
3
4
6
6
100.0%
0
0.0%
4
0
0.0%
6.67
5.58
7.75
.05
5.25
.10
5.50
.25
6.25
median
7.00
.75
7.00
.90
7.50
.95
7.75
range
3.00
sd
1.03
vcoef
0.15
mad
0.74
IQR
0.75
skew
-0.37
kurt
-1.37
level
5
6
7
8
freq
1
1
3
1
perc
16.7%
16.7%
50.0%
16.7%
cumfreq
1
2
5
6
cumperc
16.7%
33.3%
83.3%
100.0%
heap(?): remarkable frequency (50.0%) for the mode(s) (= 7)
length: veriseti boyutu, n: veri satısı, NAs: Eksik veri sayısı, unique: farklı de er
sayısı, mean: ortalama, meanCI: Ortalama Güven Aralı ı, .05 - 0.95: Dilim ortalamaları,
median: medyan(ortanca), range: aralık, sd: standart sapma, vcoef: varyans katsaıyısı,
mad: ortalama mutlak sapma, IQR: çeyrekler arası aralık, skew: çarpıklık,kurt: basıklık
2.3
X kesikli rassal de i kenine ili kin bilgiler a a ıda özetlenmi tir.
X
Px
2.3.1
0.0
0.3
1.0
0.2
2.0
0.4
3.0
0.1
Buna göre, bu rassal de i kene ait ortalama, varyans ve standart sapma
de erlerini bulunuz.
Ortalama(µ):
µ=
n
ÿ
(Xi .P (Xi ))
(8)
i=1
µ = (0 ◊ 0.3) + (1 ◊ 0.2) + (2 ◊ 0.4) + (3 ◊ 0.1) = 1.30
Varyans (‡ 2 ):
‡2 =
n
ÿ
i=1
(Xi2 .P (Xi )) ≠ µ2
‡ 2 = (02 ◊ 0.3) + (12 ◊ 0.2) + (22 ◊ 0.4) + (32 ◊ 0.1) ≠ 1.302 = 1.01
11
(9)
Standart sapma (‡):
‡=
ı̂ n
ıÿ
Ù
(X 2 .P (X
i ))
i
i=1
‡=
Ô
≠ µ2 =
Ô
‡2
(10)
1.01 = 1.005
R Çözümü
a <- data.frame(X=0:3,Px=c(.3,.2,.4,.1)) #veriler olu turuldu
m <- sum(a$X * a$Px) # ortalama
m
## [1] 1.3
v <- sum(a$Xˆ2 * a$Px) - mˆ2 # varyans
v
## [1] 1.01
s <- sqrt(v) # standart sapma
s
## [1] 1.004988
2.3.2
P(0), P (X < 3), P(1) de erlerini bulunuz.
P (0) = 0.30
P (X < 3) = 1 ≠ 0.10 = 0.90
P (1) = 0.20
R Çözümü:
subset(a,subset = X==0)$Px # P(0)
## [1] 0.3
sum(subset(a,subset = X<3)$Px) #P(X<3)
## [1] 0.9
subset(a,subset =
X==1)$Px #$P(1)
## [1] 0.2
2.4
Bir populasyondaki insanların = 0.6’sının sigara içti i bilinmektedir. Rastgele seçilen 8 ki iden;
= 0.6 (Sigara içme oranı)
12
1≠
= 0.4 (Sigara içmeme oranı)
n=8
P (x) =
n!
x!(n ≠ x)!
x
(1 ≠ )n≠x
(11)
P (1) + P (2) + P (3) + P (4) + P (5) + P (6) + P (7) + P (8) = 1
µ = n.
: Binom da ılımın ortalaması
‡ 2 = n. .(1 ≠ ) : Binom sa ılımının varyansı
2.4.1
kisinin (x = 2) sigara içme olası ı nedir?
Formul (11) yardımıyla P (x) =
8!
0.62 0.42
2!(8≠2)!
= 0.04123 sonucu bulunur.
R Çözümü:
dbinom(x = 2, size = 8, prob = 0.60)
## [1] 0.04128768
• dbinom komutu verilen de erlere göre seçilme olasılı ını hesaplar. x argümanı istenilen
örneklem sayısı, size populasyon büyüklü ü, prob ise seçim olasılı ı ifade etmektedir.
2.4.2
En fazla ikisinin sigara içme olasılı ı nedir?
8!)
P (x Æ 2) = P (0) + P (1) + P (2) = 0!(8≠0)!
+
0.00786432 + 0.04128768 = 0.04980736
8!)
1!(8≠1)!
+
8!)
2!(8≠2)!
P (x Æ 2) = 0.00065536 +
R Çözümü:
sum(dbinom(x=0:2,size = 8,prob = 0.60))
## [1] 0.04980736
• dbinom komutunda x argümanına birden fazla de er verilebilir. x = 0 : 2 diyerek
0, 1, 2 de erleri için ayrı ayrı hesaplama yapılması istemi olduk. Bu i lemin sonucunda;
0.00065536, 0.00786432, 0.04128768 eklinde üç de eri olan bir vektör elde ederiz.
• sum komutu toplama için kullanılır ve dbinom komutundan dönen vektörün de elerini
toplar.
2.5
3000 ki ilik bir köyde 126 ya ına kadar ya ama olasılı ı
p=0.002 oldu una göre;
Bilindi i üzere 126 ya ına kadar ya ama durumu Nadir olaylardan biridir. Nadir olayların
da ılımı Poisson Da ılımının ortalaması varyansına e ittir.
13
P (X) =
‡ 2 = n.
µX ≠µ
e
X!
(12)
= µ = 0.002 ◊ 3000 = 6
P (0) + P (1) + P (3) + ... + P (2999) + P (3000) = 1
2.5.1
Bir ki inin 126 ya ına kadar ya ama olasılı ı nedir?
Formul (12) den yararlanarak P (X) =
61 ≠6
e
1!
= 0.01487251 de eri hesap edilir.
R çözümü:
dpois(x = 1,lambda = 6)
## [1] 0.01487251
• dpois, possion olası ını hesaplayan komuttur. x argümanına rastlanılan olay sayısı
yazılır. lambda argümanına ortalama yazılır ve olasılık hesaplatılır.
2.5.2
En fazla 4 ki inin 126 ya ına kadar ya ama olasılı ı nedir?
P (X Æ 4) = P (0) + P (1) + P (2) + P (3) + P (4) =
0.2850565
60 ≠6
e
0!
+
61 ≠6
e
1!
+
62 ≠6
e
2!
+
63 ≠6
e
3!
+
64 ≠6
e
4!
=
R Çözümü:
sum(dpois(x=0:4,lambda = 6))
## [1] 0.2850565
• dpois komutunda da dbinom komutunda oldu u gibi x argümanına birden fazla
de er verilebilir. x = 0 : 4 diyerek 0, 1, 2, 3, 4 de erleri için ayrı ayrı hesaplama
yapılması istemi olduk. Bu i lemin sonucunda; 0.002478752, 0.014872513, 0.044617539,
0.089235078, 0.133852618 eklinde be de eri olan bir vektör elde ederiz.
• sum komutu toplama için kullanılır ve dpois komutundan dönen vektörün de elerini
toplar.
2.5.3
En az 5 ki inin 126 ya ına kadar ya ama olasılı ı nedir?
stenilen olasılık;
C = P (X Ø 5) = P (5) + P (6) + P (7) + ... + P (2999) + P (3000) ve P (X < 5) + C = 1
oldu una göre C = 1 ≠ P (X < 5) olarak hesaplanabilir.
C = 1 ≠ P (X > 5) = 1 ≠ P (0) + P (1) + P (2) + P (3) + P (4) = 1 ≠
4
63 ≠6
e + 64! e≠6 = 0.71494355
3!
R Çözümü:
14
60 ≠6
e
0!
+
61 ≠6
e
1!
+
62 ≠6
e
2!
+
1-sum(dpois(x=0:4,lambda = 6)) #1. Yöntem
## [1] 0.7149435
sum(dpois(5:3000,lambda = 6)) #2. Yöntem
## [1] 0.7149435
2.6
Bir hastalı a yakalanan insanların ortalama iyile me oranının
0,30 oldu u rapor edilmi tir. Söz konusu hastalı a yakalanan
insanların iyile me oranını arttırmak amacıyla geli tirilen yeni
bir antibiyotik, hastanedeki 1000 hastaya uygulanmı , hastaların 3/5’inin iyile ti i görülmü tür.
2.6.1
Yeni antibiyoti in, hastalar üzerinde etkili oldu unu söyleyebilir misiniz?
(kritik de er:0.05)
Hipotez takımı:
H0 :
= 0.30
H1 :
> 0.30
p≠
z=Ò
.(1≠ )
n
Kurulan hipotez tek taraflı hipotezdir.
(13)
Formul (13) formülü yardımıyla test z de eri hesaplanır:
Zhesap = Ò 0.6≠0.3
0.3◊(1≠0.3)
1000
= 20.70
R Çözümü:
prop.test(x = 600,n = 1000,p = 0.3,alternative = "greater",correct = FALSE)
##
##
##
##
##
##
##
##
##
##
##
1-sample proportions test without continuity correction
data: 600 out of 1000, null probability 0.3
X-squared = 428.57, df = 1, p-value < 2.2e-16
alternative hypothesis: true p is greater than 0.3
95 percent confidence interval:
0.5742812 1.0000000
sample estimates:
p
0.6
15
• ncelenen 1000 hastanın 3/5’i yani 600’ü kullanılan yeni antibiyoti in etkisiyle iyile mi ,
geri kalan 400’ü iyile memi tir. Bu nedenle, n argümanına incelemeye alınan yani
örne e alınan toplam hasta sayısı (1000) yazılır. x argümanına ise iyile en hastaların
sayısı (600) yazılır. Daha sonra popülasyon iyile me oranı olan
= 0.30 oranı p
argümanına girilir. Alternatif Hipotezimizden (H1 ) dolayı alternative argümanına
“greater” yazılır. E er devam düzeltmesi yapılacaksa correct argümanına TRUE,
yapılmayacaksa FALSE kodlanarak komut çalı tırılır.
• Analiz sonucu elde edilen X 2 = 428.57 de eri z = 20.70193 de erinin karesidir. Teste
ili kin olasılık (p-value) de eri p < 0.05 oldu undan dolayı H0 hipotezi “RED” edilir.
Dolayısıyla, hastalara uygulanan yeni antibiyoti in hastalar üzerinde etkili oldu u yani
iyile me oranını arttırdı ı söylenebilir.
2.7
Bir hastalı a yakalanan insanların ortalama iyile me süresinin
80 gün, standart sapmasının 10 oldu u bildirilmi tir. Bu
hastalı a yakalanan insanların iyile me sürelerini kısaltmak
amacıyla geli tirilen yeni bir ilaç, rastgele seçilen 64 hastaya uygulanmı , ortalama iyile me süresinin 75 gün oldu u
kaydedilmi tir. “Yeni geli tirilen bu ilacın, iyile me süresinde
herhangi de i iklik yapıp yapmama durumunu test ediniz.
Hipotez takımı:
H0 : µ = 80
H1 : µ ”= 80
Kurulan hipotez çift taraflı hipotezdir.
z=
X̄ ≠ µ
Ô‡
n
(14)
Formul (14) yardımıyla z de eri hesaplanır:
Zhesap =
75≠80
Ô10
64
= ≠4
R Çözümü:
z.test = function(x,n,mu,std){
z.score <- (x-mu)/(std/sqrt(n)) # z skoru hesalandı
one.tail.p <- pnorm(abs(z.score),lower.tail = FALSE) # z skoruna göre p de eri hesapl
cat(" z =",z.score,"\n",
"one-tailed probability =", one.tail.p,"\n",
"two-tailed probability =", 2*one.tail.p ) # sonuçlar yazdırıldı
}
z.test(x = 75,n=64,mu = 80,std = 10)
16
##
##
##
z = -4
one-tailed probability = 3.167124e-05
two-tailed probability = 6.334248e-05
## a adaki komut ile daha kolayca hesaplanabilir.
BSDA::zsum.test(mean.x = 75, #örneklem ortalaması
sigma.x = 10, #örneklem standart sapması
n.x = 64, # örneklemdeki gözlem sayısı
alternative = "two.sided", #çift yönlü test
mu =80 ) # populasyon ortalaması
##
##
##
##
##
##
##
##
##
##
##
One-sample z-Test
data: Summarized x
z = -4, p-value = 6.334e-05
alternative hypothesis: true mean is not equal to 80
95 percent confidence interval:
72.55005 77.44995
sample estimates:
mean of x
75
R için yeni bir fonksiyon yapılarak hesaplama yapılmı tır:
• Fonksiyona x(örneklem ortalaması),n(örneklem sayısı),mu(populasyon ortalaması),std(populasyon standart sapması) argümanları girilerek i lem yapılmaktadır.
Hazırlanan fonksiyona çalı ılan örne e ili kin örnek geni li i (n = 64), örneklem
ortalması (X̄ = x = 75), populasyona ait standart sapma de eri (‡ = std = 10),
popülasyona ait ortalama de eri (µ = mu = 80) de erleri girilerek çalı tırılmı tır.
• Teste ait olasılık de eri p < 0.05 oldu u için H0 hipotezi RED edilir. Sonuç olarak,
yeni geli tirilen ilacın iyile me süresi üzerinde de i ikli e neden oldu u söylenebilir.
• BSDA paketindeki zsum.test komutu ile kolayca hesaplanabilir.
2.8
X rassal de i keninin ortalaması 60, varyansı 64 olmak üzere
normal da ılım göstermektedir. P (60 < X < U ) = 0.400
oldu una göre “U” kaçtır.
Populayona ili kin varyans de eri ‡ 2 = 64 ise standart sapma de eri buradan ‡ = 8 bulunur.
Standart normal da ılım tablosundan P (60< X<U)=0.400 alan de erine kar ılık gelen z
de erinin z = +1.28 oldu u görülmektedir. A a ıdaki formülde X yerine U denilirse;
z=
U ≠µ
‡
=
U ≠60
8
= 1.28
U = 60 + (1.28 ◊ 8) = 60 + 10.24 = 70.24
17
R Çözümü:
U <- 60+(1.28*8)
U
## [1] 70.24
• Yukarıda görüldüü üzere R hesap makinesi olarakda kullanılabilmektedir.
2.9
X poisson da ılmı bir de i ken oldu una göre P (6) = 0.1220,
e≠µ = 0.00033 , n = 10000 ise olasılı ını hesaplayınız.
Fornul (12) yardımıyla olasılık de eri hesaplanır:
P (X) =
µX ≠µ
e
X!
µ = n. ;
=
= P (6) =
8.02
10000
µ6
6!
◊ 0.00033 = 0.1220
= 0.000802
mu <- (.1220/0.00033*factorial(6))ˆ(1/6)
mu
## [1] 8.020407
p <- mu / 10000
p
## [1] 0.0008020407
2.10
A a ıdaki bo lukları doldurunuz.
a) statistikte varsayım gerektiren testlere PARAMETR K testler VARSAYIM gerektirmeyen testlere ise NON-PARAMETR K testler adı verilir.
b) statistikte amaç, eldeki verilerin TEOR K da ılımlara uygunlu unu ara tırmaktır.
c) X ve Y gibi iki de i kenin VARYANSLARININ e it olması sonucunda KORELASYON
ve REGRESYON katsayıları e it olur.
d) Ortalaması SIFIR ve varyansı B R olan da ılıma STANDART NORMAL DA ILIM
denir.
e) Tanımlanan bir populasyondan n hacimli olu turulabilecek mümkün bütün örnekler
için hesaplanan ortalamalara (istatistiklere) ait da ılıma ORTALAMALARA A T
ÖRNEKLEME DA ILIMI denir.
f) Bir örne e ait gözlem de erleri için hesaplanan karakteristik de erlere STAT ST K
denir.
g) B NOM ve POISSON da ılımları KES KL da ılıma örnek olu tururken, K -KARE ve
T da ılımları da ılımları ise SÜREKL da ılıma örnek olu turur.
h) DO RU olan bir H0 hipotezinin RED edilme olasılı ı I. T P HATA olarak adlandırılır.
YANLI bir H0 hipotezinin KABUL edilme olasılı ı II. T P HATA olarak adlandırılır.
RED edilmesi gereken bir Ho hipotezinin RED edilme olasılı ına TEST N GÜCÜ denir.
18
i) VARYANSI 100 olan bir serinin tüm gözlem de erleri 3 ile çarpılmı tır. Buna göre yeni
serinin standart sapması 30 e it olur.
j) Ortalaması ve VARYANSI birbirine e it olan da ılıma POISSON da ılımı denir.
k) X, p=0.4 olmak üzere binom da ılmı bir rassal de i ken olsun. X’in varyansı 2.4 ise
ortalaması 4 olarak bulunur. l) Z de eri 3.9 dan BÜYÜK olunca standart normal
da ılımda olasılık de eri %50’e yakla ır.
l) X ortalaması 4, varyansı 16 olan normal da ılım gösteren bir rassal de i ken olsun.
Buna göre P (X<3) olma olasılı ı %40.13 olarak hesaplanır.
m) 22 birey üzerinde yürütülen bir çalı mada, X ve Y sürekli de i kenleri arasında rxy=0.20
pozitif bir korelasyon bulunmu tur. Bu korelasyon katsayısının istatistiksel olarak
önemlili ini test ediniz.
n) REGRESYON ve KORELASYON katsayılarının önem kontrolünde T TEST kullanılır.
o) Standart normal da ılımın µ ± 2‡ aralı ındaki alanın % 95 olarak hesaplanır.
p) ki KATEGOR K de i ken arasındaki ili ki K -KARE ile test edilebilir.
q) ki SÜREKL de i ken arasındaki DO RUSAL ili ki KORELASYON ANAL Z ile
belirlenir.
r) K yönlü ÇAPRAZ tablolarda, gözlem sayısının N<20 olması durumunda, K -KARE
yerine FISHER EXACT testi kullanılır.
s) Mc Nemar ve Fisher Exact test istatistikleri sadece 2 x 2 boyutlu tablolarda kullanılır
ve serbestlik derecesi B R dir.
t) POISSON da ılımının varyansı µ = n ◊ olarak hesaplanır.
2.11
Bir yerle im merkezinde sigara içme oranının 0.30 oldu u
bilinmektedir.
Sigara kullanımı azaltmak amacıyla tedaviye ba vuran 500 hastadan, 356’sının sigarayı bıraktı ı
gözlendi ine göre, “uygulanan tedavi yönteminin sigarayı
bırakmada etkili olmu tur” görü üne katılır mısınız?
Hipotez takımı:
H0 :
= 0.30
H1 :
<0
Kurulan hipotez tek taraflı hipotezdir. Tek taraflı z kritik de eri= 1.645 olarak alınır.
Sigara içenler
144
Sigara içmeyenler
356
Toplam birey sayısı 500
Sigara içme oranı
p=
Formul (13) yardımıyla z de eri hesaplanır:
19
144
500
= 0.288
Zhesap = Ò p≠
.(1≠ )
n
= Ò0.288≠0.30
0.30◊(1≠0.30)
500
|z| > zkritik ise H0 hipotezini reddetmek için yeterli kanıt bulunur. Ancak bu soruda
| ≠ 0.59| < | ± 1.645| oldu undan H0 hipotezi korunmu olur. Tedavinin sigarayı bırakmada
etkili olmadı ı ileri sürülebilir.
sigara_icenler <- 500-356
prop.test(x = sigara_icenler, #sigara_icenler de i kenin de eri 144
n = 500,
p = 0.3,
alternative = "less",
correct = FALSE)
##
##
##
##
##
##
##
##
##
##
##
1-sample proportions test without continuity correction
data: sigara_icenler out of 500, null probability 0.3
X-squared = 0.34286, df = 1, p-value = 0.2791
alternative hypothesis: true p is less than 0.3
95 percent confidence interval:
0.0000000 0.3223811
sample estimates:
p
0.288
• ncelenen 500 hastadan 356 tanesi iyile mi ancak 144 tanesi sigara içmeye devam
etmektedirler. Bu nedenle, n argümanına incelemeye alınan yani örne e alınan toplam
hasta sayısı (500) yazılır. x argümanına ise sigara içmeye devam eden hastaların
sayısı (144) yazılır. Daha sonra popülasyon sigara kullanma oranı olan
= 0.30
oranı p argümanına girilir. Alternatif Hipotezimizden (H1 ) dolayı alternative
argümanına “less” yazılır. E er devam düzeltmesi yapılacaksa correct argümanına
TRUE, yapılmayacaksa FALSE kodlanarak komut çalı tırılır.
• Analiz sonucu elde edilen X 2 = 0.34286 de eri z = 0.5855 de erinin karesidir. Teste
ili kin olasılık (p-value) de eri p = 0.28 oldu undan dolayı H0 hipotezi “RED” edilemez.
Dolayısıyla, hastalara uygulanan yeni yöntemin hastaların sigara bırakmaları üzerinde
etkili olmadı ı söylenebilir. Bu konuyla ilgili yukarıdaki 2.6.1 sorusunu da incelebilirsiniz.
2.12
Bir su fabrikasında üretilen suların 0.5 lt oldu u bilinmektedir.
Fabrikanın standartlara uygun üretim yapıp
yapmadı ını denetlemek isteyen bir Gıda Mühendisi rasgele
16 adet su i esini tartmı ve bunların ortalamalarının 0.46,
standart sapmalarının 0.05 oldu u belirlenmi tir. Fabrikanın
standartlara uygun üretim yaptı ını ileri sürebilir misiniz?
20
Veriler
Fabrikada üretilen suların ortalaması
Örne e alınan su i e sayısı
Örne e alınan su i elerinin ortalaması
Örne e alınan su i elerinin standart sapması
µ = 0.5 lt
n = 16
X̄ = 0.46
S = 0.05
Hipotez Takımı:
H0 : µ = 0.05
H1 : µ ”= 0.05
Kurulan hipotez çift taraflı hipotezdir.
t=
Formul (15) ’dan yaralanılarak thesap =
X̄ ≠ µ
ÔS
n
0.46◊0.50
0.05
Ô
16
(15)
= ≠3.20
Serbestlik derecesi df = n ≠ 1 = 16 ≠ 1 = 15 olarak hesaplanır. Çift taraflı tablodan
t15 = 2.1231 olarak bulunur. |thesap | > t15 ; | ≠ 3.20| > | ± 2.131| oldu undan H0 hipotezi RED
edilir ve bu fabrikada standara uygun üretim yapılmadı ı söylenebilir.
R Çözümü:
t_skor <- function(x,mu,s,n) {
return((x-mu)/(s/sqrt(n)))
}
ts <- t_skor(x=0.46,mu=0.50,s=0.05,n=16)
ts
## [1] -3.2
tk<- qt(p = .05/2, # çift taraflı oldu undan 0.05/2=0.25 yazılı
df = 15) # serbestlik derecesi
tk
## [1] -2.13145
abs(ts)>abs(tk) # do ru oldu undan H0 hipotezi reddedilir
## [1] TRUE
## BSDA paketi kullanarak bir komutla hesaplatıldı
BSDA::tsum.test(mean.x = 0.46, # örneklem ortalaması
s.x = 0.05, #örneklem standart sapması
n.x =16, # örneklemdeki gözlem sayısı
21
mu = 0.50, #populasyon ortalaması
alternative = "two.sided") #çift yönlü test
## Warning in BSDA::tsum.test(mean.x = 0.46, s.x = 0.05, n.x = 16, mu = 0.5, :
## argument var.equal ignored for one-sample test.
##
##
##
##
##
##
##
##
##
##
##
One-sample t-Test
data: Summarized x
t = -3.2, df = 15, p-value = 0.005964
alternative hypothesis: true mean is not equal to 0.5
95 percent confidence interval:
0.4333569 0.4866431
sample estimates:
mean of x
0.46
• t de erini hesaplamak için basit bir fonksiyon yazıldı. Fonksiyon yazmadan da t
de eri hesaplanabilir ancak fonksiyon eklinde hesaplatmanın yararı daha sonra lazım
oldu unda aynı fonksiyonla daha kolay hesaplama yapılabilmesidir.
• Kritik t de erini hesaplamak için temel komutlardan qt komutu kullanılmı tır. Bu
komutta p argümanına – de eri yani 1-güven aralı ı (– = 1 ≠ 0.95 = 0.05) de eri yazılır.
Ancak testimiz çift yönlü oldu undan – de eri 2’ye bölünür ve p argümanına 0.025
yazılır. df argümanına ise serbestlik derecesi (df = n ≠ 1) girilerek komut çalı tırılır.
• BSDA paketinde bulunan tsum.test komutu yardımıyla da hesaplama yapılabilir. Bu
test sonucunda elde edilen p de eri seçilen – de erinden küçük olursa (ör: p < 0.05)
H0 hipotezini reddetmek için yeterli kanıt vardır.
2.13
Haftalık bir derginin sayılarında ortalama 5 yazım hatası bulunmaktadır. Bu derginin gelecek yazısında hiç yazım hatası
bulunmaması olasılı ı kaçtır? ( pucu= Poisson Da ılımı)
‡ 2 = n.
=5
Formul (12) formulü yardımıyla olasılık hesaplanır:
P (0) =
50
0!
◊ e≠5 = e≠5 = 0.00674
R Çözümü:
dpois(x = 0, #istenilen hata yazıldı
lambda = 5) #ortalama hata yazıldı
## [1] 0.006737947
22
2.14
Bir su fabrikasında üretilen suların 0.5 lt, varyansın 0.1
oldu u bilinmektedir. Fabrikanın standartlara uygun üretim
yapıp yapmadı ını denetlemek isteyen bir Gıda Mühendisi
rasgele 16 adet su i esini tartmı ve elde edilen sonuçları
a a ıdaki gibi kaydetmi tir. Fabrikanın standartlardan daha
dü ük üretim yaptı ını ileri sürebilir misiniz?
0.39
0.46
0.49
0.47
0.39
0.38
0.45
0.40
0.45
0.50
0.46
0.49
0.48
0.41
0.42
0.50
Verler
Fabrika ortalaması
µ = 0.5
Fabrika varyansı
‡ 2 = 0.01
Fabrika standart sapması ‡ = 0.316
Hipotez takımı:
H0 : µ = 0.5
H1 : µ < 0.5
Tek taraflı hipotez
X̄ =
0.39+0.46+...+0.42+0.50
16
= 0.4463
Formul (1) yardımıyla z de eri bulunur:
zhesap =
0.4463≠0.50
0.316
Ô
16
= | ≠ 0.68| < |zkritik = ±1.645|
H0 hipotezi kabul edilir.
R Çözümü:
agirlik <- c(0.39,0.46,0.49,0.47,0.39,0.38,0.45,0.40,0.45,0.50,0.46,0.49,0.48,0.41,0.42,
ortalama <- mean(agirlik)
Fabrika_standart_sapma <- sqrt(0.1)
BSDA::zsum.test(mean.x = ortalama, #orneklem ortalaması
sigma.x = Fabrika_standart_sapma, #standart sapma
n.x = 16, #gözlem sayısı
mu = 0.50, #populasyon ortalaması
alternative = "less") # tek taraflı test
##
##
##
One-sample z-Test
23
##
##
##
##
##
##
##
##
data: Summarized x
z = -0.67989, p-value = 0.2483
alternative hypothesis: true mean is less than 0.5
95 percent confidence interval:
NA 0.5762871
sample estimates:
mean of x
0.44625
Sonuç olarak, p = 0.248 oldu undan “H0 hipotezi KABUL” edilir. Buna göre bu fabrikada
standartlara uygun bir üretimin yapıldı ı ileri sürülebilir.
2.15
Antrenman yöntemine göre performans sonuçları a a ıdaki
iki yönlü tabloda özetlenmi tir.
Performans sonuc
Antrenman yöntemi
AY1
AY2
AY3
Sütun Toplam
2.15.1
yi
20
30
50
100
Kötü
Satır Toplam
60
20
80
160
80
50
130
260
Performans sonuçları antrenman yöntemine göre de i mekte midir?
H0 : Performans sonuçları antrenman yöntemine göre DE
MEMEKTED R. (Performans
sonuçları ile antrenman yöntemleri arasında (ÖNEML ) L K YOKTUR)
H1 : Performans sonuçları antrenman yöntemine göre DE
MEKTED R. (Performans
sonuçları ile antrenman yöntemleri arasında (ÖNEML ) L K VARDIR)
‰2 =
(Oi ≠ Ei )2
Ei
i=1
k
ÿ
(16)
SD = (SAT IR.SAY ISI˘1) ◊ (SU T U N.SAY ISI˘1) = (3 ≠ 1) ◊ (2 ≠ 1) = 2
BeklenenF rekans =
planır.
SatirT oplamß◊SutunT oplam
GenelT oplam
Antrenman yöntemi
AY1
AY2
AY3
formülü yardımıyla beklenen frekanslar hesa-
yi
B1 =
B1 =
B1 =
Kötü
80◊100
= 30.77
260
50◊100
= 19.23
260
130◊100
= 50.0
260
24
B2 =
B2 =
B2 =
80◊160
= 49.23
260
50◊160
= 30.77
260
130◊160
= 80
260
Formul (16) yardımıyla ‰2 katsayısı hesaplanır:
‰2hesap =
(20≠30.77)2
30.77
+
(60≠49.23)2
49.23
+
(30≠19.23)2
19.23
+
(20≠30.77)2
30.77
+
(50≠50)2
50
+
(80≠80)2
80
= 15.925
‰2hesap > ‰2kritik ; 15.925 > 5.991 oldu undan “H0 hipotezi RED”" edilir.
R Çözümü:
#oncelikle de erler matriks eklinde olu turuldu.
o <- matrix(c(20,60,30,20,50,80), #de erler satır sırasıyla yazıldı.
nrow = 3,#3 satır olaca ı belirtildi.
byrow=TRUE) #satır sırasıyla veri giri i yapıldı ı belirtildi.
colnames(o) <- c("iyi","kotu") #sütün isimleri sırasıyla yazıldı.
rownames(o) <- c("AY1","AY2","AY3") #satır isimleri sırasıyla yazıldı.
o <- as.table(o) # matriks tabloya dönü türüldü
print(o) # matriksin gorunumu
##
iyi kotu
## AY1 20
60
## AY2 30
20
## AY3 50
80
chisq.test(o) # kikare testi
##
## Pearson s Chi-squared test
##
## data: o
## X-squared = 15.925, df = 2, p-value = 0.0003483
• R’da ba ımsızlık ki-kare testi chisq.test komutu yardımıyla yapılabilmektedir. Ancak veriler tablo eklinde verilmelidir. Bu sebeple ilk önce tablonun olu turlmasına
ba lanır. Tablo yukarıdaki ekilde olu turulduktan sonra komut içinde yazılarak test
gerçekle tirilir.
Yorumlanması: Analize ili kin P de eri=0.0003483 (P < 0.05) oldu u için “Performans
sonuçları antrenman yöntemine göre DE
MEKTED R” ya da “Performans sonuçları ile
antrenman yöntemleri arasında (ÖNEML ) L K VARDIR” denilebilir.
2.16
Bir dersten e itim alan ö rencilerin e itim öncesi ve sonrası
ba arı durumları a a ıdaki iki yönlü tabloda sunulmu tur.
E itim Öncesi
E itim Sonrası Ba arılı + Ba arısız Ba arılı +
50 a
60 b
25
E itim Öncesi
Ba arısız 2.16.1
10 c
10 d
“Verilen e itim ö rencilerin dersin ba arısını arttırmı tır” görü üne
katılır mısınız?
H0 : “Verilen e itim ö rencilerin dersin ba arısını ARTTIRMAMI TIR”
H1 : “Verilen e itim ö rencilerin dersin ba arısını ARTTIRMI TIR”
‰2M CN EM AR =
(b≠c)2
b+c
=
(60≠10)2
60+10
=
2500
70
= 35.714 Ø ‰2kritik = 3.841
oldu undan “H0 hipotezi RED” edilmi tir. Yani H1 hipotezi kabul edilir. Sonuç olarak,
“verilen e itim ö rencilerin dersin ba arısını arttırmı tır”yorumu yapılabilir.
2.16.2
Yukarıdaki tablo için en uygun test istatisti i ne olmalıdır?
Cevap: MC NEMAR TEST
2.17
X ve Y gibi iki özellik için elde edilen sonuçlar a a ıda
özetlenmi tir. Buna göre korelasyon (rxy ) ve regresyon (byx )
katsayılarını hesaplayınız.
X
Y
2
5
7
9
6
8
12
14
Korelasyon Analizi
q
rxy = Òq
(Xi ≠ X̄)(Yi ≠ Ȳ )
(Xi ≠ X̄)2
q
(Yi ≠ Ȳ )2
(17)
Formul (17) yardımıyla korelasyon katsayısı hesaplanır:
X̄ = 5.75
Ȳ = 10
q
(Xi ≠ X̄)(Yi ≠ Ȳ ) = (2 ≠ 5.75)(6 ≠ 10) + (6 ≠ 5.75)(8 ≠ 10) + (7 ≠ 5.75)(12 ≠ 10) + (9 ≠
5.75)(14 ≠ 10) = 32.12
q
(Xi ≠ X̄)2 = (2 ≠ 5.75)2 + (5 ≠ 5.75)2 + (7 ≠ 5.75)2 + (9 ≠ 5.75)2 = 26.76
26
q
(Yi ≠ Ȳ )2 = (6 ≠ 10)2 + (8 ≠ 10)2 + (12 ≠ 10)2 + (14 ≠ 10)2 = 39.99
rxy =
Ô
32.12
26.76◊39.99
= 0.9783
R Çözümü:
x<- c(2,5,7,9) #x de erleri vektör oalak girildi
y <-c(6,8,12,14) #y de erleri vektör oalak girildi
cor(x,y) #korelasyon hesaplandı
## [1] 0.9782685
YORUM: X ve Y özelliklerine arasındaki 0.978’lik pozitif korelasyon önemli bulunmu tur.
Regresyon Analizi
bY X =
q
(Xi ≠ X̄)(Yi ≠ Ȳ )
q
(Xi ≠ X̄)2
(18)
Formul (18) yardımıyla reresyon katsayısı hesaplanır:
bY X =
32.112
26.76
= 1.2
R Çözümü:
0.0
−0.5
−1.0
Pearson residuals
0.5
df <- data.frame(x=x,y=y) # veriler data.frame formatına dönü türüldü
fit <- lm(y~x, # ~ i aretinin solu ba ımlı, sa ı ba ımsız de i kenleri ifade eder.
data=df) # analiz yapılacak veriseti yazıldı.
car::residualPlot(fit) #hata terimleri grafi i çizdirildi
6
8
10
Fitted values
27
12
14
#car paketi yüklü de ilse install.packages("car") komutyula yüklenmelidir.
Hata terimlerinin +2 ile -2 sınırından daha dar bir sınırda da ıldı ı yukarıdaki grafikten
görülmektedir. Hataların homojen da ıldı ı kabaca söylenebilir.
summary(fit)
##
##
##
##
##
##
##
##
##
##
##
##
##
##
##
##
##
##
Call:
lm(formula = y ~ x, data = df)
Residuals:
1
2
0.4860 -1.1028
3
0.5047
4
0.1121
Coefficients:
Estimate Std. Error t value Pr(>|t|)
(Intercept)
3.1215
1.1303
2.762
0.1099
x
1.1963
0.1793
6.672
0.0217 *
--Signif. codes: 0 *** 0.001 ** 0.01 * 0.05 .
0.1
1
Residual standard error: 0.9273 on 2 degrees of freedom
Multiple R-squared: 0.957, Adjusted R-squared: 0.9355
F-statistic: 44.52 on 1 and 2 DF, p-value: 0.02173
Elde edilen regresyon denklemi ve buna ili kin özet tablo ve bireysel önemlilikler yukarıda
özetlenmi tir. En altta bulunan hata terimlerine ait ANOVA (Analysis of Variance) bilgilerinde
P de eri=0.022 oldu undan (Intercept) veya bY X katsayılarından en azından birinin önemli
oldu u görülmektedir. Elde edilen regresyon denklemi ve buna ili kin ANOVA tablosu ve
bireysel önemlilikler a a ıda özetlenmi tir. ANOVA (Analysis of Variance) tablosunda P
de eri=0.022 oldu undan a ya da bYX katsayılarından en azından birinin önemli oldu u
görülmektedir. bYX katsayısına ait önem kontrolü için . . . . . . .soruya bakınız.
2.18
ki sürekli de i kene ili kin Sx = 4.Sy ve rxy = 0.90 gibi bir
ili ki vardır. Buna göre bY X , bX Y ve isabet derecesini
hesaplayınız.
Y
rXY = rY X = bY X . SSXY oldu una göre bY X 4S
= 0.90 olur. Buradan bY X =
SY
sonucu bulunur.
0.90
4
SY
rXY = rY X = bXY . SSXY oldu una göre bXY 4S
= 0.90 olur. Buradan bY X =
Y
sonucu bulunur.
0.90◊
1
2
sabet derecesi : rXY
= 0.902 = 0.81
28
= 0.225
= 3.60
2.19
Tesadüf parselleri deneme deseninde yürütülen bir çalı mada
üç farklı türün (Ahududu, Bö ürtlen ve Çilek) antioksidan
kapasitelerinin kar ıla tırılması istenmektedir.
Varyans
analizi tablosunu olu turunuz ( pucu= F testi).
Ahududu A Bö ürtlen B
Çilek C
3
3
4
8
8
9
q
5
5
7
q
A = 10
q
B = 17
C = 25
Tesadüf Parselleri Deneme Deseni
Randomised Plot Design=Completely Randomised Design=One-way ANOVA= One-way
classification
H 0 : µA = µB = µC
H1 : µA ”= µB ”= µC
Tüm gözlem de erlerinin toplamı= 10 + 17 + 25 = 52
Genel Kareler Toplamı=Tür. Arası K.T + Tür çi K.T.
Genel Kareler Toplamı=32 + 32 + 42 + 52 + 52 + 72 + 8 +2 +82 + 92 ≠
Tür. Arası K.T.=
102 +172 +252
3
≠
522
9
522
9
= 41.556
= 37.556
Tür. çi. K.T = Genel Kareler Toplamı – Tür. Arası K.T.=4
Varyasyon Kaynakları
SD KT
Türler Arası
Türler çi (Hata)
Genel
2
6
8
KO
F
F2,6 Cetvel
37.556 18.778 28.17 5.14
4.000 0.667
41.556
Fhesap = 28.17 > F2,6 = 5.14 oldu u için “H0 hipotezi RED” edilir.
bakımından türler arasında farklılı ın önemli oldu u söylenebilir.
ncelenen özellik
R Çözümü
#öncelikle veriler girilir
#veya hazır bir dosyada mevcutsa read.table komutu ile yüklenir.
df <- data.frame(A=c(3,3,4),#A parseline ait veriler sırasıyla girilir
B=c(5,5,7),#B parseline ait veriler sırasıyla girilir
C=c(8,8,9))#C parseline ait veriler sırasıyla girilir
r <- c(t(as.matrix(df))) # veriler satır olarak tek sıra vektör haline dönü ür
29
r
## [1] 3 5 8 3 5 8 4 7 9
f <k<-3
n<-3
tm<tm
c("A","B","C") # fakörler sırasıyla yazılır
# parsel sayısı
# her parsele dü en gözlem sayısı
gl(k,1,n*k,factor(f)) # parsel vektörü olu turulur
## [1] A B C A B C A B C
## Levels: A B C
fit <- aov(r~tm) # anova ba ımlı de i ken ~ parsel vektörü olacak
#olu turulur
summary(fit) #sonuçlar yazdırılır.
##
##
##
##
##
ekilde
Df Sum Sq Mean Sq F value
Pr(>F)
2 37.56 18.778
28.17 0.000892 ***
6
4.00
0.667
tm
Residuals
--Signif. codes:
0
***
0.001
**
0.01
*
0.05
.
0.1
1
#bütün bu süreç için kısa bir fonksiyon olu turulup kullanılablir
anovaRPD <- function(dataframe) {
r <- c(t(as.matrix(dataframe)))
f <- colnames(dataframe)
k <- ncol(dataframe)
n <- nrow(dataframe)
tm <- gl(k,1,n*k,factor(f))
return(aov(r~tm))
}
summary(anovaRPD(df))
##
##
##
##
##
Df Sum Sq Mean Sq F value
Pr(>F)
tm
2 37.56 18.778
28.17 0.000892 ***
Residuals
6
4.00
0.667
--Signif. codes: 0 *** 0.001 ** 0.01 * 0.05 .
0.1
1
p < 0.05 oldu u için “H0 hipotezi RED” edilir. ncelenen özellik bakımından türler arasında
farklılı ın önemli oldu u söylenebilir.
30
2.20
Akkaraman ve Merinos ırklarına ili kin gebelik oranı verileri a a ıda verilmi tir. Buna göre gebelik oranı bakımından
Merinos ırkı koyunların Akkaraman ırkından üstün oldu u
söylenebilir mi?
IRK
X (Gebe olanlar) N (Toplam) P (Gebelik oranı)
Akkaraman (A) 100 (XA)
Merinos (B)
400(XB)
400(NA)
500 (NB)
PA =
PB =
XA
NA
XB
NB
=
=
100
400
400
500
= 0.25
= 0.80
Hipotez Takımı:
H0 : fi A = fi B
H 1 : fi A < fiB
1. Yakla ım:
P =
XA +XB
NA +NB
zhesap = Ò
=
100+400
400+500
=
500
900
PA +PB
P.(1≠P )( N1 + N1 )
A
B
= 0.56
=Ô
0.25+0.85
1
1
0.56.(1≠0.56)( 400
+ 500
)
= ≠16.50
R Çözümü:
prop.test(c(100,400),#Akkaraman verileri c(ba arılı,toplam) ekilde yazıldı
c(400,500),#merinos verileri c(ba arılı,toplam) ekilde yazıldı
alternative = "less", # tek yönlü ve 1. 2. den küçük
correct = FALSE) #Yates düzeltmesi yok
##
##
##
##
##
##
##
##
##
##
##
##
2-sample test for equality of proportions without continuity
correction
data: c(100, 400) out of c(400, 500)
X-squared = 272.25, df = 1, p-value < 2.2e-16
alternative hypothesis: less
95 percent confidence interval:
-1.0000000 -0.5038048
sample estimates:
prop 1 prop 2
0.25
0.80
p < 0.05 oldu u için “H0 hipotezi RED” edilir. Merinos ırkının gebelik oranının Akkaraman
ırkından daha üstün oldu u söylenebilir.
2. Yakla ım:
31
zhesap = Ò
(
PA +PB
PA (1≠PA )
P (1≠P )
)+( B N B )
NA
B
=Ò
0.25+0.85
(
0.25(1≠0.55)
0.80(1≠0.80)
)+(
)
400
500
= ≠19.58
Exact::exact.test(data = matrix(c(100,300,400,100), #veriler buraya biraz
#farklı olarak girildi.
#c(ba arılı,ba arısız,ba arılı,ba arısız) eklinde
nrow = 2, # iki satır oldu u belirtildi
byrow = T), # satır sırasıyla veriler alındı.
alternative = "less", # küçüktür için kritik de er alındı.
method = "Z-unpooled", #metot olarak Z-unpooled seçildi
to.plot= FALSE) #grafik çizilmesin
##
##
##
##
##
##
##
##
##
##
Z-unpooled Exact Test
data: 100 out of 400 vs. 400 out of 500
test statistic = -19.584, first sample size = 400, second sample size =
500, p-value < 2.2e-16
alternative hypothesis: true difference in proportion is less than 0
sample estimates:
difference in proportion
-0.55
p < 0.05 oldu u için “H0 hipotezi RED” edilir. Merinos ırkının gebelik oranının Akkaraman
ırkından daha üstün oldu u söylenebilir.
2.21
Akkaraman ve Merinos ırklarına ili kin canlı a ırlık verileri a a ıda verilmi tir. Buna göre canlı a ırlık bakımından
Merinos ırkı koyunların Akkaraman ırkından üstün oldu u
söylenebilir mi?
IRK
X (ortalama) N
Akkaraman (A) 60
Merinos (B)
80
Standart Sapma
35 6
35 7
Varyansların homojenli i testi öncelikle test edilmelidir.
H0 : ‡A2 = ‡B2
H0 : ‡A2 ”= ‡B2
Varyansların homojen olup olmadı ını belirlemek için büyük varyansın küçük varyans oranı
hesaplanmalıdır.
2
‡B
2
‡A
=
92
72
= 1.65 Æ 4 oldu undan varyansların homojen oldu u kabaca söylenebilir.
32
Di er bir ifadeyle iki grup ortalamasının kar ıla tırılmasında a a ıdaki e itlik kullanılabilir.
Serbestlik derecesi: nA + nB ≠ 2 = 35 + 35 ≠ 2 = 68 sd li tek taraflı tablo de erine bakılır.
Hipotez takımı:
H 0 : µA = µB
H1 : µA < µB
t= Ú q
Ā ≠ B̄
q
d2A + d2B
(nA ≠1)+(nB ≠1)
◊
( n1A
+
1
)
nB
(19)
Formul (19) yardımıyla t de eri hesaplanır:
60≠80
thesap = Ò (62 ◊34)+(7
2 ◊34)
(35≠1)+(35≠1)
1
1
◊( 35
+ 35
)
= ≠12.83 > t68 = 1.668
Hesap de eri tablo de erinden büyük oldu u için “H0 hipotezi RED”edilir. Sonuç olarak,
canlı a ırlık bakımından Merinos ırkı koyunların Akkaraman ırkından üstün oldu u
SÖYLENEB L R.
R Çözümü:
(F <- 6ˆ2/7ˆ2)# F de eri hesaplanır
## [1] 0.7346939
(p<- pf(q = F, # hesaplanan F de eri yazılır
df1=34, # birinci serbestlik (Na-1)
df2=34) # ikinci serbestli (Nb-1)
*2) # çift yönlü p için iki ile çarpılır.
## [1] 0.3731884
# normal veri setlerinde var.test ile hesaplama yapılabilir
d <- data.frame(x=c(rnorm(35,60,6),rnorm(35,80,7)),
y=c(rep("A",35),rep("B",35)))
psych::describeBy(x = d,group = d$y)
##
##
##
##
##
##
##
##
##
##
Descriptive statistics by group
group: A
vars n mean
sd median trimmed mad
min
max range skew kurtosis
se
x
1 35 59.38 6.26
58.7
59.13 3.72 46.93 74.08 27.15 0.4
0.3 1.06
y*
2 35 1.00 0.00
1.0
1.00 0.00 1.00 1.00 0.00 NaN
NaN 0.00
-----------------------------------------------------------group: B
vars n mean
sd median trimmed mad
min
max range skew kurtosis
se
x
1 35 79.47 6.61 78.35
79.13 5.44 68.01 93.66 25.66 0.61
-0.12 1.12
33
## y*
2 35
2.00 0.00
2.00
2.00 0.00
2.00
2.00
0.00
NaN
NaN 0.00
t.test(x~y,d)
##
##
##
##
##
##
##
##
##
##
##
Welch Two Sample t-test
data: x by y
t = -13.055, df = 67.795, p-value < 2.2e-16
alternative hypothesis: true difference in means is not equal to 0
95 percent confidence interval:
-23.16044 -17.01877
sample estimates:
mean in group A mean in group B
59.37622
79.46583
Varyansların e it oldu u anl ıldıktan sonra t testi yapılır:
BSDA::tsum.test(mean.x = 60,#akkaraman ortalaması
s.x = 6, #akkaraman standart sapması
n.x = 35, #akkaraman gözlem sayısı
mean.y = 80,#merinos ortalaması
s.y = 7, #merinos standart sapması
n.y = 35, #merinos gözlem sayısı
alternative = "less", # x ortalaması y den küçüktür
var.equal = TRUE) #varyanslar e ittir
##
##
##
##
##
##
##
##
##
##
##
Standard Two-Sample t-Test
data: Summarized x and y
t = -12.834, df = 68, p-value < 2.2e-16
alternative hypothesis: true difference in means is less than 0
95 percent confidence interval:
NA -17.40128
sample estimates:
mean of x mean of y
60
80
p = 0.000 de eri 0.05 de erinden küçük oldu u için “H0 hipotezi RED”edilir. Sonuç
olarak, canlı a ırlık bakımından Merinos ırkı koyunların Akkaraman ırkından üstün oldu u
SÖYLENEB L R.
34
2.22
Be tansiyon hastasına yeni bir tansiyon ilacı uygulanmı elde
edilen sonuçlar a a ıda verilmi tir. Buna göre uygulanan
yeni ilacın tansiyonu dü ürücü etkisinin oldu unu söyleyebilir misiniz?
Hastalar A (önce) B (sonra) D (önce-sonra) Di2
Ali
Veli
Peyami
lhami
Bestami
150
160
155
155
160
130
135
125
130
135
20
25
30
25
25
q
D = 125
400
625
900
625
625
q 2
Di = 3175
Hipotez Takımı:
H 0 : µA ≠ µB = 0
H 1 : µA ≠ µB > 0
Tek Taraflı hipotez
D̄ =
q
D
n
=
125
5
= 25 (farklara ait ortalama)
SD =
ı̂ q
ı D2
Ù
i
(
q
≠
n≠1
D)2
n
(20)
Formül (20) yarımıyla farklara ait standart sapma hesaplanır:
SD =
Ú
(125)2
5
3175≠
4
= 3.536
Farlara ait standart hata hesaplanır:
DD̄ =
SD
Ô
n
=
3.536
Ô
4
= 14.4
Serbestlik derecesi df = n ≠ 1 = 5 ≠ 1 = 4
thesap =
D̄
SD̄
=
25
1.768
= 14.14
|thesap = 14.4| Ø |t4 = 2.13| oldu u için “H0 hipotezi RED” edilir. Uygulanan tansiyon
ilacının tansiyonu dü ürücü etkiye sahip oldu u söylenebilir.
R çözümü:
d <- matrix(data = c(150,130,160,135,155,125,155,130,160,135), # veriler
#satır sırası ile girildi.
ncol=2, #matriksin iki stün oldu u belirtildi
byrow = TRUE) # satır sırasıyla kodalnadı ı belirtildi
35
t.test(x = d[,1], #önceki de erler için matriksin birinci sütunu seçildi
y = d[,2], #sonraki de erler için matriksin ikinci sütunu seçildi.
paired = TRUE, #e le tirilmi t testi oldu undan "paired" TRUE yapıldı
alternative = "greater") # 0 dan büyk istendi inde "greater" seçildi
##
##
##
##
##
##
##
##
##
##
##
Paired t-test
data: d[, 1] and d[, 2]
t = 15.811, df = 4, p-value = 4.675e-05
alternative hypothesis: true difference in means is greater than 0
95 percent confidence interval:
21.62925
Inf
sample estimates:
mean of the differences
25
P = 0.000 de eri 0.05 de erinden küçük oldu u için “H0 hipotezi RED” edilir. Böylece,
uygulanan tansiyon ilacının tansiyonu dü ürücü etkiye sahip oldu u söylenebilir.
2.23
Koyunlarda canlı a ırlık (X) ve gö üs çevresi (Y) arasında
rXY = 0.85 korelasyon bulunmu tur. Buna göre, bu korelasyon katsayısının istatistiksel olarak önemli olup olmadı ını
test ediniz (n=42).
Hipotez takımı:
H0 : fl = 0
H1 : fl ”= 0
Korelasyon katsayısının önemlilik testine ili kin hipotez her zaman çift taraflıdır. Örne e
alınan birey sayısı korelasyon testinin önemli olup olmasını etkilemektedir. Örne in: örne e
alınan birey sayısının çok yetersiz olması durumunda 0.80 gibi güçlü ve pozitif korelasyon
istatistiksel olarak önemsiz olabilmektedir. Buna kar ın, 0.25 gibi dü ük korelasyon katsayısı
örne e alınan birey sayısının artmasıyla istatistiksel olarak önemli olabilmektedir.
thesap = Ò
r
1≠r 2
n≠2
(21)
Formül (21) yardımıyla t de eri hesaplanır:
thesap = Ò 0.85
1≠0.852
42≠2
= 10.205
|thesap = 10.205| Ø |t40 = 2.021| oldu undan “H0 hipotezi RED” edilir. X ve Y de i kenleri
arasındaki 0.85’lik korelasyon (do rusal ili ki) istatistiksel olarak önemli bulunmu tur (p <
36
0.05). Serbestlik derecesi df = n ≠ 2 = 42 ≠ 2 = 40 (% 5 için 40 serbestlik dereceli çift taraflı
t tablo de erine bakılmı tır).
R Çözümü:
tCor <- function(r,n) {
return(r/(sqrt((1-rˆ2)/(n-2))))
}
(t <- tCor(.85,42)) #t de eri
## [1] 10.2051
(tkritik <- qt(0.975,40)) # çift taraflı kritik de er
## [1] 2.021075
(t>=tkritik) # do ru oldu undan Ho red edilir
## [1] TRUE
(p <- pt(q = t, # hesaplanan t de eri yazıldı
df = 40, # n-2 serbestlik derecesi yazıldı
lower.tail = F) # P[X>x]
*2) # p de eri çif taraflı olması için 2 ile çarpıldı
## [1] 1.071884e-12
2.24
Dört birey için X ve Y gibi iki özellik arasında Y = 3.12 +
1.2X gibi ili kinin oldu u belirlenmi tir. HKO = 0.860 ve X
özelli ine ait standart sapmanın S = 2.99 oldu u bilindi ine
göre bY X = 1.2 katsayısının istatistiksel olarak önemli olup
olmadı ını test ediniz.
Hipotez Takımı:
H0 : —Y X = 0
H1 : —Y X ”= 0
Çift taraflı hipotez kurulur.
Ò
Ô
Ô
‡
ˆ = HKO = HKT
=
0.860 = 0.927
n≠2
(5) yarımıyla kareler toplamı SS =
S 2 = 2.992 ,
SbY X =
ˆ
Ô‡
SS
SS
n≠1
=
q
(Xi ≠ X̄)2 hesaplanır:
= 2.992 ise SS = 2.992 ◊ 3 = 26.82
Ô0.927
26.82
= 0.179
37
thesap =
bY X
SbY X
=
1.2
0.179
= 6.701
Serbestlik derecesi df = n ≠ 2 = 4 ≠ 2 = 2 sd dereceli çift taraflı tablo de eri: t2 = 4.30
|thesap = 6.701| Ø |t2 = 4.30|oldu u için “Ho hipotezi RED” edilir. Regresyon katsayısının
(bY X = 1.2) istatistiksel olarak önemli oldu u ileri sürülebilir.
R Çözümü:
(byx <- 1.2)
## [1] 1.2
(sHat <- sqrt(0.86))
## [1] 0.9273618
(SS <- 2.99ˆ2*(4-1))
## [1] 26.8203
(sbyx <- sHat / sqrt(SS))
## [1] 0.1790678
(tHesap <- byx/sbyx)
## [1] 6.701374
(t2 <- qt(p = .975,df = 2))
## [1] 4.302653
(tHesap>=t2)
## [1] TRUE
(pt(tHesap,df = 2,lower.tail = F)*2)
## [1] 0.02155035
38
View publication stats
Download