See discussions, stats, and author profiles for this publication at: https://www.researchgate.net/publication/340084804 R YAZILIMI İLE UYGULAMALI TEMEL İSTATİSTİK DERS NOTLARI Presentation · January 2019 DOI: 10.13140/RG.2.2.29204.45442 CITATIONS READS 0 2,648 4 authors, including: Ecevit Eyduran Hakan Duman Igdir Üniversitesi Igdir Üniversitesi 231 PUBLICATIONS 1,530 CITATIONS 25 PUBLICATIONS 2 CITATIONS SEE PROFILE SEE PROFILE Cem Tırınk Igdir Üniversitesi 33 PUBLICATIONS 132 CITATIONS SEE PROFILE Some of the authors of this publication are also working on these related projects: Comparison of Bootstrap Aggregating Multivariate Adaptive Regression Splines (Bagging MARS) and Multivariate Adaptive Regression Splines (MARS) in predictive performance for regression type problems View project Statistical Applications with R Program (R Programla Dilinde İstatistik Uygulamaları) View project All content following this page was uploaded by Hakan Duman on 21 March 2020. The user has requested enhancement of the downloaded file. R YAZILIMI LE UYGULAMALI TEMEL STAT ST K DERS NOTLARI EYDURAN, Ecevit DUMAN, Hakan† Serkan ÖZTÜRK§ TIRINK, Cem‡ Kasım 20, 2019 Contents 1 Temel kavramlar 3 2 Sorular 2.1 A ırlı ı 900-925 gr arasında de i en konserve kutularının C vitamini ortalaması µ = 60gr ve standart sapması ‡ = 4 oldu u bilinmektedir. Buna göre; . . . . 2.2 A a ıdaki X basit seri için ortalama, standart sapma, tepe de eri, varyans, kareler toplamı, geometrik ortalama, regresyon, korelasyon, ortanca de er ve varyasyon katsayısını hesaplayınız. . . . . . . . . . . . . . . . . . . . . . . . . 2.3 X kesikli rassal de i kenine ili kin bilgiler a a ıda özetlenmi tir. . . . . . . . 2.4 Bir populasyondaki insanların = 0.6’sının sigara içti i bilinmektedir. Rastgele seçilen 8 ki iden; . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2.5 3000 ki ilik bir köyde 126 ya ına kadar ya ama olasılı ı p=0.002 oldu una göre; 2.6 Bir hastalı a yakalanan insanların ortalama iyile me oranının 0,30 oldu u rapor edilmi tir. Söz konusu hastalı a yakalanan insanların iyile me oranını arttırmak amacıyla geli tirilen yeni bir antibiyotik, hastanedeki 1000 hastaya uygulanmı , hastaların 3/5’inin iyile ti i görülmü tür. . . . . . . . . . . . . . 2.7 Bir hastalı a yakalanan insanların ortalama iyile me süresinin 80 gün, standart sapmasının 10 oldu u bildirilmi tir. Bu hastalı a yakalanan insanların iyile me sürelerini kısaltmak amacıyla geli tirilen yeni bir ilaç, rastgele seçilen 64 hastaya uygulanmı , ortalama iyile me süresinin 75 gün oldu u kaydedilmi tir. “Yeni geli tirilen bu ilacın, iyile me süresinde herhangi de i iklik yapıp yapmama durumunu test ediniz. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 5 5 8 11 12 13 15 16 Prof.Dr. I dır Universitesi letme Fakültesi - Sayısal Yöntemler Anabilim Dalı (ecevit@eyduran@igdir.e du.tr) † Ö r. Gör. I dır Universitesi I dır Meslek Yüksekokulu (hknd1977@gmail.com) ‡ Ar . Gör. I dır Universitesi Ziraat Fakültesi - Biyometri ve Genetik Anabilim Dalı § Ziraat Müh. 1 2.8 2.9 2.10 2.11 2.12 2.13 2.14 2.15 2.16 2.17 2.18 2.19 2.20 2.21 2.22 2.23 X rassal de i keninin ortalaması 60, varyansı 64 olmak üzere normal da ılım göstermektedir. P (60 < X < U ) = 0.400 oldu una göre “U” kaçtır. . . . . . X poisson da ılmı bir de i ken oldu una göre P (6) = 0.1220, e≠µ = 0.00033 , n = 10000 ise olasılı ını hesaplayınız. . . . . . . . . . . . . . . . . . . . . . A a ıdaki bo lukları doldurunuz. . . . . . . . . . . . . . . . . . . . . . . . . Bir yerle im merkezinde sigara içme oranının 0.30 oldu u bilinmektedir. Sigara kullanımı azaltmak amacıyla tedaviye ba vuran 500 hastadan, 356’sının sigarayı bıraktı ı gözlendi ine göre, “uygulanan tedavi yönteminin sigarayı bırakmada etkili olmu tur” görü üne katılır mısınız? . . . . . . . . . . . . . . . . . . . . Bir su fabrikasında üretilen suların 0.5 lt oldu u bilinmektedir. Fabrikanın standartlara uygun üretim yapıp yapmadı ını denetlemek isteyen bir Gıda Mühendisi rasgele 16 adet su i esini tartmı ve bunların ortalamalarının 0.46, standart sapmalarının 0.05 oldu u belirlenmi tir. Fabrikanın standartlara uygun üretim yaptı ını ileri sürebilir misiniz? . . . . . . . . . . . . . . . . . . Haftalık bir derginin sayılarında ortalama 5 yazım hatası bulunmaktadır. Bu derginin gelecek yazısında hiç yazım hatası bulunmaması olasılı ı kaçtır? ( pucu= Poisson Da ılımı) . . . . . . . . . . . . . . . . . . . . . . . . . . . . Bir su fabrikasında üretilen suların 0.5 lt, varyansın 0.1 oldu u bilinmektedir. Fabrikanın standartlara uygun üretim yapıp yapmadı ını denetlemek isteyen bir Gıda Mühendisi rasgele 16 adet su i esini tartmı ve elde edilen sonuçları a a ıdaki gibi kaydetmi tir. Fabrikanın standartlardan daha dü ük üretim yaptı ını ileri sürebilir misiniz? . . . . . . . . . . . . . . . . . . . . . . . . . Antrenman yöntemine göre performans sonuçları a a ıdaki iki yönlü tabloda özetlenmi tir. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Bir dersten e itim alan ö rencilerin e itim öncesi ve sonrası ba arı durumları a a ıdaki iki yönlü tabloda sunulmu tur. . . . . . . . . . . . . . . . . . . . . X ve Y gibi iki özellik için elde edilen sonuçlar a a ıda özetlenmi tir. Buna göre korelasyon (rxy ) ve regresyon (byx ) katsayılarını hesaplayınız. . . . . . . ki sürekli de i kene ili kin Sx = 4.Sy ve rxy = 0.90 gibi bir ili ki vardır. Buna göre bY X , bX Y ve isabet derecesini hesaplayınız. . . . . . . . . . . . . . . . Tesadüf parselleri deneme deseninde yürütülen bir çalı mada üç farklı türün (Ahududu, Bö ürtlen ve Çilek) antioksidan kapasitelerinin kar ıla tırılması istenmektedir. Varyans analizi tablosunu olu turunuz ( pucu= F testi). . . . Akkaraman ve Merinos ırklarına ili kin gebelik oranı verileri a a ıda verilmi tir. Buna göre gebelik oranı bakımından Merinos ırkı koyunların Akkaraman ırkından üstün oldu u söylenebilir mi? . . . . . . . . . . . . . . . . . . . . . Akkaraman ve Merinos ırklarına ili kin canlı a ırlık verileri a a ıda verilmi tir. Buna göre canlı a ırlık bakımından Merinos ırkı koyunların Akkaraman ırkından üstün oldu u söylenebilir mi? . . . . . . . . . . . . . . . . . . . . . . . . Be tansiyon hastasına yeni bir tansiyon ilacı uygulanmı elde edilen sonuçlar a a ıda verilmi tir. Buna göre uygulanan yeni ilacın tansiyonu dü ürücü etkisinin oldu unu söyleyebilir misiniz? . . . . . . . . . . . . . . . . . . . . . Koyunlarda canlı a ırlık (X) ve gö üs çevresi (Y) arasında rXY = 0.85 korelasyon bulunmu tur. Buna göre, bu korelasyon katsayısının istatistiksel olarak önemli olup olmadı ını test ediniz (n=42). . . . . . . . . . . . . . . . . . . . 2 17 18 18 19 20 22 23 24 25 26 28 29 31 32 35 36 2.24 Dört birey için X ve Y gibi iki özellik arasında Y = 3.12 + 1.2X gibi ili kinin oldu u belirlenmi tir. HKO = 0.860 ve X özelli ine ait standart sapmanın S = 2.99 oldu u bilindi ine göre bY X = 1.2 katsayısının istatistiksel olarak önemli olup olmadı ını test ediniz. . . . . . . . . . . . . . . . . . . . . . . . . 1 37 Temel kavramlar Populasyon (Population) : Teorik olarak sınırsız sayıda bireyden olu an toplulu a denir Örnek (Sample) : Populasyondan belirli tekniklerle çekilen sınırlı sayıda bireyden olu an toplulu a denir Sürekli De i ken (Quantitative=Continous=Measurable variable) : Tanımlı oldu u bir sayı do rusunda hemen hemen her noktada ya da sonsuz sayıda de er alabilen de i kenlerdir. Bu de i kenler ölçülebilen ve tartılabilen de i kenlerdir. Örn: boy, kilo, süt verimi vb. Kesikli De i ken (Qualitative=Discontinous=Discrete=Grouped variable) : Tanımlı oldu u bir sayı do rusunda sadece tam sayı noktalarında sınırlı sayıda de er alabilen de i kenlerdir. Örn: Cinsiyet (erkek ve kız), Kan grubu (A, B, AB, ve O) vb. Ortanca De er (Median): Veri setini küçükten büyü e sıradıktan sonra veri setini iki e it parçaya bölen en ortadaki de erdir. Parametre (Parameter): Populasyondan hesaplanan µ, ‡, gibi karakteristik de erlere denir. Parametre de erleri Yunan (Grek) alfabeleri ile gösterilir. Korelasyon (Pearson Correlation Coefficient) : ki sürekli de i ken arasındaki do rusal ili kinin yönü ve derecesi hakkında bilgi veren katsayıdır. Korelasyon katsayısı -1 ile +1 arasında de er almaktadır. Regresyon (Regression Coefficient=Slope) : Ba ımsız de i kenin kendi biriminden 1 br artmasına kar ılık, ba ımlı de i kende meydana gelen ortalama de i im konusunda bilgi veren katsayıya denir. Bu katsayının tanım aralı ı (≠Œ, +Œ) olarak belirlenmi tir. Kalitatif Özellik (Qualitative=Discontinous=Discrete=Grouped Characteristic) : Tanımlı oldu u bir sayı do rusunda sadece tam sayı noktalarında sınırlı sayıda de er alabilen de i kenlerdir. Örn: Cinsiyet (erkek ve kız), Kan grubu (A, B, AB, ve O), Göz rengi (Siyah, Kahverengi, Ela ve Ye il) vb. Kantitatif Özellik (Quantitative=Continous=Measurable Characteristic) : Tanımlı oldu u bir sayı do rusunda hemen hemen her noktada ya da sonsuz sayıda de er alabilen de i kenlerdir. Bu de i kenler ölçülebilen ve tartılabilen de i kenlerdir. Örn: boy, kilo, süt verimi vb. Sıralı De i ken (Ordinal variable): Sahip oldu u (sınırlı sayıdaki) kategorilerin seviyeleri arasında önem düzeyi açısından farklılık yani hiyerar i olan de i kenlerdir. Kategorileri temsil eden rakam ya da semboller birbirlerine olan üstünlü ü ya da önem derecesini ifade etmektedir. 3 Örn: Likert tipi ölçekler (Hiç, Az, Orta Çok, En çok), E itim düzeyi ( lkokul (1), Ortaokul (2), Lise (3), Üniversite (4)), Yumurta kalitesi (az, orta, çok) vb. Hiç Az Orta Çok En Çok 1 2 3 4 5 Deneme Hatası (Experimental error): Aynı muameleye maruz bırakılan deney üniteleri arasındaki (grup içi) farklılı a denir. Tekerrür (Replicate=Replication): Aynı muameleye maruz bırakılan deney ünitesi adedine denir. Hipotez (Hypothesis): iddialara denir. ncelenen populasyonların parametrelerine ili kin ileri sürülen Paralel (Parallel): Ölçüm do rulu unu artırmak amacıyla aynı deney ünitesinden alınan birden fazla ölçüme denir. Blok (Block): Deneme materyalini olu turan alt gruplara denir. Her alt grubun kendi içinde homojen oldu u varsayılır. Örn: Hayvanların ya grupları (2, 3, 4 ve 5), a açların ya grupları (genç, orta ve ya lı), bir tarla denemesinde kullanılan farklı yapıdaki araziler (Killi, Tınlı ve Killi-Tınlı) birer blok olarak dü ünülebilir. statistik (Statistics): Bir özellik bakımından bir örnekte bulunan bireylerin sahip oldu u ölçüm de erlerinden hesaplanan de ere denir. Örnekten hesaplanan de erlerin hepsi birer istatistik olup, örnekten örne e farklılık göstermektedir. Bir istatistik, popülasyonun bir nokta tahminidir. simsel De i ken (Nominal variable): Sahip oldu u (sınırlı sayıdaki) kategorilerin seviyeleri arasında önem düzeyi açısından farklılık olmayan de i kenlerdir. Örn: Cinsiyet (Erkek, Kız), Kan grubu (A, B, AB, O) vb. Faktör (Factor): Üzerinde durulan ba ımlı de i keni etkileyebilen ve en az iki seviyesi olan kesikli de i kene denir. Kovaryet (Covariate): Üzerinde durulan ba ımlı de i keni etkileyebilen sürekli de i kene denir. Deneme hatasının azaltılması bakımından kovaryet alınması önerilir. 4 2 Sorular 2.1 2.1.1 A ırlı ı 900-925 gr arasında de i en konserve kutularının C vitamini ortalaması µ = 60gr ve standart sapması ‡ = 4 oldu u bilinmektedir. Buna göre; C vitamininin 70 gr’dan az olma ihtimali nedir? 0.100 y 0.075 A 0.050 B 0.025 0.000 50 55 60 65 70 x Yukarıdaki normal da ılım e risinden istenilen alanın A+B oldu u görülmektedir. Da ılım e risinin altında kalan alanın yarısının (B alanı) % 50 oldu u görülmektedir. A alanını bulabilmek için X=70’e kar ılık gelen z de erinin bulunması gerekir. Unutulmamalıdır ki S.N.D. tablosu merkez ile herhangi bir nokta arasında kalan e ri alanını vermektedir. z= X ≠µ ‡ (1) Formül (1) yardımıyla z = 70≠60 = 2.5 hesap edilir. z = 2.5 için S.N.D. tablosundaki de er 4 A = 0.4938 yani %49.38 alanını verir. Cevap: A + B = 0.4939 + 0.50 = 0.99.38 = %99.38 Uzun R çözümü a ıda verilmi tir: 5 x <- 70 # istenilen üst sınır m <- 60 # ortalama std <- 4 # standart sapma z <- (x-m)/std # z skoru = 2.5 z ## [1] 2.5 a <- pnorm(q=z) # z-skoruna göre toplam alan a ## [1] 0.9937903 # veya kısaca a a ıdaki ekilde tek komutlada hesaplanabilir. pnorm(q = 70, mean = 60, sd = 4) ## [1] 0.9937903 • pnorm komutu verilen de erlere göre da ılım e risi altında kalan alanı hesaplar. q argümanına alanı hesaplanması istenilen örneklem de er girilir (70). Populasyonun ortalaması mean argümanına yazılır (60). Son olarak da populasyonun standart sapması sd argümanına yazılarak komut çalı tırılır. Bu komuta sadece q de eri girilirse, komut girilen de eri z skoru olarak algılar ve normal da ılım üzerinden hesaplama yapar. 6 2.1.2 C vitamininin 40 ile 80 gr arasında olma ihtimali nedir? 0.100 y 0.075 A 0.050 B 0.025 0.000 50 60 70 80 x Formül (1)’dan yaralanılarak z1 = X≠µ ‡ = 40≠60 4 z1 = ≠5’e kar ılık gelen alan S1 = %50 z2 = X≠µ ‡ = 80≠60 4 = ≠5 de eri hesaplanır. =5 z2 = 5’e kar ılık gelen alan S2 = %50 S1 + S2 = %50 + %50 = %100 Aslında z Ø 3.9 ise alan direk %50 alınabilir. R çözümü diff(pnorm(q = c(40,80) ,mean = 60,sd=4)) ## [1] 0.9999994 • diff() fonksiyonu iki de er arasındaki farkı almaktadır. • pnorm() fonksiyonu normal da ılım için q argümanında verilen de er veya de erlerin alanını hesaplamaktadır. mean argümanına ortalama yazılırken, sd argumanına populasyonun standart sapması yazılmalıdır. E er mean ve sd argumanları girilmez ise q de erine z skorları verilerek hesaplama yapılabilir. 7 2.1.3 C vitamini bakımından en yüksek % 5’lik gruptaki en dü ük içerik kaç gr’dır? 0.4 0.3 y C=%5 A=%50 0.2 B=%45 0.1 0.0 1.654 −2 0 2 x %95’in z-skoru tablodan 1.645 olarak bulunur. Yine Formül (1)’dan yaralanılır. z = 1.645 = x≠60 4 x = 60 + (1.645 ◊ 4) = 66.58 R çözümü: qnorm(p = .95,mean = 60,sd = 4) ## [1] 66.57941 • qnorm komutu p argumanında verilen alana, mean argumanındaki ortalama ve sd argümanındaki standart sapmaya göre en dü ük noktanın de erini hesaplar. 2.2 A a ıdaki X basit seri için ortalama, standart sapma, tepe de eri, varyans, kareler toplamı, geometrik ortalama, regresyon, korelasyon, ortanca de er ve varyasyon katsayısını hesaplayınız. 5 6 7 7 8 8 7 Tepe de eri: 7 (Bir seride en fazla tekrarlanan de er) Ortalama (X̄): X̄ = X̄ = 5+6+7+7+8+7 6 q Xi n (2) = 6.667 Kareler Toplamı (SS): SS = n ÿ i=1 (Xi ≠ X̄)2 (3) SS = (5≠6.667)2 +(6≠6.667)2 +(7≠6.667)2 +(7≠6.667)2 +(8≠6.667)2 +(7≠6.667)2 = 5.3333 Standart Sapma (S): S= S= Ò 5.3333 6≠1 = 1.0328 ı̂ ÿ ı n ı (Xi ı Ù i=1 ≠ X̄)2 n≠1 = Û SS n≠1 (4) Varyans(S 2 ): S2 = n ÿ i=1 (Xi ≠ X̄)2 n≠1 = SS n≠1 (5) S 2 = 1.03282 = 1.0667 Ortanca de er (Median) bir seriyi olu turan gözlem de erleri küçükten büyü e sıralandı ında veri setini iki e it parçaya bölen de ere denir. veri sira 5 1 6 2 7 3 7 4 7 5 8 6 Medyanın bulundu u nokta n+1 ile bulunur. 6+1 = 3.5 de eri 3 ile 4 tam de erleri arasındadır. 2 2 Ortanca de er 3. ve 4. Sıradaki gözlem de erinin ortalamasına e ittir. OD = 7+7 = 7 2 Çalı ılan bir veri setinde çok yüksek ya da dü ük (outlier) gözlemlerin olması durumunda, zamana ba lı de i kenlerin olması durumunda (tavuklarda cinsi olgunluk ya ı, bebeklerde di çıkarma ya ı vb.), aritmetik ortalama yerine ortanca de erinin kullanılması önerilir. Varyans Katsayısı (CV ): CV = S ◊ 100 X̄ 9 (6) CV = 1.0328 6.66667 = 15.49 Geometrik Ortalama (GM ): GM = ( GM = Ô 6 n Ÿ 1 )n (7) i=1 5 ◊ 6 ◊ 7 ◊ 7 ◊ 8 ◊ 7 = 6.596 Tek seri için regresyon ve korelasyon hesaplanamaz R çözümü: a <- c(5,6,7,7,8,7) # veriler için a vektörü olu turuldu max(a) # tepe noktası ## [1] 8 mean(a) # ortalama ## [1] 6.666667 sum((a-mean(a))ˆ2) #kareler toplamı ## [1] 5.333333 sd(a) #standart sapma ## [1] 1.032796 var(a) #varyans ## [1] 1.066667 median(a) #medyan ## [1] 7 sd(a)/mean(a)*100 #varyans katsayısı ## [1] 15.49193 prod(a)ˆ(1/6) # geometrik ortalama ## [1] 6.595548 ######## Toplu hesaplama DescTools::Desc(a,plotit=FALSE) ## -----------------------------------------------------------------------------## a (numeric) ## ## length n NAs unique 0s mean meanCI 10 ## ## ## ## ## ## ## ## ## ## ## ## ## ## ## ## ## 1 2 3 4 6 6 100.0% 0 0.0% 4 0 0.0% 6.67 5.58 7.75 .05 5.25 .10 5.50 .25 6.25 median 7.00 .75 7.00 .90 7.50 .95 7.75 range 3.00 sd 1.03 vcoef 0.15 mad 0.74 IQR 0.75 skew -0.37 kurt -1.37 level 5 6 7 8 freq 1 1 3 1 perc 16.7% 16.7% 50.0% 16.7% cumfreq 1 2 5 6 cumperc 16.7% 33.3% 83.3% 100.0% heap(?): remarkable frequency (50.0%) for the mode(s) (= 7) length: veriseti boyutu, n: veri satısı, NAs: Eksik veri sayısı, unique: farklı de er sayısı, mean: ortalama, meanCI: Ortalama Güven Aralı ı, .05 - 0.95: Dilim ortalamaları, median: medyan(ortanca), range: aralık, sd: standart sapma, vcoef: varyans katsaıyısı, mad: ortalama mutlak sapma, IQR: çeyrekler arası aralık, skew: çarpıklık,kurt: basıklık 2.3 X kesikli rassal de i kenine ili kin bilgiler a a ıda özetlenmi tir. X Px 2.3.1 0.0 0.3 1.0 0.2 2.0 0.4 3.0 0.1 Buna göre, bu rassal de i kene ait ortalama, varyans ve standart sapma de erlerini bulunuz. Ortalama(µ): µ= n ÿ (Xi .P (Xi )) (8) i=1 µ = (0 ◊ 0.3) + (1 ◊ 0.2) + (2 ◊ 0.4) + (3 ◊ 0.1) = 1.30 Varyans (‡ 2 ): ‡2 = n ÿ i=1 (Xi2 .P (Xi )) ≠ µ2 ‡ 2 = (02 ◊ 0.3) + (12 ◊ 0.2) + (22 ◊ 0.4) + (32 ◊ 0.1) ≠ 1.302 = 1.01 11 (9) Standart sapma (‡): ‡= ı̂ n ıÿ Ù (X 2 .P (X i )) i i=1 ‡= Ô ≠ µ2 = Ô ‡2 (10) 1.01 = 1.005 R Çözümü a <- data.frame(X=0:3,Px=c(.3,.2,.4,.1)) #veriler olu turuldu m <- sum(a$X * a$Px) # ortalama m ## [1] 1.3 v <- sum(a$Xˆ2 * a$Px) - mˆ2 # varyans v ## [1] 1.01 s <- sqrt(v) # standart sapma s ## [1] 1.004988 2.3.2 P(0), P (X < 3), P(1) de erlerini bulunuz. P (0) = 0.30 P (X < 3) = 1 ≠ 0.10 = 0.90 P (1) = 0.20 R Çözümü: subset(a,subset = X==0)$Px # P(0) ## [1] 0.3 sum(subset(a,subset = X<3)$Px) #P(X<3) ## [1] 0.9 subset(a,subset = X==1)$Px #$P(1) ## [1] 0.2 2.4 Bir populasyondaki insanların = 0.6’sının sigara içti i bilinmektedir. Rastgele seçilen 8 ki iden; = 0.6 (Sigara içme oranı) 12 1≠ = 0.4 (Sigara içmeme oranı) n=8 P (x) = n! x!(n ≠ x)! x (1 ≠ )n≠x (11) P (1) + P (2) + P (3) + P (4) + P (5) + P (6) + P (7) + P (8) = 1 µ = n. : Binom da ılımın ortalaması ‡ 2 = n. .(1 ≠ ) : Binom sa ılımının varyansı 2.4.1 kisinin (x = 2) sigara içme olası ı nedir? Formul (11) yardımıyla P (x) = 8! 0.62 0.42 2!(8≠2)! = 0.04123 sonucu bulunur. R Çözümü: dbinom(x = 2, size = 8, prob = 0.60) ## [1] 0.04128768 • dbinom komutu verilen de erlere göre seçilme olasılı ını hesaplar. x argümanı istenilen örneklem sayısı, size populasyon büyüklü ü, prob ise seçim olasılı ı ifade etmektedir. 2.4.2 En fazla ikisinin sigara içme olasılı ı nedir? 8!) P (x Æ 2) = P (0) + P (1) + P (2) = 0!(8≠0)! + 0.00786432 + 0.04128768 = 0.04980736 8!) 1!(8≠1)! + 8!) 2!(8≠2)! P (x Æ 2) = 0.00065536 + R Çözümü: sum(dbinom(x=0:2,size = 8,prob = 0.60)) ## [1] 0.04980736 • dbinom komutunda x argümanına birden fazla de er verilebilir. x = 0 : 2 diyerek 0, 1, 2 de erleri için ayrı ayrı hesaplama yapılması istemi olduk. Bu i lemin sonucunda; 0.00065536, 0.00786432, 0.04128768 eklinde üç de eri olan bir vektör elde ederiz. • sum komutu toplama için kullanılır ve dbinom komutundan dönen vektörün de elerini toplar. 2.5 3000 ki ilik bir köyde 126 ya ına kadar ya ama olasılı ı p=0.002 oldu una göre; Bilindi i üzere 126 ya ına kadar ya ama durumu Nadir olaylardan biridir. Nadir olayların da ılımı Poisson Da ılımının ortalaması varyansına e ittir. 13 P (X) = ‡ 2 = n. µX ≠µ e X! (12) = µ = 0.002 ◊ 3000 = 6 P (0) + P (1) + P (3) + ... + P (2999) + P (3000) = 1 2.5.1 Bir ki inin 126 ya ına kadar ya ama olasılı ı nedir? Formul (12) den yararlanarak P (X) = 61 ≠6 e 1! = 0.01487251 de eri hesap edilir. R çözümü: dpois(x = 1,lambda = 6) ## [1] 0.01487251 • dpois, possion olası ını hesaplayan komuttur. x argümanına rastlanılan olay sayısı yazılır. lambda argümanına ortalama yazılır ve olasılık hesaplatılır. 2.5.2 En fazla 4 ki inin 126 ya ına kadar ya ama olasılı ı nedir? P (X Æ 4) = P (0) + P (1) + P (2) + P (3) + P (4) = 0.2850565 60 ≠6 e 0! + 61 ≠6 e 1! + 62 ≠6 e 2! + 63 ≠6 e 3! + 64 ≠6 e 4! = R Çözümü: sum(dpois(x=0:4,lambda = 6)) ## [1] 0.2850565 • dpois komutunda da dbinom komutunda oldu u gibi x argümanına birden fazla de er verilebilir. x = 0 : 4 diyerek 0, 1, 2, 3, 4 de erleri için ayrı ayrı hesaplama yapılması istemi olduk. Bu i lemin sonucunda; 0.002478752, 0.014872513, 0.044617539, 0.089235078, 0.133852618 eklinde be de eri olan bir vektör elde ederiz. • sum komutu toplama için kullanılır ve dpois komutundan dönen vektörün de elerini toplar. 2.5.3 En az 5 ki inin 126 ya ına kadar ya ama olasılı ı nedir? stenilen olasılık; C = P (X Ø 5) = P (5) + P (6) + P (7) + ... + P (2999) + P (3000) ve P (X < 5) + C = 1 oldu una göre C = 1 ≠ P (X < 5) olarak hesaplanabilir. C = 1 ≠ P (X > 5) = 1 ≠ P (0) + P (1) + P (2) + P (3) + P (4) = 1 ≠ 4 63 ≠6 e + 64! e≠6 = 0.71494355 3! R Çözümü: 14 60 ≠6 e 0! + 61 ≠6 e 1! + 62 ≠6 e 2! + 1-sum(dpois(x=0:4,lambda = 6)) #1. Yöntem ## [1] 0.7149435 sum(dpois(5:3000,lambda = 6)) #2. Yöntem ## [1] 0.7149435 2.6 Bir hastalı a yakalanan insanların ortalama iyile me oranının 0,30 oldu u rapor edilmi tir. Söz konusu hastalı a yakalanan insanların iyile me oranını arttırmak amacıyla geli tirilen yeni bir antibiyotik, hastanedeki 1000 hastaya uygulanmı , hastaların 3/5’inin iyile ti i görülmü tür. 2.6.1 Yeni antibiyoti in, hastalar üzerinde etkili oldu unu söyleyebilir misiniz? (kritik de er:0.05) Hipotez takımı: H0 : = 0.30 H1 : > 0.30 p≠ z=Ò .(1≠ ) n Kurulan hipotez tek taraflı hipotezdir. (13) Formul (13) formülü yardımıyla test z de eri hesaplanır: Zhesap = Ò 0.6≠0.3 0.3◊(1≠0.3) 1000 = 20.70 R Çözümü: prop.test(x = 600,n = 1000,p = 0.3,alternative = "greater",correct = FALSE) ## ## ## ## ## ## ## ## ## ## ## 1-sample proportions test without continuity correction data: 600 out of 1000, null probability 0.3 X-squared = 428.57, df = 1, p-value < 2.2e-16 alternative hypothesis: true p is greater than 0.3 95 percent confidence interval: 0.5742812 1.0000000 sample estimates: p 0.6 15 • ncelenen 1000 hastanın 3/5’i yani 600’ü kullanılan yeni antibiyoti in etkisiyle iyile mi , geri kalan 400’ü iyile memi tir. Bu nedenle, n argümanına incelemeye alınan yani örne e alınan toplam hasta sayısı (1000) yazılır. x argümanına ise iyile en hastaların sayısı (600) yazılır. Daha sonra popülasyon iyile me oranı olan = 0.30 oranı p argümanına girilir. Alternatif Hipotezimizden (H1 ) dolayı alternative argümanına “greater” yazılır. E er devam düzeltmesi yapılacaksa correct argümanına TRUE, yapılmayacaksa FALSE kodlanarak komut çalı tırılır. • Analiz sonucu elde edilen X 2 = 428.57 de eri z = 20.70193 de erinin karesidir. Teste ili kin olasılık (p-value) de eri p < 0.05 oldu undan dolayı H0 hipotezi “RED” edilir. Dolayısıyla, hastalara uygulanan yeni antibiyoti in hastalar üzerinde etkili oldu u yani iyile me oranını arttırdı ı söylenebilir. 2.7 Bir hastalı a yakalanan insanların ortalama iyile me süresinin 80 gün, standart sapmasının 10 oldu u bildirilmi tir. Bu hastalı a yakalanan insanların iyile me sürelerini kısaltmak amacıyla geli tirilen yeni bir ilaç, rastgele seçilen 64 hastaya uygulanmı , ortalama iyile me süresinin 75 gün oldu u kaydedilmi tir. “Yeni geli tirilen bu ilacın, iyile me süresinde herhangi de i iklik yapıp yapmama durumunu test ediniz. Hipotez takımı: H0 : µ = 80 H1 : µ ”= 80 Kurulan hipotez çift taraflı hipotezdir. z= X̄ ≠ µ Ô‡ n (14) Formul (14) yardımıyla z de eri hesaplanır: Zhesap = 75≠80 Ô10 64 = ≠4 R Çözümü: z.test = function(x,n,mu,std){ z.score <- (x-mu)/(std/sqrt(n)) # z skoru hesalandı one.tail.p <- pnorm(abs(z.score),lower.tail = FALSE) # z skoruna göre p de eri hesapl cat(" z =",z.score,"\n", "one-tailed probability =", one.tail.p,"\n", "two-tailed probability =", 2*one.tail.p ) # sonuçlar yazdırıldı } z.test(x = 75,n=64,mu = 80,std = 10) 16 ## ## ## z = -4 one-tailed probability = 3.167124e-05 two-tailed probability = 6.334248e-05 ## a adaki komut ile daha kolayca hesaplanabilir. BSDA::zsum.test(mean.x = 75, #örneklem ortalaması sigma.x = 10, #örneklem standart sapması n.x = 64, # örneklemdeki gözlem sayısı alternative = "two.sided", #çift yönlü test mu =80 ) # populasyon ortalaması ## ## ## ## ## ## ## ## ## ## ## One-sample z-Test data: Summarized x z = -4, p-value = 6.334e-05 alternative hypothesis: true mean is not equal to 80 95 percent confidence interval: 72.55005 77.44995 sample estimates: mean of x 75 R için yeni bir fonksiyon yapılarak hesaplama yapılmı tır: • Fonksiyona x(örneklem ortalaması),n(örneklem sayısı),mu(populasyon ortalaması),std(populasyon standart sapması) argümanları girilerek i lem yapılmaktadır. Hazırlanan fonksiyona çalı ılan örne e ili kin örnek geni li i (n = 64), örneklem ortalması (X̄ = x = 75), populasyona ait standart sapma de eri (‡ = std = 10), popülasyona ait ortalama de eri (µ = mu = 80) de erleri girilerek çalı tırılmı tır. • Teste ait olasılık de eri p < 0.05 oldu u için H0 hipotezi RED edilir. Sonuç olarak, yeni geli tirilen ilacın iyile me süresi üzerinde de i ikli e neden oldu u söylenebilir. • BSDA paketindeki zsum.test komutu ile kolayca hesaplanabilir. 2.8 X rassal de i keninin ortalaması 60, varyansı 64 olmak üzere normal da ılım göstermektedir. P (60 < X < U ) = 0.400 oldu una göre “U” kaçtır. Populayona ili kin varyans de eri ‡ 2 = 64 ise standart sapma de eri buradan ‡ = 8 bulunur. Standart normal da ılım tablosundan P (60< X<U)=0.400 alan de erine kar ılık gelen z de erinin z = +1.28 oldu u görülmektedir. A a ıdaki formülde X yerine U denilirse; z= U ≠µ ‡ = U ≠60 8 = 1.28 U = 60 + (1.28 ◊ 8) = 60 + 10.24 = 70.24 17 R Çözümü: U <- 60+(1.28*8) U ## [1] 70.24 • Yukarıda görüldüü üzere R hesap makinesi olarakda kullanılabilmektedir. 2.9 X poisson da ılmı bir de i ken oldu una göre P (6) = 0.1220, e≠µ = 0.00033 , n = 10000 ise olasılı ını hesaplayınız. Fornul (12) yardımıyla olasılık de eri hesaplanır: P (X) = µX ≠µ e X! µ = n. ; = = P (6) = 8.02 10000 µ6 6! ◊ 0.00033 = 0.1220 = 0.000802 mu <- (.1220/0.00033*factorial(6))ˆ(1/6) mu ## [1] 8.020407 p <- mu / 10000 p ## [1] 0.0008020407 2.10 A a ıdaki bo lukları doldurunuz. a) statistikte varsayım gerektiren testlere PARAMETR K testler VARSAYIM gerektirmeyen testlere ise NON-PARAMETR K testler adı verilir. b) statistikte amaç, eldeki verilerin TEOR K da ılımlara uygunlu unu ara tırmaktır. c) X ve Y gibi iki de i kenin VARYANSLARININ e it olması sonucunda KORELASYON ve REGRESYON katsayıları e it olur. d) Ortalaması SIFIR ve varyansı B R olan da ılıma STANDART NORMAL DA ILIM denir. e) Tanımlanan bir populasyondan n hacimli olu turulabilecek mümkün bütün örnekler için hesaplanan ortalamalara (istatistiklere) ait da ılıma ORTALAMALARA A T ÖRNEKLEME DA ILIMI denir. f) Bir örne e ait gözlem de erleri için hesaplanan karakteristik de erlere STAT ST K denir. g) B NOM ve POISSON da ılımları KES KL da ılıma örnek olu tururken, K -KARE ve T da ılımları da ılımları ise SÜREKL da ılıma örnek olu turur. h) DO RU olan bir H0 hipotezinin RED edilme olasılı ı I. T P HATA olarak adlandırılır. YANLI bir H0 hipotezinin KABUL edilme olasılı ı II. T P HATA olarak adlandırılır. RED edilmesi gereken bir Ho hipotezinin RED edilme olasılı ına TEST N GÜCÜ denir. 18 i) VARYANSI 100 olan bir serinin tüm gözlem de erleri 3 ile çarpılmı tır. Buna göre yeni serinin standart sapması 30 e it olur. j) Ortalaması ve VARYANSI birbirine e it olan da ılıma POISSON da ılımı denir. k) X, p=0.4 olmak üzere binom da ılmı bir rassal de i ken olsun. X’in varyansı 2.4 ise ortalaması 4 olarak bulunur. l) Z de eri 3.9 dan BÜYÜK olunca standart normal da ılımda olasılık de eri %50’e yakla ır. l) X ortalaması 4, varyansı 16 olan normal da ılım gösteren bir rassal de i ken olsun. Buna göre P (X<3) olma olasılı ı %40.13 olarak hesaplanır. m) 22 birey üzerinde yürütülen bir çalı mada, X ve Y sürekli de i kenleri arasında rxy=0.20 pozitif bir korelasyon bulunmu tur. Bu korelasyon katsayısının istatistiksel olarak önemlili ini test ediniz. n) REGRESYON ve KORELASYON katsayılarının önem kontrolünde T TEST kullanılır. o) Standart normal da ılımın µ ± 2‡ aralı ındaki alanın % 95 olarak hesaplanır. p) ki KATEGOR K de i ken arasındaki ili ki K -KARE ile test edilebilir. q) ki SÜREKL de i ken arasındaki DO RUSAL ili ki KORELASYON ANAL Z ile belirlenir. r) K yönlü ÇAPRAZ tablolarda, gözlem sayısının N<20 olması durumunda, K -KARE yerine FISHER EXACT testi kullanılır. s) Mc Nemar ve Fisher Exact test istatistikleri sadece 2 x 2 boyutlu tablolarda kullanılır ve serbestlik derecesi B R dir. t) POISSON da ılımının varyansı µ = n ◊ olarak hesaplanır. 2.11 Bir yerle im merkezinde sigara içme oranının 0.30 oldu u bilinmektedir. Sigara kullanımı azaltmak amacıyla tedaviye ba vuran 500 hastadan, 356’sının sigarayı bıraktı ı gözlendi ine göre, “uygulanan tedavi yönteminin sigarayı bırakmada etkili olmu tur” görü üne katılır mısınız? Hipotez takımı: H0 : = 0.30 H1 : <0 Kurulan hipotez tek taraflı hipotezdir. Tek taraflı z kritik de eri= 1.645 olarak alınır. Sigara içenler 144 Sigara içmeyenler 356 Toplam birey sayısı 500 Sigara içme oranı p= Formul (13) yardımıyla z de eri hesaplanır: 19 144 500 = 0.288 Zhesap = Ò p≠ .(1≠ ) n = Ò0.288≠0.30 0.30◊(1≠0.30) 500 |z| > zkritik ise H0 hipotezini reddetmek için yeterli kanıt bulunur. Ancak bu soruda | ≠ 0.59| < | ± 1.645| oldu undan H0 hipotezi korunmu olur. Tedavinin sigarayı bırakmada etkili olmadı ı ileri sürülebilir. sigara_icenler <- 500-356 prop.test(x = sigara_icenler, #sigara_icenler de i kenin de eri 144 n = 500, p = 0.3, alternative = "less", correct = FALSE) ## ## ## ## ## ## ## ## ## ## ## 1-sample proportions test without continuity correction data: sigara_icenler out of 500, null probability 0.3 X-squared = 0.34286, df = 1, p-value = 0.2791 alternative hypothesis: true p is less than 0.3 95 percent confidence interval: 0.0000000 0.3223811 sample estimates: p 0.288 • ncelenen 500 hastadan 356 tanesi iyile mi ancak 144 tanesi sigara içmeye devam etmektedirler. Bu nedenle, n argümanına incelemeye alınan yani örne e alınan toplam hasta sayısı (500) yazılır. x argümanına ise sigara içmeye devam eden hastaların sayısı (144) yazılır. Daha sonra popülasyon sigara kullanma oranı olan = 0.30 oranı p argümanına girilir. Alternatif Hipotezimizden (H1 ) dolayı alternative argümanına “less” yazılır. E er devam düzeltmesi yapılacaksa correct argümanına TRUE, yapılmayacaksa FALSE kodlanarak komut çalı tırılır. • Analiz sonucu elde edilen X 2 = 0.34286 de eri z = 0.5855 de erinin karesidir. Teste ili kin olasılık (p-value) de eri p = 0.28 oldu undan dolayı H0 hipotezi “RED” edilemez. Dolayısıyla, hastalara uygulanan yeni yöntemin hastaların sigara bırakmaları üzerinde etkili olmadı ı söylenebilir. Bu konuyla ilgili yukarıdaki 2.6.1 sorusunu da incelebilirsiniz. 2.12 Bir su fabrikasında üretilen suların 0.5 lt oldu u bilinmektedir. Fabrikanın standartlara uygun üretim yapıp yapmadı ını denetlemek isteyen bir Gıda Mühendisi rasgele 16 adet su i esini tartmı ve bunların ortalamalarının 0.46, standart sapmalarının 0.05 oldu u belirlenmi tir. Fabrikanın standartlara uygun üretim yaptı ını ileri sürebilir misiniz? 20 Veriler Fabrikada üretilen suların ortalaması Örne e alınan su i e sayısı Örne e alınan su i elerinin ortalaması Örne e alınan su i elerinin standart sapması µ = 0.5 lt n = 16 X̄ = 0.46 S = 0.05 Hipotez Takımı: H0 : µ = 0.05 H1 : µ ”= 0.05 Kurulan hipotez çift taraflı hipotezdir. t= Formul (15) ’dan yaralanılarak thesap = X̄ ≠ µ ÔS n 0.46◊0.50 0.05 Ô 16 (15) = ≠3.20 Serbestlik derecesi df = n ≠ 1 = 16 ≠ 1 = 15 olarak hesaplanır. Çift taraflı tablodan t15 = 2.1231 olarak bulunur. |thesap | > t15 ; | ≠ 3.20| > | ± 2.131| oldu undan H0 hipotezi RED edilir ve bu fabrikada standara uygun üretim yapılmadı ı söylenebilir. R Çözümü: t_skor <- function(x,mu,s,n) { return((x-mu)/(s/sqrt(n))) } ts <- t_skor(x=0.46,mu=0.50,s=0.05,n=16) ts ## [1] -3.2 tk<- qt(p = .05/2, # çift taraflı oldu undan 0.05/2=0.25 yazılı df = 15) # serbestlik derecesi tk ## [1] -2.13145 abs(ts)>abs(tk) # do ru oldu undan H0 hipotezi reddedilir ## [1] TRUE ## BSDA paketi kullanarak bir komutla hesaplatıldı BSDA::tsum.test(mean.x = 0.46, # örneklem ortalaması s.x = 0.05, #örneklem standart sapması n.x =16, # örneklemdeki gözlem sayısı 21 mu = 0.50, #populasyon ortalaması alternative = "two.sided") #çift yönlü test ## Warning in BSDA::tsum.test(mean.x = 0.46, s.x = 0.05, n.x = 16, mu = 0.5, : ## argument var.equal ignored for one-sample test. ## ## ## ## ## ## ## ## ## ## ## One-sample t-Test data: Summarized x t = -3.2, df = 15, p-value = 0.005964 alternative hypothesis: true mean is not equal to 0.5 95 percent confidence interval: 0.4333569 0.4866431 sample estimates: mean of x 0.46 • t de erini hesaplamak için basit bir fonksiyon yazıldı. Fonksiyon yazmadan da t de eri hesaplanabilir ancak fonksiyon eklinde hesaplatmanın yararı daha sonra lazım oldu unda aynı fonksiyonla daha kolay hesaplama yapılabilmesidir. • Kritik t de erini hesaplamak için temel komutlardan qt komutu kullanılmı tır. Bu komutta p argümanına – de eri yani 1-güven aralı ı (– = 1 ≠ 0.95 = 0.05) de eri yazılır. Ancak testimiz çift yönlü oldu undan – de eri 2’ye bölünür ve p argümanına 0.025 yazılır. df argümanına ise serbestlik derecesi (df = n ≠ 1) girilerek komut çalı tırılır. • BSDA paketinde bulunan tsum.test komutu yardımıyla da hesaplama yapılabilir. Bu test sonucunda elde edilen p de eri seçilen – de erinden küçük olursa (ör: p < 0.05) H0 hipotezini reddetmek için yeterli kanıt vardır. 2.13 Haftalık bir derginin sayılarında ortalama 5 yazım hatası bulunmaktadır. Bu derginin gelecek yazısında hiç yazım hatası bulunmaması olasılı ı kaçtır? ( pucu= Poisson Da ılımı) ‡ 2 = n. =5 Formul (12) formulü yardımıyla olasılık hesaplanır: P (0) = 50 0! ◊ e≠5 = e≠5 = 0.00674 R Çözümü: dpois(x = 0, #istenilen hata yazıldı lambda = 5) #ortalama hata yazıldı ## [1] 0.006737947 22 2.14 Bir su fabrikasında üretilen suların 0.5 lt, varyansın 0.1 oldu u bilinmektedir. Fabrikanın standartlara uygun üretim yapıp yapmadı ını denetlemek isteyen bir Gıda Mühendisi rasgele 16 adet su i esini tartmı ve elde edilen sonuçları a a ıdaki gibi kaydetmi tir. Fabrikanın standartlardan daha dü ük üretim yaptı ını ileri sürebilir misiniz? 0.39 0.46 0.49 0.47 0.39 0.38 0.45 0.40 0.45 0.50 0.46 0.49 0.48 0.41 0.42 0.50 Verler Fabrika ortalaması µ = 0.5 Fabrika varyansı ‡ 2 = 0.01 Fabrika standart sapması ‡ = 0.316 Hipotez takımı: H0 : µ = 0.5 H1 : µ < 0.5 Tek taraflı hipotez X̄ = 0.39+0.46+...+0.42+0.50 16 = 0.4463 Formul (1) yardımıyla z de eri bulunur: zhesap = 0.4463≠0.50 0.316 Ô 16 = | ≠ 0.68| < |zkritik = ±1.645| H0 hipotezi kabul edilir. R Çözümü: agirlik <- c(0.39,0.46,0.49,0.47,0.39,0.38,0.45,0.40,0.45,0.50,0.46,0.49,0.48,0.41,0.42, ortalama <- mean(agirlik) Fabrika_standart_sapma <- sqrt(0.1) BSDA::zsum.test(mean.x = ortalama, #orneklem ortalaması sigma.x = Fabrika_standart_sapma, #standart sapma n.x = 16, #gözlem sayısı mu = 0.50, #populasyon ortalaması alternative = "less") # tek taraflı test ## ## ## One-sample z-Test 23 ## ## ## ## ## ## ## ## data: Summarized x z = -0.67989, p-value = 0.2483 alternative hypothesis: true mean is less than 0.5 95 percent confidence interval: NA 0.5762871 sample estimates: mean of x 0.44625 Sonuç olarak, p = 0.248 oldu undan “H0 hipotezi KABUL” edilir. Buna göre bu fabrikada standartlara uygun bir üretimin yapıldı ı ileri sürülebilir. 2.15 Antrenman yöntemine göre performans sonuçları a a ıdaki iki yönlü tabloda özetlenmi tir. Performans sonuc Antrenman yöntemi AY1 AY2 AY3 Sütun Toplam 2.15.1 yi 20 30 50 100 Kötü Satır Toplam 60 20 80 160 80 50 130 260 Performans sonuçları antrenman yöntemine göre de i mekte midir? H0 : Performans sonuçları antrenman yöntemine göre DE MEMEKTED R. (Performans sonuçları ile antrenman yöntemleri arasında (ÖNEML ) L K YOKTUR) H1 : Performans sonuçları antrenman yöntemine göre DE MEKTED R. (Performans sonuçları ile antrenman yöntemleri arasında (ÖNEML ) L K VARDIR) ‰2 = (Oi ≠ Ei )2 Ei i=1 k ÿ (16) SD = (SAT IR.SAY ISI˘1) ◊ (SU T U N.SAY ISI˘1) = (3 ≠ 1) ◊ (2 ≠ 1) = 2 BeklenenF rekans = planır. SatirT oplamß◊SutunT oplam GenelT oplam Antrenman yöntemi AY1 AY2 AY3 formülü yardımıyla beklenen frekanslar hesa- yi B1 = B1 = B1 = Kötü 80◊100 = 30.77 260 50◊100 = 19.23 260 130◊100 = 50.0 260 24 B2 = B2 = B2 = 80◊160 = 49.23 260 50◊160 = 30.77 260 130◊160 = 80 260 Formul (16) yardımıyla ‰2 katsayısı hesaplanır: ‰2hesap = (20≠30.77)2 30.77 + (60≠49.23)2 49.23 + (30≠19.23)2 19.23 + (20≠30.77)2 30.77 + (50≠50)2 50 + (80≠80)2 80 = 15.925 ‰2hesap > ‰2kritik ; 15.925 > 5.991 oldu undan “H0 hipotezi RED”" edilir. R Çözümü: #oncelikle de erler matriks eklinde olu turuldu. o <- matrix(c(20,60,30,20,50,80), #de erler satır sırasıyla yazıldı. nrow = 3,#3 satır olaca ı belirtildi. byrow=TRUE) #satır sırasıyla veri giri i yapıldı ı belirtildi. colnames(o) <- c("iyi","kotu") #sütün isimleri sırasıyla yazıldı. rownames(o) <- c("AY1","AY2","AY3") #satır isimleri sırasıyla yazıldı. o <- as.table(o) # matriks tabloya dönü türüldü print(o) # matriksin gorunumu ## iyi kotu ## AY1 20 60 ## AY2 30 20 ## AY3 50 80 chisq.test(o) # kikare testi ## ## Pearson s Chi-squared test ## ## data: o ## X-squared = 15.925, df = 2, p-value = 0.0003483 • R’da ba ımsızlık ki-kare testi chisq.test komutu yardımıyla yapılabilmektedir. Ancak veriler tablo eklinde verilmelidir. Bu sebeple ilk önce tablonun olu turlmasına ba lanır. Tablo yukarıdaki ekilde olu turulduktan sonra komut içinde yazılarak test gerçekle tirilir. Yorumlanması: Analize ili kin P de eri=0.0003483 (P < 0.05) oldu u için “Performans sonuçları antrenman yöntemine göre DE MEKTED R” ya da “Performans sonuçları ile antrenman yöntemleri arasında (ÖNEML ) L K VARDIR” denilebilir. 2.16 Bir dersten e itim alan ö rencilerin e itim öncesi ve sonrası ba arı durumları a a ıdaki iki yönlü tabloda sunulmu tur. E itim Öncesi E itim Sonrası Ba arılı + Ba arısız Ba arılı + 50 a 60 b 25 E itim Öncesi Ba arısız 2.16.1 10 c 10 d “Verilen e itim ö rencilerin dersin ba arısını arttırmı tır” görü üne katılır mısınız? H0 : “Verilen e itim ö rencilerin dersin ba arısını ARTTIRMAMI TIR” H1 : “Verilen e itim ö rencilerin dersin ba arısını ARTTIRMI TIR” ‰2M CN EM AR = (b≠c)2 b+c = (60≠10)2 60+10 = 2500 70 = 35.714 Ø ‰2kritik = 3.841 oldu undan “H0 hipotezi RED” edilmi tir. Yani H1 hipotezi kabul edilir. Sonuç olarak, “verilen e itim ö rencilerin dersin ba arısını arttırmı tır”yorumu yapılabilir. 2.16.2 Yukarıdaki tablo için en uygun test istatisti i ne olmalıdır? Cevap: MC NEMAR TEST 2.17 X ve Y gibi iki özellik için elde edilen sonuçlar a a ıda özetlenmi tir. Buna göre korelasyon (rxy ) ve regresyon (byx ) katsayılarını hesaplayınız. X Y 2 5 7 9 6 8 12 14 Korelasyon Analizi q rxy = Òq (Xi ≠ X̄)(Yi ≠ Ȳ ) (Xi ≠ X̄)2 q (Yi ≠ Ȳ )2 (17) Formul (17) yardımıyla korelasyon katsayısı hesaplanır: X̄ = 5.75 Ȳ = 10 q (Xi ≠ X̄)(Yi ≠ Ȳ ) = (2 ≠ 5.75)(6 ≠ 10) + (6 ≠ 5.75)(8 ≠ 10) + (7 ≠ 5.75)(12 ≠ 10) + (9 ≠ 5.75)(14 ≠ 10) = 32.12 q (Xi ≠ X̄)2 = (2 ≠ 5.75)2 + (5 ≠ 5.75)2 + (7 ≠ 5.75)2 + (9 ≠ 5.75)2 = 26.76 26 q (Yi ≠ Ȳ )2 = (6 ≠ 10)2 + (8 ≠ 10)2 + (12 ≠ 10)2 + (14 ≠ 10)2 = 39.99 rxy = Ô 32.12 26.76◊39.99 = 0.9783 R Çözümü: x<- c(2,5,7,9) #x de erleri vektör oalak girildi y <-c(6,8,12,14) #y de erleri vektör oalak girildi cor(x,y) #korelasyon hesaplandı ## [1] 0.9782685 YORUM: X ve Y özelliklerine arasındaki 0.978’lik pozitif korelasyon önemli bulunmu tur. Regresyon Analizi bY X = q (Xi ≠ X̄)(Yi ≠ Ȳ ) q (Xi ≠ X̄)2 (18) Formul (18) yardımıyla reresyon katsayısı hesaplanır: bY X = 32.112 26.76 = 1.2 R Çözümü: 0.0 −0.5 −1.0 Pearson residuals 0.5 df <- data.frame(x=x,y=y) # veriler data.frame formatına dönü türüldü fit <- lm(y~x, # ~ i aretinin solu ba ımlı, sa ı ba ımsız de i kenleri ifade eder. data=df) # analiz yapılacak veriseti yazıldı. car::residualPlot(fit) #hata terimleri grafi i çizdirildi 6 8 10 Fitted values 27 12 14 #car paketi yüklü de ilse install.packages("car") komutyula yüklenmelidir. Hata terimlerinin +2 ile -2 sınırından daha dar bir sınırda da ıldı ı yukarıdaki grafikten görülmektedir. Hataların homojen da ıldı ı kabaca söylenebilir. summary(fit) ## ## ## ## ## ## ## ## ## ## ## ## ## ## ## ## ## ## Call: lm(formula = y ~ x, data = df) Residuals: 1 2 0.4860 -1.1028 3 0.5047 4 0.1121 Coefficients: Estimate Std. Error t value Pr(>|t|) (Intercept) 3.1215 1.1303 2.762 0.1099 x 1.1963 0.1793 6.672 0.0217 * --Signif. codes: 0 *** 0.001 ** 0.01 * 0.05 . 0.1 1 Residual standard error: 0.9273 on 2 degrees of freedom Multiple R-squared: 0.957, Adjusted R-squared: 0.9355 F-statistic: 44.52 on 1 and 2 DF, p-value: 0.02173 Elde edilen regresyon denklemi ve buna ili kin özet tablo ve bireysel önemlilikler yukarıda özetlenmi tir. En altta bulunan hata terimlerine ait ANOVA (Analysis of Variance) bilgilerinde P de eri=0.022 oldu undan (Intercept) veya bY X katsayılarından en azından birinin önemli oldu u görülmektedir. Elde edilen regresyon denklemi ve buna ili kin ANOVA tablosu ve bireysel önemlilikler a a ıda özetlenmi tir. ANOVA (Analysis of Variance) tablosunda P de eri=0.022 oldu undan a ya da bYX katsayılarından en azından birinin önemli oldu u görülmektedir. bYX katsayısına ait önem kontrolü için . . . . . . .soruya bakınız. 2.18 ki sürekli de i kene ili kin Sx = 4.Sy ve rxy = 0.90 gibi bir ili ki vardır. Buna göre bY X , bX Y ve isabet derecesini hesaplayınız. Y rXY = rY X = bY X . SSXY oldu una göre bY X 4S = 0.90 olur. Buradan bY X = SY sonucu bulunur. 0.90 4 SY rXY = rY X = bXY . SSXY oldu una göre bXY 4S = 0.90 olur. Buradan bY X = Y sonucu bulunur. 0.90◊ 1 2 sabet derecesi : rXY = 0.902 = 0.81 28 = 0.225 = 3.60 2.19 Tesadüf parselleri deneme deseninde yürütülen bir çalı mada üç farklı türün (Ahududu, Bö ürtlen ve Çilek) antioksidan kapasitelerinin kar ıla tırılması istenmektedir. Varyans analizi tablosunu olu turunuz ( pucu= F testi). Ahududu A Bö ürtlen B Çilek C 3 3 4 8 8 9 q 5 5 7 q A = 10 q B = 17 C = 25 Tesadüf Parselleri Deneme Deseni Randomised Plot Design=Completely Randomised Design=One-way ANOVA= One-way classification H 0 : µA = µB = µC H1 : µA ”= µB ”= µC Tüm gözlem de erlerinin toplamı= 10 + 17 + 25 = 52 Genel Kareler Toplamı=Tür. Arası K.T + Tür çi K.T. Genel Kareler Toplamı=32 + 32 + 42 + 52 + 52 + 72 + 8 +2 +82 + 92 ≠ Tür. Arası K.T.= 102 +172 +252 3 ≠ 522 9 522 9 = 41.556 = 37.556 Tür. çi. K.T = Genel Kareler Toplamı – Tür. Arası K.T.=4 Varyasyon Kaynakları SD KT Türler Arası Türler çi (Hata) Genel 2 6 8 KO F F2,6 Cetvel 37.556 18.778 28.17 5.14 4.000 0.667 41.556 Fhesap = 28.17 > F2,6 = 5.14 oldu u için “H0 hipotezi RED” edilir. bakımından türler arasında farklılı ın önemli oldu u söylenebilir. ncelenen özellik R Çözümü #öncelikle veriler girilir #veya hazır bir dosyada mevcutsa read.table komutu ile yüklenir. df <- data.frame(A=c(3,3,4),#A parseline ait veriler sırasıyla girilir B=c(5,5,7),#B parseline ait veriler sırasıyla girilir C=c(8,8,9))#C parseline ait veriler sırasıyla girilir r <- c(t(as.matrix(df))) # veriler satır olarak tek sıra vektör haline dönü ür 29 r ## [1] 3 5 8 3 5 8 4 7 9 f <k<-3 n<-3 tm<tm c("A","B","C") # fakörler sırasıyla yazılır # parsel sayısı # her parsele dü en gözlem sayısı gl(k,1,n*k,factor(f)) # parsel vektörü olu turulur ## [1] A B C A B C A B C ## Levels: A B C fit <- aov(r~tm) # anova ba ımlı de i ken ~ parsel vektörü olacak #olu turulur summary(fit) #sonuçlar yazdırılır. ## ## ## ## ## ekilde Df Sum Sq Mean Sq F value Pr(>F) 2 37.56 18.778 28.17 0.000892 *** 6 4.00 0.667 tm Residuals --Signif. codes: 0 *** 0.001 ** 0.01 * 0.05 . 0.1 1 #bütün bu süreç için kısa bir fonksiyon olu turulup kullanılablir anovaRPD <- function(dataframe) { r <- c(t(as.matrix(dataframe))) f <- colnames(dataframe) k <- ncol(dataframe) n <- nrow(dataframe) tm <- gl(k,1,n*k,factor(f)) return(aov(r~tm)) } summary(anovaRPD(df)) ## ## ## ## ## Df Sum Sq Mean Sq F value Pr(>F) tm 2 37.56 18.778 28.17 0.000892 *** Residuals 6 4.00 0.667 --Signif. codes: 0 *** 0.001 ** 0.01 * 0.05 . 0.1 1 p < 0.05 oldu u için “H0 hipotezi RED” edilir. ncelenen özellik bakımından türler arasında farklılı ın önemli oldu u söylenebilir. 30 2.20 Akkaraman ve Merinos ırklarına ili kin gebelik oranı verileri a a ıda verilmi tir. Buna göre gebelik oranı bakımından Merinos ırkı koyunların Akkaraman ırkından üstün oldu u söylenebilir mi? IRK X (Gebe olanlar) N (Toplam) P (Gebelik oranı) Akkaraman (A) 100 (XA) Merinos (B) 400(XB) 400(NA) 500 (NB) PA = PB = XA NA XB NB = = 100 400 400 500 = 0.25 = 0.80 Hipotez Takımı: H0 : fi A = fi B H 1 : fi A < fiB 1. Yakla ım: P = XA +XB NA +NB zhesap = Ò = 100+400 400+500 = 500 900 PA +PB P.(1≠P )( N1 + N1 ) A B = 0.56 =Ô 0.25+0.85 1 1 0.56.(1≠0.56)( 400 + 500 ) = ≠16.50 R Çözümü: prop.test(c(100,400),#Akkaraman verileri c(ba arılı,toplam) ekilde yazıldı c(400,500),#merinos verileri c(ba arılı,toplam) ekilde yazıldı alternative = "less", # tek yönlü ve 1. 2. den küçük correct = FALSE) #Yates düzeltmesi yok ## ## ## ## ## ## ## ## ## ## ## ## 2-sample test for equality of proportions without continuity correction data: c(100, 400) out of c(400, 500) X-squared = 272.25, df = 1, p-value < 2.2e-16 alternative hypothesis: less 95 percent confidence interval: -1.0000000 -0.5038048 sample estimates: prop 1 prop 2 0.25 0.80 p < 0.05 oldu u için “H0 hipotezi RED” edilir. Merinos ırkının gebelik oranının Akkaraman ırkından daha üstün oldu u söylenebilir. 2. Yakla ım: 31 zhesap = Ò ( PA +PB PA (1≠PA ) P (1≠P ) )+( B N B ) NA B =Ò 0.25+0.85 ( 0.25(1≠0.55) 0.80(1≠0.80) )+( ) 400 500 = ≠19.58 Exact::exact.test(data = matrix(c(100,300,400,100), #veriler buraya biraz #farklı olarak girildi. #c(ba arılı,ba arısız,ba arılı,ba arısız) eklinde nrow = 2, # iki satır oldu u belirtildi byrow = T), # satır sırasıyla veriler alındı. alternative = "less", # küçüktür için kritik de er alındı. method = "Z-unpooled", #metot olarak Z-unpooled seçildi to.plot= FALSE) #grafik çizilmesin ## ## ## ## ## ## ## ## ## ## Z-unpooled Exact Test data: 100 out of 400 vs. 400 out of 500 test statistic = -19.584, first sample size = 400, second sample size = 500, p-value < 2.2e-16 alternative hypothesis: true difference in proportion is less than 0 sample estimates: difference in proportion -0.55 p < 0.05 oldu u için “H0 hipotezi RED” edilir. Merinos ırkının gebelik oranının Akkaraman ırkından daha üstün oldu u söylenebilir. 2.21 Akkaraman ve Merinos ırklarına ili kin canlı a ırlık verileri a a ıda verilmi tir. Buna göre canlı a ırlık bakımından Merinos ırkı koyunların Akkaraman ırkından üstün oldu u söylenebilir mi? IRK X (ortalama) N Akkaraman (A) 60 Merinos (B) 80 Standart Sapma 35 6 35 7 Varyansların homojenli i testi öncelikle test edilmelidir. H0 : ‡A2 = ‡B2 H0 : ‡A2 ”= ‡B2 Varyansların homojen olup olmadı ını belirlemek için büyük varyansın küçük varyans oranı hesaplanmalıdır. 2 ‡B 2 ‡A = 92 72 = 1.65 Æ 4 oldu undan varyansların homojen oldu u kabaca söylenebilir. 32 Di er bir ifadeyle iki grup ortalamasının kar ıla tırılmasında a a ıdaki e itlik kullanılabilir. Serbestlik derecesi: nA + nB ≠ 2 = 35 + 35 ≠ 2 = 68 sd li tek taraflı tablo de erine bakılır. Hipotez takımı: H 0 : µA = µB H1 : µA < µB t= Ú q Ā ≠ B̄ q d2A + d2B (nA ≠1)+(nB ≠1) ◊ ( n1A + 1 ) nB (19) Formul (19) yardımıyla t de eri hesaplanır: 60≠80 thesap = Ò (62 ◊34)+(7 2 ◊34) (35≠1)+(35≠1) 1 1 ◊( 35 + 35 ) = ≠12.83 > t68 = 1.668 Hesap de eri tablo de erinden büyük oldu u için “H0 hipotezi RED”edilir. Sonuç olarak, canlı a ırlık bakımından Merinos ırkı koyunların Akkaraman ırkından üstün oldu u SÖYLENEB L R. R Çözümü: (F <- 6ˆ2/7ˆ2)# F de eri hesaplanır ## [1] 0.7346939 (p<- pf(q = F, # hesaplanan F de eri yazılır df1=34, # birinci serbestlik (Na-1) df2=34) # ikinci serbestli (Nb-1) *2) # çift yönlü p için iki ile çarpılır. ## [1] 0.3731884 # normal veri setlerinde var.test ile hesaplama yapılabilir d <- data.frame(x=c(rnorm(35,60,6),rnorm(35,80,7)), y=c(rep("A",35),rep("B",35))) psych::describeBy(x = d,group = d$y) ## ## ## ## ## ## ## ## ## ## Descriptive statistics by group group: A vars n mean sd median trimmed mad min max range skew kurtosis se x 1 35 59.38 6.26 58.7 59.13 3.72 46.93 74.08 27.15 0.4 0.3 1.06 y* 2 35 1.00 0.00 1.0 1.00 0.00 1.00 1.00 0.00 NaN NaN 0.00 -----------------------------------------------------------group: B vars n mean sd median trimmed mad min max range skew kurtosis se x 1 35 79.47 6.61 78.35 79.13 5.44 68.01 93.66 25.66 0.61 -0.12 1.12 33 ## y* 2 35 2.00 0.00 2.00 2.00 0.00 2.00 2.00 0.00 NaN NaN 0.00 t.test(x~y,d) ## ## ## ## ## ## ## ## ## ## ## Welch Two Sample t-test data: x by y t = -13.055, df = 67.795, p-value < 2.2e-16 alternative hypothesis: true difference in means is not equal to 0 95 percent confidence interval: -23.16044 -17.01877 sample estimates: mean in group A mean in group B 59.37622 79.46583 Varyansların e it oldu u anl ıldıktan sonra t testi yapılır: BSDA::tsum.test(mean.x = 60,#akkaraman ortalaması s.x = 6, #akkaraman standart sapması n.x = 35, #akkaraman gözlem sayısı mean.y = 80,#merinos ortalaması s.y = 7, #merinos standart sapması n.y = 35, #merinos gözlem sayısı alternative = "less", # x ortalaması y den küçüktür var.equal = TRUE) #varyanslar e ittir ## ## ## ## ## ## ## ## ## ## ## Standard Two-Sample t-Test data: Summarized x and y t = -12.834, df = 68, p-value < 2.2e-16 alternative hypothesis: true difference in means is less than 0 95 percent confidence interval: NA -17.40128 sample estimates: mean of x mean of y 60 80 p = 0.000 de eri 0.05 de erinden küçük oldu u için “H0 hipotezi RED”edilir. Sonuç olarak, canlı a ırlık bakımından Merinos ırkı koyunların Akkaraman ırkından üstün oldu u SÖYLENEB L R. 34 2.22 Be tansiyon hastasına yeni bir tansiyon ilacı uygulanmı elde edilen sonuçlar a a ıda verilmi tir. Buna göre uygulanan yeni ilacın tansiyonu dü ürücü etkisinin oldu unu söyleyebilir misiniz? Hastalar A (önce) B (sonra) D (önce-sonra) Di2 Ali Veli Peyami lhami Bestami 150 160 155 155 160 130 135 125 130 135 20 25 30 25 25 q D = 125 400 625 900 625 625 q 2 Di = 3175 Hipotez Takımı: H 0 : µA ≠ µB = 0 H 1 : µA ≠ µB > 0 Tek Taraflı hipotez D̄ = q D n = 125 5 = 25 (farklara ait ortalama) SD = ı̂ q ı D2 Ù i ( q ≠ n≠1 D)2 n (20) Formül (20) yarımıyla farklara ait standart sapma hesaplanır: SD = Ú (125)2 5 3175≠ 4 = 3.536 Farlara ait standart hata hesaplanır: DD̄ = SD Ô n = 3.536 Ô 4 = 14.4 Serbestlik derecesi df = n ≠ 1 = 5 ≠ 1 = 4 thesap = D̄ SD̄ = 25 1.768 = 14.14 |thesap = 14.4| Ø |t4 = 2.13| oldu u için “H0 hipotezi RED” edilir. Uygulanan tansiyon ilacının tansiyonu dü ürücü etkiye sahip oldu u söylenebilir. R çözümü: d <- matrix(data = c(150,130,160,135,155,125,155,130,160,135), # veriler #satır sırası ile girildi. ncol=2, #matriksin iki stün oldu u belirtildi byrow = TRUE) # satır sırasıyla kodalnadı ı belirtildi 35 t.test(x = d[,1], #önceki de erler için matriksin birinci sütunu seçildi y = d[,2], #sonraki de erler için matriksin ikinci sütunu seçildi. paired = TRUE, #e le tirilmi t testi oldu undan "paired" TRUE yapıldı alternative = "greater") # 0 dan büyk istendi inde "greater" seçildi ## ## ## ## ## ## ## ## ## ## ## Paired t-test data: d[, 1] and d[, 2] t = 15.811, df = 4, p-value = 4.675e-05 alternative hypothesis: true difference in means is greater than 0 95 percent confidence interval: 21.62925 Inf sample estimates: mean of the differences 25 P = 0.000 de eri 0.05 de erinden küçük oldu u için “H0 hipotezi RED” edilir. Böylece, uygulanan tansiyon ilacının tansiyonu dü ürücü etkiye sahip oldu u söylenebilir. 2.23 Koyunlarda canlı a ırlık (X) ve gö üs çevresi (Y) arasında rXY = 0.85 korelasyon bulunmu tur. Buna göre, bu korelasyon katsayısının istatistiksel olarak önemli olup olmadı ını test ediniz (n=42). Hipotez takımı: H0 : fl = 0 H1 : fl ”= 0 Korelasyon katsayısının önemlilik testine ili kin hipotez her zaman çift taraflıdır. Örne e alınan birey sayısı korelasyon testinin önemli olup olmasını etkilemektedir. Örne in: örne e alınan birey sayısının çok yetersiz olması durumunda 0.80 gibi güçlü ve pozitif korelasyon istatistiksel olarak önemsiz olabilmektedir. Buna kar ın, 0.25 gibi dü ük korelasyon katsayısı örne e alınan birey sayısının artmasıyla istatistiksel olarak önemli olabilmektedir. thesap = Ò r 1≠r 2 n≠2 (21) Formül (21) yardımıyla t de eri hesaplanır: thesap = Ò 0.85 1≠0.852 42≠2 = 10.205 |thesap = 10.205| Ø |t40 = 2.021| oldu undan “H0 hipotezi RED” edilir. X ve Y de i kenleri arasındaki 0.85’lik korelasyon (do rusal ili ki) istatistiksel olarak önemli bulunmu tur (p < 36 0.05). Serbestlik derecesi df = n ≠ 2 = 42 ≠ 2 = 40 (% 5 için 40 serbestlik dereceli çift taraflı t tablo de erine bakılmı tır). R Çözümü: tCor <- function(r,n) { return(r/(sqrt((1-rˆ2)/(n-2)))) } (t <- tCor(.85,42)) #t de eri ## [1] 10.2051 (tkritik <- qt(0.975,40)) # çift taraflı kritik de er ## [1] 2.021075 (t>=tkritik) # do ru oldu undan Ho red edilir ## [1] TRUE (p <- pt(q = t, # hesaplanan t de eri yazıldı df = 40, # n-2 serbestlik derecesi yazıldı lower.tail = F) # P[X>x] *2) # p de eri çif taraflı olması için 2 ile çarpıldı ## [1] 1.071884e-12 2.24 Dört birey için X ve Y gibi iki özellik arasında Y = 3.12 + 1.2X gibi ili kinin oldu u belirlenmi tir. HKO = 0.860 ve X özelli ine ait standart sapmanın S = 2.99 oldu u bilindi ine göre bY X = 1.2 katsayısının istatistiksel olarak önemli olup olmadı ını test ediniz. Hipotez Takımı: H0 : —Y X = 0 H1 : —Y X ”= 0 Çift taraflı hipotez kurulur. Ò Ô Ô ‡ ˆ = HKO = HKT = 0.860 = 0.927 n≠2 (5) yarımıyla kareler toplamı SS = S 2 = 2.992 , SbY X = ˆ Ô‡ SS SS n≠1 = q (Xi ≠ X̄)2 hesaplanır: = 2.992 ise SS = 2.992 ◊ 3 = 26.82 Ô0.927 26.82 = 0.179 37 thesap = bY X SbY X = 1.2 0.179 = 6.701 Serbestlik derecesi df = n ≠ 2 = 4 ≠ 2 = 2 sd dereceli çift taraflı tablo de eri: t2 = 4.30 |thesap = 6.701| Ø |t2 = 4.30|oldu u için “Ho hipotezi RED” edilir. Regresyon katsayısının (bY X = 1.2) istatistiksel olarak önemli oldu u ileri sürülebilir. R Çözümü: (byx <- 1.2) ## [1] 1.2 (sHat <- sqrt(0.86)) ## [1] 0.9273618 (SS <- 2.99ˆ2*(4-1)) ## [1] 26.8203 (sbyx <- sHat / sqrt(SS)) ## [1] 0.1790678 (tHesap <- byx/sbyx) ## [1] 6.701374 (t2 <- qt(p = .975,df = 2)) ## [1] 4.302653 (tHesap>=t2) ## [1] TRUE (pt(tHesap,df = 2,lower.tail = F)*2) ## [1] 0.02155035 38 View publication stats