KULIAH 7 Bab 10 Inferens Bagi Populasi: Penganggaran Pegenalan Statistik Inferens ialah proses mendapatkan maklumat dan membuat kesimpulan berkenaan populasi dengan menggunakan sampel. ◼ Taburan persampelan akan digunakan untuk membuat inferens berkenaan parameter populasi yang tidak diketahui. ◼ Terdapat dua prosedur yang digunakan untuk membuat inferens iaitu: ◼ ◼ Penganggaran ◼ Ujian Hipotesis Konsep Penganggaran ◼ Penganggar Titik ◼ ◼ ◼ Penganggar titik merupakan nombor tunggal (single value/certain value) Merupakan statistik yang dihitung daripada maklumat sampel dan digunakan untuk menganggar parameter populasi. Contoh: Pilih sampel 50 pelajar tahun 1 dan bertanyakan tempoh belajar untuk seminggu. Anggarkan min sampel ini dan guna nilai yang diperoleh sebagai anggaran titik untuk min populasi yang tidak diketahui. ◼ Min sampel yang diperoleh merupakan anggaran titik bagi min populasi. Penganggar Selang ◼ ◼ ◼ Merupakan julat nilai yang dibentuk daripada data sampel maka parameter akan terletak dalam julat tersebut pada tingkat kebarangkalian tertentu (any value along the interval) Ia melibatkan dua nilai iaitu had atas dan had bawah. Kebarangkalian tertentu disebut aras keyakinan (level of confidence). Anggaran Titik dan Anggaran Selang Sekiranya, min populasi berada dalam julat antara had atas dan had bawah keyakinan maka kenyataan berkenaan µ adalah benar Lower Confidence Limit Point Estimate Width of confidence interval Upper Confidence Limit Penganggar Titik dan Selang… ◼ Selang Keyakinan ◼ Pengiraan anggaran titik adalah tidak pasti kerana mungkin tidak menggambarkan parameter populasi. ◼ Sebaliknya, anggaran selang memberikan lebih banyak maklumat tentang kriteria populasi berbanding anggaran titik. ◼ Anggaran selang juga dikenali sebagai selang keyakinan (confidence intervals) Kualiti Penganggar Kriteria penting dalam memilih statistik sample sebagai penganggar titik kepada parameter populasi ialah statistik sampel adalah penganggar yang tidak bias (unbiased). Penganggar tidak bias jika nilai dijangka statistik sampel sama dengan parameter yang dianggarkan. ❖ ❖ Dua lagi kriteria penting bagi penganggar unbias ialah: Konsisten iaitu perbezaan antara penganggar dan parameter semakin kecil apabila bilangan sampel meningkat. Cekap secara relatif iaitu penganggar mempunyai nilai varian yang kecil. Parameter Populasi Min , Varian , 2 Perkadaran, p Penganggar Titik Anggaran Selang keyakinan ◼ ◼ ◼ ◼ Selang keyakinan ialah anggaran selang yang merangkumi parameter populasi yang tidak diketahui dengan aras keyakinan tertentu. Had Keyakinan (Confidence limits) adalah nilai bawah (lower) dan nilai atas (upper) bagi anggaran selang. Aras keyakinan (Confidence level) ialah (1 – ) iaitu kebarangkalian di mana selang yang dianggarkan mengandungi nilai sebenar parameter populasi jika proses mendapatkan selang diulang beberapa kali. Nota: ialah nilai kritikal (critical value) Apa itu Aras Keyakinan? ◼ ◼ ◼ ◼ Berapa peratus anda yakin bahawa selang yang dianggarkan akan mengandungi parameter populasi yang tidak diketahui. ◼ Anda Tidak boleh yakin 100% ◼ Maka peratus keyakinan mestilah kurang daripada 100% misalnya 95% yakin, 99% yakin dsb. Aras keyakinan ialah (1-) ialah aras keertian Jika = 0.05 maka (1 - ) = 0.95 iaitu 95% yakin Selang Keyakinan Selang Keyakinan Min Populasi σ Diketahui σ Tidak Diketahui Perkadaran Populasi (i) Selang Keyakinan Bagi μ (σ Diketahui) ◼ Andaian ◼ Sisihan piawai populasi, σ diketahui ◼ Populasi bertaburan normal ◼ Jika populasi tidak bertaburan normal, gunakan sampel besar ◼ Menganggar selang keyakinan: X Zα/2 dengan X σ n anggaran titik Zα/2 nilai kritikal taburan normal bagi kebarangkalian /2 di setiap hujung σ/ n sisihan piawai Bagimana cari nilai kritikal? ◼ ◼ Contoh jika aras keyakinan ialah 95% Maka Mencari Nilai Kritikal, Zα/2 ◼ Andaikan aras keyakinan ialah 90%, maka: 1 − = 0.95 so = 0.05 α = 0.025 2 α = 0.025 2 Z units: X units: Zα/2 = 1.96 Zα/2 = -1.96 Had Bawah (Lower Confidence Limit) 0 Point Estimate Zα/2 = 1.96 Had Atas (Upper Confidence Limit) Rujuk nilai α Z0.025 = 1.96 Jadual Z hujung kanan Mencari Nilai Kritikal, Zα/2 ◼ Andaikan aras keyakinan 90%, maka: Contoh 1 ◼ Satu sampel terdiri daripada 11 litar elektrik daripada satu populasi besar yang bertaburan normal mempunyai min bagi rintangan sebanyak 2.20 ohm. Daripada ujian sebelum ini diketahui sisihan piawai populasi ialah 0.35 ohm. ◼ Tentukan 95% selang keyakinan bagi min sebenar rintangan bagi populasi berkenaan. Contoh 1: Penyelesaian ◼ Penyelesaian: X Z α/2 σ n = 2.20 1.96 (0.35/ 11 ) = 2.20 0.2068 1.9932 μ 2.4068 Interpretasi Diyakini 95% yang min sebenar rintangan berada antara 1.9932 dan 2.4068 ohm. (ii) Selang Keyakinan Bagi μ (σTidak Diketahui) ◼ Jika sisihan piawai populasi, σ tidak diketahui maka kita gantikan dengan sisihan piawai sampel, S ◼ Ini menambah ketakpastian kerana S adalah berbeza antara satu sampel dengan sampel lain. ◼ Jadi kita gunakan taburan t dan bukannya taburan normal Selang Keyakinan Bagi μ (σTidak Diketahui) ◼ Andaian: ◼ ◼ ◼ ◼ ◼ Sisihan piawai populasi tidak diketahui Populasi bertaburan normal Jika populasi tidak bertaburan normal maka guna sampel besar Gunakan taburan ‘student-t’ Menganggar selang keyakinan: X tα / 2 S n (dengan tα/2 adalah nilai kritikal bagi taburan t dengan n -1 darjah kebebasan dan bagi kawasan α/2 bagi setiap hujung) Taburan ‘Student-t’ ◼ ◼ ‘Student-t’ termasuk dalam satu jenis taburan Nilai tα/2 bergantung kepada darjah kebebasan (degrees of freedom (d.f.)) d.f. = n - 1 Jadual ‘Student-t’ Upper Tail Area df .10 .05 .025 1 3.078 6.314 12.706 Let: n = 3 df = n - 1 = 2 = 0.10 /2 = 0.05 2 1.886 2.920 4.303 3 1.638 2.353 /2 = 0.05 3.182 The body of the table contains t values, not probabilities 0 2.920 t Contoh 2: Selang Keyakinan Dengan Taburan t Andaikan sampel rawak, n = 25 dgn X = 50 dan S = 8. Bentukkan 95% selang keyakinan bagi μ ◼ d.f. = n – 1 = 24, jadi t/2 = t 0.025 = 2.064 Selang keyakinan bersamaan: X t/2 S 8 = 50 (2.064) n 25 46.698 ≤ μ ≤ 53.302 (iii) Selang Keyakinan bagi Perkadaran Populasi, p ◼ (iii) Selang Keyakinan bagi Perkadaran Populasi, p ◼ Ingat semula, taburan perkadaran sampel adalah menghampiri normal jika saiz sampel besar, dengan sisihan piawai σp = ◼ p(1 − p) n Kita boleh mengiranya dengan menggunakan data sampel. p̂(1 − p̂) n Selang keyakinan, p ◼ p̂ Z/2 p̂(1 − p̂) n Contoh 3: ◼ Satu sampel rawak terdiri daripada 100 orang menunjukkan 25 orang daripadanya adalah ‘left-handed’. Bentuk 95% selang keyakinan untuk perkadaran populasi bagi ‘left-handers’. p̂ Z/2 p̂(1 − p̂)/n = 0.25 1.96 0.25(0.75)/100 = 0.25 1.96 (0.0433) 0.1651 p 0.3349 Interpretasi ◼ Kita yakin 95% bahawa peratusan benar bagi ‘left-handers’ dalam populasi berada antara 16.51% dan 33.49%. Contoh 4 : ◼ p̂ Z/2 p̂(1 − p̂)/n = 0.75 1.96 0.25(0.75)/100 = 0.75 1.96 (0.0433) 0.6651 p 0.8349 Interpretasi: Kita yakin 95% bahawa perkadaran populasi right-handers bagi populasi berada antara 66.51% dan 83.49%. Penentuan Saiz Sampel Menentukan saiz sampel Bagi Min Bagi Perkadaran Bagaimana untuk menentukan saiz sampel yang perlu untuk menganggar perkadaran populasi? Ralat Persampelan ◼ ◼ Biasanya saiz sampel yang diperlukan akan mempunyai margin ralat (margin of error or bounded error (B) atau ralat maksimum yang dibenarkan (maximum likely error that is acceptable) dengan aras keyakinan tertentu (1 - ) Margin ralat juga dikenali sebagai ralat persampelan ◼ Ketidaktepatan dalam anggaran parameter populasi. ◼ Jumlah yang ditambah atau ditolak daripada anggaran titik untuk membentuk selang keyakinan. Menentukan Saiz Sampel Menentukan Saiz Sampel Bagi Min Ralat Persampelan: X Zα / 2 σ n B = Z / 2 σ n Menentukan Saiz Sampel Menentukan Saiz Sampel Bagi Min B = Z / 2 σ n 2 Selesaikan untuk n Z / 2 σ n= 2 B 2 Contoh 5: Saiz Sampel yang Diperlukan Jika = 45, apakah saiz sampel yang diperlukan untuk menganggar min dengan ralat persampelan di antara ± 5 dengan 90% keyakinan? Z σ (1.645) (45) n= = = 219.19 2 2 B 5 2 2 2 2 Jadi sampel yang diperlukan ialah n = 220 (Always round up) to the one greater value Penentuan Saiz Sampel: Perkadaran Tentukan Saiz Sampel Bagi Perkadaran Selesaikan n untuk dapat p = nilai anggaran bagi perkadaran populasi Contoh 6: Penentuan Saiz Sampel ◼ Contoh: Penentuan Saiz Sampel Jadi guna n = 451 Latihan 1 From past experience, the population standard deviation of rod diameters produced by a machine has been found to be 0.053 inches. For a simple random sample of 30 rods, the average diameter is found to be 1.4 inches. (i) Find the 95% confidence interval for the population mean. (ii) What sample size is necessary to have 95% confidence that sample mean will be within 0.01 inch of the actual population mean? Jawapan : Latihan 1 From past experience, the population standard deviation of rod diameters produced by a machine has been found to be 0.053 inches. For a simple random sample of 30 rods, the average diameter is found to be 1.4 inches. (i) Find the 95% confidence interval for the population mean. LCL= 1.381, UCL = 1.419 1.381 ≤ µ ≤ 1.419 We have 95% confidence that the population mean length falls between 1.381 and 1.419 inches LCL = lower confidence limit ; UCL = upper confidence limit Jawapan: Latihan 1 (ii) What sample size is necessary to have 95% confidence that sample mean will be within 0.01 inch of the actual population mean? Latihan 2 In an April 2007 NBC News / Wall Street Journal poll, 1008 adults were randomly sampled from across the United States. In response to the question, “All in all, do you think that things in the nation are generally headed in the right direction, or do you feel that things are off on the wrong track?” 22% responded “headed in the right direction”. (i) What is the 90% confidence interval for the population proportion who would have answered “headed in the right direction” to the question posed? (ii) Determine the sample size necessary to estimate the population proportion to within 0.015 with 90% confidence if we believe that the estimated value of the population proportion is approximately 0.30. Jawapan: Latihan 2 0.199 ≤ p ≤ 0.241 Jawapan: Latihan 2 (ii) Determine the sample size necessary to estimate the population proportion to within 0.015 with 90% confidence if we believe that the estimated value of the population proportion is approximately 0.30.