Uploaded by Amer Ibrahim

sheet 1 Sampling Distribution

advertisement
2022
Sheet 1
Applied Statistics
SAMPLING DISTRIBUTION
LEVEL 3 FCBA
‫‪Sampling Distribution‬‬
‫بص بقا ركز معايا كده لحظة هقولك حاجه مهمة‪.‬‬
‫هو إحنا في اإلحصاء بنكون عايزين ندرس المجتمع ‪ Population‬وبنكون عايزين نطلع من المجتمع ارقام‬
‫مختصرة توصفلي المجتمع بنسميها معالم ‪ Parameters‬بس لألسف انا مش بقدر أوصل للمجتمع وال اقدر‬
‫احسب المعالم دي بس بيكون فيه حل إني اخد عينة ‪ Sample‬والعينة دي احسب منها ارقام مختصرة بس‬
‫بسميها إحصاء ‪ Statistic‬واحد لماح بقا ومركز معايا يجي يقولي وإحنا كده استفدنا ايه إحنا مش بندرس‬
‫المجتمع كدة إحنا بندرس جزء صغير منة أقوله أيه بقا هنا بيجي دور ‪ Inferential Statistics‬اإلحصاء‬
‫االستداللي يعني ايه يعني زي اسمها كده الفرع ده من اإلحصاء بيساعدني استدل من العينة على المجتمع مش‬
‫بس كده إني اختبر صحة االستدالل ده بص معايا كدة‬
‫‪Sample‬‬
‫‪Population‬‬
‫𝝁‬
‫>‪------‬‬
‫̅‬
‫𝑿‬
‫‪Mean‬‬
‫𝟐𝝈‬
‫>‪------‬‬
‫𝟐𝑺‬
‫‪Variance‬‬
‫𝝈‬
‫>‪------‬‬
‫𝑺‬
‫‪Standard deviation‬‬
‫𝝆‬
‫>‪------‬‬
‫̂‬
‫𝝆‬
‫‪Proportion‬‬
‫𝑵‬
‫>‪------‬‬
‫𝒏‬
‫‪Size‬‬
‫‪We will use every statistic we calculated from the sample to inference about the‬‬
‫‪Population parameter‬‬
‫هنستدل بكل إحصاء هنحسبة من العينة على المعلمة المقابلة ليه في المجتمع‪.‬‬
‫بس ثانية واحدة هو دلوقتي لو انا اخدت عينة ومحمود اخد عينة واحمد اخد عينة من المجتمع وكل واحد فينا‬
‫ل̅‬
‫حسب مث ا‬
‫𝑿 ‪ Sample mean‬هل هنكون زي بعض ؟ أل طبعا ا كل واحد الزم برقم طيب مين فينا احسن من‬
‫التاني هو مفيش حد احسن بس فيه نقطة إن لو حسبت متوسط المتوسطات الحسبناها ‪Mean of sample‬‬
‫‪ means‬الزم هيساوي قيمة متوسط المجتمع 𝝁 ‪Population mean‬‬
‫𝝁 = )̅‬
‫𝑿(𝑬‬
‫وبيكون عندي ‪ Variance‬بتاع ̅‬
‫𝑿‬
‫‪Expected value‬‬
‫هي القيمة المتوقعة وبتكون بتحسب المتوسط‬
‫بيساوي‬
‫𝟐𝝈‬
‫=‬
‫𝒏‬
‫̅𝑿𝟐𝝈‬
‫‪Standard error of the mean‬‬
‫الخطأ المعياري الممكن يحصل واحنا بنحسب المتوسط‬
‫طبعا ا الكلم حلو لكن الحل مختلف طيب نشوف مثال‪:‬‬
‫‪Consider the population created by throwing a fair die infinitely many times, with‬‬
‫‪the random variable 𝒙 indicating the number of spots showing on any of the throw.‬‬
‫‪The population distribution of the random variable 𝒙 is as follows:‬‬
‫‪sum‬‬
‫‪1‬‬
‫‪6‬‬
‫‪1/6‬‬
‫‪5‬‬
‫‪1/6‬‬
‫‪4‬‬
‫‪1/6‬‬
‫‪3‬‬
‫‪1/6‬‬
‫‪2‬‬
‫‪1/6‬‬
‫‪1‬‬
‫‪1/6‬‬
‫𝒙‬
‫)𝒙(𝒑‬
‫هنا بيقولي إن إحنا عندنا مجتمع مكون من إن احنا رمينا زهر مرات غير محدودة وكان عندي المتغير العشوائي‬
‫𝑥 بيمثل الرقم البيطلع كل مرة برمي فيها الزهر وطبعا ا احتمالية إني ارمي الظهر ويطلع لي أي رقم من ‪ 1‬ل ‪6‬‬
‫متساوية كلها بتساوي ‪ 1/6‬ومجموعهم واحد طيب ده كدا عندنا المجتمع خلينا نروح نحسب ‪mean and‬‬
‫‪ variance‬ونشوف بعد كدة‪.‬‬
‫𝟏‬
‫𝟏‬
‫𝟏‬
‫𝟏‬
‫𝟏‬
‫𝟏‬
‫𝟓 ‪𝝁 = 𝑬(𝒙) = ∑ 𝒙 𝒑(𝒙) = 𝟏 ( ) + 𝟐 ( ) + 𝟑 ( ) + 𝟒 ( ) + 𝟓 ( ) + 𝟔 ( ) = 𝟑.‬‬
‫𝟔‬
‫𝟔‬
‫𝟔‬
‫𝟔‬
‫𝟔‬
‫𝟔‬
‫يبقى إحنا كدا عندنا متوسط المجتمع 𝟓 ‪𝝁 = 𝟑.‬‬
‫)𝒙(𝒑 𝟐)𝝁 ‪𝝈𝟐 = 𝑽(𝒙) = ∑(𝒙 −‬‬
‫𝟏‬
‫𝟏‬
‫𝟏‬
‫𝟏‬
‫) ( 𝟐)𝟓 ‪= (𝟏 − 𝟑. 𝟓)𝟐 ( ) + (𝟐 − 𝟑. 𝟓)𝟐 ( ) + (𝟑 − 𝟑. 𝟓)𝟐 ( ) + (𝟒 − 𝟑.‬‬
‫𝟔‬
‫𝟔‬
‫𝟔‬
‫𝟔‬
‫𝟏‬
‫𝟏‬
‫𝟐𝟗 ‪+ (𝟓 − 𝟑. 𝟓)𝟐 ( ) + (𝟔 − 𝟑. 𝟓)𝟐 ( ) = 𝟐.‬‬
‫𝟔‬
‫𝟔‬
‫‪Now we suppose that 𝝁 is unknown and that we want to estimate its value by using‬‬
‫‪̅ , calculated from a sample of size 𝒏 = 𝟐. In actual practice, only‬‬
‫𝑿 ‪the sample mean‬‬
‫‪̅ , but to‬‬
‫𝑿 ‪one sample would be drawn, and hence there would be only one value of‬‬
‫‪assess how closely estimates the value of 𝝁, we will develop the sampling‬‬
‫‪̅ by evaluating every possible sample of size 2. Consider all the‬‬
‫𝑿 ‪distribution of‬‬
‫‪possible different samples of size 2 that could be drawn from the parent‬‬
‫‪population.‬‬
‫طبعا ا الكلم الفوق شكله يخض ومش مفهوم بس مش كلمي وهللا كلم الكتاب‬
‫بيقول ايه بيقول دلوقتي لو افترضنا إن 𝝁 مجهولة مش هقدر احسبها ألي سبب وقتها هروح اسحب عينة واحسب‬
‫𝑿 ‪ sample mean‬وحجم العينة عندنا ‪ 2‬وفي العادي عينة واحده كانت هتكون كفاية علشان نحسب ̅‬
‫̅‬
‫𝑿 بس‬
‫علشان إحنا عايزين نشوف إزاي متوسط العينة ̅‬
‫𝑿 بيطلع تقدير قريب اوي من متوسط العينة 𝝁 علشان كده‬
‫هنسحب كل عينة ممكنه من المجتمع حجمها ‪ ☹ 2‬ونحسب لكل واحده ̅‬
‫𝑿‪.‬‬
‫طيب هنعرف عدد العينات إزاي هنعمل‬
‫𝟔𝟑 = 𝟐𝟔 = 𝒔𝒆𝒍𝒑𝒎𝒂𝒔 𝒇𝒐 𝒓𝒆𝒃𝒎𝒖𝒏‬
‫‪∑𝑥 1+ 1‬‬
‫=‬
‫‪=1‬‬
‫𝑛‬
‫‪2‬‬
‫̅‬
‫𝑿‬
‫‪3‬‬
‫‪3.5‬‬
‫‪4‬‬
‫‪4.5‬‬
‫‪5‬‬
‫‪5.5‬‬
‫‪3.5‬‬
‫‪4‬‬
‫‪4.5‬‬
‫‪5‬‬
‫‪5.5‬‬
‫‪6‬‬
‫̅‬
‫𝑿‬
‫‪2‬‬
‫‪2.5‬‬
‫‪3‬‬
‫‪3.5‬‬
‫‪4‬‬
‫‪4.5‬‬
‫‪2.5‬‬
‫‪3‬‬
‫‪3.5‬‬
‫‪4‬‬
‫‪4.5‬‬
‫‪5‬‬
‫‪Sample‬‬
‫)‪(5,1‬‬
‫)‪(5,2‬‬
‫)‪(5,3‬‬
‫)‪(5,4‬‬
‫)‪(5,5‬‬
‫)‪(5,6‬‬
‫)‪(6,1‬‬
‫)‪(6,2‬‬
‫)‪(6,3‬‬
‫)‪(6,4‬‬
‫)‪(6,5‬‬
‫)‪(6,6‬‬
‫‪Sample‬‬
‫)‪(3,1‬‬
‫)‪(3,2‬‬
‫)‪(3,3‬‬
‫)‪(3,4‬‬
‫)‪(3,5‬‬
‫)‪(3,6‬‬
‫)‪(4,1‬‬
‫)‪(4,2‬‬
‫)‪(4,3‬‬
‫)‪(4,4‬‬
‫)‪(4,5‬‬
‫)‪(4,6‬‬
‫̅‬
‫𝑿‬
‫‪1‬‬
‫‪1.5‬‬
‫‪2‬‬
‫‪2.5‬‬
‫‪3‬‬
‫‪3.5‬‬
‫‪1.5‬‬
‫‪2‬‬
‫‪2.5‬‬
‫‪3‬‬
‫‪3.5‬‬
‫‪4‬‬
‫= ̅𝑋‬
‫‪Sample‬‬
‫)‪(1,1‬‬
‫)‪(1,2‬‬
‫)‪(1,3‬‬
‫)‪(1,4‬‬
‫)‪(1,5‬‬
‫)‪(1,6‬‬
‫)‪(2,1‬‬
‫)‪(2,2‬‬
‫)‪(2,3‬‬
‫)‪(2,4‬‬
‫)‪(2,5‬‬
‫)‪(2,6‬‬
‫عملنا ايه بقا هنا اخدنا كل رقم مع نفسه وباقي األرقام في العينة فطلع عندي الجدول ده وجمعت كل رقمين‬
‫وقسمتهم على عددهم ‪ 2‬علشان احسب المتوسط‬
‫̅‬
‫‪1‬‬
‫‪1.5‬‬
‫‪2‬‬
‫‪2.5‬‬
‫‪3‬‬
‫‪3.5‬‬
‫‪4‬‬
‫‪4.5‬‬
‫‪5‬‬
‫‪5.5‬‬
‫‪6 sum‬‬
‫𝑿‬
‫‪̅ ) 1/36 2/36 3/36 4/36 5/36 6/36 5/36 4/36 3/36 2/36 1/36 1‬‬
‫𝑿(𝒑‬
‫هنا عملنا ‪ frequency distribution‬جدول تكراري لكل قيمة في ̅‬
‫𝑿 علشان اقدر احسب احتمالية كل واحدة‬
‫قد ايه‪.‬‬
‫‪We can also compute the mean and the variance of the sampling distribution.‬‬
‫‪Using our definition of expectation and variance.‬‬
‫إحنا دلوقتي نقدر نسحب المتوسط والتباين لتوزيع العينات‬
‫̅‬
‫𝑿 ‪We determine the mean of‬‬
‫) ̅𝑿(𝒑 ̅𝑿 ∑ = ) ̅𝑿(𝑬 = ̅𝑿𝝁‬
‫𝟏‬
‫𝟒‬
‫𝟑‬
‫𝟐‬
‫𝟔𝟑‬
‫𝟔𝟑‬
‫𝟔𝟑‬
‫𝟔𝟑‬
‫) ( 𝟔 ‪) + 𝟏. 𝟓 ( ) + 𝟐 ( ) + 𝟐. 𝟓 ( ) + ⋯ +‬‬
‫𝟏‬
‫(𝟏 =‬
‫𝟔𝟑‬
‫𝟓 ‪= 𝟑.‬‬
‫الحظ كده إن متوسط المتوسطات 𝝁 = ) ̅‬
‫𝑿(𝑬 بيساوي متوسط المجتمع كنا حسبناه فوق بس هقولك حاجة‬
‫في كذا متوسط كان بعيد اوي عن متوسط المجتمع يعني مث ا‬
‫ل متوسط العينة األولى كان بيساوي ‪ 1‬ومتوسط‬
‫المجتمع بيساوي ‪ 3.5‬طيب عايزين نعرف بعد كل متوسط عن متوسط المتوسطات يبقى نحسب‬
‫̅‬
‫𝑿 ‪Variance of‬‬
̅ ) = ∑(𝑿̅ − 𝝁𝑿̅ )𝟐 𝒑(𝑿̅ )
𝝈𝟐𝑿̅ = 𝑽(𝑿
= (𝟏 − 𝟑. 𝟓)𝟐 (
+ (𝟔 − 𝟑. 𝟓)𝟐 (
𝟏
𝟐
𝟑𝟔
𝟏
𝟑𝟔
) + (𝟏. 𝟓 − 𝟑. 𝟓)𝟐 ( ) + ⋯
𝟑𝟔
) = 𝟏. 𝟒𝟔
Central limit theorem ☹
If a random sample is drawn from any population, the sampling distribution of
the sample mean approximately normal for a sufficiently large sample size. The
̅ will resemble a
larger sample size, the more closely the sampling distribution of 𝑿
normal distribution.
̅ ‫يعني لو احنا سحبنا عينة عشوائية من أي مجتمع توزيع العينات بتاع المتوسط‬
normal ‫𝑿 بيكون بالتقريب‬
̅ ‫ لما تكون العينة حجمها كبير وكل ما العينة بتكون اكبر كل ما بيكون توزيع‬distribution
‫𝑿 اقرب للتوزيع‬
.‫الطبيعي‬
Sampling distribution for the sample mean:
1) 𝝁𝑿
̅ =𝝁
2)
𝝈𝟐𝑿̅
=
𝝈𝟐
𝝈
̅ is called the
or 𝝈𝑿̅ = ( ) (the standard deviation of 𝑿
𝒏
√𝒏
standard error of the mean)
̅ will be normal, if 𝒙 is non-normal, 𝑿
̅ will be approximately
3) If 𝒙 is normal, 𝑿
normally distributed for sufficient large sample size
if 𝒙~𝑵(𝝁, 𝝈𝟐 )
If 𝒙 𝒇𝒐𝒍𝒍𝒐𝒘 𝒂𝒏𝒚 𝒅𝒊𝒔𝒕𝒓𝒊𝒃𝒖𝒕𝒊𝒐𝒏
𝟐
𝟐
̅ ~𝑵(𝝁, 𝝈 )
then 𝑿
̅ ~𝑵(𝝁, 𝝈 ) when n is large
then 𝑿
𝒏
𝒏
̅ ~𝑵 ‫طيب فيه نقطة مهمة لو إحنا عندنا‬
‫𝑿 وانا عايز احسب بقا احتماالت بقا للمتوسط ده اعمل ايه‬
‫ بنشتغل‬probabilities ‫ لما نيجي نحسب‬normal distribution ‫وهللا إحنا مش بنشتغل على‬
‫ ☹ طيب وده بنروحله إزاي بص بقا في العادي لما‬standard normal distribution ‫من‬
̅ ‫𝒙 = 𝒛 طيب لما يكون عندنا‬−𝝁 ‫كان عندي 𝒙 وعايز احولها كنا بنقول‬
‫𝑿 هنعمل ايه‬
𝝈
𝒛=
̅ −𝝁
𝑿
𝝈
√𝒏
☹ ‫مثال بقا علشان نفهم بس من الكتاب‬
Example:
The dean of a business school claims that the average weekly income of
graduates of his school one year after graduation is $600.
a) If the dean's claim is correct, and if the distribution of weekly incomes
has a standard deviation of $100, what is the probability that 25
randomly selected graduates have an average weekly income of less
than $550?
b) If a random sample of 25 graduates had an average weekly income of
$550, what would you conclude about the validity of the dean's claim?
‫بيقول ايه المثال بقا بيقول عميد كلية إدارة بيقول افتراضا ا إن متوسط الدخل األسبوعي للخريجين من‬
$600 ‫الكلية بتاعتها‬
𝝈 = $𝟏𝟎𝟎 ‫ = 𝝁 ولو عرفنا إن التوزيع‬$𝟔𝟎𝟎 ‫بعد كده بيقولي لو هنقول إن كلم العميد صح يعني‬
‫ واحد اختارناهم عشوائي من الخريجين عندهم متوسط دخل اسبوعي اقل من‬25 ‫عايز يعرف احتمال إن‬
$550
Answer:
𝝈𝑿̅ =
𝝈
√𝒏
=
𝟏𝟎𝟎
√𝟐𝟓
‫جبناها من الجدول‬
= 𝟐𝟎.
̅
̅ < 𝟓𝟓𝟎) = 𝒑 (𝑿−𝝁𝑿̅ < 𝟓𝟓𝟎−𝟔𝟎𝟎) = 𝒛 < −𝟐. 𝟓 = 𝟎. 𝟎𝟎𝟔𝟐
a) 𝒑(𝑿
𝝈𝑿̅
𝟐𝟎
‫باقي السؤال بيقول تستنتج ايه من من إدعاء العميد‬
b) The probability of observing a sample mean as low as $550 when the
population mean is $600 is extremely small, because this event is quite
rare and quite unlikely, we would conclude that the dean claim is
probably unjustified.
‫ واالحتمالية طلعت معايا‬600 ‫ وكان متوسط المجتمع‬550 ‫بعد ما حسبنا احتمالية إن متوسط العينة يكون‬
.‫قليلة جدا ا وده معناه إن الحدث ده نادر ومش بيحصل وإن كلم العميد مش صحيح‬
Example: A normally distributed population has a mean 𝝁 = 4, and a
standard deviation of 12. What does the central limit theorem say about the
sampling distribution of the mean if samples of size 100 are drawn from this
population?
‫بيقول هنا لو عندنا مجتمع بيتبع التوزيع الطبيعي ومديني المتوسط واالنحراف المعياري بيقولي نظرية‬
̅ ‫ هتقول ايه هنا على توزيع العينات لمتوسط العينة‬central limit theorem
‫𝑿 لو عرفت إن حجم‬
100 ‫العينة‬
Answer:
The central limit theorem says that
̅ ~𝑵(𝝁, 𝝈𝑿̅ )
𝑿
𝝈𝑿̅ =
𝝈
√𝒏
=
𝟏𝟐
√𝟏𝟎𝟎
= 𝟏. 𝟐
̅ ~𝑵(𝟒, 𝟏. 𝟐)
𝑿
Refer to the previous example Suppose that the population is not normally
distributed. Does this change your answer? Explain.
.‫بيقولك باإلشارة للمثال الفات لو عرفت أن المجتمع مش توزيع طبيعي ده هيغير اجابتك ووضح‬
Answer:
No, it will not change my answer, since the sample size is large then the
̅ will be approximately normal.
distribution of 𝑿
A sample of 𝒏 = 𝟏𝟎𝟎 observations is drawn from a normal population, with
𝝁 = 𝟏, 𝟎𝟎𝟎 and 𝝈 = 𝟐𝟎𝟎.
Find the following:
a) 𝒑𝒓(𝒙̅ > 𝟏, 𝟎𝟓𝟎)
̅ < 𝟗𝟔𝟎)
b) 𝒑𝒓(𝒙
̅ > 𝟏𝟏𝟎𝟎)
c) 𝒑𝒓(𝒙
d) 𝒑𝒓(𝟗𝟓𝟎 < ̅𝒙 < 𝟏, 𝟏𝟓𝟎)
Answer:
𝝈𝑿̅ =
𝝈
√𝒏
=
𝟐𝟎𝟎
√𝟏𝟎𝟎
= 𝟐𝟎 𝒛 =
a) 𝒑𝒓(𝒙̅ > 𝟏, 𝟎𝟓𝟎) = 𝒑𝒓 (
̅−𝝁
𝒙
𝝈
√𝒏
̅ −𝝁
𝒙
𝝈
√𝒏
>
𝟏𝟎𝟓𝟎−𝟏𝟎𝟎𝟎
)
𝟐𝟎
= 𝒑𝒓(𝒛 > 𝟐. 𝟓) =
𝟎. 𝟎𝟎𝟔𝟐
̅ < 𝟗𝟔𝟎) = 𝒑𝒓 (
b) 𝒑𝒓(𝒙
̅ −𝝁
𝒙
̅ > 𝟏𝟏𝟎𝟎) = 𝒑𝒓 (
c) 𝒑𝒓(𝒙
𝝈
√𝒏
<
̅ −𝝁
𝒙
𝝈
√𝒏
𝟗𝟔𝟎−𝟏𝟎𝟎𝟎
)
𝟐𝟎
>
= 𝒑𝒓(𝒛 < −𝟐) = 𝟎. 𝟎𝟐𝟐𝟖
𝟏𝟏𝟎𝟎−𝟏𝟎𝟎𝟎
)
𝟐𝟎
= 𝒑𝒓(𝒛 > 𝟓) = 𝟏
d) 𝒑𝒓(𝟗𝟓𝟎 < ̅𝒙 < 𝟏, 𝟏𝟓𝟎) = 𝒑𝒓 (𝟗𝟓𝟎−𝟏𝟎𝟎𝟎
<
𝟐𝟎
̅ −𝝁
𝒙
𝝈
√𝒏
<
𝟏𝟏𝟓𝟎−𝟏𝟎𝟎𝟎
)
𝟐𝟎
𝒑𝒓(−𝟐. 𝟓 < 𝒛 < 𝟕. 𝟓) = 𝟏 − 𝟎. 𝟎𝟎𝟔𝟐 = 𝟎. 𝟗𝟗𝟑𝟖
=
Exercises:
1. A population has a mean of 200 and a standard deviation of 50. A sample of size
100 will be taken and the sample mean will be used to estimate the population mean.
a) What is the expected value of 𝑋̅ ?
b) What is the standard deviation of 𝑋̅ ?
c) Show the sampling distribution of 𝑋̅
2. A population has a mean of 200 and a standard deviation of 50. Suppose a sample
of size 100 is selected and 𝑥̅ is used to estimate 𝜇.
a. What is the probability that the sample mean will be within ±5 of the population
mean?
b. What is the probability that the sample mean will be within ±10 of the
population mean?
3. Assume the population standard deviation is 25. Compute the standard error of the
mean for sample sizes of 50, 100, 150, and 200. What can you say about the size of
the standard error of the mean as the sample size is increased?
4. An electronics company manufactures resistors that have a mean resistance of 100
ohms and a standard deviation of 10 ohms. The distribution of resistance is normal.
Find the probability that a random sample of 𝑛 = 25 resistors will have an average
resistance of fewer than 95 ohms
Download