סיכום הסתברות וסטטיסטיקה: נוסחאות ומושגים מרכזיים

‫פונקציה יוצרת מומנטים‪-‬‬ ‫פונקציה יוצרת מומנטים של משתנה מקרי כלשהו מוגדרת להיות‬ ‫] 𝑒[𝐸 = )𝑡( 𝑀‬ ‫משתנה מקרי בדיד ‪𝑀 (𝑡) = 𝐸[𝑒 ] = ∑ 𝑒 ∙ 𝑃(𝑋 = 𝑘) :‬‬ ‫משתנה מקרי רציף‪𝑀 (𝑡) = 𝐸[𝑒 ] = ∫ 𝑒 ∙ 𝑓(𝑥)𝑑𝑥 :‬‬ ‫בדיקה‪ :‬אם ‪ t=0‬אז מתקיים 𝟏 = ) 𝟎𝒆(𝑬 = )𝟎 = 𝒕( 𝒙𝑴‬ ‫מומנט מסדר ‪ n‬מוגדר להיות ‪ .𝐸[𝑒 ] :‬מומנט מספר ‪ n‬של משתנה מקרי ‪X‬‬ ‫מתקבל מנגזרת ה‪-n-‬ית לפי ‪ t‬של פונקציית יוצרת המומנטים‪ ,‬בנקודה בה‬ ‫) (‬ ‫| = )𝑡( 𝑀‪ .‬מומנט מסדר ראשון )תוחלת של ‪.(x‬‬ ‫‪ t=0‬כלומר ] 𝑋[𝐸 =‬ ‫) (‬ ‫|‬ ‫ממוצע המדגם ומשפט הגבול המרכזי‪-‬‬ ‫∑‬ ‫= ̅𝑥 ממדגם למדגם אנו יכולים לקבל ממוצע מדגם שונה ‪,‬ולכן‬ ‫ממוצע המדגם‪:‬‬ ‫ממוצע המדגם הוא משתנה מקרי ויש לו התפלגות‪ .‬ממוצע האוכלוסייה נסמן ב ‪µ-‬‬ ‫)נקרא גם תוחלת(‪ .‬שונות אוכלוסייה נסמן ב‪ σ -‬סטיית תקן של אוכלוסייה‪σ :‬‬ ‫א ‪.‬תכונות התפלגות‪-‬‬ ‫ממוצע כל ממוצעי המדגם האפשריים שווה לממוצע האוכלוסייה‪𝐸[𝑋] = 𝜇 ̅ = μ :‬‬ ‫שונות כל ממוצעי המדגם האפשריים שווה לשונות האוכלוסייה מחולק ב‪ . n-‬תכונה זו‬ ‫נכונה רק במדגם מקרי‪, 𝑉(𝑋) = 𝜎 ̅ = :‬יש יחס הפוך בין גודל המדגם לבין‬ ‫) (‬ ‫שנקראת גם טעות תקן‪:‬‬ ‫‪ σ‬ממוצע המדגם גם יתפלג נורמאלית‪:‬‬ ‫̅‬ ‫‪ 𝑥̅ ~𝑁 𝜇,‬והתיקנון שלה ‪-‬‬ ‫=̅𝑍‬ ‫√‬ ‫ג‪ .‬משפט הגבול המרכזי –‬ ‫אם אוכלוסייה מתפלגת עם ממוצע ‪ µ‬ושונות ‪ σ‬אזי עבור מדגם מספיק גדול‬ ‫)‪ (n>30‬ממוצע המדגם מתפלג בקירוב נורמאלית ‪:‬‬ ‫) 𝑥(𝐸‬ ‫‪𝑥̅ ↝ 𝑁 𝜇,‬‬ ‫יש לבצע תיקון רציפות‪ -‬לא לשכוח תיקוני רציפות לאחר מעבר מבדיד לרציף‬ ‫‪1‬‬ ‫‪1‬‬ ‫‪<x<a+‬‬ ‫‪2‬‬ ‫‪2‬‬ ‫‪1‬‬ ‫‪1‬‬ ‫‪p(x ≤ a) = p x < a +‬‬ ‫‪p(x < a) = p x < a −‬‬ ‫‪2‬‬ ‫‪2‬‬ ‫‪1‬‬ ‫‪1‬‬ ‫‪p(x ≥ a) = p x > a −‬‬ ‫‪p(x > a) = p x > a +‬‬ ‫‪2‬‬ ‫‪2‬‬ ‫‪p(−a < z < a) = ϕ(a) − ϕ(−a) = 2ϕ(a) − 1‬‬ ‫)𝑎(𝜙 ‪𝜙(−𝑎) = 1 −‬‬ ‫𝑍‪𝑍 = −‬‬ ‫)𝑎 ‪→ 𝑃(𝑧 < 𝑘) = 𝑎 → 𝑃(𝑧 < 𝑘) = −1 ∗ 𝐹𝑟𝑜𝑚𝑇𝑎𝑏𝑙𝑒(1 −‬‬ ‫𝐪𝐩‬ ‫𝐱‬ ‫√‬ ‫= 𝑥‬ ‫‪1‬‬ ‫)𝑎(𝑛𝑎𝑙𝑥‬ ‫‪1‬‬ ‫𝑥‬ ‫‪1‬‬ ‫=‬ ‫𝑥‬ ‫התפלגות 𝟐𝛘‬ ‫‪E[x] = n‬‬ ‫‪V(x) = 2n‬‬ ‫‪𝑥 −μ‬‬ ‫)‪~𝜒 (1‬‬ ‫𝜎‬ ‫‪𝑥 −μ‬‬ ‫)𝑛( 𝜒~‬ ‫𝜎‬ ‫̅𝑥 ‪𝑥 −‬‬ ‫)‪~𝜒 (𝑛 − 1‬‬ ‫𝜎‬ ‫)𝑡‪𝑀( ) (𝑡) = (1 − 2‬‬ ‫)𝐪𝐩𝐧 ‪, 𝐱~𝐍(𝐧𝐩,‬תנאי‪𝐧𝐪 > 𝟓 𝐧𝐩 > 𝟓 :‬‬ ‫אם‬ ‫‪,‬‬ ‫∑‬ ‫)‪~𝜒 (𝑛 − 1‬‬ ‫)𝑛( 𝜒~‬ ‫התפלגות מינימום ומקסימום‪-‬‬ ‫התפלגות מקסימום‪ :‬נניח ש‪𝑥 -‬הינם משתנים מקריים בלתי תלויים בעלי‬ ‫אותה התפלגות רציפה‪ .‬נגדיר את ) 𝑥 ‪ 𝑈 = max (𝑥 , 𝑥 , … ,‬מתקיים ש‪:‬‬ ‫))𝑢( 𝐹( ∙ 𝑛 = )𝑢(𝑓‬ ‫))𝑡( 𝐹( = )𝑡( 𝐹 ‪ ,‬ולכן )𝑢( 𝑓 ∙‬ ‫התפלגות מינימום‪ :‬נניח ש‪𝑥 -‬הינם משתנים מקריים בלתי תלויים בעלי אותה‬ ‫התפלגות רציפה‪ .‬נגדיר את ) 𝑥 ‪ 𝑍 = min(𝑥 , 𝑥 , … ,‬מתקיים ש‪𝐹 (𝑡) = :‬‬ ‫])𝑧( 𝐹 ‪𝑓(𝑧) = 𝑛 ∙ [1 −‬‬ ‫))𝑡( 𝐹 ‪, 1 − (1 −‬ולכן )𝑧( 𝑓 ∙‬ ‫‪ 𝑥~Γ‬אז‪~𝜒 (𝑛) :‬‬ ‫= 𝑧‬ ‫שם‬ ‫סימון‬ ‫משמעות המשתנה‬ ‫אחידה‬ ‫)‪X~Ud(a,b‬‬ ‫‪ X‬מקבל ערכים שלמים בקטע ]‪ [a,b‬בהסתברות שווה )יש סה"כ‬ ‫‪ b-a+1‬תוצאות אפשריות (‪.‬‬ ‫‪ab‬‬ ‫‪2‬‬ ‫‪(b  a  1)  1‬‬ ‫‪12‬‬ ‫*‬ ‫‪np‬‬ ‫)‪np(1-p‬‬ ‫‪n‬‬ ‫בינומית‬ ‫)‪X~B(n,p‬‬ ‫‪ X‬סופר מספר "הצלחות" מתוך ‪ n‬ניסויים בלתי תלויים )אם‬ ‫אותה הסתברות ‪ p‬ל"הצלחה" בניסוי בודד(‬ ‫בינומית‬ ‫שלילית‬ ‫)‪X~NB(k,p‬‬ ‫‪ X‬סופר מספר ניסיונות עד ל"הצלחה" ‪-k‬ית )כולל( בסדרת‬ ‫ניסויים בלתי תלויים )אם אותה הסתברות ‪ p‬ל"הצלחה" בניסוי‬ ‫בודד(‬ ‫‪ x  1 k x k‬‬ ‫‪‬‬ ‫‪ p q‬‬ ‫‪ k  1‬‬ ‫*‬ ‫‪k/p‬‬ ‫‪(1  p)k‬‬ ‫‪p2‬‬ ‫‪r‬‬ ‫גיאומטרית‬ ‫)‪X~G(p‬‬ ‫היפר‪-‬‬ ‫גיאומטרית‬ ‫)‪X~HG(N,D,n‬‬ ‫‪ X‬סופר מספר ניסיונות עד ל"הצלחה" ראשונה )כולל( בסדרת‬ ‫ניסויים בלתי תלויים )אם אותה הסתברות ‪ p‬ל"הצלחה" בניסוי‬ ‫בודד(‬ ‫‪ X‬סופר מספר פריטים "מיוחדים" תוך מדגם של ‪ n‬פריטים )ללא‬ ‫החזרה( שהוצאו תוך אוכלוסיה בת ‪ N‬פריטים ומתוכם ‪D‬‬ ‫מיוחדים‪.‬‬ ‫‪p (1  p ) x 1‬‬ ‫‪1  (1  p) x‬‬ ‫‪1/p‬‬ ‫)‪(1  p‬‬ ‫‪p2‬‬ ‫‪ D  N  D ‬‬ ‫‪ x  n  x ‬‬ ‫‪ ‬‬ ‫‪‬‬ ‫‪N‬‬ ‫‪ ‬‬ ‫‪n‬‬ ‫‪ ‬‬ ‫*‬ ‫‪D‬‬ ‫‪N‬‬ ‫פואסונית‬ ‫)‪X~Pois(‬‬ ‫‪ X‬סופר מספר אירועים בזרם אירועים פואסוני ביחידת זמן‪.‬‬ ‫כאשר ‪ ‬הינו קצב האירועים )זרם אירועים פואסוני בדרך כלל‬ ‫אופייני בהרבה תהליכים סוציאליים וטבעיים כגון‪ :‬הגעות של‬ ‫שיחות טלפון למרכזיה‪ ,‬פליטה של חלקיקים בחומרים רדיו‪-‬‬ ‫אקטיביים וכדומה ‪(.‬‬ ‫‪e  x‬‬ ‫!‪x‬‬ ‫*‬ ‫‪‬‬ ‫‪‬‬ ‫אחידה‬ ‫רציפה‬ ‫)‪X~Uc(a,b‬‬ ‫‪ X‬מקבל ערכים בקטע ]‪ [a,b‬בהסתברות שווה‬ ‫‪1‬‬ ‫‪,a  x  b‬‬ ‫‪ba‬‬ ‫‪xa‬‬ ‫‪ba‬‬ ‫‪a b‬‬ ‫‪2‬‬ ‫‪b  a 2‬‬ ‫פ‪.‬הסתברות‪ /‬צפיפות‬ ‫גאמא‬ ‫התפלגות של‬ ‫זמן‬ ‫) ‪X ~ ( , ‬‬ ‫מעריכית‬ ‫‪X~Exp(‬‬ ‫נורמלית‬ ‫)‪X~N(2‬‬ ‫‪1‬‬ ‫‪b  a 1‬‬ ‫‪n x‬‬ ‫‪n x‬‬ ‫)‪ x  p (1  p‬‬ ‫‪ ‬‬ ‫משתנה רציף‬ ‫‪ X‬הינו זמן עד לאירוע "ה‪ -‬מעכשיו" בזרם אירועים פואסוני‪.‬‬ ‫)שקול ל‪ :‬זמן בין ‪ ‬אירועים פואסוניים סמוכים( כאשר ‪ ‬הינו‬ ‫קצב האירועים‪.‬‬ ‫הערה‪ :‬המשמעות הנ"ל כמובן נכונה רק עבור ‪ ‬שלם‪.‬‬ ‫המופע ה‪-n-‬י יהיה בזמן קטן מ‪𝑝(𝑥 ≤ 𝑡) = 1 − : t-‬‬ ‫)‬ ‫!‬ ‫כאשר ‪0 < 𝑞 < 1‬‬ ‫חוקי ‪-ln-‬‬ ‫𝑦 ‪ln(𝑥 ∙ 𝑦) = ln 𝑥 + ln‬‬ ‫𝑥‬ ‫‪ln‬‬ ‫𝑦 ‪= ln 𝑥 − ln‬‬ ‫𝑦‬ ‫𝑥 ‪ln 𝑥 = 𝑦 ln‬‬ ‫) 𝑥 ‪(ln‬‬ ‫𝑥‬ ‫=‬ ‫תוחלת‬ ‫שונות‬ ‫‪n‬‬ ‫פונקציה יוצרת‬ ‫מומנטים‬ ‫‪1‬‬ ‫‪e ti‬‬ ‫‪b  a 1‬‬ ‫‪2‬‬ ‫)𝑏 ‪(𝑎 ±‬‬ ‫‪𝑎±‬‬ ‫𝑏‬ ‫∙‬ ‫ס‪ .‬הנדסית אינסופית‪:‬‬ ‫= 𝑆‬ ‫‪,‬‬ ‫ס‪ .‬סדרה הנדסית‪:‬‬ ‫)‪𝑎 (𝑞 − 1‬‬ ‫= 𝑆‬ ‫‪𝑞−1‬‬ ‫‪D  D  N  n ‬‬ ‫‪1  ‬‬ ‫‪‬‬ ‫‪N  N  N  1 ‬‬ ‫‪12‬‬ ‫‪x 1e  x , x  0‬‬ ‫‪‬‬ ‫) ‪(‬‬ ‫‪when‬‬ ‫‪‬‬ ‫‪( )   x 1e  x dx‬‬ ‫∑‬ ‫‪0‬‬ ‫‪‬‬ ‫‪‬‬ ‫) ‪x (‬‬ ‫) ‪(‬‬ ‫‪‬‬ ‫‪2‬‬ ‫‪i 1‬‬ ‫‪ et p‬‬ ‫‪‬‬ ‫‪t‬‬ ‫‪ 1  qe‬‬ ‫‪1‬‬ ‫̅𝑥‬ ‫‪et p‬‬ ‫‪1  qe t‬‬ ‫) (‬ ‫=‪,c‬‬ ‫‪n‬‬ ‫‪‬‬ ‫‪‬‬ ‫)‪exp  (et  1‬‬ ‫∑𝜆 𝑒‬ ‫! 𝑥 …! 𝑥 ! 𝑥‬ ‫‪‬‬ ‫𝑥≤‪0‬‬ ‫‪‬‬ ‫‪𝑥 ≤ +∞‬‬ ‫‪𝜆 = 𝑥̅ ‬‬ ‫‪1‬‬ ‫𝑎‪𝑏−‬‬ ‫‪‬‬ ‫‪𝑎 ≤ 𝑥1‬‬ ‫‪‬‬ ‫‪𝑥 ≤ 𝑏‬‬ ‫𝑥=‪ 𝑏=θ‬‬ ‫‪  ‬‬ ‫‪‬‬ ‫‪‬‬ ‫‪ t‬‬ ‫לשים לב‪:‬‬ ‫פונק' גמא‪:‬‬ ‫!)𝛼 ‪Γ(𝛼) = (1 −‬‬ ‫‪e bt  e at‬‬ ‫‪(b  a )t‬‬ ‫‪‬‬ ‫‪when‬‬ ‫‪x‬‬ ‫𝜋√ = )‪Γ(1/2‬‬ ‫‪Γ(3/2 ) = √𝜋/2‬‬ ‫נכון כאשר 𝛼 טבעי‬ ‫‪x ( )   t  1 e t dt‬‬ ‫‪0‬‬ ‫פונק' גמא‪:‬‬ ‫𝑥 ∙ 𝑐 = )𝑥(𝑓‬ ‫‪ X‬הינו זמן עד לאירוע "הבא מעכשיו" בזרם אירועים פואסוני‪.‬‬ ‫)שקול ל‪ :‬זמן בין ‪ 2‬אירועים פואסוניים סמוכים( כאשר ‪ ‬הינו‬ ‫קצב האירועים‪.‬‬ ‫‪ x‬מתפלגת התפלגות רציפה מיוחדת בעלת צורה של פעמון ‪,‬עם‬ ‫שני פרמטרים ‪ :‬ו‪)  -‬אחראיים על מיקום ורוחב של פעמון(‪.‬‬ ‫)התפלגות נורמלית בד"כ אופיינית למשתנים מקריים ש"נוצרים"‬ ‫מהרבה השפעות שונות‪ ,‬למשל‪ :‬גובה של בן‪-‬אדם‪ ,‬ממוצע של‬ ‫ציונים של כל הסטודנטים באוניברסיטה בשנה וכדומה‪(.‬‬ ‫= ̂𝑝‬ ‫*‬ ‫‪ ,  0‬‬ ‫𝑒‬ ‫פ‪ .‬צפיפות‬ ‫המדגם‪ +‬אנ"מ‬ ‫‪‬‬ ‫‪t‬‬ ‫‪ x‬‬ ‫)‬ ‫(‬ ‫𝑒‬ ‫‪e‬‬ ‫‪1‬‬ ‫𝜋‪𝜎√2‬‬ ‫‪  x‬‬ ‫= )𝑥(𝑝‬ ‫)‬ ‫‪1  e‬‬ ‫‪x‬‬ ‫‪‬‬ ‫(‪‬‬ ‫‪1/ ‬‬ ‫‪‬‬ ‫‪2‬‬ ‫‪1/ ‬‬ ‫‪2‬‬ ‫‪‬‬ ‫∑‬ ‫‪ t‬‬ ‫‪1‬‬ ‫̅𝑥‬ ‫‪1‬‬ ‫‪‬‬ ‫‪‬‬ ‫‪exp   t   2t 2 ‬‬ ‫‪2‬‬ ‫‪‬‬ ‫‪‬‬ ‫סטנדרטי‪:‬‬ ‫𝑒‬ ‫=‬ ‫𝑒= 𝑒‬ ‫𝑛‬ ‫)𝑝 ‪𝑝 (1 −‬‬ ‫𝑥‬ ‫𝑥‬ ‫= ̂𝑝‬ ‫𝑛‬ ‫) ‪( pe  q‬‬ ‫‪‬‬ ‫‪‬‬ ‫‪‬‬ ‫‪ln‬‬ ‫𝑎𝑛 = 𝑎‬ ‫‪b  a 1‬‬ ‫𝑥‬ ‫(‬ ‫𝑛‬ ‫𝑞 𝑝‬ ‫𝑥‬ ‫מציאת סכום התפלגויות‪-‬‬ ‫𝑥𝑑)𝑥 ‪ 𝑧 = 𝑥 + 𝑦 𝑓 (𝑥 + 𝑦) = ∫ 𝑓 (𝑥)𝑓 (𝑧 −‬לזכור לתקן גבולות!‬ ‫)𝑛( 𝜒~𝑥‬ ‫חי בריבוע ‪𝑦~𝜒 (𝑚) => (𝑥 + 𝑦)~𝜒 (𝑛 + 𝑚) :‬‬ ‫)𝜆 ‪𝑥~𝛾(𝛼1,‬‬ ‫גמא ‪𝑦~𝛾(𝛼2, 𝜆) => (𝑥 + 𝑦)~𝛾(𝛼1 + 𝛼2, 𝜆) :‬‬ ‫)‪𝑥~𝑝(𝜆1‬‬ ‫פואסוני ‪𝑦~𝑝(𝜆2) => (𝑥 + 𝑦)~𝑝(𝜆1 + 𝜆2) :‬‬ ‫)𝜆(‪𝑥~ exp‬‬ ‫מעריכית ‪𝑦~ exp(𝜆) => (𝑥 + 𝑦)~ p(2, 𝜆) :‬‬ ‫𝑦 = 𝑥 ∑ )𝜆(‪𝑥 ~ exp‬‬ ‫)𝜆 ‪=> 𝑦~Γ(𝛼 = 𝑛,‬‬ ‫>= )‪𝑥~𝑁(μ1, 𝜎 1) 𝑦~𝑁(μ2, 𝜎 2‬‬ ‫נורמלית ‪:‬‬ ‫)‪(𝑥 + 𝑦)~𝑁(μ1 + μ2, 𝜎 1 + 𝜎 2‬‬ ‫פ‪ .‬התפלגות‬ ‫מצטברת‬ ‫‪x  a 1‬‬ ‫‪b  a 1‬‬ ‫𝑒‬ ‫= 𝑒‬ ‫סדרה הנדסית‪:‬‬ ‫= 𝑎 ∑‬ ‫= 𝑞‪,‬‬ ‫‪1‬‬ ‫𝑥‬ ‫∙‬ ‫∑‬ ‫𝑥‬ ‫!𝑛‬ ‫∑𝑎 = 𝑎‬ ‫משפט הגבול המרכזי‪ -‬אם ‪ X‬מתפלג כלשהוא וידוע ‪ 𝐸[𝑋] = 𝜇 𝑉(𝑋) = 𝜎 ,‬אז‬ ‫עבור מדגם מספיק גדול )לפחות ‪T ↝ 𝑁(𝑛 ∙ 𝜇, 𝑛 ∙ 𝜎 ) (30‬‬ ‫התפלגות מספר ההצלחות במדגם – הקרוב הנורמאלי להתפלגות הבינומית‪-‬‬ ‫כאשר )𝑝 ‪ Y~B(𝑛,‬ומתקיימים התנאים הבאים ‪ 𝑛 ∙ p ≥ 5 :‬וגם‬ ‫‪ 𝑛 ∙ (1 − p) ≥ 5‬ניתן לומר שהסטטיסטי ‪ Y‬מתפלג בקירוב נורמאלי ↝ ‪y‬‬ ‫∙‬ ‫))𝑝 ‪ 𝑁(𝑛 ∙ 𝑝, 𝑛 ∙ 𝑝 ∙ (1 −‬ולכן התיקנון יהיה ‪𝑍 = ∙ ∙( ) :‬‬ ‫)‪𝑦 = 𝑥 ~𝛾 𝛼 = , 𝜆 = ~𝜒 (1‬‬ ‫אם ) 𝜎 ‪) 𝑥~𝑁(μ,‬נורמלית( אז נתקנן‪ ,‬ואז‪ :‬הריבוע שלו‬ ‫)‪𝑦 = 𝑧 ~𝛾 𝛼 = , 𝜆 = ~𝜒 (1‬‬ ‫כי בריבוע‪ :‬סכום של ריבוע נורמלי ‪:‬‬ ‫טורים‪:‬‬ ‫= )𝑥 ‪(log‬‬ ‫= )𝑥𝑛𝑙(‬ ‫‪~𝐍 𝐩,‬‬ ‫קירוב בינומי לנורמלי‪:‬‬ ‫𝐧‬ ‫קירוב בינומי לפואסוני‪𝐱~𝐏(𝒏𝒑) :‬‬ ‫קירוב פואסוני לנורמלי‪ 𝐱~𝐍(𝛌, 𝛌) :‬תנאי 𝟓 > 𝛌‬ ‫התפלגות סכום תצפיות המדגם ומשפט הגבול המרכזי‬ ‫סטטיסטי – פונקציה של תוצאות המדגם‪.‬‬ ‫סטטיסטי מבטא את סכום התצפיות במדגם ‪T = ∑ 𝑥 :‬‬ ‫כל התצפיות נדגמות באקראי מאותה אוכלוסייה ‪ 𝑥 , 𝑥 , … 𝑥 ,‬הם משתנים מקריים‬ ‫בלתי תלויים בעלי התפלגות זהה שתוחלתה ‪ µ‬ושונותה ‪ σ‬אז התוחלת והשונות של‬ ‫סכום התצפיות יהיו ‪𝑉(𝑇) = 𝑛 ∙ 𝜎 , 𝐸[𝑇] = 𝑛 ∙ 𝜇 :‬‬ ‫דגימה מתוך התפלגות נורמאלית – אם ) 𝜎 ‪ X~𝑁(𝜇,‬אז‬ ‫∙‬ ‫=𝑍‬ ‫) 𝜎 ∙ 𝑛 ‪ T~𝑁(𝑛 ∙ 𝜇,‬ו‪-‬‬ ‫אם ) 𝜎 ‪) 𝑥~𝑁(0,‬חצי סטנדרטי( אז הריבוע שלו‬ ‫‪𝑦 = 𝑥 ~𝛾(𝛼 = , 𝜆 = ) :‬‬ ‫אם )‪) 𝑥~𝑁(0,1‬נורמלית סטנדרטית( אז הריבוע שלו ‪:‬‬ ‫𝐸‬ ‫בדיד‪𝐸 𝑔(𝑥) = ∑ 𝑔(𝑥 )𝑃(𝑋 = 𝑥 ) :‬‬ ‫רציף‪𝐸 𝑔(𝑥) = ∫ 𝑔(𝑥)𝑓(𝑥) ∙ 𝑑𝑥 :‬‬ ‫𝑥𝑛 = ) 𝑥(‬ ‫)𝑥(‪(𝑘 ∙ 𝑓(𝑥)) = 𝑘 ∙ 𝑓′‬‬ ‫)𝑎(‪(𝑎 ) = 𝑎 ∙ ln‬‬ ‫𝑒 = ) 𝑒(‬ ‫‪p(x = a) = p a −‬‬ ‫𝐧‬ ‫=‬ ‫)𝑞 ‪= (𝑝 +‬‬ ‫משפט הגבול המרכזי‪ :‬עבור כל התפלגות בעל תוחלת ‪ μ‬ושונות ‪ σ‬כאשר ‪n ≥ 30‬‬ ‫)מספר התצפיות( ניתן לקרב את סכום התצפיות ואת הממוצע שלהן להתפלגות‬ ‫) ‪∑ x ~N(nμ, nσ‬‬ ‫נורמלית בצורה הבאה‪x ~N μ, :‬‬ ‫מ"מ ובת"ל‬ ‫טיפים‪:‬‬ ‫‪ ‬שמחשבים פונקציה יוצרת מומנטים ‪ -‬לעשות בדיקה!!! ‪M (t = 0) = 1‬‬ ‫‪ ‬אם מבקשים גודל מדגם או מספר דגימות ← לנסות להשתמש ב‪,𝑥̅ -‬‬ ‫ושמספר האיברים יהיה הנעלם‪.‬‬ ‫‪ ‬אם מבקשים יחס איברים בין דגימות‪ :‬למצוא אמד שתלוי בממוצע‪ ,‬לחשב‬ ‫את השונות ולגזור ע"מ למצוא מינימום‪.‬‬ ‫‪ ‬אם צריך אמד לשונות ← לנסות להשתמש ב‪𝑆 -‬‬ ‫‪ ‬אם צריך להשוות בין ‪ 2‬אמדים‪ ,‬צריך לבדוק את ה ‪ – MSE‬עדיף אמד‬ ‫שהוא אח"ה ושהשונות שלו בגבול שווה ל‪.0-‬‬ ‫‪ ‬כשמחשבים שונות בעזרת פונקציה יוצרת מומנטים‪ ,‬זה כולה ) 𝑥(‪ E‬ולא‬ ‫השונות‪ .‬צריך לעשות נוסחאות בשביל להגיע אל זה‪.‬‬ ‫מציאת ריבוע התפלגות‪-‬‬ ‫נוסחת הטרנספורמציה של 𝑥 = 𝑦 ‪ ,‬כאשר )𝑥( 𝑓 ידוע‪:‬‬ ‫= )𝑦( 𝑓‬ ‫)𝑦 ‪𝑓 + 𝑦 + 𝑓 (−‬‬ ‫משתנה בדיד‬ ‫√‬ ‫=‬ ‫= ) 𝑋(𝜎‬ ‫ב‪ .‬דגימה מהתפלגות נורמאלית‪-‬‬ ‫אם נדגום מתוך אוכלוסייה שהמשתנה בה מתפלג נורמאלית עם ממוצע ‪ µ‬ושונות‬ ‫∑𝑀‬ ‫̅‬ ‫∩ 𝑃‪𝑃 ∪ = 𝑃 +𝑃 −‬‬ ‫𝟐])𝒙(𝑬[ ‪𝒗𝒂𝒓(𝒙) = 𝑬(𝒙𝟐 ) −‬‬ ‫𝟐])𝒙(𝑬[ ‪𝑬(𝒙𝟐 ) = 𝒗𝒂𝒓(𝒙) +‬‬ ‫𝜎‬ ‫= ] )𝜇 ‪E[(𝑥̅ −‬‬ ‫𝑛‬ ‫𝜇 = ) 𝑥(𝐸 = ) ̅𝑥(𝐸‬ ‫‪2‬‬ ‫שונות ממוצעי המדגם‪ .‬אם נוציא שורש לשונות נקבל סטיית תקן של ממוצע המדגם‬ ‫‪= 𝐸(𝑥) ,‬‬ ‫|‬ ‫) 𝑥(𝐸 =‬ ‫מומנט מסדר שני )תוחלת של 𝑥(‪.‬‬ ‫שימו לב שהנגזרת השני יה לא נותנת את השונות‪ ,‬אלא את ) 𝑥(𝐸‬ ‫) (‬ ‫מסדר ‪| :n‬‬ ‫= ) 𝑥(𝐸‬ ‫פונקציית יוצרת מומנטים של סכום משתנים בת"ל‪-‬‬ ‫)𝑡( 𝑀 ∗ … ∗ )𝑡( 𝑀 ∗ )𝑡( 𝑀 = )𝑡( ‪𝑀 , ,…,‬‬ ‫משפטים ‪:‬‬ ‫‪ .1‬קיימת התאמה חד חד ערכית בין משתנה מקרי לבין פונקציית יוצרת‬ ‫המומנטים שלו‪.‬‬ ‫משפט היחידות‪ :‬לכל פונקציה יוצרת מומנטים ישנה פונקציית צפיפות אחת‬ ‫שמתאימה לה ולכל פונקציית צפיפות ישנה פו"מ אחת שמתאימה לה‪.‬‬ ‫‪ .2‬השפעת הטרנספורמציה הלינארית על פונקציית יוצאת מומנטים ‪:‬‬ ‫)𝑡𝑎( 𝑀 𝑒 = )𝑡(‬ ‫𝑀‬ ‫‪ .3‬אם ‪ X‬ו‪ Y-‬משתנים בלתי תלויים מתקיים ש‪-‬‬ ‫)𝑡( 𝑀 ∙ )𝑡( 𝑀 = ] 𝑒[𝐸 ∙ ] 𝑒[𝐸 = )𝑡( 𝑀‬ ‫או באופן כללי )𝑡( 𝑀 ∏ = )𝑡(‬ ‫∑𝑀 אם ‪ x‬בעלי אותו חוק התפלגות‬ ‫)𝑡( 𝑀 = )𝑡(‬ ‫הגדרות בסיסיות‪-‬‬ ‫כאשר המשתנים בת"ל‬ ‫𝑃∙ 𝑃 = ∩ 𝑝‬ ‫)𝑦(𝑟𝑎𝑣 ‪𝑣𝑎𝑟(𝑎𝑥 ± 𝑦 + 𝑏) = 𝑎 𝑣𝑎𝑟(𝑥) +‬‬ ‫)‪E(XY) = E(X) ∗ E(Y‬‬ ‫𝜎 = )𝑥(𝑟𝑎𝑣 = ] )𝜇 ‪E[(𝑥 −‬‬ ‫𝜎 ) 𝑥(𝑟𝑎𝑣‬ ‫= ) ̅𝑥(𝑟𝑎𝑣‬ ‫=‬ ‫𝑛‬ ‫𝑛‬ ‫גם כשהמשתנים לא בת"ל‬ ‫אינטגרלים‪-‬‬ ‫𝒖𝒅 𝒗 ∫ ‪∫ 𝒖𝒅𝒗 = 𝒖𝒗 −‬‬ ‫‪1‬‬ ‫𝑐 ‪𝑒 𝑑𝑥 = 𝑒 +‬‬ ‫𝑎‬ ‫‪1‬‬ ‫𝑥 ‪𝑑𝑥 = ln‬‬ ‫𝑥‬ ‫‪1‬‬ ‫= 𝑥𝑑 𝑒𝛼𝑥‬ ‫𝛼‬ ‫𝑒 𝜆‬ ‫=𝜆‬ ‫(‬ ‫)‬ ‫‪1‬‬ ‫∑‬ ‫𝑒‬ ‫‪‬‬ ‫𝜎𝜋‪2‬‬ ‫‪−∞ ≤ 𝑥 ≤ +∞‬‬ ‫)𝜇 ‪∑(𝑥 −‬‬ ‫= 𝜎‬ ‫‪‬‬ ‫𝑛‬ ‫בדיקת השערות כללית‪-‬‬ ‫הסקה סטטיסטית‪ -‬אומדים‪-‬‬ ‫פרמטר‪ -‬ערך המאפיין את ההתפלגות שבד"כ אינו ידוע‪ .‬בד"כ יסומן ע"י 𝜃‪.‬‬ ‫סטטיסטי‪ -‬פונקציה של תצפיות המדגם בלב‪ ,‬לא תלוי בפרמטרים לא ידועים‪.‬‬ ‫אומד חסר הטיה‪ -‬אומד 𝜃 נקרא אומד חסר הטיה עבור פרמטר 𝜃 אם ורק אם‪:‬‬ ‫𝜃 =‬ ‫רמת בטחון‬ ‫𝜃 ‪ .E‬קריטריון ‪ :MSE‬קריטריון המשמש להשוואה בין אומדים שונים‪.‬‬ ‫𝜃‪𝜃−‬‬ ‫𝜃 ‪= 𝑉 𝜃 + 𝐵𝑖𝑎𝑠 𝜃, 𝜃 = 𝑉 𝜃 + 𝐸 𝜃 −‬‬ ‫ככל שה‪ MSE-‬קטן יותר‪ ,‬כך האומד טוב יותר‪.‬‬ ‫אם האומד חסר הטיה כלומר ‪ 𝐸 𝜃 − 𝜃 = 0‬אז ככל שהשונות יותר קטנה כך ה‪-‬‬ ‫‪ MSE‬יותר קטן ואם האומד לא חסר הטיה יש להציב כרגיל ולגלות מי קטן יותר ‪.‬‬ ‫פונקציית הפסד – הקשר בין הסטטיסטי לפרמטר ואומרת מה מפסידה בכל פעם‬ ‫שבוחרים באומדן מסוים 𝜃 ‪ ℓ 𝜃,‬היא תמיד תהיה חיובית או אפס ובנוסף תמיד קיימת‬ ‫נקודה אשר בה ההפסד בדיוק שווה לאפס ‪ ,‬זאת כאשר הסטטיסטי שווה בדיוק לפרמטר‪.‬‬ ‫פונקציית סיכון ‪. ℛ 𝜃, 𝜃 = E 𝜃 − 𝜃 , ℛ 𝜃, 𝜃 = E[ℓ 𝜃 , 𝜃 ] -‬אמד 𝜃 הוא אמד טוב‬ ‫לפרמטר 𝜃 ‪ ,‬אם פונקציית הסיכון שלו תהיה מינימאלית‪ .‬נסמן באופן כללי פרמטר באות‬ ‫‪ θ‬ואומר ב‪ .𝜃-‬הפרמטר 𝜃 הוא סטטיסטי המחושב על המדגם ובאמצעותו נאמוד את ‪.θ‬‬ ‫𝐸 = 𝜃 ‪𝑀𝑆𝐸 𝜃,‬‬ ‫שגיאת אמידה ‪ |𝜃 − 𝜃| -‬ההפרש בין האומד לאמת)הפרמטר(‪.‬‬ ‫אמד חסר הטיה לשונות האוכלוסייה‪:‬‬ ‫תוחלת ידועה‬ ‫𝟐𝝁𝒏 ‪∑(𝒙𝒊 − 𝝁)𝟐 ∑ 𝒙𝟐𝒊 −‬‬ ‫=‬ ‫𝒏‬ ‫𝒏‬ ‫תוחלת לא ידועה‬ ‫= 𝟐𝑺‬ ‫) 𝒊𝟐𝒙(∑‬ ‫𝟐𝒙𝒏 ‪−‬‬ ‫𝟏‪𝒏−‬‬ ‫𝟐𝝈 = ) 𝟐𝑺(𝑬‬ ‫𝟒𝝈𝟐‬ ‫𝒏‬ ‫=‬ ‫𝟐)‬ ‫𝟐𝝈 =‬ ‫𝟒𝝈𝟐‬ ‫𝟏‪𝒏−‬‬ ‫= ) 𝟐𝑺(𝑽‬ ‫𝒙 ‪∑(𝒙𝒊 −‬‬ ‫𝟏‪𝒏−‬‬ ‫𝟐‬ ‫=‬ ‫= 𝟐𝑺‬ ‫𝑺 𝑬‬ ‫𝟐‬ ‫𝑺 𝑽‬ ‫כלל המינימאקס‪ :‬אם יש כמה פונקציות סיכון‪ ,‬נבחן את המקסימום של כל‬ ‫אחת ומבין כל המקסימומים יש לחפש את המינימום‪.‬‬ ‫)‪= varθ + (E[θ] − θ‬‬ ‫אם ההכרעה תהיה כמו במציאות אין טעות ‪ .‬כלל הכרעה טוב הוא כלל‬ ‫הכרעה שבו הסיכוי לעשות טעויות הוא יותר נמוך‪.‬‬ ‫נגדיר את ההסתברויות הבאות‪:‬‬ ‫רמת מובהקות‪:‬מסוג ‪) 1‬לדחות 𝐻 ( 𝑃 = )נכונה 𝐻 לדחות 𝐻 𝑃 = ‪α‬‬ ‫לבצע טעות מסוג ‪) : 2‬לקבל 𝐻 ( 𝑃 = )נכונה 𝐻 לקבל 𝐻 𝑃 = ‪β‬‬ ‫רמת הביטחון– )לקבל 𝐻 ( 𝑃 = )נכונה 𝐻 לקבל 𝐻 𝑃 = ‪1 − α‬‬ ‫רמת העוצמה– )לדחות 𝐻 ( 𝑃 = )נכונה 𝐻 לדחות 𝐻 𝑃 = ‪1 − β‬‬ ‫**תמיד אם מרחיקים את הפרמטר ב‪ 𝐻 -‬מהפרמטר ב‪ 𝐻 -‬אז מגדילים את‬ ‫העוצמה‪.‬‬ ‫𝜷 𝜶 בפרופורציות‪:‬‬ ‫𝜃 ‪𝐿 𝜃, 𝜃 = 𝜃 −‬‬ ‫‪θ−θ‬‬ ‫עוצ‬ ‫‪MSE θ, θ = R θ, θ = E‬‬ ‫‪Bais θ, θ = E θ − θ‬‬ ‫ככל ש‪ MSE-‬קטן יותר האומד טוב יותר‪.‬‬ ‫משפט הפיצול‪∑ (x − μ) = ∑ (x − x) + n(x − μ) :‬‬ ‫אח"ה‪ :‬עבור פרמטר ‪ θ‬מתקיים ‪ E θ = θ‬כלומר ההטיה שווה לאפס‪.‬‬ ‫יעילות‪ 𝜃 :‬ו‪ 𝜃 -‬אח"ה ל‪ .θ-‬אם 𝜃 𝑟𝑎𝑣 < 𝜃 𝑟𝑎𝑣 אז 𝜃 יותר יעיל מ‪𝜃 -‬‬ ‫** אח"ה יכול לצאת לא הגיוני!‬ ‫משפט‪ :‬אם אח"ה הוא בעל שונות ששואפת ל‪ 0-‬בגבול‪ .‬אז האמד הוא עקיב לפרמטר‪.‬‬ ‫טבלת סיכום למבחנים של השונות כאשר 𝝁 ידועה‪:‬‬ ‫טבלה למבחנים של השונות כאשר 𝝁 לא ידועה‪:‬‬ ‫קירוב ‪ 𝑝̂0‬ל ורמלי → ) ‪𝛼 = 𝑝(𝑝̂ > 𝑝𝑐 |𝐻0 ) = 1 − 𝑝(𝑝̂ < 𝑝𝑐 |𝐻0 ) ⇒ 𝑝̂0 ~𝑁(𝜇0 , 𝜎02‬‬ ‫קירוב ‪ 𝑝̂1‬ל ורמלי → ) ‪𝛽 = 𝑝(𝑝̂ < 𝑝𝑐 |𝐻1 ) ⇒ 𝑝̂1 ~𝑁(𝜇1 , 𝜎12‬‬ ‫‪𝑝𝑐 − 𝜇1‬‬ ‫‪𝑝𝑐 − 𝜇0‬‬ ‫(𝜙 = 𝛽‬ ‫)‬ ‫‪𝑝1 ∙ 𝑞1‬‬ ‫(𝜙 ‪𝛼 = 1 −‬‬ ‫)‬ ‫=𝜎‬ ‫‪𝜎12‬‬ ‫‪𝜎2‬‬ ‫𝑛‬ ‫‪0‬‬ ‫הגדלת או הקטנת 𝛂 –‬ ‫‪𝛼 >α‬‬ ‫‪𝛼 <α‬‬ ‫דחינו 𝐻 עבור ‪α‬‬ ‫נדחה בוודאות‬ ‫לא ניתן לדעת‬ ‫√‬ ‫הגורמים שמשפיעים על אורך הרווח‪:‬‬ ‫) ‪ : (1-‬ככל שרמת הסמך גדולה‪ ,‬אורך הרווח גדל‪ :  .‬ככל שסטיית התקן‬ ‫גדלה‪ ,‬אורך הרווח גדל‪ :n .‬ככל שגודל המדגם גדל‪ ,‬אורך הרווח קטן‪ .‬מבין‬ ‫שלושת גורמים אלו אנו יכולים לשלוט רק על גודל המדגם‪.‬‬ ‫בחירת גודל המדגם ‪ -‬נשאל מהו גודל המדגם הדרוש‪ ,‬כדי שבביטחון של‬ ‫𝛼 ‪ 1 −‬הסטייה בין ממוצע המדגם לבין התוחלת לא תעלה על גודל מסוים ‪d‬‬ ‫)זאת אומרת‪ ,‬שאורך הרווח לא יעלה על ‪. (2d‬‬ ‫𝑍∙‪2‬‬ ‫עלינו לפתור את 𝐿 = 𝑑‪∙ ≤ 2‬‬ ‫√‬ ‫∙ ‪/‬‬ ‫מכאן נובע שגודל המדגם שיקיים את הדרישה הנ"ל הוא‬ ‫שגיאת האמידה המקסימלית‪:‬‬ ‫מבחני ‪t‬‬ ‫קריטי‬ ‫מבחני ‪z‬‬ ‫קריטי‬ ‫‪Pval‬‬ ‫≥𝑛‬ ‫𝑍 = ‪ , = 𝑑 = ε‬כאשר אפסילון‬ ‫נותן את שגיאת האמידה המקסימלית‪ ,‬דבר שנקרא גם טעות סטטיסטית ‪,‬‬ ‫טעות דגימה‪.‬‬ ‫אמד נראות מקסימלי )אנ"מ(‪:‬‬ ‫כדי לנבא היטב את הפרמטר האמיתי על‪-‬סמך מדגם מקרי מסוים‪ ,‬יש לבדוק‬ ‫איזה פרמטר מתוך כל האפשרויות הוא זה ש"יסביר" בצורה הטובה ביותר‬ ‫את המדגם‪ .‬כלומר אומד הנראות המרבית הוא הפרמטר שאם היינו מציבים‬ ‫בפונקציית ההתפלגות מראש‪ ,‬הוא היה נותן את ההסתברות הגבוהה ביותר‬ ‫לקבל את המדגם שאכן התקבל‪ ,‬ובכך ממקסם את פונקציית הנראות‪.‬‬ ‫פונקציית נראות‪:‬‬ ‫במקרה הרציף‪𝑓(𝑥 , … , 𝑥 ) = 𝑓(𝑥 ) ∗ … ∗ 𝑓(𝑥 ) = ∏ 𝑓(𝑥 ) :‬‬ ‫במקרה הבדיד‪𝑝(𝑥 , … , 𝑥 ) = 𝑝(𝑥 ) ∗ … ∗ 𝑝(𝑥 ) = ∏ 𝑝(𝑥 ) :‬‬ ‫תכונות של אנ"מ‪:‬‬ ‫‪ .1‬עקיבים )לא בהכרח חסרי הטיה אבל כש‪ n-‬שואף לאינסוף‪ -‬כן(‪.‬‬ ‫‪ .2‬אינוורינטיות‪ -‬אם האמד הוא אנ"מ עבור הפרמטר‪ ,‬אז פונקציה של האמד‬ ‫הוא אנ"מ של אותה פונקציה של הפרמטר‪ .‬לכל פונקציה חח"ע בתחום בו‬ ‫הפרמטר מוגדר‪) .‬תכונה זו נכונה גם לאח"ה רק אם הפונקציה של‬ ‫הפרמטר לינארית(‬ ‫שונות מינימלית‪ -‬גזירת השונות ע"פ המשתנה והשוואה ל‪.0-‬‬ ‫𝑥 = 𝜃 וצריך למצוא אח"ה‪/‬תוחלת‪/‬שונות‪ ,‬נצטרך‬ ‫‪#‬במידה ונמצא ש‬ ‫לעשות‪:‬‬ ‫למצוא פונק' התפלגות מצטברת ע"י אינטגרל לפונק' הצפיפות‬ ‫)𝑡( 𝐹 = 𝑥𝑑)𝑥(𝑓 ∫ להציב בנוסחה ))𝑥( 𝐹 ‪ 𝐹 (𝑥) = 1 − (1 −‬ואז‬ ‫𝜃‬ ‫ב)𝑥(‬ ‫חי בריבוע‬ ‫קריטי‬ ‫‪Pval‬‬ ‫𝑓=‬ ‫)𝑡(‬ ‫𝐹‬ ‫ולבסוף להציב בנוסחת התוחלת 𝑥𝑑)𝑥(‬ ‫𝑓 ∙ 𝑥 ∫ = ] 𝑥[𝐸‬ ‫הלמה של ניימן פירסון ‪ -‬שיטה זו עוזרת לנו לבנות מבחנים בעלי עוצמה‬ ‫מקסימאלית עבור ‪ α‬נתונה ורק בהשערה פשוטה כנגד פשוטה‪ .‬הלמה של‬ ‫ניימן פירסון אומרת שמבחן בעל עוצמה מקסימלית מתקבל כאשר אזור‬ ‫הדחיה שלו כולל את התוצאות שעבורן יחס הנראות הוא הגבוה ביותר ‪.‬‬ ‫נגדיר את יחס הנראות‪ 𝑥 , 𝑥 … 𝑥 :‬תוצאות הניסוי )תוצאות המדגם(‬ ‫ההשערות ‪:‬‬ ‫) …‪( , ,‬‬ ‫= ) 𝑥 … ‪λ(𝑥 , 𝑥 ,‬‬ ‫𝑝~ 𝑥 ∶ 𝐻 ‪, 𝐻 ∶ 𝑥 ~𝑝 ,‬‬ ‫)‬ ‫‪,‬‬ ‫…‪,‬‬ ‫(‬ ‫המשמעות של יחס הנראות היא פי כמה 𝐻 יותר סבירה מ‪𝐻 -‬‬ ‫עבור משתנים שמתפלגים רציף ‪:‬‬ ‫שלב א – בונים את פונקציית הצפיפות המשותפת בהנחת השערת האפס‬ ‫לתוצאות המדגם ובהנחת ההשערה האלטרנטיבית‪.‬‬ ‫) …‪( , ,‬‬ ‫=𝑐‬ ‫שלב ב‪ -‬מחלקים את תוצאות שלב א באופן הבא ‪> 𝑘 :‬‬ ‫)‬ ‫אם פונקציית הנראות עולה‪ .‬ו‪≤ 𝑘 -‬‬ ‫)‬ ‫…‪,‬‬ ‫‪,‬‬ ‫(‬ ‫)‬ ‫…‪,‬‬ ‫‪,‬‬ ‫(‬ ‫רווח סמך ‪-‬‬ ‫̅‬ ‫√‬ ‫∙‬ ‫∑‬ ‫∙‬ ‫𝑍 ‪ 𝑋 ±‬כאשר‬ ‫)‬ ‫=‬ ‫במקרה בו המדגם קטן נשתמש בנוסחה הבאה ‪:‬‬ ‫̅‬ ‫√‬ ‫∑‬ ‫(‬ ‫∙‬ ‫‪,‬‬ ‫= ̅𝑠‬ ‫𝑡‪𝑋±‬‬ ‫הקשר בין רווח סמך לבדיקת השערות על תוחלת – ניתן לדעת מה תהיה תוצאת‬ ‫בדיקת השערות דו‪ -‬צדדית תוך שימוש באותו מדגם‪ ,‬אותה רמת ביטחון ותחת‬ ‫הנחת 𝐻 מסוימת‪ .‬אם התוחלת הנתונה תחת 𝐻 נופלת מחוץ לרווח בר סמך‪,‬‬ ‫נדחה את 𝐻 ‪ .‬אם התוחלת נופלת בתוך הרווח בר סמך‪ ,‬לא נדחה את השערת 𝐻‬ ‫חשוב‬ ‫גדול‪-‬ימינה בגרףאמד חסר הטייה ל ‪:p‬‬ ‫רמת מובהקות ∶ ‪a‬‬ ‫קטן‪-‬שמאלה בגרף‬ ‫בדיקת השערות מושגים כלליים –‬ ‫תוצאה מובהקת = השערת האפס נדחתה‬ ‫תשובה מילולית מלאה של המסקנה – ברמת מובהקות של ___ לא נוכל‬ ‫לקבל את הטענה \ נקבל את הטענה ש____‬ ‫כאשר אנחנו מרחיקים את 𝐻 מ‪ 𝐻 -‬תמיד הסיכוי מהסוג השני קטן‪ ,‬ככל‬ ‫שהשערות מתרחקות אחת מהשנייה הסיכוי לטעויות קטן‪.‬‬ ‫מובהקות התוצאה 𝒆𝒖𝒍𝒂𝒗𝑷בבדיקת ה שערות על תוחלת עם שונות ידועה –‬ ‫אם 𝜶 ≤ 𝒆𝒖𝒍𝒂𝒗𝑷 דוחים את 𝟎𝑯 מובהקות התוצאה זה הסיכוי לקבלת תוצאות‬ ‫המדגם וקיצוני מתוצאות אלה בהנחת השערת האפס‪.‬‬ ‫𝑃‬ ‫)לקבל את תוצאות המדגם וקיצוני( 𝑃 =‬ ‫אם ההשערה היא דו צדדית ‪:‬‬ ‫𝑃‬ ‫)לקבל את תוצאות המדגם וקיצוני( 𝑃 ∙ ‪= 2‬‬ ‫הקיצוני – הכוונה יותר מתוצאות המדגם‪ ,‬לכיוון השערת המחקר לכיוון 𝐻‪,‬‬ ‫לכיוון תוצאות המדגם וקיצונה לו‪.‬‬ ‫מובהקות התוצאה היא גם האלפא המינימאלית לדחיית השערת האפס‪.‬‬ ‫רווח בר סמך טוב הוא רווח )‪ (L‬קצר ביותר בהסתברות הגבוהה ביותר‬ ‫)נרצה שהטווח יהיה קצר ביותר וההסתברות גדולה ביותר(‬ ‫𝑍‪𝑋±‬‬ ‫הנוסחה לרווח סמך ‪∙ -‬‬ ‫√‬ ‫רווח סמך לתוחלת )ממוצע האוכלוסייה( כששונות האוכלוסייה אינה ידועה –‬ ‫התנאי – ‪ X‬מתפלג נורמאלית או שהמדגם מספיק גדול‪.‬‬ ‫בדיקת השערות ל‪ p‬של הבינום עבור ‪ n‬גדול‪:‬‬ ‫לא דחינו 𝐻 עבור ‪α‬‬ ‫לא ניתן לדעת‬ ‫לא נדחה בוודאות‬ ‫∙‬ ‫בדיקת השערות על תוחלת ) ממוצע( כאשר שונות האוכלוסייה אינה ידועה‬ ‫התפלגות ‪-T‬‬ ‫התפלגות סימטרית פעמונית שהתוחלת שלה היא אפס‪ .‬ההתפלגות דומה‬ ‫להתפלגות ‪ Z‬רק שהיא יותר רחבה ולכן הערכים ש לה יהיו יותר גבוהים ‪ .‬התפלגות‬ ‫‪ T‬תלויה במושג שנקרא דרגות חופש‪ .‬דרגת החופש שווה למספר המדגמים פחות‬ ‫‪ 1‬כלומר ‪ , 𝑑𝑓 = 𝑛 − 1‬ככל שדרגות החופש עולות ההתפלגות הופעת להיות יותר‬ ‫גבוהה וצרה ‪ .‬כשדרגות החופש שואפות לאינסוף התפלגות ‪ T‬שואפת להיות כמו‬ ‫התפלגות ‪.Z‬‬ ‫𝑃 כאשר שונות האוכלוסייה אינה ידועה‪-‬‬ ‫מובהקות התוצאה‬ ‫מובהקות התוצאה זה הסיכוי לקבלת תוצאות המדגם וקיצוני מתוצאות אלה בהנחת‬ ‫𝑃 על פי טבלת ‪ T‬הערכים לא‬ ‫השערת האפס‪ .‬כאשר מחשבים את הערך של‬ ‫יהיו מדויקים והחישוב יהיה עבור חסמים למובהקות התוצאה כלומר תחום ולא‬ ‫מספר מדויק‪.‬‬ ‫…‪,‬‬ ‫‪,‬‬ ‫(‬ ‫= 𝑐 אם פונקציית הנראות‬ ‫יורדת‪ .‬כאשר ‪ c‬זה אזור הדחיה של 𝐻‪.‬‬ ‫שלב ג‪ -‬מזהים את האזור עבורו יחד הנראות הוא הגבוה ביותר ‪.‬‬ ‫שלב ד – לפי ההתפלגות של השערת האפס מוצאים את הערכים הקריטיים‬ ‫באזור בנקבע בסעיף הקודם כך שרמת המובהקות תהיה ה‪ α -‬שנקבעה‬ ‫מראש‪.‬‬ ‫^‬ ‫𝑛‪H𝑜: 𝑃 = 𝑃𝑜 , 𝑃 = 𝐵/‬‬ ‫מבחן יחס הנראות‪-‬‬ ‫כאשר אחד הפרמטרים)חוץ מזה שבודקים( אינו ידוע – לא ניתן להשתמש בלמה‪,‬‬ ‫לכן משתמשים במבחן "יחס הנראות" מבחן זה מתאים להשערות מהסוג‪:‬‬ ‫‪𝐻 :𝜇 = 𝜇 𝐻 :𝜇 ≠ 𝜇 ,‬‬ ‫ניסוח המבחן נראות‪-‬‬ ‫במונה‪ -‬מציבים במקום כל הפרמטרים את אומדני הנראות המקסימלית שלהם‪.‬‬ ‫במכנה‪ -‬נציב במקום כל הפרמטרים הלא ידועים שלא בהשערה את אומדני הנראות‬ ‫המקסימלית שלהם ובמקום הפרמטר שנבדק בהשערת האפס‪ -‬נציב את אותו‬ ‫פרמטר שבהשערת האפס‪> 𝐾.‬‬ ‫) (‬ ‫)‬ ‫(‬ ‫=𝜆‬ ‫) ‪2((1(X(Xst) 9 ft(X‬‬‫‪-‬‬ ‫‪+‬‬ ‫‪2‬‬ ‫חד צדדי עליון‪pvalue=p(x>xst|h0) :‬‬ ‫חד צדדי תחתון‪pvalue=p(x<xst|h0) :‬‬ ‫אמד טוב ל‪) Y/n :p-‬מס׳ ההצלחות במדגם(‬ ‫אמד טוב לשונות‪s^2 :‬‬ ‫‪2‬‬ ‫=‬ ‫=‬ ‫)‪prn‬‬ ‫‪zcz‬‬ ‫‪M‬‬ ‫הוכחה של התפלגות גמא סכום של מ״מ מעריכיים‬ ‫מבחן חי בריבוע לטיב התאמה‬ ‫מבחן חי בריבוע לאי תלות‬

סיכום הסתברות וסטטיסטיקה: נוסחאות ומושגים מרכזיים

Related documents

Products

Support

סיכום הסתברות וסטטיסטיקה: נוסחאות ומושגים מרכזיים

Related documents

Add this document to collection(s)

Add this document to saved

Suggest us how to improve StudyLib