Uploaded by Ron Sharabi

דף נוסחאות דוצ צבעוני

advertisement
‫פונקציה יוצרת מומנטים‪-‬‬
‫פונקציה יוצרת מומנטים של משתנה מקרי כלשהו מוגדרת להיות‬
‫] 𝑒[𝐸 = )𝑡( 𝑀‬
‫משתנה מקרי בדיד ‪𝑀 (𝑡) = 𝐸[𝑒 ] = ∑ 𝑒 ∙ 𝑃(𝑋 = 𝑘) :‬‬
‫משתנה מקרי רציף‪𝑀 (𝑡) = 𝐸[𝑒 ] = ∫ 𝑒 ∙ 𝑓(𝑥)𝑑𝑥 :‬‬
‫בדיקה‪ :‬אם ‪ t=0‬אז מתקיים 𝟏 = ) 𝟎𝒆(𝑬 = )𝟎 = 𝒕( 𝒙𝑴‬
‫מומנט מסדר ‪ n‬מוגדר להיות ‪ .𝐸[𝑒 ] :‬מומנט מספר ‪ n‬של משתנה מקרי ‪X‬‬
‫מתקבל מנגזרת ה‪-n-‬ית לפי ‪ t‬של פונקציית יוצרת המומנטים‪ ,‬בנקודה בה‬
‫) (‬
‫| = )𝑡( 𝑀‪ .‬מומנט מסדר ראשון )תוחלת של ‪.(x‬‬
‫‪ t=0‬כלומר ] 𝑋[𝐸 =‬
‫) (‬
‫|‬
‫ממוצע המדגם ומשפט הגבול המרכזי‪-‬‬
‫∑‬
‫= ̅𝑥 ממדגם למדגם אנו יכולים לקבל ממוצע מדגם שונה ‪,‬ולכן‬
‫ממוצע המדגם‪:‬‬
‫ממוצע המדגם הוא משתנה מקרי ויש לו התפלגות‪ .‬ממוצע האוכלוסייה נסמן ב ‪µ-‬‬
‫)נקרא גם תוחלת(‪ .‬שונות אוכלוסייה נסמן ב‪ σ -‬סטיית תקן של אוכלוסייה‪σ :‬‬
‫א ‪.‬תכונות התפלגות‪-‬‬
‫ממוצע כל ממוצעי המדגם האפשריים שווה לממוצע האוכלוסייה‪𝐸[𝑋] = 𝜇 ̅ = μ :‬‬
‫שונות כל ממוצעי המדגם האפשריים שווה לשונות האוכלוסייה מחולק ב‪ . n-‬תכונה זו‬
‫נכונה רק במדגם מקרי‪, 𝑉(𝑋) = 𝜎 ̅ = :‬יש יחס הפוך בין גודל המדגם לבין‬
‫) (‬
‫שנקראת גם טעות תקן‪:‬‬
‫‪ σ‬ממוצע המדגם גם יתפלג נורמאלית‪:‬‬
‫̅‬
‫‪ 𝑥̅ ~𝑁 𝜇,‬והתיקנון שלה ‪-‬‬
‫=̅𝑍‬
‫√‬
‫ג‪ .‬משפט הגבול המרכזי –‬
‫אם אוכלוסייה מתפלגת עם ממוצע ‪ µ‬ושונות ‪ σ‬אזי עבור מדגם מספיק גדול‬
‫)‪ (n>30‬ממוצע המדגם מתפלג בקירוב נורמאלית ‪:‬‬
‫) 𝑥(𝐸‬
‫‪𝑥̅ ↝ 𝑁 𝜇,‬‬
‫יש לבצע תיקון רציפות‪ -‬לא לשכוח תיקוני רציפות לאחר מעבר מבדיד לרציף‬
‫‪1‬‬
‫‪1‬‬
‫‪<x<a+‬‬
‫‪2‬‬
‫‪2‬‬
‫‪1‬‬
‫‪1‬‬
‫‪p(x ≤ a) = p x < a +‬‬
‫‪p(x < a) = p x < a −‬‬
‫‪2‬‬
‫‪2‬‬
‫‪1‬‬
‫‪1‬‬
‫‪p(x ≥ a) = p x > a −‬‬
‫‪p(x > a) = p x > a +‬‬
‫‪2‬‬
‫‪2‬‬
‫‪p(−a < z < a) = ϕ(a) − ϕ(−a) = 2ϕ(a) − 1‬‬
‫)𝑎(𝜙 ‪𝜙(−𝑎) = 1 −‬‬
‫𝑍‪𝑍 = −‬‬
‫)𝑎 ‪→ 𝑃(𝑧 < 𝑘) = 𝑎 → 𝑃(𝑧 < 𝑘) = −1 ∗ 𝐹𝑟𝑜𝑚𝑇𝑎𝑏𝑙𝑒(1 −‬‬
‫𝐪𝐩‬
‫𝐱‬
‫√‬
‫= 𝑥‬
‫‪1‬‬
‫)𝑎(𝑛𝑎𝑙𝑥‬
‫‪1‬‬
‫𝑥‬
‫‪1‬‬
‫=‬
‫𝑥‬
‫התפלגות 𝟐𝛘‬
‫‪E[x] = n‬‬
‫‪V(x) = 2n‬‬
‫‪𝑥 −μ‬‬
‫)‪~𝜒 (1‬‬
‫𝜎‬
‫‪𝑥 −μ‬‬
‫)𝑛( 𝜒~‬
‫𝜎‬
‫̅𝑥 ‪𝑥 −‬‬
‫)‪~𝜒 (𝑛 − 1‬‬
‫𝜎‬
‫)𝑡‪𝑀( ) (𝑡) = (1 − 2‬‬
‫)𝐪𝐩𝐧 ‪, 𝐱~𝐍(𝐧𝐩,‬תנאי‪𝐧𝐪 > 𝟓 𝐧𝐩 > 𝟓 :‬‬
‫אם‬
‫‪,‬‬
‫∑‬
‫)‪~𝜒 (𝑛 − 1‬‬
‫)𝑛( 𝜒~‬
‫התפלגות מינימום ומקסימום‪-‬‬
‫התפלגות מקסימום‪ :‬נניח ש‪𝑥 -‬הינם משתנים מקריים בלתי תלויים בעלי‬
‫אותה התפלגות רציפה‪ .‬נגדיר את ) 𝑥 ‪ 𝑈 = max (𝑥 , 𝑥 , … ,‬מתקיים ש‪:‬‬
‫))𝑢( 𝐹( ∙ 𝑛 = )𝑢(𝑓‬
‫))𝑡( 𝐹( = )𝑡( 𝐹 ‪ ,‬ולכן )𝑢( 𝑓 ∙‬
‫התפלגות מינימום‪ :‬נניח ש‪𝑥 -‬הינם משתנים מקריים בלתי תלויים בעלי אותה‬
‫התפלגות רציפה‪ .‬נגדיר את ) 𝑥 ‪ 𝑍 = min(𝑥 , 𝑥 , … ,‬מתקיים ש‪𝐹 (𝑡) = :‬‬
‫])𝑧( 𝐹 ‪𝑓(𝑧) = 𝑛 ∙ [1 −‬‬
‫))𝑡( 𝐹 ‪, 1 − (1 −‬ולכן )𝑧( 𝑓 ∙‬
‫‪ 𝑥~Γ‬אז‪~𝜒 (𝑛) :‬‬
‫= 𝑧‬
‫שם‬
‫סימון‬
‫משמעות המשתנה‬
‫אחידה‬
‫)‪X~Ud(a,b‬‬
‫‪ X‬מקבל ערכים שלמים בקטע ]‪ [a,b‬בהסתברות שווה )יש סה"כ‬
‫‪ b-a+1‬תוצאות אפשריות (‪.‬‬
‫‪ab‬‬
‫‪2‬‬
‫‪(b  a  1)  1‬‬
‫‪12‬‬
‫*‬
‫‪np‬‬
‫)‪np(1-p‬‬
‫‪n‬‬
‫בינומית‬
‫)‪X~B(n,p‬‬
‫‪ X‬סופר מספר "הצלחות" מתוך ‪ n‬ניסויים בלתי תלויים )אם‬
‫אותה הסתברות ‪ p‬ל"הצלחה" בניסוי בודד(‬
‫בינומית‬
‫שלילית‬
‫)‪X~NB(k,p‬‬
‫‪ X‬סופר מספר ניסיונות עד ל"הצלחה" ‪-k‬ית )כולל( בסדרת‬
‫ניסויים בלתי תלויים )אם אותה הסתברות ‪ p‬ל"הצלחה" בניסוי‬
‫בודד(‬
‫‪ x  1 k x k‬‬
‫‪‬‬
‫‪ p q‬‬
‫‪ k  1‬‬
‫*‬
‫‪k/p‬‬
‫‪(1  p)k‬‬
‫‪p2‬‬
‫‪r‬‬
‫גיאומטרית‬
‫)‪X~G(p‬‬
‫היפר‪-‬‬
‫גיאומטרית‬
‫)‪X~HG(N,D,n‬‬
‫‪ X‬סופר מספר ניסיונות עד ל"הצלחה" ראשונה )כולל( בסדרת‬
‫ניסויים בלתי תלויים )אם אותה הסתברות ‪ p‬ל"הצלחה" בניסוי‬
‫בודד(‬
‫‪ X‬סופר מספר פריטים "מיוחדים" תוך מדגם של ‪ n‬פריטים )ללא‬
‫החזרה( שהוצאו תוך אוכלוסיה בת ‪ N‬פריטים ומתוכם ‪D‬‬
‫מיוחדים‪.‬‬
‫‪p (1  p ) x 1‬‬
‫‪1  (1  p) x‬‬
‫‪1/p‬‬
‫)‪(1  p‬‬
‫‪p2‬‬
‫‪ D  N  D ‬‬
‫‪ x  n  x ‬‬
‫‪ ‬‬
‫‪‬‬
‫‪N‬‬
‫‪ ‬‬
‫‪n‬‬
‫‪ ‬‬
‫*‬
‫‪D‬‬
‫‪N‬‬
‫פואסונית‬
‫)‪X~Pois(‬‬
‫‪ X‬סופר מספר אירועים בזרם אירועים פואסוני ביחידת זמן‪.‬‬
‫כאשר ‪ ‬הינו קצב האירועים )זרם אירועים פואסוני בדרך כלל‬
‫אופייני בהרבה תהליכים סוציאליים וטבעיים כגון‪ :‬הגעות של‬
‫שיחות טלפון למרכזיה‪ ,‬פליטה של חלקיקים בחומרים רדיו‪-‬‬
‫אקטיביים וכדומה ‪(.‬‬
‫‪e  x‬‬
‫!‪x‬‬
‫*‬
‫‪‬‬
‫‪‬‬
‫אחידה‬
‫רציפה‬
‫)‪X~Uc(a,b‬‬
‫‪ X‬מקבל ערכים בקטע ]‪ [a,b‬בהסתברות שווה‬
‫‪1‬‬
‫‪,a  x  b‬‬
‫‪ba‬‬
‫‪xa‬‬
‫‪ba‬‬
‫‪a b‬‬
‫‪2‬‬
‫‪b  a 2‬‬
‫פ‪.‬הסתברות‪ /‬צפיפות‬
‫גאמא‬
‫התפלגות של‬
‫זמן‬
‫) ‪X ~ ( , ‬‬
‫מעריכית‬
‫‪X~Exp(‬‬
‫נורמלית‬
‫)‪X~N(2‬‬
‫‪1‬‬
‫‪b  a 1‬‬
‫‪n x‬‬
‫‪n x‬‬
‫)‪ x  p (1  p‬‬
‫‪ ‬‬
‫משתנה רציף‬
‫‪ X‬הינו זמן עד לאירוע "ה‪ -‬מעכשיו" בזרם אירועים פואסוני‪.‬‬
‫)שקול ל‪ :‬זמן בין ‪ ‬אירועים פואסוניים סמוכים( כאשר ‪ ‬הינו‬
‫קצב האירועים‪.‬‬
‫הערה‪ :‬המשמעות הנ"ל כמובן נכונה רק עבור ‪ ‬שלם‪.‬‬
‫המופע ה‪-n-‬י יהיה בזמן קטן מ‪𝑝(𝑥 ≤ 𝑡) = 1 − : t-‬‬
‫)‬
‫!‬
‫כאשר ‪0 < 𝑞 < 1‬‬
‫חוקי ‪-ln-‬‬
‫𝑦 ‪ln(𝑥 ∙ 𝑦) = ln 𝑥 + ln‬‬
‫𝑥‬
‫‪ln‬‬
‫𝑦 ‪= ln 𝑥 − ln‬‬
‫𝑦‬
‫𝑥 ‪ln 𝑥 = 𝑦 ln‬‬
‫) 𝑥 ‪(ln‬‬
‫𝑥‬
‫=‬
‫תוחלת‬
‫שונות‬
‫‪n‬‬
‫פונקציה יוצרת‬
‫מומנטים‬
‫‪1‬‬
‫‪e ti‬‬
‫‪b  a 1‬‬
‫‪2‬‬
‫)𝑏 ‪(𝑎 ±‬‬
‫‪𝑎±‬‬
‫𝑏‬
‫∙‬
‫ס‪ .‬הנדסית אינסופית‪:‬‬
‫= 𝑆‬
‫‪,‬‬
‫ס‪ .‬סדרה הנדסית‪:‬‬
‫)‪𝑎 (𝑞 − 1‬‬
‫= 𝑆‬
‫‪𝑞−1‬‬
‫‪D  D  N  n ‬‬
‫‪1  ‬‬
‫‪‬‬
‫‪N  N  N  1 ‬‬
‫‪12‬‬
‫‪x 1e  x , x  0‬‬
‫‪‬‬
‫) ‪(‬‬
‫‪when‬‬
‫‪‬‬
‫‪( )   x 1e  x dx‬‬
‫∑‬
‫‪0‬‬
‫‪‬‬
‫‪‬‬
‫) ‪x (‬‬
‫) ‪(‬‬
‫‪‬‬
‫‪2‬‬
‫‪i 1‬‬
‫‪ et p‬‬
‫‪‬‬
‫‪t‬‬
‫‪ 1  qe‬‬
‫‪1‬‬
‫̅𝑥‬
‫‪et p‬‬
‫‪1  qe t‬‬
‫) (‬
‫=‪,c‬‬
‫‪n‬‬
‫‪‬‬
‫‪‬‬
‫)‪exp  (et  1‬‬
‫∑𝜆 𝑒‬
‫! 𝑥 …! 𝑥 ! 𝑥‬
‫‪‬‬
‫𝑥≤‪0‬‬
‫‪‬‬
‫‪𝑥 ≤ +∞‬‬
‫‪𝜆 = 𝑥̅ ‬‬
‫‪1‬‬
‫𝑎‪𝑏−‬‬
‫‪‬‬
‫‪𝑎 ≤ 𝑥1‬‬
‫‪‬‬
‫‪𝑥 ≤ 𝑏‬‬
‫𝑥=‪ 𝑏=θ‬‬
‫‪  ‬‬
‫‪‬‬
‫‪‬‬
‫‪ t‬‬
‫לשים לב‪:‬‬
‫פונק' גמא‪:‬‬
‫!)𝛼 ‪Γ(𝛼) = (1 −‬‬
‫‪e bt  e at‬‬
‫‪(b  a )t‬‬
‫‪‬‬
‫‪when‬‬
‫‪x‬‬
‫𝜋√ = )‪Γ(1/2‬‬
‫‪Γ(3/2 ) = √𝜋/2‬‬
‫נכון כאשר 𝛼 טבעי‬
‫‪x ( )   t  1 e t dt‬‬
‫‪0‬‬
‫פונק' גמא‪:‬‬
‫𝑥 ∙ 𝑐 = )𝑥(𝑓‬
‫‪ X‬הינו זמן עד לאירוע "הבא מעכשיו" בזרם אירועים פואסוני‪.‬‬
‫)שקול ל‪ :‬זמן בין ‪ 2‬אירועים פואסוניים סמוכים( כאשר ‪ ‬הינו‬
‫קצב האירועים‪.‬‬
‫‪ x‬מתפלגת התפלגות רציפה מיוחדת בעלת צורה של פעמון ‪,‬עם‬
‫שני פרמטרים ‪ :‬ו‪)  -‬אחראיים על מיקום ורוחב של פעמון(‪.‬‬
‫)התפלגות נורמלית בד"כ אופיינית למשתנים מקריים ש"נוצרים"‬
‫מהרבה השפעות שונות‪ ,‬למשל‪ :‬גובה של בן‪-‬אדם‪ ,‬ממוצע של‬
‫ציונים של כל הסטודנטים באוניברסיטה בשנה וכדומה‪(.‬‬
‫= ̂𝑝‬
‫*‬
‫‪ ,  0‬‬
‫𝑒‬
‫פ‪ .‬צפיפות‬
‫המדגם‪ +‬אנ"מ‬
‫‪‬‬
‫‪t‬‬
‫‪ x‬‬
‫)‬
‫(‬
‫𝑒‬
‫‪e‬‬
‫‪1‬‬
‫𝜋‪𝜎√2‬‬
‫‪  x‬‬
‫= )𝑥(𝑝‬
‫)‬
‫‪1  e‬‬
‫‪x‬‬
‫‪‬‬
‫(‪‬‬
‫‪1/ ‬‬
‫‪‬‬
‫‪2‬‬
‫‪1/ ‬‬
‫‪2‬‬
‫‪‬‬
‫∑‬
‫‪ t‬‬
‫‪1‬‬
‫̅𝑥‬
‫‪1‬‬
‫‪‬‬
‫‪‬‬
‫‪exp   t   2t 2 ‬‬
‫‪2‬‬
‫‪‬‬
‫‪‬‬
‫סטנדרטי‪:‬‬
‫𝑒‬
‫=‬
‫𝑒= 𝑒‬
‫𝑛‬
‫)𝑝 ‪𝑝 (1 −‬‬
‫𝑥‬
‫𝑥‬
‫= ̂𝑝‬
‫𝑛‬
‫) ‪( pe  q‬‬
‫‪‬‬
‫‪‬‬
‫‪‬‬
‫‪ln‬‬
‫𝑎𝑛 = 𝑎‬
‫‪b  a 1‬‬
‫𝑥‬
‫(‬
‫𝑛‬
‫𝑞 𝑝‬
‫𝑥‬
‫מציאת סכום התפלגויות‪-‬‬
‫𝑥𝑑)𝑥 ‪ 𝑧 = 𝑥 + 𝑦 𝑓 (𝑥 + 𝑦) = ∫ 𝑓 (𝑥)𝑓 (𝑧 −‬לזכור לתקן גבולות!‬
‫)𝑛( 𝜒~𝑥‬
‫חי בריבוע ‪𝑦~𝜒 (𝑚) => (𝑥 + 𝑦)~𝜒 (𝑛 + 𝑚) :‬‬
‫)𝜆 ‪𝑥~𝛾(𝛼1,‬‬
‫גמא ‪𝑦~𝛾(𝛼2, 𝜆) => (𝑥 + 𝑦)~𝛾(𝛼1 + 𝛼2, 𝜆) :‬‬
‫)‪𝑥~𝑝(𝜆1‬‬
‫פואסוני ‪𝑦~𝑝(𝜆2) => (𝑥 + 𝑦)~𝑝(𝜆1 + 𝜆2) :‬‬
‫)𝜆(‪𝑥~ exp‬‬
‫מעריכית ‪𝑦~ exp(𝜆) => (𝑥 + 𝑦)~ p(2, 𝜆) :‬‬
‫𝑦 = 𝑥 ∑ )𝜆(‪𝑥 ~ exp‬‬
‫)𝜆 ‪=> 𝑦~Γ(𝛼 = 𝑛,‬‬
‫>= )‪𝑥~𝑁(μ1, 𝜎 1) 𝑦~𝑁(μ2, 𝜎 2‬‬
‫נורמלית ‪:‬‬
‫)‪(𝑥 + 𝑦)~𝑁(μ1 + μ2, 𝜎 1 + 𝜎 2‬‬
‫פ‪ .‬התפלגות‬
‫מצטברת‬
‫‪x  a 1‬‬
‫‪b  a 1‬‬
‫𝑒‬
‫= 𝑒‬
‫סדרה הנדסית‪:‬‬
‫= 𝑎 ∑‬
‫= 𝑞‪,‬‬
‫‪1‬‬
‫𝑥‬
‫∙‬
‫∑‬
‫𝑥‬
‫!𝑛‬
‫∑𝑎 = 𝑎‬
‫משפט הגבול המרכזי‪ -‬אם ‪ X‬מתפלג כלשהוא וידוע ‪ 𝐸[𝑋] = 𝜇 𝑉(𝑋) = 𝜎 ,‬אז‬
‫עבור מדגם מספיק גדול )לפחות ‪T ↝ 𝑁(𝑛 ∙ 𝜇, 𝑛 ∙ 𝜎 ) (30‬‬
‫התפלגות מספר ההצלחות במדגם – הקרוב הנורמאלי להתפלגות הבינומית‪-‬‬
‫כאשר )𝑝 ‪ Y~B(𝑛,‬ומתקיימים התנאים הבאים ‪ 𝑛 ∙ p ≥ 5 :‬וגם‬
‫‪ 𝑛 ∙ (1 − p) ≥ 5‬ניתן לומר שהסטטיסטי ‪ Y‬מתפלג בקירוב נורמאלי ↝ ‪y‬‬
‫∙‬
‫))𝑝 ‪ 𝑁(𝑛 ∙ 𝑝, 𝑛 ∙ 𝑝 ∙ (1 −‬ולכן התיקנון יהיה ‪𝑍 = ∙ ∙( ) :‬‬
‫)‪𝑦 = 𝑥 ~𝛾 𝛼 = , 𝜆 = ~𝜒 (1‬‬
‫אם ) 𝜎 ‪) 𝑥~𝑁(μ,‬נורמלית( אז נתקנן‪ ,‬ואז‪ :‬הריבוע שלו‬
‫)‪𝑦 = 𝑧 ~𝛾 𝛼 = , 𝜆 = ~𝜒 (1‬‬
‫כי בריבוע‪ :‬סכום של ריבוע נורמלי ‪:‬‬
‫טורים‪:‬‬
‫= )𝑥 ‪(log‬‬
‫= )𝑥𝑛𝑙(‬
‫‪~𝐍 𝐩,‬‬
‫קירוב בינומי לנורמלי‪:‬‬
‫𝐧‬
‫קירוב בינומי לפואסוני‪𝐱~𝐏(𝒏𝒑) :‬‬
‫קירוב פואסוני לנורמלי‪ 𝐱~𝐍(𝛌, 𝛌) :‬תנאי 𝟓 > 𝛌‬
‫התפלגות סכום תצפיות המדגם ומשפט הגבול המרכזי‬
‫סטטיסטי – פונקציה של תוצאות המדגם‪.‬‬
‫סטטיסטי מבטא את סכום התצפיות במדגם ‪T = ∑ 𝑥 :‬‬
‫כל התצפיות נדגמות באקראי מאותה אוכלוסייה ‪ 𝑥 , 𝑥 , … 𝑥 ,‬הם משתנים מקריים‬
‫בלתי תלויים בעלי התפלגות זהה שתוחלתה ‪ µ‬ושונותה ‪ σ‬אז התוחלת והשונות של‬
‫סכום התצפיות יהיו ‪𝑉(𝑇) = 𝑛 ∙ 𝜎 , 𝐸[𝑇] = 𝑛 ∙ 𝜇 :‬‬
‫דגימה מתוך התפלגות נורמאלית – אם ) 𝜎 ‪ X~𝑁(𝜇,‬אז‬
‫∙‬
‫=𝑍‬
‫) 𝜎 ∙ 𝑛 ‪ T~𝑁(𝑛 ∙ 𝜇,‬ו‪-‬‬
‫אם ) 𝜎 ‪) 𝑥~𝑁(0,‬חצי סטנדרטי( אז הריבוע שלו‬
‫‪𝑦 = 𝑥 ~𝛾(𝛼 = , 𝜆 = ) :‬‬
‫אם )‪) 𝑥~𝑁(0,1‬נורמלית סטנדרטית( אז הריבוע שלו ‪:‬‬
‫𝐸‬
‫בדיד‪𝐸 𝑔(𝑥) = ∑ 𝑔(𝑥 )𝑃(𝑋 = 𝑥 ) :‬‬
‫רציף‪𝐸 𝑔(𝑥) = ∫ 𝑔(𝑥)𝑓(𝑥) ∙ 𝑑𝑥 :‬‬
‫𝑥𝑛 = ) 𝑥(‬
‫)𝑥(‪(𝑘 ∙ 𝑓(𝑥)) = 𝑘 ∙ 𝑓′‬‬
‫)𝑎(‪(𝑎 ) = 𝑎 ∙ ln‬‬
‫𝑒 = ) 𝑒(‬
‫‪p(x = a) = p a −‬‬
‫𝐧‬
‫=‬
‫)𝑞 ‪= (𝑝 +‬‬
‫משפט הגבול המרכזי‪ :‬עבור כל התפלגות בעל תוחלת ‪ μ‬ושונות ‪ σ‬כאשר ‪n ≥ 30‬‬
‫)מספר התצפיות( ניתן לקרב את סכום התצפיות ואת הממוצע שלהן להתפלגות‬
‫) ‪∑ x ~N(nμ, nσ‬‬
‫נורמלית בצורה הבאה‪x ~N μ, :‬‬
‫מ"מ ובת"ל‬
‫טיפים‪:‬‬
‫‪ ‬שמחשבים פונקציה יוצרת מומנטים ‪ -‬לעשות בדיקה!!! ‪M (t = 0) = 1‬‬
‫‪ ‬אם מבקשים גודל מדגם או מספר דגימות ← לנסות להשתמש ב‪,𝑥̅ -‬‬
‫ושמספר האיברים יהיה הנעלם‪.‬‬
‫‪ ‬אם מבקשים יחס איברים בין דגימות‪ :‬למצוא אמד שתלוי בממוצע‪ ,‬לחשב‬
‫את השונות ולגזור ע"מ למצוא מינימום‪.‬‬
‫‪ ‬אם צריך אמד לשונות ← לנסות להשתמש ב‪𝑆 -‬‬
‫‪ ‬אם צריך להשוות בין ‪ 2‬אמדים‪ ,‬צריך לבדוק את ה ‪ – MSE‬עדיף אמד‬
‫שהוא אח"ה ושהשונות שלו בגבול שווה ל‪.0-‬‬
‫‪ ‬כשמחשבים שונות בעזרת פונקציה יוצרת מומנטים‪ ,‬זה כולה ) 𝑥(‪ E‬ולא‬
‫השונות‪ .‬צריך לעשות נוסחאות בשביל להגיע אל זה‪.‬‬
‫מציאת ריבוע התפלגות‪-‬‬
‫נוסחת הטרנספורמציה של 𝑥 = 𝑦 ‪ ,‬כאשר )𝑥( 𝑓 ידוע‪:‬‬
‫= )𝑦( 𝑓‬
‫)𝑦 ‪𝑓 + 𝑦 + 𝑓 (−‬‬
‫משתנה בדיד‬
‫√‬
‫=‬
‫= ) 𝑋(𝜎‬
‫ב‪ .‬דגימה מהתפלגות נורמאלית‪-‬‬
‫אם נדגום מתוך אוכלוסייה שהמשתנה בה מתפלג נורמאלית עם ממוצע ‪ µ‬ושונות‬
‫∑𝑀‬
‫̅‬
‫∩ 𝑃‪𝑃 ∪ = 𝑃 +𝑃 −‬‬
‫𝟐])𝒙(𝑬[ ‪𝒗𝒂𝒓(𝒙) = 𝑬(𝒙𝟐 ) −‬‬
‫𝟐])𝒙(𝑬[ ‪𝑬(𝒙𝟐 ) = 𝒗𝒂𝒓(𝒙) +‬‬
‫𝜎‬
‫= ] )𝜇 ‪E[(𝑥̅ −‬‬
‫𝑛‬
‫𝜇 = ) 𝑥(𝐸 = ) ̅𝑥(𝐸‬
‫‪2‬‬
‫שונות ממוצעי המדגם‪ .‬אם נוציא שורש לשונות נקבל סטיית תקן של ממוצע המדגם‬
‫‪= 𝐸(𝑥) ,‬‬
‫|‬
‫) 𝑥(𝐸 =‬
‫מומנט מסדר שני )תוחלת של 𝑥(‪.‬‬
‫שימו לב שהנגזרת השני יה לא נותנת את השונות‪ ,‬אלא את ) 𝑥(𝐸‬
‫) (‬
‫מסדר ‪| :n‬‬
‫= ) 𝑥(𝐸‬
‫פונקציית יוצרת מומנטים של סכום משתנים בת"ל‪-‬‬
‫)𝑡( 𝑀 ∗ … ∗ )𝑡( 𝑀 ∗ )𝑡( 𝑀 = )𝑡( ‪𝑀 , ,…,‬‬
‫משפטים ‪:‬‬
‫‪ .1‬קיימת התאמה חד חד ערכית בין משתנה מקרי לבין פונקציית יוצרת‬
‫המומנטים שלו‪.‬‬
‫משפט היחידות‪ :‬לכל פונקציה יוצרת מומנטים ישנה פונקציית צפיפות אחת‬
‫שמתאימה לה ולכל פונקציית צפיפות ישנה פו"מ אחת שמתאימה לה‪.‬‬
‫‪ .2‬השפעת הטרנספורמציה הלינארית על פונקציית יוצאת מומנטים ‪:‬‬
‫)𝑡𝑎( 𝑀 𝑒 = )𝑡(‬
‫𝑀‬
‫‪ .3‬אם ‪ X‬ו‪ Y-‬משתנים בלתי תלויים מתקיים ש‪-‬‬
‫)𝑡( 𝑀 ∙ )𝑡( 𝑀 = ] 𝑒[𝐸 ∙ ] 𝑒[𝐸 = )𝑡( 𝑀‬
‫או באופן כללי )𝑡( 𝑀 ∏ = )𝑡(‬
‫∑𝑀 אם ‪ x‬בעלי אותו חוק התפלגות‬
‫)𝑡( 𝑀 = )𝑡(‬
‫הגדרות בסיסיות‪-‬‬
‫כאשר המשתנים בת"ל‬
‫𝑃∙ 𝑃 = ∩ 𝑝‬
‫)𝑦(𝑟𝑎𝑣 ‪𝑣𝑎𝑟(𝑎𝑥 ± 𝑦 + 𝑏) = 𝑎 𝑣𝑎𝑟(𝑥) +‬‬
‫)‪E(XY) = E(X) ∗ E(Y‬‬
‫𝜎 = )𝑥(𝑟𝑎𝑣 = ] )𝜇 ‪E[(𝑥 −‬‬
‫𝜎 ) 𝑥(𝑟𝑎𝑣‬
‫= ) ̅𝑥(𝑟𝑎𝑣‬
‫=‬
‫𝑛‬
‫𝑛‬
‫גם כשהמשתנים לא בת"ל‬
‫אינטגרלים‪-‬‬
‫𝒖𝒅 𝒗 ∫ ‪∫ 𝒖𝒅𝒗 = 𝒖𝒗 −‬‬
‫‪1‬‬
‫𝑐 ‪𝑒 𝑑𝑥 = 𝑒 +‬‬
‫𝑎‬
‫‪1‬‬
‫𝑥 ‪𝑑𝑥 = ln‬‬
‫𝑥‬
‫‪1‬‬
‫= 𝑥𝑑 𝑒𝛼𝑥‬
‫𝛼‬
‫𝑒 𝜆‬
‫=𝜆‬
‫(‬
‫)‬
‫‪1‬‬
‫∑‬
‫𝑒‬
‫‪‬‬
‫𝜎𝜋‪2‬‬
‫‪−∞ ≤ 𝑥 ≤ +∞‬‬
‫)𝜇 ‪∑(𝑥 −‬‬
‫= 𝜎‬
‫‪‬‬
‫𝑛‬
‫בדיקת השערות כללית‪-‬‬
‫הסקה סטטיסטית‪ -‬אומדים‪-‬‬
‫פרמטר‪ -‬ערך המאפיין את ההתפלגות שבד"כ אינו ידוע‪ .‬בד"כ יסומן ע"י 𝜃‪.‬‬
‫סטטיסטי‪ -‬פונקציה של תצפיות המדגם בלב‪ ,‬לא תלוי בפרמטרים לא ידועים‪.‬‬
‫אומד חסר הטיה‪ -‬אומד 𝜃 נקרא אומד חסר הטיה עבור פרמטר 𝜃 אם ורק אם‪:‬‬
‫𝜃 =‬
‫רמת בטחון‬
‫𝜃 ‪ .E‬קריטריון ‪ :MSE‬קריטריון המשמש להשוואה בין אומדים שונים‪.‬‬
‫𝜃‪𝜃−‬‬
‫𝜃 ‪= 𝑉 𝜃 + 𝐵𝑖𝑎𝑠 𝜃, 𝜃 = 𝑉 𝜃 + 𝐸 𝜃 −‬‬
‫ככל שה‪ MSE-‬קטן יותר‪ ,‬כך האומד טוב יותר‪.‬‬
‫אם האומד חסר הטיה כלומר ‪ 𝐸 𝜃 − 𝜃 = 0‬אז ככל שהשונות יותר קטנה כך ה‪-‬‬
‫‪ MSE‬יותר קטן ואם האומד לא חסר הטיה יש להציב כרגיל ולגלות מי קטן יותר ‪.‬‬
‫פונקציית הפסד – הקשר בין הסטטיסטי לפרמטר ואומרת מה מפסידה בכל פעם‬
‫שבוחרים באומדן מסוים 𝜃 ‪ ℓ 𝜃,‬היא תמיד תהיה חיובית או אפס ובנוסף תמיד קיימת‬
‫נקודה אשר בה ההפסד בדיוק שווה לאפס ‪ ,‬זאת כאשר הסטטיסטי שווה בדיוק לפרמטר‪.‬‬
‫פונקציית סיכון ‪. ℛ 𝜃, 𝜃 = E 𝜃 − 𝜃 , ℛ 𝜃, 𝜃 = E[ℓ 𝜃 , 𝜃 ] -‬אמד 𝜃 הוא אמד טוב‬
‫לפרמטר 𝜃 ‪ ,‬אם פונקציית הסיכון שלו תהיה מינימאלית‪ .‬נסמן באופן כללי פרמטר באות‬
‫‪ θ‬ואומר ב‪ .𝜃-‬הפרמטר 𝜃 הוא סטטיסטי המחושב על המדגם ובאמצעותו נאמוד את ‪.θ‬‬
‫𝐸 = 𝜃 ‪𝑀𝑆𝐸 𝜃,‬‬
‫שגיאת אמידה ‪ |𝜃 − 𝜃| -‬ההפרש בין האומד לאמת)הפרמטר(‪.‬‬
‫אמד חסר הטיה לשונות האוכלוסייה‪:‬‬
‫תוחלת ידועה‬
‫𝟐𝝁𝒏 ‪∑(𝒙𝒊 − 𝝁)𝟐 ∑ 𝒙𝟐𝒊 −‬‬
‫=‬
‫𝒏‬
‫𝒏‬
‫תוחלת לא ידועה‬
‫= 𝟐𝑺‬
‫) 𝒊𝟐𝒙(∑‬
‫𝟐𝒙𝒏 ‪−‬‬
‫𝟏‪𝒏−‬‬
‫𝟐𝝈 = ) 𝟐𝑺(𝑬‬
‫𝟒𝝈𝟐‬
‫𝒏‬
‫=‬
‫𝟐)‬
‫𝟐𝝈 =‬
‫𝟒𝝈𝟐‬
‫𝟏‪𝒏−‬‬
‫= ) 𝟐𝑺(𝑽‬
‫𝒙 ‪∑(𝒙𝒊 −‬‬
‫𝟏‪𝒏−‬‬
‫𝟐‬
‫=‬
‫= 𝟐𝑺‬
‫𝑺 𝑬‬
‫𝟐‬
‫𝑺 𝑽‬
‫כלל המינימאקס‪ :‬אם יש כמה פונקציות סיכון‪ ,‬נבחן את המקסימום של כל‬
‫אחת ומבין כל המקסימומים יש לחפש את המינימום‪.‬‬
‫)‪= varθ + (E[θ] − θ‬‬
‫אם ההכרעה תהיה כמו במציאות אין טעות ‪ .‬כלל הכרעה טוב הוא כלל‬
‫הכרעה שבו הסיכוי לעשות טעויות הוא יותר נמוך‪.‬‬
‫נגדיר את ההסתברויות הבאות‪:‬‬
‫רמת מובהקות‪:‬מסוג ‪) 1‬לדחות 𝐻 ( 𝑃 = )נכונה 𝐻 לדחות 𝐻 𝑃 = ‪α‬‬
‫לבצע טעות מסוג ‪) : 2‬לקבל 𝐻 ( 𝑃 = )נכונה 𝐻 לקבל 𝐻 𝑃 = ‪β‬‬
‫רמת הביטחון– )לקבל 𝐻 ( 𝑃 = )נכונה 𝐻 לקבל 𝐻 𝑃 = ‪1 − α‬‬
‫רמת העוצמה– )לדחות 𝐻 ( 𝑃 = )נכונה 𝐻 לדחות 𝐻 𝑃 = ‪1 − β‬‬
‫**תמיד אם מרחיקים את הפרמטר ב‪ 𝐻 -‬מהפרמטר ב‪ 𝐻 -‬אז מגדילים את‬
‫העוצמה‪.‬‬
‫𝜷 𝜶 בפרופורציות‪:‬‬
‫𝜃 ‪𝐿 𝜃, 𝜃 = 𝜃 −‬‬
‫‪θ−θ‬‬
‫עוצ‬
‫‪MSE θ, θ = R θ, θ = E‬‬
‫‪Bais θ, θ = E θ − θ‬‬
‫ככל ש‪ MSE-‬קטן יותר האומד טוב יותר‪.‬‬
‫משפט הפיצול‪∑ (x − μ) = ∑ (x − x) + n(x − μ) :‬‬
‫אח"ה‪ :‬עבור פרמטר ‪ θ‬מתקיים ‪ E θ = θ‬כלומר ההטיה שווה לאפס‪.‬‬
‫יעילות‪ 𝜃 :‬ו‪ 𝜃 -‬אח"ה ל‪ .θ-‬אם 𝜃 𝑟𝑎𝑣 < 𝜃 𝑟𝑎𝑣 אז 𝜃 יותר יעיל מ‪𝜃 -‬‬
‫** אח"ה יכול לצאת לא הגיוני!‬
‫משפט‪ :‬אם אח"ה הוא בעל שונות ששואפת ל‪ 0-‬בגבול‪ .‬אז האמד הוא עקיב לפרמטר‪.‬‬
‫טבלת סיכום למבחנים של השונות כאשר 𝝁 ידועה‪:‬‬
‫טבלה למבחנים של השונות כאשר 𝝁 לא ידועה‪:‬‬
‫קירוב ‪ 𝑝̂0‬ל ורמלי → ) ‪𝛼 = 𝑝(𝑝̂ > 𝑝𝑐 |𝐻0 ) = 1 − 𝑝(𝑝̂ < 𝑝𝑐 |𝐻0 ) ⇒ 𝑝̂0 ~𝑁(𝜇0 , 𝜎02‬‬
‫קירוב ‪ 𝑝̂1‬ל ורמלי → ) ‪𝛽 = 𝑝(𝑝̂ < 𝑝𝑐 |𝐻1 ) ⇒ 𝑝̂1 ~𝑁(𝜇1 , 𝜎12‬‬
‫‪𝑝𝑐 − 𝜇1‬‬
‫‪𝑝𝑐 − 𝜇0‬‬
‫(𝜙 = 𝛽‬
‫)‬
‫‪𝑝1 ∙ 𝑞1‬‬
‫(𝜙 ‪𝛼 = 1 −‬‬
‫)‬
‫=𝜎‬
‫‪𝜎12‬‬
‫‪𝜎2‬‬
‫𝑛‬
‫‪0‬‬
‫הגדלת או הקטנת 𝛂 –‬
‫‪𝛼 >α‬‬
‫‪𝛼 <α‬‬
‫דחינו 𝐻 עבור ‪α‬‬
‫נדחה בוודאות‬
‫לא ניתן לדעת‬
‫√‬
‫הגורמים שמשפיעים על אורך הרווח‪:‬‬
‫) ‪ : (1-‬ככל שרמת הסמך גדולה‪ ,‬אורך הרווח גדל‪ :  .‬ככל שסטיית התקן‬
‫גדלה‪ ,‬אורך הרווח גדל‪ :n .‬ככל שגודל המדגם גדל‪ ,‬אורך הרווח קטן‪ .‬מבין‬
‫שלושת גורמים אלו אנו יכולים לשלוט רק על גודל המדגם‪.‬‬
‫בחירת גודל המדגם ‪ -‬נשאל מהו גודל המדגם הדרוש‪ ,‬כדי שבביטחון של‬
‫𝛼 ‪ 1 −‬הסטייה בין ממוצע המדגם לבין התוחלת לא תעלה על גודל מסוים ‪d‬‬
‫)זאת אומרת‪ ,‬שאורך הרווח לא יעלה על ‪. (2d‬‬
‫𝑍∙‪2‬‬
‫עלינו לפתור את 𝐿 = 𝑑‪∙ ≤ 2‬‬
‫√‬
‫∙ ‪/‬‬
‫מכאן נובע שגודל המדגם שיקיים את הדרישה הנ"ל הוא‬
‫שגיאת האמידה המקסימלית‪:‬‬
‫מבחני ‪t‬‬
‫קריטי‬
‫מבחני ‪z‬‬
‫קריטי‬
‫‪Pval‬‬
‫≥𝑛‬
‫𝑍 = ‪ , = 𝑑 = ε‬כאשר אפסילון‬
‫נותן את שגיאת האמידה המקסימלית‪ ,‬דבר שנקרא גם טעות סטטיסטית ‪,‬‬
‫טעות דגימה‪.‬‬
‫אמד נראות מקסימלי )אנ"מ(‪:‬‬
‫כדי לנבא היטב את הפרמטר האמיתי על‪-‬סמך מדגם מקרי מסוים‪ ,‬יש לבדוק‬
‫איזה פרמטר מתוך כל האפשרויות הוא זה ש"יסביר" בצורה הטובה ביותר‬
‫את המדגם‪ .‬כלומר אומד הנראות המרבית הוא הפרמטר שאם היינו מציבים‬
‫בפונקציית ההתפלגות מראש‪ ,‬הוא היה נותן את ההסתברות הגבוהה ביותר‬
‫לקבל את המדגם שאכן התקבל‪ ,‬ובכך ממקסם את פונקציית הנראות‪.‬‬
‫פונקציית נראות‪:‬‬
‫במקרה הרציף‪𝑓(𝑥 , … , 𝑥 ) = 𝑓(𝑥 ) ∗ … ∗ 𝑓(𝑥 ) = ∏ 𝑓(𝑥 ) :‬‬
‫במקרה הבדיד‪𝑝(𝑥 , … , 𝑥 ) = 𝑝(𝑥 ) ∗ … ∗ 𝑝(𝑥 ) = ∏ 𝑝(𝑥 ) :‬‬
‫תכונות של אנ"מ‪:‬‬
‫‪ .1‬עקיבים )לא בהכרח חסרי הטיה אבל כש‪ n-‬שואף לאינסוף‪ -‬כן(‪.‬‬
‫‪ .2‬אינוורינטיות‪ -‬אם האמד הוא אנ"מ עבור הפרמטר‪ ,‬אז פונקציה של האמד‬
‫הוא אנ"מ של אותה פונקציה של הפרמטר‪ .‬לכל פונקציה חח"ע בתחום בו‬
‫הפרמטר מוגדר‪) .‬תכונה זו נכונה גם לאח"ה רק אם הפונקציה של‬
‫הפרמטר לינארית(‬
‫שונות מינימלית‪ -‬גזירת השונות ע"פ המשתנה והשוואה ל‪.0-‬‬
‫𝑥 = 𝜃 וצריך למצוא אח"ה‪/‬תוחלת‪/‬שונות‪ ,‬נצטרך‬
‫‪#‬במידה ונמצא ש‬
‫לעשות‪:‬‬
‫למצוא פונק' התפלגות מצטברת ע"י אינטגרל לפונק' הצפיפות‬
‫)𝑡( 𝐹 = 𝑥𝑑)𝑥(𝑓 ∫ להציב בנוסחה ))𝑥( 𝐹 ‪ 𝐹 (𝑥) = 1 − (1 −‬ואז‬
‫𝜃‬
‫ב)𝑥(‬
‫חי בריבוע‬
‫קריטי‬
‫‪Pval‬‬
‫𝑓=‬
‫)𝑡(‬
‫𝐹‬
‫ולבסוף להציב בנוסחת התוחלת 𝑥𝑑)𝑥(‬
‫𝑓 ∙ 𝑥 ∫ = ] 𝑥[𝐸‬
‫הלמה של ניימן פירסון ‪ -‬שיטה זו עוזרת לנו לבנות מבחנים בעלי עוצמה‬
‫מקסימאלית עבור ‪ α‬נתונה ורק בהשערה פשוטה כנגד פשוטה‪ .‬הלמה של‬
‫ניימן פירסון אומרת שמבחן בעל עוצמה מקסימלית מתקבל כאשר אזור‬
‫הדחיה שלו כולל את התוצאות שעבורן יחס הנראות הוא הגבוה ביותר ‪.‬‬
‫נגדיר את יחס הנראות‪ 𝑥 , 𝑥 … 𝑥 :‬תוצאות הניסוי )תוצאות המדגם(‬
‫ההשערות ‪:‬‬
‫) …‪( , ,‬‬
‫= ) 𝑥 … ‪λ(𝑥 , 𝑥 ,‬‬
‫𝑝~ 𝑥 ∶ 𝐻 ‪, 𝐻 ∶ 𝑥 ~𝑝 ,‬‬
‫)‬
‫‪,‬‬
‫…‪,‬‬
‫(‬
‫המשמעות של יחס הנראות היא פי כמה 𝐻 יותר סבירה מ‪𝐻 -‬‬
‫עבור משתנים שמתפלגים רציף ‪:‬‬
‫שלב א – בונים את פונקציית הצפיפות המשותפת בהנחת השערת האפס‬
‫לתוצאות המדגם ובהנחת ההשערה האלטרנטיבית‪.‬‬
‫) …‪( , ,‬‬
‫=𝑐‬
‫שלב ב‪ -‬מחלקים את תוצאות שלב א באופן הבא ‪> 𝑘 :‬‬
‫)‬
‫אם פונקציית הנראות עולה‪ .‬ו‪≤ 𝑘 -‬‬
‫)‬
‫…‪,‬‬
‫‪,‬‬
‫(‬
‫)‬
‫…‪,‬‬
‫‪,‬‬
‫(‬
‫רווח סמך ‪-‬‬
‫̅‬
‫√‬
‫∙‬
‫∑‬
‫∙‬
‫𝑍 ‪ 𝑋 ±‬כאשר‬
‫)‬
‫=‬
‫במקרה בו המדגם קטן נשתמש בנוסחה הבאה ‪:‬‬
‫̅‬
‫√‬
‫∑‬
‫(‬
‫∙‬
‫‪,‬‬
‫= ̅𝑠‬
‫𝑡‪𝑋±‬‬
‫הקשר בין רווח סמך לבדיקת השערות על תוחלת – ניתן לדעת מה תהיה תוצאת‬
‫בדיקת השערות דו‪ -‬צדדית תוך שימוש באותו מדגם‪ ,‬אותה רמת ביטחון ותחת‬
‫הנחת 𝐻 מסוימת‪ .‬אם התוחלת הנתונה תחת 𝐻 נופלת מחוץ לרווח בר סמך‪,‬‬
‫נדחה את 𝐻 ‪ .‬אם התוחלת נופלת בתוך הרווח בר סמך‪ ,‬לא נדחה את השערת 𝐻‬
‫חשוב‬
‫גדול‪-‬ימינה בגרףאמד חסר הטייה ל ‪:p‬‬
‫רמת מובהקות ∶ ‪a‬‬
‫קטן‪-‬שמאלה בגרף‬
‫בדיקת השערות מושגים כלליים –‬
‫תוצאה מובהקת = השערת האפס נדחתה‬
‫תשובה מילולית מלאה של המסקנה – ברמת מובהקות של ___ לא נוכל‬
‫לקבל את הטענה \ נקבל את הטענה ש____‬
‫כאשר אנחנו מרחיקים את 𝐻 מ‪ 𝐻 -‬תמיד הסיכוי מהסוג השני קטן‪ ,‬ככל‬
‫שהשערות מתרחקות אחת מהשנייה הסיכוי לטעויות קטן‪.‬‬
‫מובהקות התוצאה 𝒆𝒖𝒍𝒂𝒗𝑷בבדיקת ה שערות על תוחלת עם שונות ידועה –‬
‫אם 𝜶 ≤ 𝒆𝒖𝒍𝒂𝒗𝑷 דוחים את 𝟎𝑯 מובהקות התוצאה זה הסיכוי לקבלת תוצאות‬
‫המדגם וקיצוני מתוצאות אלה בהנחת השערת האפס‪.‬‬
‫𝑃‬
‫)לקבל את תוצאות המדגם וקיצוני( 𝑃 =‬
‫אם ההשערה היא דו צדדית ‪:‬‬
‫𝑃‬
‫)לקבל את תוצאות המדגם וקיצוני( 𝑃 ∙ ‪= 2‬‬
‫הקיצוני – הכוונה יותר מתוצאות המדגם‪ ,‬לכיוון השערת המחקר לכיוון 𝐻‪,‬‬
‫לכיוון תוצאות המדגם וקיצונה לו‪.‬‬
‫מובהקות התוצאה היא גם האלפא המינימאלית לדחיית השערת האפס‪.‬‬
‫רווח בר סמך טוב הוא רווח )‪ (L‬קצר ביותר בהסתברות הגבוהה ביותר‬
‫)נרצה שהטווח יהיה קצר ביותר וההסתברות גדולה ביותר(‬
‫𝑍‪𝑋±‬‬
‫הנוסחה לרווח סמך ‪∙ -‬‬
‫√‬
‫רווח סמך לתוחלת )ממוצע האוכלוסייה( כששונות האוכלוסייה אינה ידועה –‬
‫התנאי – ‪ X‬מתפלג נורמאלית או שהמדגם מספיק גדול‪.‬‬
‫בדיקת השערות ל‪ p‬של הבינום עבור ‪ n‬גדול‪:‬‬
‫לא דחינו 𝐻 עבור ‪α‬‬
‫לא ניתן לדעת‬
‫לא נדחה בוודאות‬
‫∙‬
‫בדיקת השערות על תוחלת ) ממוצע( כאשר שונות האוכלוסייה אינה ידועה‬
‫התפלגות ‪-T‬‬
‫התפלגות סימטרית פעמונית שהתוחלת שלה היא אפס‪ .‬ההתפלגות דומה‬
‫להתפלגות ‪ Z‬רק שהיא יותר רחבה ולכן הערכים ש לה יהיו יותר גבוהים ‪ .‬התפלגות‬
‫‪ T‬תלויה במושג שנקרא דרגות חופש‪ .‬דרגת החופש שווה למספר המדגמים פחות‬
‫‪ 1‬כלומר ‪ , 𝑑𝑓 = 𝑛 − 1‬ככל שדרגות החופש עולות ההתפלגות הופעת להיות יותר‬
‫גבוהה וצרה ‪ .‬כשדרגות החופש שואפות לאינסוף התפלגות ‪ T‬שואפת להיות כמו‬
‫התפלגות ‪.Z‬‬
‫𝑃 כאשר שונות האוכלוסייה אינה ידועה‪-‬‬
‫מובהקות התוצאה‬
‫מובהקות התוצאה זה הסיכוי לקבלת תוצאות המדגם וקיצוני מתוצאות אלה בהנחת‬
‫𝑃 על פי טבלת ‪ T‬הערכים לא‬
‫השערת האפס‪ .‬כאשר מחשבים את הערך של‬
‫יהיו מדויקים והחישוב יהיה עבור חסמים למובהקות התוצאה כלומר תחום ולא‬
‫מספר מדויק‪.‬‬
‫…‪,‬‬
‫‪,‬‬
‫(‬
‫= 𝑐 אם פונקציית הנראות‬
‫יורדת‪ .‬כאשר ‪ c‬זה אזור הדחיה של 𝐻‪.‬‬
‫שלב ג‪ -‬מזהים את האזור עבורו יחד הנראות הוא הגבוה ביותר ‪.‬‬
‫שלב ד – לפי ההתפלגות של השערת האפס מוצאים את הערכים הקריטיים‬
‫באזור בנקבע בסעיף הקודם כך שרמת המובהקות תהיה ה‪ α -‬שנקבעה‬
‫מראש‪.‬‬
‫^‬
‫𝑛‪H𝑜: 𝑃 = 𝑃𝑜 , 𝑃 = 𝐵/‬‬
‫מבחן יחס הנראות‪-‬‬
‫כאשר אחד הפרמטרים)חוץ מזה שבודקים( אינו ידוע – לא ניתן להשתמש בלמה‪,‬‬
‫לכן משתמשים במבחן "יחס הנראות" מבחן זה מתאים להשערות מהסוג‪:‬‬
‫‪𝐻 :𝜇 = 𝜇 𝐻 :𝜇 ≠ 𝜇 ,‬‬
‫ניסוח המבחן נראות‪-‬‬
‫במונה‪ -‬מציבים במקום כל הפרמטרים את אומדני הנראות המקסימלית שלהם‪.‬‬
‫במכנה‪ -‬נציב במקום כל הפרמטרים הלא ידועים שלא בהשערה את אומדני הנראות‬
‫המקסימלית שלהם ובמקום הפרמטר שנבדק בהשערת האפס‪ -‬נציב את אותו‬
‫פרמטר שבהשערת האפס‪> 𝐾.‬‬
‫) (‬
‫)‬
‫(‬
‫=𝜆‬
‫) ‪2((1(X(Xst) 9 ft(X‬‬‫‪-‬‬
‫‪+‬‬
‫‪2‬‬
‫חד צדדי עליון‪pvalue=p(x>xst|h0) :‬‬
‫חד צדדי תחתון‪pvalue=p(x<xst|h0) :‬‬
‫אמד טוב ל‪) Y/n :p-‬מס׳ ההצלחות במדגם(‬
‫אמד טוב לשונות‪s^2 :‬‬
‫‪2‬‬
‫=‬
‫=‬
‫)‪prn‬‬
‫‪zcz‬‬
‫‪M‬‬
‫הוכחה של התפלגות גמא סכום של מ״מ מעריכיים‬
‫מבחן חי בריבוע לטיב התאמה‬
‫מבחן חי בריבוע לאי תלות‬
Download