פונקציה יוצרת מומנטים- פונקציה יוצרת מומנטים של משתנה מקרי כלשהו מוגדרת להיות ] 𝑒[𝐸 = )𝑡( 𝑀 משתנה מקרי בדיד 𝑀 (𝑡) = 𝐸[𝑒 ] = ∑ 𝑒 ∙ 𝑃(𝑋 = 𝑘) : משתנה מקרי רציף𝑀 (𝑡) = 𝐸[𝑒 ] = ∫ 𝑒 ∙ 𝑓(𝑥)𝑑𝑥 : בדיקה :אם t=0אז מתקיים 𝟏 = ) 𝟎𝒆(𝑬 = )𝟎 = 𝒕( 𝒙𝑴 מומנט מסדר nמוגדר להיות .𝐸[𝑒 ] :מומנט מספר nשל משתנה מקרי X מתקבל מנגזרת ה-n-ית לפי tשל פונקציית יוצרת המומנטים ,בנקודה בה ) ( | = )𝑡( 𝑀 .מומנט מסדר ראשון )תוחלת של .(x t=0כלומר ] 𝑋[𝐸 = ) ( | ממוצע המדגם ומשפט הגבול המרכזי- ∑ = ̅𝑥 ממדגם למדגם אנו יכולים לקבל ממוצע מדגם שונה ,ולכן ממוצע המדגם: ממוצע המדגם הוא משתנה מקרי ויש לו התפלגות .ממוצע האוכלוסייה נסמן ב µ- )נקרא גם תוחלת( .שונות אוכלוסייה נסמן ב σ -סטיית תקן של אוכלוסייהσ : א .תכונות התפלגות- ממוצע כל ממוצעי המדגם האפשריים שווה לממוצע האוכלוסייה𝐸[𝑋] = 𝜇 ̅ = μ : שונות כל ממוצעי המדגם האפשריים שווה לשונות האוכלוסייה מחולק ב . n-תכונה זו נכונה רק במדגם מקרי, 𝑉(𝑋) = 𝜎 ̅ = :יש יחס הפוך בין גודל המדגם לבין ) ( שנקראת גם טעות תקן: σממוצע המדגם גם יתפלג נורמאלית: ̅ 𝑥̅ ~𝑁 𝜇,והתיקנון שלה - =̅𝑍 √ ג .משפט הגבול המרכזי – אם אוכלוסייה מתפלגת עם ממוצע µושונות σאזי עבור מדגם מספיק גדול ) (n>30ממוצע המדגם מתפלג בקירוב נורמאלית : ) 𝑥(𝐸 𝑥̅ ↝ 𝑁 𝜇, יש לבצע תיקון רציפות -לא לשכוח תיקוני רציפות לאחר מעבר מבדיד לרציף 1 1 <x<a+ 2 2 1 1 p(x ≤ a) = p x < a + p(x < a) = p x < a − 2 2 1 1 p(x ≥ a) = p x > a − p(x > a) = p x > a + 2 2 p(−a < z < a) = ϕ(a) − ϕ(−a) = 2ϕ(a) − 1 )𝑎(𝜙 𝜙(−𝑎) = 1 − 𝑍𝑍 = − )𝑎 → 𝑃(𝑧 < 𝑘) = 𝑎 → 𝑃(𝑧 < 𝑘) = −1 ∗ 𝐹𝑟𝑜𝑚𝑇𝑎𝑏𝑙𝑒(1 − 𝐪𝐩 𝐱 √ = 𝑥 1 )𝑎(𝑛𝑎𝑙𝑥 1 𝑥 1 = 𝑥 התפלגות 𝟐𝛘 E[x] = n V(x) = 2n 𝑥 −μ )~𝜒 (1 𝜎 𝑥 −μ )𝑛( 𝜒~ 𝜎 ̅𝑥 𝑥 − )~𝜒 (𝑛 − 1 𝜎 )𝑡𝑀( ) (𝑡) = (1 − 2 )𝐪𝐩𝐧 , 𝐱~𝐍(𝐧𝐩,תנאי𝐧𝐪 > 𝟓 𝐧𝐩 > 𝟓 : אם , ∑ )~𝜒 (𝑛 − 1 )𝑛( 𝜒~ התפלגות מינימום ומקסימום- התפלגות מקסימום :נניח ש𝑥 -הינם משתנים מקריים בלתי תלויים בעלי אותה התפלגות רציפה .נגדיר את ) 𝑥 𝑈 = max (𝑥 , 𝑥 , … ,מתקיים ש: ))𝑢( 𝐹( ∙ 𝑛 = )𝑢(𝑓 ))𝑡( 𝐹( = )𝑡( 𝐹 ,ולכן )𝑢( 𝑓 ∙ התפלגות מינימום :נניח ש𝑥 -הינם משתנים מקריים בלתי תלויים בעלי אותה התפלגות רציפה .נגדיר את ) 𝑥 𝑍 = min(𝑥 , 𝑥 , … ,מתקיים ש𝐹 (𝑡) = : ])𝑧( 𝐹 𝑓(𝑧) = 𝑛 ∙ [1 − ))𝑡( 𝐹 , 1 − (1 −ולכן )𝑧( 𝑓 ∙ 𝑥~Γאז~𝜒 (𝑛) : = 𝑧 שם סימון משמעות המשתנה אחידה )X~Ud(a,b Xמקבל ערכים שלמים בקטע ] [a,bבהסתברות שווה )יש סה"כ b-a+1תוצאות אפשריות (. ab 2 (b a 1) 1 12 * np )np(1-p n בינומית )X~B(n,p Xסופר מספר "הצלחות" מתוך nניסויים בלתי תלויים )אם אותה הסתברות pל"הצלחה" בניסוי בודד( בינומית שלילית )X~NB(k,p Xסופר מספר ניסיונות עד ל"הצלחה" -kית )כולל( בסדרת ניסויים בלתי תלויים )אם אותה הסתברות pל"הצלחה" בניסוי בודד( x 1 k x k p q k 1 * k/p (1 p)k p2 r גיאומטרית )X~G(p היפר- גיאומטרית )X~HG(N,D,n Xסופר מספר ניסיונות עד ל"הצלחה" ראשונה )כולל( בסדרת ניסויים בלתי תלויים )אם אותה הסתברות pל"הצלחה" בניסוי בודד( Xסופר מספר פריטים "מיוחדים" תוך מדגם של nפריטים )ללא החזרה( שהוצאו תוך אוכלוסיה בת Nפריטים ומתוכם D מיוחדים. p (1 p ) x 1 1 (1 p) x 1/p )(1 p p2 D N D x n x N n * D N פואסונית )X~Pois( Xסופר מספר אירועים בזרם אירועים פואסוני ביחידת זמן. כאשר הינו קצב האירועים )זרם אירועים פואסוני בדרך כלל אופייני בהרבה תהליכים סוציאליים וטבעיים כגון :הגעות של שיחות טלפון למרכזיה ,פליטה של חלקיקים בחומרים רדיו- אקטיביים וכדומה (. e x !x * אחידה רציפה )X~Uc(a,b Xמקבל ערכים בקטע ] [a,bבהסתברות שווה 1 ,a x b ba xa ba a b 2 b a 2 פ.הסתברות /צפיפות גאמא התפלגות של זמן ) X ~ ( , מעריכית X~Exp( נורמלית )X~N(2 1 b a 1 n x n x ) x p (1 p משתנה רציף Xהינו זמן עד לאירוע "ה -מעכשיו" בזרם אירועים פואסוני. )שקול ל :זמן בין אירועים פואסוניים סמוכים( כאשר הינו קצב האירועים. הערה :המשמעות הנ"ל כמובן נכונה רק עבור שלם. המופע ה-n-י יהיה בזמן קטן מ𝑝(𝑥 ≤ 𝑡) = 1 − : t- ) ! כאשר 0 < 𝑞 < 1 חוקי -ln- 𝑦 ln(𝑥 ∙ 𝑦) = ln 𝑥 + ln 𝑥 ln 𝑦 = ln 𝑥 − ln 𝑦 𝑥 ln 𝑥 = 𝑦 ln ) 𝑥 (ln 𝑥 = תוחלת שונות n פונקציה יוצרת מומנטים 1 e ti b a 1 2 )𝑏 (𝑎 ± 𝑎± 𝑏 ∙ ס .הנדסית אינסופית: = 𝑆 , ס .סדרה הנדסית: )𝑎 (𝑞 − 1 = 𝑆 𝑞−1 D D N n 1 N N N 1 12 x 1e x , x 0 ) ( when ( ) x 1e x dx ∑ 0 ) x ( ) ( 2 i 1 et p t 1 qe 1 ̅𝑥 et p 1 qe t ) ( =,c n )exp (et 1 ∑𝜆 𝑒 ! 𝑥 …! 𝑥 ! 𝑥 𝑥≤0 𝑥 ≤ +∞ 𝜆 = 𝑥̅ 1 𝑎𝑏− 𝑎 ≤ 𝑥1 𝑥 ≤ 𝑏 𝑥= 𝑏=θ t לשים לב: פונק' גמא: !)𝛼 Γ(𝛼) = (1 − e bt e at (b a )t when x 𝜋√ = )Γ(1/2 Γ(3/2 ) = √𝜋/2 נכון כאשר 𝛼 טבעי x ( ) t 1 e t dt 0 פונק' גמא: 𝑥 ∙ 𝑐 = )𝑥(𝑓 Xהינו זמן עד לאירוע "הבא מעכשיו" בזרם אירועים פואסוני. )שקול ל :זמן בין 2אירועים פואסוניים סמוכים( כאשר הינו קצב האירועים. xמתפלגת התפלגות רציפה מיוחדת בעלת צורה של פעמון ,עם שני פרמטרים :ו) -אחראיים על מיקום ורוחב של פעמון(. )התפלגות נורמלית בד"כ אופיינית למשתנים מקריים ש"נוצרים" מהרבה השפעות שונות ,למשל :גובה של בן-אדם ,ממוצע של ציונים של כל הסטודנטים באוניברסיטה בשנה וכדומה(. = ̂𝑝 * , 0 𝑒 פ .צפיפות המדגם +אנ"מ t x ) ( 𝑒 e 1 𝜋𝜎√2 x = )𝑥(𝑝 ) 1 e x ( 1/ 2 1/ 2 ∑ t 1 ̅𝑥 1 exp t 2t 2 2 סטנדרטי: 𝑒 = 𝑒= 𝑒 𝑛 )𝑝 𝑝 (1 − 𝑥 𝑥 = ̂𝑝 𝑛 ) ( pe q ln 𝑎𝑛 = 𝑎 b a 1 𝑥 ( 𝑛 𝑞 𝑝 𝑥 מציאת סכום התפלגויות- 𝑥𝑑)𝑥 𝑧 = 𝑥 + 𝑦 𝑓 (𝑥 + 𝑦) = ∫ 𝑓 (𝑥)𝑓 (𝑧 −לזכור לתקן גבולות! )𝑛( 𝜒~𝑥 חי בריבוע 𝑦~𝜒 (𝑚) => (𝑥 + 𝑦)~𝜒 (𝑛 + 𝑚) : )𝜆 𝑥~𝛾(𝛼1, גמא 𝑦~𝛾(𝛼2, 𝜆) => (𝑥 + 𝑦)~𝛾(𝛼1 + 𝛼2, 𝜆) : )𝑥~𝑝(𝜆1 פואסוני 𝑦~𝑝(𝜆2) => (𝑥 + 𝑦)~𝑝(𝜆1 + 𝜆2) : )𝜆(𝑥~ exp מעריכית 𝑦~ exp(𝜆) => (𝑥 + 𝑦)~ p(2, 𝜆) : 𝑦 = 𝑥 ∑ )𝜆(𝑥 ~ exp )𝜆 => 𝑦~Γ(𝛼 = 𝑛, >= )𝑥~𝑁(μ1, 𝜎 1) 𝑦~𝑁(μ2, 𝜎 2 נורמלית : )(𝑥 + 𝑦)~𝑁(μ1 + μ2, 𝜎 1 + 𝜎 2 פ .התפלגות מצטברת x a 1 b a 1 𝑒 = 𝑒 סדרה הנדסית: = 𝑎 ∑ = 𝑞, 1 𝑥 ∙ ∑ 𝑥 !𝑛 ∑𝑎 = 𝑎 משפט הגבול המרכזי -אם Xמתפלג כלשהוא וידוע 𝐸[𝑋] = 𝜇 𝑉(𝑋) = 𝜎 ,אז עבור מדגם מספיק גדול )לפחות T ↝ 𝑁(𝑛 ∙ 𝜇, 𝑛 ∙ 𝜎 ) (30 התפלגות מספר ההצלחות במדגם – הקרוב הנורמאלי להתפלגות הבינומית- כאשר )𝑝 Y~B(𝑛,ומתקיימים התנאים הבאים 𝑛 ∙ p ≥ 5 :וגם 𝑛 ∙ (1 − p) ≥ 5ניתן לומר שהסטטיסטי Yמתפלג בקירוב נורמאלי ↝ y ∙ ))𝑝 𝑁(𝑛 ∙ 𝑝, 𝑛 ∙ 𝑝 ∙ (1 −ולכן התיקנון יהיה 𝑍 = ∙ ∙( ) : )𝑦 = 𝑥 ~𝛾 𝛼 = , 𝜆 = ~𝜒 (1 אם ) 𝜎 ) 𝑥~𝑁(μ,נורמלית( אז נתקנן ,ואז :הריבוע שלו )𝑦 = 𝑧 ~𝛾 𝛼 = , 𝜆 = ~𝜒 (1 כי בריבוע :סכום של ריבוע נורמלי : טורים: = )𝑥 (log = )𝑥𝑛𝑙( ~𝐍 𝐩, קירוב בינומי לנורמלי: 𝐧 קירוב בינומי לפואסוני𝐱~𝐏(𝒏𝒑) : קירוב פואסוני לנורמלי 𝐱~𝐍(𝛌, 𝛌) :תנאי 𝟓 > 𝛌 התפלגות סכום תצפיות המדגם ומשפט הגבול המרכזי סטטיסטי – פונקציה של תוצאות המדגם. סטטיסטי מבטא את סכום התצפיות במדגם T = ∑ 𝑥 : כל התצפיות נדגמות באקראי מאותה אוכלוסייה 𝑥 , 𝑥 , … 𝑥 ,הם משתנים מקריים בלתי תלויים בעלי התפלגות זהה שתוחלתה µושונותה σאז התוחלת והשונות של סכום התצפיות יהיו 𝑉(𝑇) = 𝑛 ∙ 𝜎 , 𝐸[𝑇] = 𝑛 ∙ 𝜇 : דגימה מתוך התפלגות נורמאלית – אם ) 𝜎 X~𝑁(𝜇,אז ∙ =𝑍 ) 𝜎 ∙ 𝑛 T~𝑁(𝑛 ∙ 𝜇,ו- אם ) 𝜎 ) 𝑥~𝑁(0,חצי סטנדרטי( אז הריבוע שלו 𝑦 = 𝑥 ~𝛾(𝛼 = , 𝜆 = ) : אם )) 𝑥~𝑁(0,1נורמלית סטנדרטית( אז הריבוע שלו : 𝐸 בדיד𝐸 𝑔(𝑥) = ∑ 𝑔(𝑥 )𝑃(𝑋 = 𝑥 ) : רציף𝐸 𝑔(𝑥) = ∫ 𝑔(𝑥)𝑓(𝑥) ∙ 𝑑𝑥 : 𝑥𝑛 = ) 𝑥( )𝑥((𝑘 ∙ 𝑓(𝑥)) = 𝑘 ∙ 𝑓′ )𝑎((𝑎 ) = 𝑎 ∙ ln 𝑒 = ) 𝑒( p(x = a) = p a − 𝐧 = )𝑞 = (𝑝 + משפט הגבול המרכזי :עבור כל התפלגות בעל תוחלת μושונות σכאשר n ≥ 30 )מספר התצפיות( ניתן לקרב את סכום התצפיות ואת הממוצע שלהן להתפלגות ) ∑ x ~N(nμ, nσ נורמלית בצורה הבאהx ~N μ, : מ"מ ובת"ל טיפים: שמחשבים פונקציה יוצרת מומנטים -לעשות בדיקה!!! M (t = 0) = 1 אם מבקשים גודל מדגם או מספר דגימות ← לנסות להשתמש ב,𝑥̅ - ושמספר האיברים יהיה הנעלם. אם מבקשים יחס איברים בין דגימות :למצוא אמד שתלוי בממוצע ,לחשב את השונות ולגזור ע"מ למצוא מינימום. אם צריך אמד לשונות ← לנסות להשתמש ב𝑆 - אם צריך להשוות בין 2אמדים ,צריך לבדוק את ה – MSEעדיף אמד שהוא אח"ה ושהשונות שלו בגבול שווה ל.0- כשמחשבים שונות בעזרת פונקציה יוצרת מומנטים ,זה כולה ) 𝑥( Eולא השונות .צריך לעשות נוסחאות בשביל להגיע אל זה. מציאת ריבוע התפלגות- נוסחת הטרנספורמציה של 𝑥 = 𝑦 ,כאשר )𝑥( 𝑓 ידוע: = )𝑦( 𝑓 )𝑦 𝑓 + 𝑦 + 𝑓 (− משתנה בדיד √ = = ) 𝑋(𝜎 ב .דגימה מהתפלגות נורמאלית- אם נדגום מתוך אוכלוסייה שהמשתנה בה מתפלג נורמאלית עם ממוצע µושונות ∑𝑀 ̅ ∩ 𝑃𝑃 ∪ = 𝑃 +𝑃 − 𝟐])𝒙(𝑬[ 𝒗𝒂𝒓(𝒙) = 𝑬(𝒙𝟐 ) − 𝟐])𝒙(𝑬[ 𝑬(𝒙𝟐 ) = 𝒗𝒂𝒓(𝒙) + 𝜎 = ] )𝜇 E[(𝑥̅ − 𝑛 𝜇 = ) 𝑥(𝐸 = ) ̅𝑥(𝐸 2 שונות ממוצעי המדגם .אם נוציא שורש לשונות נקבל סטיית תקן של ממוצע המדגם = 𝐸(𝑥) , | ) 𝑥(𝐸 = מומנט מסדר שני )תוחלת של 𝑥(. שימו לב שהנגזרת השני יה לא נותנת את השונות ,אלא את ) 𝑥(𝐸 ) ( מסדר | :n = ) 𝑥(𝐸 פונקציית יוצרת מומנטים של סכום משתנים בת"ל- )𝑡( 𝑀 ∗ … ∗ )𝑡( 𝑀 ∗ )𝑡( 𝑀 = )𝑡( 𝑀 , ,…, משפטים : .1קיימת התאמה חד חד ערכית בין משתנה מקרי לבין פונקציית יוצרת המומנטים שלו. משפט היחידות :לכל פונקציה יוצרת מומנטים ישנה פונקציית צפיפות אחת שמתאימה לה ולכל פונקציית צפיפות ישנה פו"מ אחת שמתאימה לה. .2השפעת הטרנספורמציה הלינארית על פונקציית יוצאת מומנטים : )𝑡𝑎( 𝑀 𝑒 = )𝑡( 𝑀 .3אם Xו Y-משתנים בלתי תלויים מתקיים ש- )𝑡( 𝑀 ∙ )𝑡( 𝑀 = ] 𝑒[𝐸 ∙ ] 𝑒[𝐸 = )𝑡( 𝑀 או באופן כללי )𝑡( 𝑀 ∏ = )𝑡( ∑𝑀 אם xבעלי אותו חוק התפלגות )𝑡( 𝑀 = )𝑡( הגדרות בסיסיות- כאשר המשתנים בת"ל 𝑃∙ 𝑃 = ∩ 𝑝 )𝑦(𝑟𝑎𝑣 𝑣𝑎𝑟(𝑎𝑥 ± 𝑦 + 𝑏) = 𝑎 𝑣𝑎𝑟(𝑥) + )E(XY) = E(X) ∗ E(Y 𝜎 = )𝑥(𝑟𝑎𝑣 = ] )𝜇 E[(𝑥 − 𝜎 ) 𝑥(𝑟𝑎𝑣 = ) ̅𝑥(𝑟𝑎𝑣 = 𝑛 𝑛 גם כשהמשתנים לא בת"ל אינטגרלים- 𝒖𝒅 𝒗 ∫ ∫ 𝒖𝒅𝒗 = 𝒖𝒗 − 1 𝑐 𝑒 𝑑𝑥 = 𝑒 + 𝑎 1 𝑥 𝑑𝑥 = ln 𝑥 1 = 𝑥𝑑 𝑒𝛼𝑥 𝛼 𝑒 𝜆 =𝜆 ( ) 1 ∑ 𝑒 𝜎𝜋2 −∞ ≤ 𝑥 ≤ +∞ )𝜇 ∑(𝑥 − = 𝜎 𝑛 בדיקת השערות כללית- הסקה סטטיסטית -אומדים- פרמטר -ערך המאפיין את ההתפלגות שבד"כ אינו ידוע .בד"כ יסומן ע"י 𝜃. סטטיסטי -פונקציה של תצפיות המדגם בלב ,לא תלוי בפרמטרים לא ידועים. אומד חסר הטיה -אומד 𝜃 נקרא אומד חסר הטיה עבור פרמטר 𝜃 אם ורק אם: 𝜃 = רמת בטחון 𝜃 .Eקריטריון :MSEקריטריון המשמש להשוואה בין אומדים שונים. 𝜃𝜃− 𝜃 = 𝑉 𝜃 + 𝐵𝑖𝑎𝑠 𝜃, 𝜃 = 𝑉 𝜃 + 𝐸 𝜃 − ככל שה MSE-קטן יותר ,כך האומד טוב יותר. אם האומד חסר הטיה כלומר 𝐸 𝜃 − 𝜃 = 0אז ככל שהשונות יותר קטנה כך ה- MSEיותר קטן ואם האומד לא חסר הטיה יש להציב כרגיל ולגלות מי קטן יותר . פונקציית הפסד – הקשר בין הסטטיסטי לפרמטר ואומרת מה מפסידה בכל פעם שבוחרים באומדן מסוים 𝜃 ℓ 𝜃,היא תמיד תהיה חיובית או אפס ובנוסף תמיד קיימת נקודה אשר בה ההפסד בדיוק שווה לאפס ,זאת כאשר הסטטיסטי שווה בדיוק לפרמטר. פונקציית סיכון . ℛ 𝜃, 𝜃 = E 𝜃 − 𝜃 , ℛ 𝜃, 𝜃 = E[ℓ 𝜃 , 𝜃 ] -אמד 𝜃 הוא אמד טוב לפרמטר 𝜃 ,אם פונקציית הסיכון שלו תהיה מינימאלית .נסמן באופן כללי פרמטר באות θואומר ב .𝜃-הפרמטר 𝜃 הוא סטטיסטי המחושב על המדגם ובאמצעותו נאמוד את .θ 𝐸 = 𝜃 𝑀𝑆𝐸 𝜃, שגיאת אמידה |𝜃 − 𝜃| -ההפרש בין האומד לאמת)הפרמטר(. אמד חסר הטיה לשונות האוכלוסייה: תוחלת ידועה 𝟐𝝁𝒏 ∑(𝒙𝒊 − 𝝁)𝟐 ∑ 𝒙𝟐𝒊 − = 𝒏 𝒏 תוחלת לא ידועה = 𝟐𝑺 ) 𝒊𝟐𝒙(∑ 𝟐𝒙𝒏 − 𝟏𝒏− 𝟐𝝈 = ) 𝟐𝑺(𝑬 𝟒𝝈𝟐 𝒏 = 𝟐) 𝟐𝝈 = 𝟒𝝈𝟐 𝟏𝒏− = ) 𝟐𝑺(𝑽 𝒙 ∑(𝒙𝒊 − 𝟏𝒏− 𝟐 = = 𝟐𝑺 𝑺 𝑬 𝟐 𝑺 𝑽 כלל המינימאקס :אם יש כמה פונקציות סיכון ,נבחן את המקסימום של כל אחת ומבין כל המקסימומים יש לחפש את המינימום. )= varθ + (E[θ] − θ אם ההכרעה תהיה כמו במציאות אין טעות .כלל הכרעה טוב הוא כלל הכרעה שבו הסיכוי לעשות טעויות הוא יותר נמוך. נגדיר את ההסתברויות הבאות: רמת מובהקות:מסוג ) 1לדחות 𝐻 ( 𝑃 = )נכונה 𝐻 לדחות 𝐻 𝑃 = α לבצע טעות מסוג ) : 2לקבל 𝐻 ( 𝑃 = )נכונה 𝐻 לקבל 𝐻 𝑃 = β רמת הביטחון– )לקבל 𝐻 ( 𝑃 = )נכונה 𝐻 לקבל 𝐻 𝑃 = 1 − α רמת העוצמה– )לדחות 𝐻 ( 𝑃 = )נכונה 𝐻 לדחות 𝐻 𝑃 = 1 − β **תמיד אם מרחיקים את הפרמטר ב 𝐻 -מהפרמטר ב 𝐻 -אז מגדילים את העוצמה. 𝜷 𝜶 בפרופורציות: 𝜃 𝐿 𝜃, 𝜃 = 𝜃 − θ−θ עוצ MSE θ, θ = R θ, θ = E Bais θ, θ = E θ − θ ככל ש MSE-קטן יותר האומד טוב יותר. משפט הפיצול∑ (x − μ) = ∑ (x − x) + n(x − μ) : אח"ה :עבור פרמטר θמתקיים E θ = θכלומר ההטיה שווה לאפס. יעילות 𝜃 :ו 𝜃 -אח"ה ל .θ-אם 𝜃 𝑟𝑎𝑣 < 𝜃 𝑟𝑎𝑣 אז 𝜃 יותר יעיל מ𝜃 - ** אח"ה יכול לצאת לא הגיוני! משפט :אם אח"ה הוא בעל שונות ששואפת ל 0-בגבול .אז האמד הוא עקיב לפרמטר. טבלת סיכום למבחנים של השונות כאשר 𝝁 ידועה: טבלה למבחנים של השונות כאשר 𝝁 לא ידועה: קירוב 𝑝̂0ל ורמלי → ) 𝛼 = 𝑝(𝑝̂ > 𝑝𝑐 |𝐻0 ) = 1 − 𝑝(𝑝̂ < 𝑝𝑐 |𝐻0 ) ⇒ 𝑝̂0 ~𝑁(𝜇0 , 𝜎02 קירוב 𝑝̂1ל ורמלי → ) 𝛽 = 𝑝(𝑝̂ < 𝑝𝑐 |𝐻1 ) ⇒ 𝑝̂1 ~𝑁(𝜇1 , 𝜎12 𝑝𝑐 − 𝜇1 𝑝𝑐 − 𝜇0 (𝜙 = 𝛽 ) 𝑝1 ∙ 𝑞1 (𝜙 𝛼 = 1 − ) =𝜎 𝜎12 𝜎2 𝑛 0 הגדלת או הקטנת 𝛂 – 𝛼 >α 𝛼 <α דחינו 𝐻 עבור α נדחה בוודאות לא ניתן לדעת √ הגורמים שמשפיעים על אורך הרווח: ) : (1-ככל שרמת הסמך גדולה ,אורך הרווח גדל : .ככל שסטיית התקן גדלה ,אורך הרווח גדל :n .ככל שגודל המדגם גדל ,אורך הרווח קטן .מבין שלושת גורמים אלו אנו יכולים לשלוט רק על גודל המדגם. בחירת גודל המדגם -נשאל מהו גודל המדגם הדרוש ,כדי שבביטחון של 𝛼 1 −הסטייה בין ממוצע המדגם לבין התוחלת לא תעלה על גודל מסוים d )זאת אומרת ,שאורך הרווח לא יעלה על . (2d 𝑍∙2 עלינו לפתור את 𝐿 = 𝑑∙ ≤ 2 √ ∙ / מכאן נובע שגודל המדגם שיקיים את הדרישה הנ"ל הוא שגיאת האמידה המקסימלית: מבחני t קריטי מבחני z קריטי Pval ≥𝑛 𝑍 = , = 𝑑 = εכאשר אפסילון נותן את שגיאת האמידה המקסימלית ,דבר שנקרא גם טעות סטטיסטית , טעות דגימה. אמד נראות מקסימלי )אנ"מ(: כדי לנבא היטב את הפרמטר האמיתי על-סמך מדגם מקרי מסוים ,יש לבדוק איזה פרמטר מתוך כל האפשרויות הוא זה ש"יסביר" בצורה הטובה ביותר את המדגם .כלומר אומד הנראות המרבית הוא הפרמטר שאם היינו מציבים בפונקציית ההתפלגות מראש ,הוא היה נותן את ההסתברות הגבוהה ביותר לקבל את המדגם שאכן התקבל ,ובכך ממקסם את פונקציית הנראות. פונקציית נראות: במקרה הרציף𝑓(𝑥 , … , 𝑥 ) = 𝑓(𝑥 ) ∗ … ∗ 𝑓(𝑥 ) = ∏ 𝑓(𝑥 ) : במקרה הבדיד𝑝(𝑥 , … , 𝑥 ) = 𝑝(𝑥 ) ∗ … ∗ 𝑝(𝑥 ) = ∏ 𝑝(𝑥 ) : תכונות של אנ"מ: .1עקיבים )לא בהכרח חסרי הטיה אבל כש n-שואף לאינסוף -כן(. .2אינוורינטיות -אם האמד הוא אנ"מ עבור הפרמטר ,אז פונקציה של האמד הוא אנ"מ של אותה פונקציה של הפרמטר .לכל פונקציה חח"ע בתחום בו הפרמטר מוגדר) .תכונה זו נכונה גם לאח"ה רק אם הפונקציה של הפרמטר לינארית( שונות מינימלית -גזירת השונות ע"פ המשתנה והשוואה ל.0- 𝑥 = 𝜃 וצריך למצוא אח"ה/תוחלת/שונות ,נצטרך #במידה ונמצא ש לעשות: למצוא פונק' התפלגות מצטברת ע"י אינטגרל לפונק' הצפיפות )𝑡( 𝐹 = 𝑥𝑑)𝑥(𝑓 ∫ להציב בנוסחה ))𝑥( 𝐹 𝐹 (𝑥) = 1 − (1 −ואז 𝜃 ב)𝑥( חי בריבוע קריטי Pval 𝑓= )𝑡( 𝐹 ולבסוף להציב בנוסחת התוחלת 𝑥𝑑)𝑥( 𝑓 ∙ 𝑥 ∫ = ] 𝑥[𝐸 הלמה של ניימן פירסון -שיטה זו עוזרת לנו לבנות מבחנים בעלי עוצמה מקסימאלית עבור αנתונה ורק בהשערה פשוטה כנגד פשוטה .הלמה של ניימן פירסון אומרת שמבחן בעל עוצמה מקסימלית מתקבל כאשר אזור הדחיה שלו כולל את התוצאות שעבורן יחס הנראות הוא הגבוה ביותר . נגדיר את יחס הנראות 𝑥 , 𝑥 … 𝑥 :תוצאות הניסוי )תוצאות המדגם( ההשערות : ) …( , , = ) 𝑥 … λ(𝑥 , 𝑥 , 𝑝~ 𝑥 ∶ 𝐻 , 𝐻 ∶ 𝑥 ~𝑝 , ) , …, ( המשמעות של יחס הנראות היא פי כמה 𝐻 יותר סבירה מ𝐻 - עבור משתנים שמתפלגים רציף : שלב א – בונים את פונקציית הצפיפות המשותפת בהנחת השערת האפס לתוצאות המדגם ובהנחת ההשערה האלטרנטיבית. ) …( , , =𝑐 שלב ב -מחלקים את תוצאות שלב א באופן הבא > 𝑘 : ) אם פונקציית הנראות עולה .ו≤ 𝑘 - ) …, , ( ) …, , ( רווח סמך - ̅ √ ∙ ∑ ∙ 𝑍 𝑋 ±כאשר ) = במקרה בו המדגם קטן נשתמש בנוסחה הבאה : ̅ √ ∑ ( ∙ , = ̅𝑠 𝑡𝑋± הקשר בין רווח סמך לבדיקת השערות על תוחלת – ניתן לדעת מה תהיה תוצאת בדיקת השערות דו -צדדית תוך שימוש באותו מדגם ,אותה רמת ביטחון ותחת הנחת 𝐻 מסוימת .אם התוחלת הנתונה תחת 𝐻 נופלת מחוץ לרווח בר סמך, נדחה את 𝐻 .אם התוחלת נופלת בתוך הרווח בר סמך ,לא נדחה את השערת 𝐻 חשוב גדול-ימינה בגרףאמד חסר הטייה ל :p רמת מובהקות ∶ a קטן-שמאלה בגרף בדיקת השערות מושגים כלליים – תוצאה מובהקת = השערת האפס נדחתה תשובה מילולית מלאה של המסקנה – ברמת מובהקות של ___ לא נוכל לקבל את הטענה \ נקבל את הטענה ש____ כאשר אנחנו מרחיקים את 𝐻 מ 𝐻 -תמיד הסיכוי מהסוג השני קטן ,ככל שהשערות מתרחקות אחת מהשנייה הסיכוי לטעויות קטן. מובהקות התוצאה 𝒆𝒖𝒍𝒂𝒗𝑷בבדיקת ה שערות על תוחלת עם שונות ידועה – אם 𝜶 ≤ 𝒆𝒖𝒍𝒂𝒗𝑷 דוחים את 𝟎𝑯 מובהקות התוצאה זה הסיכוי לקבלת תוצאות המדגם וקיצוני מתוצאות אלה בהנחת השערת האפס. 𝑃 )לקבל את תוצאות המדגם וקיצוני( 𝑃 = אם ההשערה היא דו צדדית : 𝑃 )לקבל את תוצאות המדגם וקיצוני( 𝑃 ∙ = 2 הקיצוני – הכוונה יותר מתוצאות המדגם ,לכיוון השערת המחקר לכיוון 𝐻, לכיוון תוצאות המדגם וקיצונה לו. מובהקות התוצאה היא גם האלפא המינימאלית לדחיית השערת האפס. רווח בר סמך טוב הוא רווח ) (Lקצר ביותר בהסתברות הגבוהה ביותר )נרצה שהטווח יהיה קצר ביותר וההסתברות גדולה ביותר( 𝑍𝑋± הנוסחה לרווח סמך ∙ - √ רווח סמך לתוחלת )ממוצע האוכלוסייה( כששונות האוכלוסייה אינה ידועה – התנאי – Xמתפלג נורמאלית או שהמדגם מספיק גדול. בדיקת השערות ל pשל הבינום עבור nגדול: לא דחינו 𝐻 עבור α לא ניתן לדעת לא נדחה בוודאות ∙ בדיקת השערות על תוחלת ) ממוצע( כאשר שונות האוכלוסייה אינה ידועה התפלגות -T התפלגות סימטרית פעמונית שהתוחלת שלה היא אפס .ההתפלגות דומה להתפלגות Zרק שהיא יותר רחבה ולכן הערכים ש לה יהיו יותר גבוהים .התפלגות Tתלויה במושג שנקרא דרגות חופש .דרגת החופש שווה למספר המדגמים פחות 1כלומר , 𝑑𝑓 = 𝑛 − 1ככל שדרגות החופש עולות ההתפלגות הופעת להיות יותר גבוהה וצרה .כשדרגות החופש שואפות לאינסוף התפלגות Tשואפת להיות כמו התפלגות .Z 𝑃 כאשר שונות האוכלוסייה אינה ידועה- מובהקות התוצאה מובהקות התוצאה זה הסיכוי לקבלת תוצאות המדגם וקיצוני מתוצאות אלה בהנחת 𝑃 על פי טבלת Tהערכים לא השערת האפס .כאשר מחשבים את הערך של יהיו מדויקים והחישוב יהיה עבור חסמים למובהקות התוצאה כלומר תחום ולא מספר מדויק. …, , ( = 𝑐 אם פונקציית הנראות יורדת .כאשר cזה אזור הדחיה של 𝐻. שלב ג -מזהים את האזור עבורו יחד הנראות הוא הגבוה ביותר . שלב ד – לפי ההתפלגות של השערת האפס מוצאים את הערכים הקריטיים באזור בנקבע בסעיף הקודם כך שרמת המובהקות תהיה ה α -שנקבעה מראש. ^ 𝑛H𝑜: 𝑃 = 𝑃𝑜 , 𝑃 = 𝐵/ מבחן יחס הנראות- כאשר אחד הפרמטרים)חוץ מזה שבודקים( אינו ידוע – לא ניתן להשתמש בלמה, לכן משתמשים במבחן "יחס הנראות" מבחן זה מתאים להשערות מהסוג: 𝐻 :𝜇 = 𝜇 𝐻 :𝜇 ≠ 𝜇 , ניסוח המבחן נראות- במונה -מציבים במקום כל הפרמטרים את אומדני הנראות המקסימלית שלהם. במכנה -נציב במקום כל הפרמטרים הלא ידועים שלא בהשערה את אומדני הנראות המקסימלית שלהם ובמקום הפרמטר שנבדק בהשערת האפס -נציב את אותו פרמטר שבהשערת האפס> 𝐾. ) ( ) ( =𝜆 ) 2((1(X(Xst) 9 ft(X- + 2 חד צדדי עליוןpvalue=p(x>xst|h0) : חד צדדי תחתוןpvalue=p(x<xst|h0) : אמד טוב ל) Y/n :p-מס׳ ההצלחות במדגם( אמד טוב לשונותs^2 : 2 = = )prn zcz M הוכחה של התפלגות גמא סכום של מ״מ מעריכיים מבחן חי בריבוע לטיב התאמה מבחן חי בריבוע לאי תלות