Prendo 25 con un livello di confidenza del 95% Luca Guerra April 2023 Contents 1 Approssimare Distribuzione Binomiale → Normale 2 2 Intervallo di Confidenza 3 3 Test T Student 4 4 Test di Chi2 6 5 Modello Lineare e Coefficiente Correlazione 8 6 Probabilità Elementare 9 7 Calcolo Media e Varianza data una V.A. 10 8 Ottenere Marginali 11 9 Vincita Media 13 10 Affidabilità 14 11 Distribuzione Normale 15 12 Distribuzione Binomiale 16 13 Distribuzione di Poisson 17 14 Distribuzione di Poisson - Periodo Temporale 18 15 Trovare Media e Varianza Non Esplicite 19 16 Funzioni di Densità 20 16.1 Esercizio Simil-Esame - V.A. Continua - . . . . . . . . . . . . . . . . . . . . . . . . . . . 21 16.2 Esercizio Simil-Esame - V.A. Discreta - . . . . . . . . . . . . . . . . . . . . . . . . . . . 22 17 Funzione di Ripartizione 18 Da Ripartizione → Densità 24 Da Densità → Ripartizione 25 19 P-Value 26 20 Test Bernoulli 27 1 1 Approssimare Distribuzione Binomiale → Normale Prima di iniziare, e’ fondamentale che siano verificate alcune proprietà. Vediamole ora: n · p ≥ 50 n(1 − p) ≥ 5 Dove ricordiamo che con n stiamo indicando i casi presi in considerazione mentre con p indichiamo la probabilità che un determinato evento accade. Per passare da una variabile aleatoria Binomiale ad una Normale procediamo con i seguenti calcoli: p µ=n·p σ = n · p · (1 − p) Possiamo sfruttare questa conoscenza per svolgere esercizi che altrimenti sarebbero un vero e proprio parto! Vediamone uno: Esempio 1 x ∼ B 120; 6 P(y ≤ 15) ??? Notiamo che la richiesta puo essere scritta come: P(0 ⩽ y ⩽ 15) Il quale sappiamo essere uguale alla somma delle probabilità singole come: P(y = 0) + P(y = 1) + . . . Essendo questo un parto da calcolare, procediamo con l’approssimazione. Verifichiamo se questo risulta pero eseguibile: 1 n · p = 120 · = 20 ≥ 5 Verificato !! 6 5 n · (1 − p) = 120 · = 100 ≥ 5 Verificato !! 6 Risulta essere possibile eseguire l’approssimazione, procediamo dunque riducendo e sommando rispettivamente l’estremo sinistro e destro della nostra probabilità con 1/2 P(0 ⩽ y ⩽ 15) ≃ P(−0, 5 ⩽ y ⩽ 15.5) Ora procedo con il solito calcolo della distribuzione normale 2 2 Intervallo di Confidenza α = 1 − C{ Percentuale di Confidenza scelta } α z= 2 ⇒ Ottengo una percentuale la quale risulta possibile trovare nell’apposita tabella Per Distribuzione Binomiale r p ± z α2 · p · (1 − p) n Dove p equivale alla proporzione campionaria ( nx , dove x sta ad indicare il numero di pezzi difettosi) mentre n e’ il numero totale di eventi/oggetti presi in considerazione Per Distribuzione Normale √ σ2 X ±z · √ n α 2 Dove x equivale alla media campionaria, σ alla varianza campionaria (il quale ricordo essere sotto radice se elevata alla seconda) ed infine n che equivale alla dimensione del campione Normale - Double Trouble r (x̄N − ȳM ) + Z 2α2 · 3 σ12 σ2 2 + N M 3 Test T Student Formula Principale: t= x̄ − µ √ s/ n Dove x̄ rappresenta il valore ottenuto dal test di qualcuno, µ la media alla quale ci si confronta, s il valore della varianza campionaria ed infine n rappresenta il numero di istanze considerate dal test Formula con Due Eventi, Stessa Varianza: t= q x̄1 − x̄2 s2p · ( n11 + n12 ) dove x̄1 e x̄2 sono le medie campionarie dei due campioni, s2p è la stima della varianza comune dei due campioni, n1 e n2 sono i numeri di osservazioni nei due campioni. La stima della varianza comune è data da: s2p = (n1 − 1)s21 + (n2 − 1)s22 n1 + n2 − 2 dove s21 e s22 sono le varianze campionarie dei due campioni. Significativamente Differente (1): Zona di Accettazione: 1 − α Zona di Rifiuto: Z α2 Significativamente Maggiore (2): Zona di Accettazione: 1 − α Zona di Rifiuto: Zα ⩽ t Significativamente Inferiore (3): Zona di Accettazione: 1 − α Zona di Rifiuto: t ⩽ Zα Se ho un valore di gradi di libertà superiore a quello massimo presente nella tabella, considero il valore di z come si fa per L’Affidabilità Rifiuto per: |t| ⩾ t αα ≃ z αα 4 Cosa Particolare Spiegata in Classe: Accetto H0 se: √ √ µ − tn−1,α/2 · Sn (s) n < Xn (s) < µ + tn−1,α/2 · Sn (s) n Dove: µ equivale alla media dell’azienda Sn (s) indica la varianza campionaria n indica il numero di eventi presi in considerazione Xn (s) equivale alla media ottenuta associata ad n 5 4 Test di Chi2 Con tabella Semplice: Formula Principale: x2 = X (O − E)2 E Dove O equivale al valore osservato (quello presente in tabella normalmente), mentre con E si intende il valore atteso cioe’: Somma Riga1 × Somma Colonna1 E11 = Somma Totale Complessiva Gradi di Libertà: (r − 1) × (c − 1) Dove r rappresenta il numero di righe mentre c il numero di colonne presenti nel grafico Regione di Rifiuto: Si ottiene il valore tramite la tabella utilizzando il grado di libertà ed il livello di significatività imposto • Se X 2 < R.R. ⇒ non rifiuto l’ipotesi nulla • Se X 2 > R.R. ⇒ rifiuto l’ipotesi nulla P-Value: Si fa un reverse-look della tabella con il valore di R.R. ottenuto e si guarda la regione piu’ vicina a questo Rifiuto per: p-value ⩽ α Con Poisson: x2 = X (f1 − n · p1 )2 n · p1 Dove f1 equivale alle frequenze osservate (trovati nella tabella normale), n equivale al numero totale di osservazioni, infine p equivale invece alla distribuzione di poisson il quale ricordo essere pari a: pk = e−λ · λk k! Esempioneee ! Prendo in considerazione solo i valori per cui ho N · pj,0 ⩾ 5, arrivato a quel valore mi fermo e calcolo la corrispettiva probabilità contenuta: p4,0 = P (P0 (0, 3) ⩾ 3) −→ 1−P (P0 (0, 3) < 3) −→ 1−P(P0 (0, 3) = 0)−P(P0 (0, 3) = 1)−P(P0 (0, 3) = 2) Di conseguenza anche il valore di fx deve rispettare questa regola, se mi dovessi fermare al valore di p4 , devo sommare tutti i restanti f4 , f5 , f6 , ecc, per andare a calcolare un unico valore da aggiungere alla sommatoria (Ovviamente si andrebbe ad utilizzare il valore di p⩾3 ) Anche i gradi di libertà vengono limitati Ricordo che in questo caso il valore di H1 e’ rappresentato dal complementare delle diverse probabilità appena calcolate (esclusivamente con Poisson cioe’ il mio pk che equivalgono al nostro H0 ) 6 Con Esponenziale: x2 = X (f1 − n · pn )2 n · pn dove pn vengono calcolati tramite la funzione esponenziale seguente 1 F (x) = 1 − e− λ ·x Ci tengo inoltre a precisare che per H0 e H1 si intende proprio: 1 1 H0 : X E’ una Exp H1 : X NON E’ una Exp 4 4 Esempio di uso - Per l’intervallo di tempo di servizio (0, 1], la probabilità che una variabile aleatoria 1 1 esponenziale con media 4 cada in questo intervallo è data da F (1) − F (0) = 1 − e− 4 ·1 − 1 − e− 4 ·0 ≈ 0.2212. - Per l’intervallo di tempo di servizio (1, 2], la probabilità che una variabile aleatoria esponenziale 1 1 con media 4 cada in questo intervallo è data da F (2) − F (1) = 1 − e− 4 ·2 − 1 − e− 4 ·1 ≈ 0.1947. - Per l’intervallo di tempo di servizio (2, 4], la probabilità che una variabile aleatoria esponenziale 1 1 con media 4 cada in questo intervallo è data da F (4) − F (2) = 1 − e− 4 ·4 − 1 − e− 4 ·2 ≈ 0.2835. - Per l’intervallo di tempo di servizio (4, 6], la probabilità che una variabile aleatoria esponenziale 1 1 con media 4 cada in questo intervallo è data da F (6) − F (4) = 1 − e− 4 ·6 − 1 − e− 4 ·4 ≈ 0.1558. - Per l’intervallo di tempo di servizio > 6, la probabilità che una variabile con aleatoria esponenziale − 41 ·∞ − 41 ·6 − 32 media 4 cada in questo intervallo è data da F (∞) − F (6) = 1 − e ≈ 0.2231. − 1−e =e 7 5 Modello Lineare e Coefficiente Correlazione Dato un modello lineare del tipo: Yi = bxi + a + Ui con U che rappresenta una variabile aleatoria N(0,σ 2 ) • Stimare i coefficienti a e b del modello lineare σxy σx2 b̂ = â = −b̂ · x̄ + ȳ Dove i valori di x̄ e ȳ rappresentano i calcoli Ricordo che: Pk i=1 xi or Pk i=1 yi n n x̄ = k X (xi e yi sono la somma dei valori) n 1X xi n i=1 1X yi n i=1 ȳ = k X 2 (xi − x̄) = σx2 i=1 2 (yi − ȳ) = σy2 i=1 k X (xi − x̄) (yi − ȳ) = σxy i=1 • Calcolare il coefficiente di correlazione: ρ= q σxy σx2 · σy2 Il coefficiente di correlazione assume valori tra -1 e 1, dove un valore vicino a -1 indica una forte correlazione negativa, un valore vicino a 1 indica una forte correlazione positiva e un valore vicino a 0 indica una debole o nulla correlazione. In questo caso, il valore di ρ è vicino a 1, il che suggerisce una forte correlazione positiva tra la velocità e lo spazio di frenata. • Costruire un intervallo di confidenza per il coefficiente angolare b sy b ± tα/2,n−2 · pPn 2 i=1 (xi − x̄) dove tα/2,n−2 è il valore critico della distribuzione t di Student con n-2 gradi di libertà (dove n è il numero di osservazioni), sy è la deviazione standard campionaria di y e xi e x̄ sono i valori della variabile indipendente. sP n 2 i=1 (yi − ȳ) sy = n−2 Oppure anche: R2 = 2 σxy σx2 · σy2 E 2 = (n − 1) · σy2 · 1 − R2 s E2 b ± tα/2,n−2 · (n − 2) · (n − 1) · σx2 • Calcolare l’equazione della retta di regressione lineare ŷ = β̂0 + β̂1 x dove βˆ0 è l’intercetta della retta di regressione lineare e βˆ1 è il coefficiente angolare della retta di regressione lineare. Pn (xi − x̄) (yi − ȳ) β̂1 = i=1 Pn 2 i=1 (xi − x̄) β̂0 = ȳ − β̂1 · x̄ 8 6 Probabilità Elementare Di seguito, le scritture piu’ comuni utilizzate agli esami: Probabilità condizionata P(E | A) Indica la probabilità che l’evento E accadi, sapendo che l’evento A e’ già accaduto Probabilità C-Qualcosa P(A)C = 1 − P(A) Se voglio calcolare l’opposto di un determinato evento, posso calcolarlo sottraendo la probabilità di un determinato evento ad 1. Probabilità Congiunta P(E ∩ A) = P(E | A) · P(A) Equivale a calcolare la probabilità della probabilità condizionata dell’evento E noto A per la probabilità a priori dell’evento A. Probabilità Totale P(A) = P(E ∩ A) + P(E ∩ B) Probabilità Beyes P (A | E) = P (E | A) · P (A) P (E) 9 7 Calcolo Media e Varianza data una V.A. Sia X una variabile aleatoria tale che P{X = −3} = P{X = 0} = P{X = 3} = 1/3. Calcolare media e varianza di X. Soluzione Innanzitutto, abbiamo una variabile aleatoria X che può assumere tre valori: -3, 0 e 3, e la probabilità di ciascun valore è 1/3. Per calcolare la media, dobbiamo moltiplicare ciascun valore per la sua probabilità e sommarli. Nel nostro caso, abbiamo: µX = (−3) · 1 1 1 + (0) · + (3) · = 0 3 3 3 Quindi la media della variabile aleatoria X è zero. Per calcolare la varianza, dobbiamo sottrarre la media da ciascun valore, elevare al quadrato il risultato e moltiplicare per la probabilità, quindi sommare tutti i risultati. Formalmente, la formula per la varianza è: X 2 σX = (xi − µX )2 P (X = xi ) i Applicando la formula alla nostra variabile aleatoria X, otteniamo: 2 σX = (−3 − 0)2 · 1 1 1 + (0 − 0)2 · + (3 − 0)2 · = 3 + 3 = 6 3 3 3 Quindi la varianza della variabile aleatoria X è 6. 10 8 Ottenere Marginali Consideriamo un’urna con B palline bianche e N palline nere. Consideriamo (X,Y) le variabili aleatorie che contano il numero di palline nere nella prime e nella seconda estrazione di due estrazioni con riimmissione. Siano invece (X’,Y’) le variabili aleatorie senza riimmissione Z = X + Y - Variabile aleatoria che comprende il numero di palline nere estratte in tutte e due le estrazioni Soluzione: Notiamo che i valori di X e Y variano esclusivamente tra 0 e 1. Questo e’ dovuto dal fatto che la pallina nera viene estratta oppure no, non ci sono altre possibilità. Procediamo con il calcolo della probabilità congiunta dei vari possibili eventi. px,y (0, 0) = P(X = 0, Y = 0) = P(Estraggo Bianca nella Prima)∩P(Estraggo Bianca nella Seconda) = b n · b+n b+n n b px,y (1, 0) = · b+n b+n n n · px,y (1, 1) = b+n b+n px,y (0, 1) = Otteniamo dunque la seguente tabella xy 0 0 b n+a 1 2 nb (n+b)2 nb (x+b)2 1 n n+b 2 Per ottenere le probabilità marginali possiamo procedere sommando per colonne o righe le probabilità congiunte. Ad esempio se volessimo calcolare la probabilità che esca una pallina bianca nella seconda estrazione senza sapere cosa accade nella prima avremo: b2 nb b(n + b) + = (n + b)2 (n + b)2 (n + b)2 Facendo i calcoli otteniamo la seguente tabella aggiornata: x×y 0 1 0 b n+a 1 2 nb (n+b)2 nb (x+b)2 b (n+b) 2 n n+b n (n+b) b (n+b) n (n+b) Procediamo ora con il calcolo della media teorica: E[X] = µx = 0 · µx (0) + 1 · µx (1) = 0 · n b +1· n+b n+b E[y] = µy = 0 · µy (0) + 1 · µy (1) (Da notare che abbiamo utilizzato il valore delle probabilità marginali nel calcolo) Procediamo con il calcolo della varianza di X e Y: Var(x) = E x2 − µ2x = 02 · px (0) + 12 · px (1) − 11 n n+b 2 b b · b+n b+n Var(y) = E y 2 − µ2y = 02 · py (0) + 12 · py (1) − n n+b 2 In questo caso, avremo che la covarianza e’ pari a zero. Questo e’ dovuto dal fatto che i due eventi sono indipendenti tra di loro. Ma esplicitiamo comunque i calcoli visto che ci vogliamo male. Cov(x, y) = E[xy] − µx µy = (0 · 0pxy (0, 0) + 0 · 1pxy (0, 1) + 1 · 0pxy (1, 0) + +1 · 1pxy (1, 1)) − µx µy = n n+b 2 − n n · =0 n+b n+b Parte 2 Ora Ipotizziamo di avere una variabile aleatoria che conti il numero di palline estratte in tutte e due le estrazioni Z =X +Y Procediamo con il calcolo della media di questa variabile aleatoria E[z] = E[x + y] = E[x] + E[y] = µx + µy = n 2n n + = n+b n+b n+b Ora procedo con il calcolo della varianza Var(z) = Var(x) + Var(y) + 2 Cov(x, y) = 2 nb (n + b)2 (Da notare che 2Cov(x,y) e’ uguale a zero per quello che abbiamo calcolato prima) Procediamo ora con le V.A. X’ e Y’ un esempio: Per capire come calcolare le varie probabilità, vediamo ora px′ y′ (0, 0) = P(Bianca Prima Estrz) · P(Bianca Seconda Estrz | Bianca Prima Estrz) = b b−1 b · (b − 1) · = n+b b+n−1 (n + b)(n + b − 1) Ottenendo dunque la seguente tabella: x′ × y ′ 0 1 0 1 b(b−1) (n+b)(n+b−1) b·n (n+b)(n+b−1) b n+b b·n (n+b)(n+b−1) n(b−1) (n+b)(n+b−1) n n+b b n+b n n+b DA NOTARE CHE LE MARGINALI SONO UGUALI A PRIMA, DUNQUE HO LO STESSO VALORE DI MEDIA E VARIANZA DI PRIMA Calcoliamo ora la covarianza: Cov(x′ , y ′ ) = F [x′ y ′ ] − µx′ µy′ = (0 · 0 · px′ y′ (0, 0) + 0 · 1 · px′ y′ (0, 1) + 1 · 0 · px′ y′ (1, 0) + 1 · 1 · px′ y′ (1, 1). = n(n − 1) n n n·b − · =− (n + b)(n + b − 1) n + b n + b (n + b)2 · (n + b − 1) Ora, definendo Z ′ = x′ + y ′ nello stesso modo di prima (senza ri-immissione). Procedo a calcolare media e varianza di z: 2·n E [z ′ ] = E [x′ ] + E [y ′ ] = µx′ + µy ′ = n+b n · b n·b 2·n·b + − Var (z ′ ) = Var (x′ ) + Var (y ′ ) + 2 Cov (x′ , y ′ ) = 2 2 (n + b) (n + b) (n + b)2 (n + b − 1) 12 9 Vincita Media Per calcolare la vincita media, bisogna moltiplicare le possibili vincite per le probabilità corrispondenti e sommarle. E[X] = Win Numerica · P(Prob. Win) − Lose Numerica · P(Prob. Lose) 13 10 Affidabilità Si intende per fase un gruppo di macchinari adibito allo stesso compito all’interno di una ipotetica catena di montaggio. Nel caso in cui questo fosse > 1 allora la il calcolo della probabilità avverrà tramite la formula: Ptot = [1 − (1 − Pa)∧ 2] ∗ [1 − (1 − Pb)∧ 2] (Nella formula qui sopra, si ipotizza di avere una catena di montaggio composta da due fasi differenti fasi caratterizzati da due macchinari ciascuno. Una volta calcolata la probabilità di ogni singola fase, sara’ necessario calcolarne il prodotto per ottenere la percentuale di affidabilità) 14 11 Distribuzione Normale P(X ≥ X̄) = Φ X̄ − µ σ dove X̄ rappresenta l’intervallo che si vuole testare, µ rappresenta la media della distribuzione della variabile aleatoria X, mentre σ rappresenta la deviazione standard della distribuzione della variabile aleatoria X. • Se ottengo un valore negativo (Φ(−x)) lo sostituisco con 1 − Φ(x) • Se viene richiesto X ≥ n, la forma e’ 1 − Φ(n) • Se viene richiesto X ≤ n, la forma e’ Φ(x) • Se viene richiesto n1 ≤ x ≤ n2 la forma risulta essere Φ(n2 ) − Φ(n1 ) Ottenuto Z, possiamo procedere con il trovare il corrispondente valore nella tabella di Distribuzione normale standardizzata (Si ricordi di approssimare gli ipotetici numeri dopo due valori dopo la virgola) P.S. Nel caso in cui mi chiedessero di calcolare una nuova probabilità con eventi dipendenti, devo dividere il valore della varianza per il numero di considerazioni fatte 15 12 Distribuzione Binomiale P (X = k) = n k pk (1 − p)n−k dove n è il numero di prove, k è il numero di successi , p è la probabilità di successo in ogni prova , e 1 − p è la probabilità di fallimento in ogni prova . 4·3·2 4 = 3 3! 16 13 Distribuzione di Poisson P(X = k) = e−λ λk k! Dove: P(X = k) rappresenta la probabilità che la variabile casuale X abbia valore k; λ è il parametro della distribuzione di Poisson, che rappresenta il valore della media; k è il valore che può assumere la variabile casuale X. Normalmente si utilizza nel caso mi venga data esclusivamente il valore della media 17 14 Distribuzione di Poisson - Periodo Temporale P(Y ⩾ x) = e−λ·x Dove: P(Y ⩾ x) rappresenta la probabilità che la variabile casuale Y abbia una durata maggiore di X; λ è il parametro della distribuzione di Poisson, che rappresenta il valore della media. In questo caso e’ pari a: 1 λ= µ x è il valore temporale che stiamo testando. Calcolo di un periodo centrale P{x < T < y} In questo caso avremo: y x e− µ − e− µ 18 15 Trovare Media e Varianza Non Esplicite Media Campionaria: X̄ = 1 X · (xi ) n Dove: n equivale al numero di eventi presi in considerazione P (xi ) indica la sommatoria del valore ottenuto per ogni singolo evento Varianza Campionaria: 1 S = · n−1 2 N X ! x2i i=1 − n · x̄2 n−1 Ovviamente x̄ equivale alla media campionaria calcolata prima, mentre ci tengo a precisare che l’elevazione al quadrato degli elementi presi in considerazione va fatta per ogni singolo elemento (non e’ possibile dunque sommarli tutti e poi elevare alla seconda il risultato ottenuto) 19 16 Funzioni di Densità Esempio: ( fx (x) = 3(1−x2 ) 4 0 −1 < x < +1 altrimenti • Per verificare se la funzione corrisponde ad una funzione di densità deve valere: – fx ⩾ 0 R +∞ – −∞ fx (x)dx = 1 • Calcolare una determinata probabilità R1 – P x > 14 = 1 fx (x)dx 4 • Calcolare la media µX (E[x]) R +∞ R1 – µx = −∞ x · fx (x)dx = −1 x · fx (x)dx • Calcolare la varianza – σ 2 = var(x) = E x2 − µ2x R +∞ R1 2 ∗ Dove E x2 = −∞ (x − µx ) · fx (x)dx = −1 x2 fx (x)dx 20 16.1 Esercizio Simil-Esame - V.A. Continua ( c x2 − x3 fx (t) = 0 per 0 ≤ x ⩽ 1 altrimenti a) Calcolare C - c ⩾ 0 =⇒ fx (t) ⩾ 0 - R +∞ −∞ fx (t)dt = 1 Quindi: Z 1 c x2 − x 3 dx =⇒ 0 3 1 4 1 ! x x c − 3 0 4 0 =⇒ c· 1 = 1 =⇒ c = 12 12 b) Calcolare la media di X Z 1 Z +∞ x · 12 · x − x x · fx (x) dx = µx = E[x] = 2 −∞ 3 4 1 5 1 ! x x 3 − = 4 0 5 0 5 dx = 12 · 0 c) Calcolare la varianza 2 Var(x) = E x2 − (µx ) Dove ricordo che dobbiamo prima calcolare E x2 E x2 = Z ∞ Z 1 2 x · fx (x)dx −∞ 2 2 x · 12 x − x =⇒ 3 dx =⇒ 12 · 0 5 1 6 1 ! x 2 x − = 5 0 6 0 5 Quindi finalmente posso concludere calcolando il dannato: 2 9 1 Var(x) = E x2 − µ2x = − = 5 25 25 d) Calcolo della moda fx (xm ) = max fx (x) = max fx (x) x∈[0,1] Si ottiene facendo la media ed isolando il valore di x fx′ (x) = 12 2x − 3x2 =⇒ x(2 − 3x) =⇒ x = 2 ex=0 3 Il valore di moda e’ dunque 32 e) Calcolare la mediana E’ necessario considerare l’intervallo 0 ⩽ m ⩽ 1 (proprio perche’ e’ quello che ci viene fornito dal testo) 3 m 4 m Z m Z m 1 x x 1 = fx (x)dx =⇒ fx (x)dx =⇒ 12 · − = 2 3 4 2 −∞ 0 0 0 21 16.2 Esercizio Simil-Esame - V.A. Discreta ( 2c(x + 1) fx (x) = 0 dove x ∈ {0, 1, 2, 3, 4} altrimenti Avendo una variabile aleatoria discreta posso, se proprio insisti, formulare la seguente tabella Da notare che i valori nella tabella corrispondono al comportamento della funzione presi dei valori specifici di x, che ricordo essere qui uguali a 0,1,2,3,4 x 0 1 2 3 4 2c 4c 6c 8c 10c a) Calcolare c -c⩾0 - P x=0,1,2,3,4 px (x) = 1 cioe’ proprio: px (0) + px (1) + px (2) + px (3) + px (4) = 1 =⇒ 30c = 1 =⇒ c = 1 30 Posso quindi aggiornare la tabella come: (Ho sostituito il valore di c nella tabella di prima) x 0 1 2 3 4 1 15 2 15 1 5 4 15 1 3 b) Calcolare µx = E[x] E[x] = X x · µx (x) = 0 · 1 2 1 4 1 8 +1· +2· +3· + 4 · =⇒ 15 15 5 15 3 3 c) Calcolare la Varianza Uso la seguente formula Var(x) = E x2 − µ2x dove : 1 2 1 4 1 E x2 = 02 · + 12 · + 22 · + 32 · + 42 15 15 5 15 3 =⇒ 26 3 Quindi posso concludere con: Var(x) = 26 64 − 3 9 =⇒ 14 9 d) Calcolare la Moda Essendo la nostra una variabile aleatoria discreta la Moda equivale al valore di x per cui ho il valore di px maggiore, in questo caso e’ palesemente 4. Moda = xm = 4 e) Calcolare la Mediana Devono valere le seguenti uguaglianze: P(x ⩾ m) ⩾ 1 2 P(x ≤ m) ⩾ 1 2 Quindi verifichiamo valore per valore: m=1? 1 2 1 1 P(X ≤ 1) = px (0) + px (1) = + = < NO 15 15 5 2 m=2? 1 2 1 6 1 P(x ≤ 2) = px (0) + px (1) + px (2) = + + = < NO 15 15 5 15 2 22 m=3? P(x ≤ 3) = px (0)+px (1)+px (2)+px (3) = P(x ⩾ 3) = px (3) + px (4) = 1 2 4 10 1 + + = = 0.6 ⩾ Attenzione! Proviamo ora l’altra guancia 15 15 15 15 2 4 1 9 1 + = = 0.6 ⩾ La Mediana e’ proprio 3 !! 15 3 15 2 23 17 Funzione di Ripartizione Come disegnare una funzione di ripartizione e la sua corrispettiva funzione di massa: 0 t < −2 0, 2 −2 ⩽ t < 0 Fx (t) = 0, 7 0 ⩽ t < 2 2 t⩾2 Ricordo che la funzione di massa si comporta sempre come zero, tranne quando la funzione esegue dei ”salti” (Il primo salto prende il corretto valore di Y, per gli altri devo sempre sottrare al valore attuale quello precedente) Cosa di dubbia utilità ( 1 f (t) = 0 what? 0≤t≤1 Altrimenti Z 1 2 1 1 1 Fx fx (t)dt = · 1 = = 2 2 2 −∞ 1 1 1 Fx = ·1= 3 3 3 so... P 1 1 ⩽x⩽ 2 3 Z 31 = 1 2 fx(s) = 24 1 1 − 3 2 1= 1 6 18 Da Ripartizione → Densità Da Densità → Ripartizione Z t Fx (t) = fx (s)dt, −∞ fx (t) = ∂v Fx (t) ∂t Da Densità a Ripartizione ( fx (t) = 1 2t se 0 ⩽ t ⩽ 2 Altrimenti 0 - Se s ⩽ t < 0: Z t Z t fx (t) = 0 → Fx (t) = fx (s)dt = −∞ - Se 0 ⩽ s ⩽ t ⩽ 2: 0 t 1 1 t2 t2 t dt = = 2 2 0 4 0 2 Z 2 Z 2 Z t Z t fx (t)dt −→ Fx (t) = -Se 2 < s ⩽ t 0dt = 0 −∞ fx (t)dt −→ Fx (t) = 0 0 2 1 1 t2 =1 t dt = 2 2 2 0 Da Ripartizione a Densità Fx (t) = 0 t 3 3 1 Se t < 0: fx (t) = Se 0 < t < 3: fx (t) = se t < 0 0⩽t⩽3 se t > 3 ∂ ∂ Fx (t) = 0 = 0 ∂t ∂t ∂ ∂ t3 1 Fx (t) = = 2 · t2 3 ∂t ∂t 3 3 Se t > 3: ∂ ∂ Fx (t) = 1 = 0 ∂t ∂t Infine ottengo quindi la funzione di densità pari a: 0 se t < 0 2 2 se 0 ≤ t ≤ 3 fx (t) = 2t 3 0 se t > 3 f x(t) = Un calcolo di probabilità si puo eseguire tramite: Z 3/2 3/2 Z 3/2 3 1 1 s2 2 P 1<x< = fx (s) ds = · s ds = 2 32 32 3 1 1 1 Ho Capito In Maniera Meccanica!!! Usiamo questa scrittura per comprendere bene come si fa: a se X ⩽ t ⩽ Y fx (t) = 0 se altro Per quanto riguarda la trasformazione da funzione di densità a quella di ripartizione, R t posso notare che il primo integrale rappresenta si esegue nella sezione t < X ed e’ sempre uguale a −∞ Il R t secondo integrale rappresenta invece il contenuto centrale X < t < Y e si calcola sempre come x Il terzo ed ultimo integrale rappresenta il contenuto di trovatosi in t > Y e si calcola sempre come 25 Ry x 19 P-Value E’ la minima significatività per cui rifiutiamo l’ipotesi H0 • Se p-value > α =⇒ l’ipotesi H0 viene accettata • Se p-value < α =⇒ l’ipotesi H0 viene rifiutata • Se p-value ≃ α =⇒ il test non ha abbastanza informazioni per accettare o rifiutare H0 P-Value Gaussiana Caso Bilaterale H0 : µ = µ0 H1 : µ ̸= µ0 x̄N (s) − µ0 p − value = 2 1 − Φ !! √σ N Caso Unilaterale 1 H0 : µ ⩽ µ0 H1 : µ > µ0 p − value = x̄N (s) − µ0 1−Φ !! √σ N Caso Unilaterale 2 H0 : µ ⩾ µ0 H1 : µ < µ0 p − value = Φ x̄N (s) − µ0 ! √σ N P-Value Applicato a T Student Caso Bilaterale H0 : µ = µ0 H1 : µ ̸= µ0 x̄ (s) − µ N 0 p − value = 2P TN −1 > S (s) N √ N Caso Unilaterale 1 H0 : µ ⩽ µ0 H1 : µ > µ0 x̄N (s) − µ0 p − value = P TN −1 > S (s) N √ N Caso Unilaterale 2 H0 : µ ⩾ µ0 H1 : µ < µ0 x̄ (s) − µ N 0 p − value = P TN −1 < S (s) N √ N Per ottenere il valore di p-value e paraganorarlo al valore di significativa prescelto, ricordo che e’ necessario eseguire una sorta di reverse-look nella tabella di t student 26 20 Test Bernoulli Caso Bilaterale H0 : p = p0 H1 : p ̸= p0 Rifiuto se: x̄ − p0 q N > z α2 x̄N (1−x̄N ) N x̄N − p0 p − value = 2 1 − Φ q x̄N (1−x̄N ) N ) Caso Unilaterale 1 H0 : p ⩽ p0 H1 : p > p0 Rifiuto se: x̄ − p0 qN x̄N (1−x̄N ) N p − value = 1 − Φ q > zα x̄N (s) − p0 x̄N (s)(1−x̄N (s)) N Caso Unilaterale 2 H0 : p ⩾ p0 H1 : p < p0 Rifiuto se: x̄ (s) − p0 q N x̄N (s)(1−x̄N (s)] N < −zα x̄N (s) − p0 p − value = Φ q x̄N )(1−x̄N (s)) N 27