Uploaded by Luca Guerra

Probabilità e Statistica: Riassunto Completo

advertisement
Prendo 25 con un livello di confidenza del 95%
Luca Guerra
April 2023
Contents
1 Approssimare Distribuzione Binomiale → Normale
2
2 Intervallo di Confidenza
3
3 Test T Student
4
4 Test di Chi2
6
5 Modello Lineare e Coefficiente Correlazione
8
6 Probabilità Elementare
9
7 Calcolo Media e Varianza data una V.A.
10
8 Ottenere Marginali
11
9 Vincita Media
13
10 Affidabilità
14
11 Distribuzione Normale
15
12 Distribuzione Binomiale
16
13 Distribuzione di Poisson
17
14 Distribuzione di Poisson - Periodo Temporale
18
15 Trovare Media e Varianza Non Esplicite
19
16 Funzioni di Densità
20
16.1 Esercizio Simil-Esame - V.A. Continua - . . . . . . . . . . . . . . . . . . . . . . . . . . . 21
16.2 Esercizio Simil-Esame - V.A. Discreta - . . . . . . . . . . . . . . . . . . . . . . . . . . . 22
17 Funzione di Ripartizione
18 Da Ripartizione → Densità
24
Da Densità → Ripartizione
25
19 P-Value
26
20 Test Bernoulli
27
1
1
Approssimare Distribuzione Binomiale → Normale
Prima di iniziare, e’ fondamentale che siano verificate alcune proprietà. Vediamole ora:
n · p ≥ 50
n(1 − p) ≥ 5
Dove ricordiamo che con n stiamo indicando i casi presi in considerazione mentre con p indichiamo la
probabilità che un determinato evento accade.
Per passare da una variabile aleatoria Binomiale ad una Normale procediamo con i seguenti calcoli:
p
µ=n·p
σ = n · p · (1 − p)
Possiamo sfruttare questa conoscenza per svolgere esercizi che altrimenti sarebbero un vero e proprio
parto! Vediamone uno:
Esempio
1
x ∼ B 120;
6
P(y ≤ 15)
???
Notiamo che la richiesta puo essere scritta come:
P(0 ⩽ y ⩽ 15)
Il quale sappiamo essere uguale alla somma delle probabilità singole come:
P(y = 0) + P(y = 1) + . . .
Essendo questo un parto da calcolare, procediamo con l’approssimazione. Verifichiamo se questo risulta
pero eseguibile:
1
n · p = 120 · = 20 ≥ 5 Verificato !!
6
5
n · (1 − p) = 120 · = 100 ≥ 5 Verificato !!
6
Risulta essere possibile eseguire l’approssimazione, procediamo dunque riducendo e sommando rispettivamente l’estremo sinistro e destro della nostra probabilità con 1/2
P(0 ⩽ y ⩽ 15) ≃ P(−0, 5 ⩽ y ⩽ 15.5)
Ora procedo con il solito calcolo della distribuzione normale
2
2
Intervallo di Confidenza
α = 1 − C{ Percentuale di Confidenza scelta }
α
z=
2
⇒
Ottengo una percentuale la quale risulta possibile trovare nell’apposita tabella
Per Distribuzione Binomiale
r
p ± z α2 ·
p · (1 − p)
n
Dove p equivale alla proporzione campionaria ( nx , dove x sta ad indicare il numero di pezzi difettosi)
mentre n e’ il numero totale di eventi/oggetti presi in considerazione
Per Distribuzione Normale
√
σ2
X ±z · √
n
α
2
Dove x equivale alla media campionaria, σ alla varianza campionaria (il quale ricordo essere sotto
radice se elevata alla seconda) ed infine n che equivale alla dimensione del campione
Normale - Double Trouble
r
(x̄N − ȳM ) + Z 2α2 ·
3
σ12
σ2 2
+
N
M
3
Test T Student
Formula Principale:
t=
x̄ − µ
√
s/ n
Dove x̄ rappresenta il valore ottenuto dal test di qualcuno, µ la media alla quale ci si confronta, s il
valore della varianza campionaria ed infine n rappresenta il numero di istanze considerate dal test
Formula con Due Eventi, Stessa Varianza:
t= q
x̄1 − x̄2
s2p · ( n11 + n12 )
dove x̄1 e x̄2 sono le medie campionarie dei due campioni, s2p è la stima della varianza comune dei due
campioni, n1 e n2 sono i numeri di osservazioni nei due campioni.
La stima della varianza comune è data da:
s2p =
(n1 − 1)s21 + (n2 − 1)s22
n1 + n2 − 2
dove s21 e s22 sono le varianze campionarie dei due campioni.
Significativamente Differente (1):
Zona di Accettazione: 1 − α
Zona di Rifiuto: Z α2
Significativamente Maggiore (2):
Zona di Accettazione: 1 − α
Zona di Rifiuto: Zα ⩽ t
Significativamente Inferiore (3):
Zona di Accettazione: 1 − α
Zona di Rifiuto: t ⩽ Zα
Se ho un valore di gradi di libertà superiore a quello massimo presente nella tabella, considero il valore
di z come si fa per L’Affidabilità
Rifiuto per: |t| ⩾ t αα ≃ z αα
4
Cosa Particolare Spiegata in Classe:
Accetto H0 se:
√
√
µ − tn−1,α/2 · Sn (s) n < Xn (s) < µ + tn−1,α/2 · Sn (s) n
Dove:
µ equivale alla media dell’azienda
Sn (s) indica la varianza campionaria
n indica il numero di eventi presi in considerazione
Xn (s) equivale alla media ottenuta associata ad n
5
4
Test di Chi2
Con tabella Semplice:
Formula Principale:
x2 =
X (O − E)2
E
Dove O equivale al valore osservato (quello presente in tabella normalmente), mentre con E si intende
il valore atteso cioe’:
Somma Riga1 × Somma Colonna1
E11 =
Somma Totale Complessiva
Gradi di Libertà:
(r − 1) × (c − 1)
Dove r rappresenta il numero di righe mentre c il numero di colonne presenti nel grafico
Regione di Rifiuto:
Si ottiene il valore tramite la tabella utilizzando il grado di libertà ed il livello di significatività imposto
• Se X 2 < R.R. ⇒ non rifiuto l’ipotesi nulla
• Se X 2 > R.R. ⇒ rifiuto l’ipotesi nulla
P-Value:
Si fa un reverse-look della tabella con il valore di R.R. ottenuto e si guarda la regione piu’ vicina
a questo
Rifiuto per: p-value ⩽ α
Con Poisson:
x2 =
X (f1 − n · p1 )2
n · p1
Dove f1 equivale alle frequenze osservate (trovati nella tabella normale), n equivale al numero totale
di osservazioni, infine p equivale invece alla distribuzione di poisson il quale ricordo essere pari a:
pk =
e−λ · λk
k!
Esempioneee !
Prendo in considerazione solo i valori per cui ho N · pj,0 ⩾ 5, arrivato a quel valore mi fermo e calcolo
la corrispettiva probabilità contenuta:
p4,0 = P (P0 (0, 3) ⩾ 3) −→ 1−P (P0 (0, 3) < 3) −→ 1−P(P0 (0, 3) = 0)−P(P0 (0, 3) = 1)−P(P0 (0, 3) = 2)
Di conseguenza anche il valore di fx deve rispettare questa regola, se mi dovessi fermare al valore di
p4 , devo sommare tutti i restanti f4 , f5 , f6 , ecc, per andare a calcolare un unico valore da aggiungere
alla sommatoria (Ovviamente si andrebbe ad utilizzare il valore di p⩾3 )
Anche i gradi di libertà vengono limitati
Ricordo che in questo caso il valore di H1 e’ rappresentato dal complementare delle diverse probabilità appena calcolate (esclusivamente con Poisson cioe’ il mio pk che equivalgono al nostro H0 )
6
Con Esponenziale:
x2 =
X (f1 − n · pn )2
n · pn
dove pn vengono calcolati tramite la funzione esponenziale seguente
1
F (x) = 1 − e− λ ·x
Ci tengo inoltre a precisare che per H0 e H1 si intende proprio:
1
1
H0 : X E’ una Exp
H1 : X NON E’ una Exp
4
4
Esempio di uso
- Per l’intervallo di tempo di servizio (0, 1], la probabilità che una variabile
aleatoria
1
1
esponenziale con media 4 cada in questo intervallo è data da F (1) − F (0) = 1 − e− 4 ·1 − 1 − e− 4 ·0 ≈
0.2212.
- Per l’intervallo di tempo di servizio (1, 2], la probabilità che una variabile
aleatoria
esponenziale
1
1
con media 4 cada in questo intervallo è data da F (2) − F (1) = 1 − e− 4 ·2 − 1 − e− 4 ·1 ≈ 0.1947.
- Per l’intervallo di tempo di servizio (2, 4], la probabilità che una variabile
aleatoria
esponenziale
1
1
con media 4 cada in questo intervallo è data da F (4) − F (2) = 1 − e− 4 ·4 − 1 − e− 4 ·2 ≈ 0.2835.
- Per l’intervallo di tempo di servizio (4, 6], la probabilità che una variabile
aleatoria
esponenziale
1
1
con media 4 cada in questo intervallo è data da F (6) − F (4) = 1 − e− 4 ·6 − 1 − e− 4 ·4 ≈ 0.1558.
- Per l’intervallo di tempo di servizio > 6, la probabilità che una variabile
con
aleatoria
esponenziale
− 41 ·∞
− 41 ·6
− 32
media 4 cada in questo intervallo è data da F (∞) − F (6) = 1 − e
≈ 0.2231.
− 1−e
=e
7
5
Modello Lineare e Coefficiente Correlazione
Dato un modello lineare del tipo: Yi = bxi + a + Ui con U che rappresenta una variabile aleatoria
N(0,σ 2 )
• Stimare i coefficienti a e b del modello lineare
σxy
σx2
b̂ =
â = −b̂ · x̄ + ȳ
Dove i valori di x̄ e ȳ rappresentano i calcoli
Ricordo che:
Pk
i=1 xi or
Pk
i=1 yi
n
n
x̄ =
k
X
(xi e yi sono la somma dei valori)
n
1X
xi
n i=1
1X
yi
n i=1
ȳ =
k
X
2
(xi − x̄) = σx2
i=1
2
(yi − ȳ) = σy2
i=1
k
X
(xi − x̄) (yi − ȳ) = σxy
i=1
• Calcolare il coefficiente di correlazione:
ρ= q
σxy
σx2 · σy2
Il coefficiente di correlazione assume valori tra -1 e 1, dove un valore vicino a -1 indica una forte
correlazione negativa, un valore vicino a 1 indica una forte correlazione positiva e un valore vicino a 0
indica una debole o nulla correlazione. In questo caso, il valore di ρ è vicino a 1, il che suggerisce una
forte correlazione positiva tra la velocità e lo spazio di frenata.
• Costruire un intervallo di confidenza per il coefficiente angolare b
sy
b ± tα/2,n−2 · pPn
2
i=1 (xi − x̄)
dove tα/2,n−2 è il valore critico della distribuzione t di Student con n-2 gradi di libertà (dove n è
il numero di osservazioni), sy è la deviazione standard campionaria di y e xi e x̄ sono i valori della
variabile indipendente.
sP
n
2
i=1 (yi − ȳ)
sy =
n−2
Oppure anche:
R2 =
2
σxy
σx2 · σy2
E 2 = (n − 1) · σy2 · 1 − R2
s
E2
b ± tα/2,n−2 ·
(n − 2) · (n − 1) · σx2
• Calcolare l’equazione della retta di regressione lineare
ŷ = β̂0 + β̂1 x
dove βˆ0 è l’intercetta della retta di regressione lineare e βˆ1 è il coefficiente angolare della retta di
regressione lineare.
Pn
(xi − x̄) (yi − ȳ)
β̂1 = i=1
Pn
2
i=1 (xi − x̄)
β̂0 = ȳ − β̂1 · x̄
8
6
Probabilità Elementare
Di seguito, le scritture piu’ comuni utilizzate agli esami:
Probabilità condizionata
P(E | A)
Indica la probabilità che l’evento E accadi, sapendo che l’evento A e’ già accaduto
Probabilità C-Qualcosa
P(A)C = 1 − P(A)
Se voglio calcolare l’opposto di un determinato evento, posso calcolarlo sottraendo la probabilità di un
determinato evento ad 1.
Probabilità Congiunta
P(E ∩ A) = P(E | A) · P(A)
Equivale a calcolare la probabilità della probabilità condizionata dell’evento E noto A per la probabilità
a priori dell’evento A.
Probabilità Totale
P(A) = P(E ∩ A) + P(E ∩ B)
Probabilità Beyes
P (A | E) =
P (E | A) · P (A)
P (E)
9
7
Calcolo Media e Varianza data una V.A.
Sia X una variabile aleatoria tale che P{X = −3} = P{X = 0} = P{X = 3} = 1/3.
Calcolare media e varianza di X.
Soluzione
Innanzitutto, abbiamo una variabile aleatoria X che può assumere tre valori: -3, 0 e 3, e la probabilità di ciascun valore è 1/3. Per calcolare la media, dobbiamo moltiplicare ciascun valore per la sua
probabilità e sommarli. Nel nostro caso, abbiamo:
µX = (−3) ·
1
1
1
+ (0) · + (3) · = 0
3
3
3
Quindi la media della variabile aleatoria X è zero.
Per calcolare la varianza, dobbiamo sottrarre la media da ciascun valore, elevare al quadrato il risultato e moltiplicare per la probabilità, quindi sommare tutti i risultati. Formalmente, la formula per la
varianza è:
X
2
σX
=
(xi − µX )2 P (X = xi )
i
Applicando la formula alla nostra variabile aleatoria X, otteniamo:
2
σX
= (−3 − 0)2 ·
1
1
1
+ (0 − 0)2 · + (3 − 0)2 · = 3 + 3 = 6
3
3
3
Quindi la varianza della variabile aleatoria X è 6.
10
8
Ottenere Marginali
Consideriamo un’urna con B palline bianche e N palline nere. Consideriamo (X,Y) le variabili aleatorie che contano il numero di palline nere nella prime e nella seconda estrazione di due estrazioni con
riimmissione.
Siano invece (X’,Y’) le variabili aleatorie senza riimmissione
Z = X + Y - Variabile aleatoria che comprende il numero di palline nere estratte in tutte e due
le estrazioni
Soluzione:
Notiamo che i valori di X e Y variano esclusivamente tra 0 e 1. Questo e’ dovuto dal fatto che la
pallina nera viene estratta oppure no, non ci sono altre possibilità.
Procediamo con il calcolo della probabilità congiunta dei vari possibili eventi.
px,y (0, 0) = P(X = 0, Y = 0) = P(Estraggo Bianca nella Prima)∩P(Estraggo Bianca nella Seconda) =
b
n
·
b+n b+n
n
b
px,y (1, 0) =
·
b+n b+n
n
n
·
px,y (1, 1) =
b+n b+n
px,y (0, 1) =
Otteniamo dunque la seguente tabella
xy
0
0
b
n+a
1
2
nb
(n+b)2
nb
(x+b)2
1
n
n+b
2
Per ottenere le probabilità marginali possiamo procedere sommando per colonne o righe le probabilità
congiunte. Ad esempio se volessimo calcolare la probabilità che esca una pallina bianca nella seconda
estrazione senza sapere cosa accade nella prima avremo:
b2
nb
b(n + b)
+
=
(n + b)2
(n + b)2
(n + b)2
Facendo i calcoli otteniamo la seguente tabella aggiornata:
x×y
0
1
0
b
n+a
1
2
nb
(n+b)2
nb
(x+b)2
b
(n+b)
2
n
n+b
n
(n+b)
b
(n+b)
n
(n+b)
Procediamo ora con il calcolo della media teorica:
E[X] = µx = 0 · µx (0) + 1 · µx (1) = 0 ·
n
b
+1·
n+b
n+b
E[y] = µy = 0 · µy (0) + 1 · µy (1)
(Da notare che abbiamo utilizzato il valore delle probabilità marginali nel calcolo)
Procediamo con il calcolo della varianza di X e Y:
Var(x) = E x2 − µ2x = 02 · px (0) + 12 · px (1) −
11
n
n+b
2
b
b
·
b+n b+n
Var(y) = E y 2 − µ2y = 02 · py (0) + 12 · py (1) −
n
n+b
2
In questo caso, avremo che la covarianza e’ pari a zero. Questo e’ dovuto dal fatto che i due eventi
sono indipendenti tra di loro. Ma esplicitiamo comunque i calcoli visto che ci vogliamo male.
Cov(x, y) = E[xy] − µx µy = (0 · 0pxy (0, 0) + 0 · 1pxy (0, 1) + 1 · 0pxy (1, 0) + +1 · 1pxy (1, 1)) − µx µy
=
n
n+b
2
−
n
n
·
=0
n+b n+b
Parte 2 Ora Ipotizziamo di avere una variabile aleatoria che conti il numero di palline estratte in
tutte e due le estrazioni
Z =X +Y
Procediamo con il calcolo della media di questa variabile aleatoria
E[z] = E[x + y] = E[x] + E[y] = µx + µy =
n
2n
n
+
=
n+b n+b
n+b
Ora procedo con il calcolo della varianza
Var(z) = Var(x) + Var(y) + 2 Cov(x, y) = 2
nb
(n + b)2
(Da notare che 2Cov(x,y) e’ uguale a zero per quello che abbiamo calcolato prima)
Procediamo ora con le V.A. X’ e Y’
un esempio:
Per capire come calcolare le varie probabilità, vediamo ora
px′ y′ (0, 0) = P(Bianca Prima Estrz) · P(Bianca Seconda Estrz | Bianca Prima Estrz)
=
b
b−1
b · (b − 1)
·
=
n+b b+n−1
(n + b)(n + b − 1)
Ottenendo dunque la seguente tabella:
x′ × y ′
0
1
0
1
b(b−1)
(n+b)(n+b−1)
b·n
(n+b)(n+b−1)
b
n+b
b·n
(n+b)(n+b−1)
n(b−1)
(n+b)(n+b−1)
n
n+b
b
n+b
n
n+b
DA NOTARE CHE LE MARGINALI SONO UGUALI A PRIMA, DUNQUE HO LO
STESSO VALORE DI MEDIA E VARIANZA DI PRIMA
Calcoliamo ora la covarianza:
Cov(x′ , y ′ ) = F [x′ y ′ ] − µx′ µy′ = (0 · 0 · px′ y′ (0, 0) + 0 · 1 · px′ y′ (0, 1) + 1 · 0 · px′ y′ (1, 0) + 1 · 1 · px′ y′ (1, 1).
=
n(n − 1)
n
n
n·b
−
·
=−
(n + b)(n + b − 1) n + b n + b
(n + b)2 · (n + b − 1)
Ora, definendo Z ′ = x′ + y ′ nello stesso modo di prima (senza ri-immissione). Procedo a calcolare
media e varianza di z:
2·n
E [z ′ ] = E [x′ ] + E [y ′ ] = µx′ + µy ′ =
n+b
n
·
b
n·b
2·n·b
+
−
Var (z ′ ) = Var (x′ ) + Var (y ′ ) + 2 Cov (x′ , y ′ ) =
2
2
(n + b)
(n + b)
(n + b)2 (n + b − 1)
12
9
Vincita Media
Per calcolare la vincita media, bisogna moltiplicare le possibili vincite per le probabilità corrispondenti
e sommarle.
E[X] = Win Numerica · P(Prob. Win) − Lose Numerica · P(Prob. Lose)
13
10
Affidabilità
Si intende per fase un gruppo di macchinari adibito allo stesso compito all’interno di una ipotetica
catena di montaggio. Nel caso in cui questo fosse > 1 allora la il calcolo della probabilità avverrà
tramite la formula:
Ptot = [1 − (1 − Pa)∧ 2] ∗ [1 − (1 − Pb)∧ 2]
(Nella formula qui sopra, si ipotizza di avere una catena di montaggio composta da due fasi differenti
fasi caratterizzati da due macchinari ciascuno. Una volta calcolata la probabilità di ogni singola fase,
sara’ necessario calcolarne il prodotto per ottenere la percentuale di affidabilità)
14
11
Distribuzione Normale
P(X ≥ X̄) = Φ
X̄ − µ
σ
dove X̄ rappresenta l’intervallo che si vuole testare, µ rappresenta la media della distribuzione della
variabile aleatoria X, mentre σ rappresenta la deviazione standard della distribuzione della variabile
aleatoria X.
• Se ottengo un valore negativo (Φ(−x)) lo sostituisco con 1 − Φ(x)
• Se viene richiesto X ≥ n, la forma e’
1 − Φ(n)
• Se viene richiesto X ≤ n, la forma e’
Φ(x)
• Se viene richiesto n1 ≤ x ≤ n2 la forma risulta essere
Φ(n2 ) − Φ(n1 )
Ottenuto Z, possiamo procedere con il trovare il corrispondente valore nella tabella di Distribuzione
normale standardizzata (Si ricordi di approssimare gli ipotetici numeri dopo due valori dopo la virgola)
P.S. Nel caso in cui mi chiedessero di calcolare una nuova probabilità con eventi dipendenti, devo
dividere il valore della varianza per il numero di considerazioni fatte
15
12
Distribuzione Binomiale
P (X = k) =
n
k
pk (1 − p)n−k
dove n è il numero di prove, k è il numero di successi , p è la probabilità di successo in ogni prova , e
1 − p è la probabilità di fallimento in ogni prova .
4·3·2
4
=
3
3!
16
13
Distribuzione di Poisson
P(X = k) =
e−λ λk
k!
Dove:
P(X = k) rappresenta la probabilità che la variabile casuale X abbia valore k;
λ è il parametro della distribuzione di Poisson, che rappresenta il valore della media;
k è il valore che può assumere la variabile casuale X.
Normalmente si utilizza nel caso mi venga data esclusivamente il valore della media
17
14
Distribuzione di Poisson - Periodo Temporale
P(Y ⩾ x) = e−λ·x
Dove:
P(Y ⩾ x) rappresenta la probabilità che la variabile casuale Y abbia una durata maggiore di X;
λ è il parametro della distribuzione di Poisson, che rappresenta il valore della media. In questo
caso e’ pari a:
1
λ=
µ
x è il valore temporale che stiamo testando.
Calcolo di un periodo centrale
P{x < T < y}
In questo caso avremo:
y
x
e− µ − e− µ
18
15
Trovare Media e Varianza Non Esplicite
Media Campionaria:
X̄ =
1 X
·
(xi )
n
Dove:
n equivale al numero di eventi presi in considerazione
P
(xi ) indica la sommatoria del valore ottenuto per ogni singolo evento
Varianza Campionaria:
1
S =
·
n−1
2
N
X
!
x2i
i=1
−
n
· x̄2
n−1
Ovviamente x̄ equivale alla media campionaria calcolata prima, mentre ci tengo a precisare che
l’elevazione al quadrato degli elementi presi in considerazione va fatta per ogni singolo elemento (non
e’ possibile dunque sommarli tutti e poi elevare alla seconda il risultato ottenuto)
19
16
Funzioni di Densità
Esempio:
(
fx (x) =
3(1−x2 )
4
0
−1 < x < +1
altrimenti
• Per verificare se la funzione corrisponde ad una funzione di densità deve valere:
– fx ⩾ 0
R +∞
– −∞ fx (x)dx = 1
• Calcolare una determinata probabilità
R1
– P x > 14 = 1 fx (x)dx
4
• Calcolare la media µX (E[x])
R +∞
R1
– µx = −∞ x · fx (x)dx = −1 x · fx (x)dx
• Calcolare la varianza
– σ 2 = var(x) = E x2 − µ2x
R +∞
R1
2
∗ Dove E x2 = −∞ (x − µx ) · fx (x)dx = −1 x2 fx (x)dx
20
16.1
Esercizio Simil-Esame - V.A. Continua (
c x2 − x3
fx (t) =
0
per 0 ≤ x ⩽ 1
altrimenti
a) Calcolare C
- c ⩾ 0 =⇒ fx (t) ⩾ 0
-
R +∞
−∞
fx (t)dt = 1 Quindi:
Z 1
c x2 − x
3
dx
=⇒
0
3 1 4 1 !
x
x
c
−
3 0
4 0
=⇒
c·
1
= 1 =⇒ c = 12
12
b) Calcolare la media di X
Z 1
Z +∞
x · 12 · x − x
x · fx (x) dx =
µx = E[x] =
2
−∞
3
4 1 5 1 !
x
x
3
−
=
4 0
5 0
5
dx = 12 ·
0
c) Calcolare la varianza
2
Var(x) = E x2 − (µx )
Dove ricordo che dobbiamo prima calcolare E x2
E x2 =
Z ∞
Z 1
2
x · fx (x)dx
−∞
2
2
x · 12 x − x
=⇒
3
dx
=⇒
12 ·
0
5 1 6 1 !
x
2
x
−
=
5 0
6 0
5
Quindi finalmente posso concludere calcolando il dannato:
2
9
1
Var(x) = E x2 − µ2x = −
=
5 25
25
d) Calcolo della moda
fx (xm ) = max fx (x) = max fx (x)
x∈[0,1]
Si ottiene facendo la media ed isolando il valore di x
fx′ (x) = 12 2x − 3x2
=⇒
x(2 − 3x)
=⇒ x =
2
ex=0
3
Il valore di moda e’ dunque 32
e) Calcolare la mediana
E’ necessario considerare l’intervallo 0 ⩽ m ⩽ 1 (proprio perche’ e’ quello che ci viene fornito dal
testo)
3 m 4 m Z m
Z m
1
x
x
1
=
fx (x)dx =⇒
fx (x)dx =⇒ 12 ·
−
=
2
3
4
2
−∞
0
0
0
21
16.2
Esercizio Simil-Esame - V.A. Discreta (
2c(x + 1)
fx (x) =
0
dove x ∈ {0, 1, 2, 3, 4}
altrimenti
Avendo una variabile aleatoria discreta posso, se proprio insisti, formulare la seguente tabella
Da notare che i valori nella tabella corrispondono al comportamento della funzione presi dei valori
specifici di x, che ricordo essere qui uguali a 0,1,2,3,4
x
0 1 2 3
4
2c 4c 6c 8c 10c
a) Calcolare c
-c⩾0
-
P
x=0,1,2,3,4 px (x) = 1 cioe’ proprio:
px (0) + px (1) + px (2) + px (3) + px (4) = 1
=⇒
30c = 1 =⇒ c =
1
30
Posso quindi aggiornare la tabella come: (Ho sostituito il valore di c nella tabella di prima)
x
0
1
2
3
4
1
15
2
15
1
5
4
15
1
3
b) Calcolare µx = E[x]
E[x] =
X
x · µx (x) = 0 ·
1
2
1
4
1
8
+1·
+2· +3·
+ 4 · =⇒
15
15
5
15
3
3
c) Calcolare la Varianza
Uso la seguente formula Var(x) = E x2 − µ2x dove :
1
2
1
4
1
E x2 = 02 ·
+ 12 ·
+ 22 · + 32 ·
+ 42
15
15
5
15
3
=⇒
26
3
Quindi posso concludere con:
Var(x) =
26 64
−
3
9
=⇒
14
9
d) Calcolare la Moda
Essendo la nostra una variabile aleatoria discreta la Moda equivale al valore di x per cui ho il valore
di px maggiore, in questo caso e’ palesemente 4.
Moda = xm = 4
e) Calcolare la Mediana
Devono valere le seguenti uguaglianze:
P(x ⩾ m) ⩾
1
2
P(x ≤ m) ⩾
1
2
Quindi verifichiamo valore per valore:
m=1?
1
2
1
1
P(X ≤ 1) = px (0) + px (1) =
+
= < NO
15 15
5
2
m=2?
1
2
1
6
1
P(x ≤ 2) = px (0) + px (1) + px (2) =
+
+ =
< NO
15 15 5
15
2
22
m=3?
P(x ≤ 3) = px (0)+px (1)+px (2)+px (3) =
P(x ⩾ 3) = px (3) + px (4) =
1
2
4
10
1
+ +
=
= 0.6 ⩾ Attenzione! Proviamo ora l’altra guancia
15 15 15
15
2
4
1
9
1
+ =
= 0.6 ⩾ La Mediana e’ proprio 3 !!
15 3
15
2
23
17
Funzione di Ripartizione
Come disegnare una funzione di ripartizione e la sua corrispettiva funzione di massa:

0
t < −2



0, 2 −2 ⩽ t < 0
Fx (t) =
0, 7 0 ⩽ t < 2



2
t⩾2
Ricordo che la funzione di massa si comporta sempre come zero, tranne quando la funzione esegue dei
”salti” (Il primo salto prende il corretto valore di Y, per gli altri devo sempre sottrare al valore attuale
quello precedente)
Cosa di dubbia utilità
(
1
f (t) =
0
what?
0≤t≤1
Altrimenti
Z 1
2
1
1
1
Fx
fx (t)dt = · 1 =
=
2
2
2
−∞
1
1
1
Fx
= ·1=
3
3
3
so...
P
1
1
⩽x⩽
2
3
Z 31
=
1
2
fx(s) =
24
1 1
−
3 2
1=
1
6
18
Da Ripartizione → Densità
Da Densità → Ripartizione
Z t
Fx (t) =
fx (s)dt,
−∞
fx (t) =
∂v
Fx (t)
∂t
Da Densità a Ripartizione
(
fx (t) =
1
2t
se 0 ⩽ t ⩽ 2
Altrimenti
0
- Se s ⩽ t < 0:
Z t
Z t
fx (t) = 0 → Fx (t) =
fx (s)dt =
−∞
- Se 0 ⩽ s ⩽ t ⩽ 2:
0
t
1
1 t2
t2
t dt =
=
2 2 0
4
0 2
Z 2
Z 2
Z t
Z t
fx (t)dt −→
Fx (t) =
-Se 2 < s ⩽ t
0dt = 0
−∞
fx (t)dt −→
Fx (t) =
0
0
2
1
1 t2
=1
t dt =
2
2 2 0
Da Ripartizione a Densità
Fx (t) =


0 t 3
3


1
Se t < 0:
fx (t) =
Se 0 < t < 3:
fx (t) =
se t < 0
0⩽t⩽3
se t > 3
∂
∂
Fx (t) = 0 = 0
∂t
∂t
∂
∂ t3
1
Fx (t) =
= 2 · t2
3
∂t
∂t 3
3
Se t > 3:
∂
∂
Fx (t) = 1 = 0
∂t
∂t
Infine ottengo quindi la funzione di densità pari a:

 0 se t < 0
2 2
se 0 ≤ t ≤ 3
fx (t) =
2t
 3
0 se t > 3
f x(t) =
Un calcolo di probabilità si puo eseguire tramite:
Z 3/2
3/2
Z 3/2
3
1
1 s2
2
P 1<x<
=
fx (s) ds =
·
s
ds
=
2
32
32 3 1
1
1
Ho Capito In Maniera Meccanica!!!
Usiamo questa scrittura per comprendere bene come si fa:
a se X ⩽ t ⩽ Y
fx (t) =
0 se altro
Per quanto riguarda la trasformazione da funzione di densità a quella di ripartizione,
R t posso notare che
il primo integrale rappresenta si esegue nella sezione t < X ed e’ sempre uguale a −∞
Il
R t secondo integrale rappresenta invece il contenuto centrale X < t < Y e si calcola sempre come
x
Il terzo ed ultimo integrale rappresenta il contenuto di trovatosi in t > Y e si calcola sempre come
25
Ry
x
19
P-Value
E’ la minima significatività per cui rifiutiamo l’ipotesi H0
• Se p-value > α =⇒ l’ipotesi H0 viene accettata
• Se p-value < α =⇒ l’ipotesi H0 viene rifiutata
• Se p-value ≃ α =⇒ il test non ha abbastanza informazioni per accettare o rifiutare H0
P-Value Gaussiana Caso Bilaterale
H0 : µ = µ0 H1 : µ ̸= µ0
x̄N (s) − µ0
p − value = 2 1 − Φ
!!
√σ
N
Caso Unilaterale 1
H0 : µ ⩽ µ0 H1 : µ > µ0
p − value =
x̄N (s) − µ0
1−Φ
!!
√σ
N
Caso Unilaterale 2
H0 : µ ⩾ µ0 H1 : µ < µ0
p − value = Φ
x̄N (s) − µ0
!
√σ
N
P-Value Applicato a T Student Caso Bilaterale
H0 : µ = µ0 H1 : µ ̸= µ0


x̄
(s)
−
µ
N
0

p − value = 2P TN −1 >
S (s)
N
√
N
Caso Unilaterale 1
H0 : µ ⩽ µ0 H1 : µ > µ0


x̄N (s) − µ0 
p − value = P TN −1 >
S (s)
N
√
N
Caso Unilaterale 2
H0 : µ ⩾ µ0 H1 : µ < µ0


x̄
(s)
−
µ
N
0
p − value = P TN −1 <
S (s)
N
√
N
Per ottenere il valore di p-value e paraganorarlo al valore di significativa prescelto, ricordo che e’
necessario eseguire una sorta di reverse-look nella tabella di t student
26
20
Test Bernoulli
Caso Bilaterale
H0 : p = p0 H1 : p ̸= p0
Rifiuto se:
x̄ − p0
q N
> z α2
x̄N (1−x̄N )
N


x̄N − p0
p − value = 2 1 − Φ q
x̄N (1−x̄N )
N
)
Caso Unilaterale 1
H0 : p ⩽ p0 H1 : p > p0
Rifiuto se:
x̄ − p0
qN
x̄N (1−x̄N )
N


p − value = 1 − Φ  q
> zα

x̄N (s) − p0
x̄N (s)(1−x̄N (s))
N
Caso Unilaterale 2
H0 : p ⩾ p0 H1 : p < p0
Rifiuto se:
x̄ (s) − p0
q N
x̄N (s)(1−x̄N (s)]
N
< −zα

x̄N (s) − p0
p − value = Φ  q
x̄N )(1−x̄N (s))
N
27



Download