Congiunte Le frequenze congiunte assolute sono sempre numeri interi Le frequenze congiunte relative sono sempre numeri interi Le frequenze congiunte relative sono sempre positive Le frequenze congiunte relative possono essere nulle Dalle frequenze congiunte si possono calcolare quelle marginali Dalle frequenze marginali si possono calcolare quelle congiunte Sinij=n.j VERO FALSO FALSO VERO VERO FALSO VERO Sinij=ni. FALSO nij è sempre minore di ni. FALSO nij non supera mai ni. VERO Condizionate fi|j=nij/n.j VERO fi|j=nij/ni. FALSO fi|j≥0 VERO fi|j>0 FALSO Sifi|j=1 VERO Sjfi|j=1 FALSO Sjfi|j·n.j=ni. VERO Sifi|j·n.j=ni. le frequenze condizionate sono definite per tutti i tipi di caratteri le frequenze condizionate sono definite solo per caratteri qualitativi H(X,Y)=-ΣiΣjfij·log(fij) FALSO VERO FALSO VERO E. congiunta H(X,Y)=Σjfij·log(fij) H(X,Y)=H(Y,X) H(X,Y)=H(Y·X) l'entropia congiunta non è mai negativa l'entropia congiunta è sempre positiva se Z è una funzione di X allora H(X,Y)≥H(Z,Y) se X è una funzione di Z allora H(X,Y)H(Z,Y) se X=Y allora H(X,Y)=H(X) se X=Y allora H(X,Y)=0 Contingenze Le frequenze teoriche possono essere uguali a quelle congiunte Le frequenze teoriche sono sempre uguali a quelle congiunte Le frequenze teoriche sono sempre numeri interi Le frequenze teoriche possono essere numeri interi Le contingenze assolute non sono mai negative La somma delle contingenze assolute è uno La somma delle contingenze assolute è zero La somma delle contingenze relative è zero Le contingenze assolute possono essere negative Le contingenze relative possono essere negative 2 Chi-Quadro l'indice c è sempre maggiore di zero l'indice c2 non è mai maggiore del numero di osservazioni l'indice c2 non è mai negativo c2 è nullo solo se le variabili sono statisticamente indipendenti c2 è nullo se le variabili sono statisticamente indipendenti c2 è positivo se le variabili sono statisticamente dipendenti c2 è sempre compreso fra zero ed uno l'indice c2 può essere calcolato solo per caratteri qualitativi l'indice c2 può essere calcolato anche per caratteri quantitativi l'indice c2 può essere calcolato solo per caratteri quantitativi Informazione J(X,Y)=ΣiΣjfij·log[fij/(fi.f.j)] J(X,Y)=ΣiΣjfij·log[fij·(fi.f.j)] J(X,Y)=J(Y,X) J(X,Y)=J(X·Y) FALSO VERO FALSO VERO FALSO VERO FALSO VERO FALSO VERO FALSO FALSO VERO FALSO FALSO VERO FALSO VERO VERO FALSO FALSO VERO VERO VERO VERO FALSO FALSO VERO FALSO VERO FALSO VERO FALSO Fij Coppie la mutua informazione non è mai negativa la mutua informazione è sempre positiva J(X,Y)=H(X)+H(Y)-H(X,Y) J(X,Y)=H(X)+H(Y)+H(X,Y) la mutua informazione è nulla se le variabili sono indipendenti la mutua informazione è nulla se una variabile è funzione dell'altra se i≥m e j≥r allora Fij≥Fmr VERO FALSO VERO FALSO VERO FALSO VERO se i≥m e j≥r allora Fij>Fmr FALSO Fij≥fij VERO Fij>fij FALSO se X e Y sono indipendenti allora Fij=Fi.·F.j VERO se X e Y sono indipendenti allora Fij=Fi.+F.j FALSO fr(X>xi;Y>yj)=1+Fij-Fi.-F.j VERO fr(X≥xi;Y≥yj)=1+Fij-Fi.-F.j FALSO se X e Y si manifestano con h e k modalità rispettivamente allora Fhk=1 VERO se X e Y si manifestano con h e k modalità rispettivamente allora Fhk=0 FALSO (xi, yi) e (xj, yj) sono concordanti se (xi-xj)(yi-yj)>0 VERO (xi, yi) e (xj, yj) sono concordanti se (xi-yi)(xj-yj)>0 Una coppia che non è concordante è discordante Una coppia può non essere nè concordante nè discordante Il numero di coppie concordanti è sempre positivo Il numero di coppie concordanti non è mai negativo E' possibile calcolare t per coppie di caratteri quantitativi FALSO FALSO VERO FALSO VERO VERO FALSO VERO FALSO VERO E' possibile calcolare t solo per coppie di caratteri quantitativi FALSO t>0 se NS-ND>0 VERO t>0 se ND-NS>0 t è sempre compreso fra zero ed uno t è sempre compreso fra meno uno ed uno, estremi inclusi t=0 se le variabili sono indipendenti se t=0 le variabili sono indipendenti t =1 solo se ND=0 FALSO FALSO VERO VERO FALSO VERO Se ND=0 allora t=1 FALSO E' possibile calcolare rS per coppie di caratteri quantitativi VERO E' possibile calcolare rS solo per coppie di caratteri quantitativi FALSO rS(X,Y) è sempre uguale a rS(Y,X) VERO rS(X,Y) può essere diverso da rS(Y,X) FALSO rS è sempre compreso fra zero ed uno FALSO rS è sempre compreso fra meno uno ed uno, estremi inclusi VERO rS=0 se le variabili sono indipendenti VERO se rS=0 le variabili sono indipendenti FALSO rS =1 solo in caso di perfetta concordanza VERO rS =1 anche se la concordanza non è perfetta FALSO FALSO VERO FALSO VERO FALSO VERO NS+ND+NV=n(n-1)/2 NS+ND+NV=n(n+1)/2 il numero di coppie vincolate può essere nullo le coppie concordanti sono tante quante le coppie discordanti Kendall Spearman Covarianza σ(X,Y)=m(X)-m(Y) σ(X,Y)=m(XY)-m(Y)m(X) σ(X,Y)=m(XY) se m(X)=m(Y) σ(X,Y)=σ(Y,X) σ(X,Y) non supera mai il prodotto σ2(X)σ2(Y) σ2(X,Y) non supera mai il prodotto σ2(X)σ2(Y) σ(X,Y)=0 solo se X ed Y sono indipendenti Se σ(X,Y)=0 allora m(X)=m(Y) σ(X,Y)=0 solo se m(XY)=m(X)m(Y) σ(X,X)=σ2(X) Lineari σ(X+a,Y)=σ(X,Y)+a σ(X+a,Y)=σ(X,Y) σ(X+a,Y)=σ(X,Y+a) σ(X+Y,Z)=σ(Y+Z,Y+X) σ(X+Y,Z)=σ(Y,Z)+σ(Y,X) σ(bY,cZ)=bcσ(Y,Z) σ(XZ,YZ)=σ(X,Y)m(Z) σ(XZ,YW)=σ(X,Y)σ(Z,W) σ(X+Z,Y+W)=σ(X,Y)+σ(X,W)+σ(Z,Y)+σ(Z,W) σ(X+a;Y+Z)=σ(X;Y)+σ(X;Z) Correlazione r(X,Y) è calcolabile anche se X o Y sono caratteri qualitativi r(X,Y) è calcolabile solo se X e Y sono caratteri quantitativi r(X,Y)=r(Y,X) r(X,Y) può essere diverso da r(Y,X) r(X,Y) è sempre compreso fra meno uno ed uno, estremi esclusi r(X,Y) è sempre compreso fra meno uno ed uno, estremi inclusi r(aX,Y)=r(X,Y) r(aX,Y)=r(X,Y) se a>0 se Y=aX+b (a>0) allora r(X,Y)=1 se Y=aX+b allora r(X,Y)=1 Regressione m(Y|X) è calcolabile solo se Y è una variabile quantitativa m(Y|X) è calcolabile solo se X è una variabile quantitativa m(Y|X) è una variabile statistica m(Y|X) è un numero m(aY+b|X)=am(Y|X)+b m(aY+b|X)=m(Y|aX+b) m[m(Y|X)]=m(Y) m[m(Y|X)]=m(X) s2[m(Y|X)] è sempre minore di s2(Y) s2[m(Y|X)] può essere uguale a s2(Y) 2 Eta-quadro h (Y|X) è calcolabile solo se Y è un carattere quantitativo h2(Y|X) è calcolabile solo se X è un carattere quantitativo h2(Y|X)=s2[m(Y|X)]/s2(Y) h2(Y|X)=s2[m(Y|X)]/s2(X) h2(Y|X) è sempre compreso fra zero ed uno, estremi esclusi h2(Y|X) è sempre compreso fra zero ed uno, estremi inclusi se h2(Y|X)=0 allora X ed Y sono statisticamente indipendenti se h2(Y|X)>0 allora X ed Y sono statisticamente dipendenti se h2(Y|X)=1 allora Y è funzione di X se h2(Y|X)=1 allora X è funzione di Y l(Y|X) è calcolabile solo se X ed Y sono caratteri quantitativi Lambda l(Y|X) è calcolabile anche se X ed Y sono caratteri qualitativi l(X|Y) può essere uguale a l(Y|X) l(X|Y) è sempre uguale a l(Y|X) l(Y|X) è sempre compreso fra zero ed uno, estremi esclusi l(Y|X) è sempre compreso fra zero ed uno, estremi inclusi se l(Y|X)=0 allora X ed Y sono statisticamente indipendenti se l(Y|X)>0 allora X ed Y sono statisticamente dipendenti se l(Y|X)=1 allora Y è funzione di X se l(Y|X)=1 allora X è funzione di Y H(X|Y)=ΣjH(X|Y=yj)f.j H(X|Y) H(X|Y)=ΣiH(X|X=xi)fi. l'entropia residua non è mai negativa FALSO FALSO VERO VERO FALSO VERO VERO FALSO FALSO VERO FALSO FALSO VERO VERO FALSO VERO VERO FALSO FALSO VERO FALSO VERO VERO FALSO VERO FALSO VERO FALSO VERO FALSO VERO FALSO FALSO VERO VERO FALSO VERO FALSO FALSO VERO FALSO VERO VERO FALSO FALSO VERO VERO FALSO FALSO VERO FALSO VERO VERO FALSO VERO FALSO VERO l'entropia residua è sempre positiva H(X)≥H(X|Y) H(X|Y)≥H(X) H(X,Y)=H(Y)+H(X|Y) H(X,Y)=H(X)+H(X|Y) se X e Y sono indipendenti allora H(X|Y)=H(X) se X e Y sono indipendenti allora H(X|Y)=0 2 Interpolante ŷi=b 0+b 1xi dove b 1=s(X,Y)/s (X) e b 0=m(Y)-b 1m(X) ŷi=b0+b1xi dove b0=s(X,Y)/s2(X) e b1=m(Y)-b0m(X) Residui FALSO ŷi è sempre uguale a yi FALSO ŷi può essere uguale a yi m(Ŷ) è sempre uguale a m(Y) m(Ŷ) può essere diversa da m(Y) s2(Ŷ) è sempre uguale a s2(Y) s2(Ŷ) è sempre minore oppure uguale a s2(Y) Ŷ è una funzione lineare di X Ŷ è una funzione lineare di Y E=Y-Ŷ E=Ŷ-Y m(E)=0 m(E)=m(Y) Tutti i residui sono nulli La media dei residui è nulla La varianza dei residui è nulla s2(E) è sempre minore oppure uguale a s2(Y) I residui e la variabile indipendente sono incorrelati I residui e la variabile dipendente sono incorrelati VERO VERO FALSO FALSO VERO VERO FALSO VERO FALSO VERO FALSO FALSO VERO FALSO VERO VERO FALSO VERO FALSO VERO FALSO VERO FALSO VERO FALSO VERO FALSO VERO FALSO VERO FALSO FALSO VERO VERO FALSO VERO FALSO Dispersione il grafico a dispersione rappresenta dati bidimensionali il grafico a dispersione rappresenta dati unidimensionali i punti del grafico a dispersione rappresentano le unità gli assi del grafico a dispersione rappresentano le unità l'asse delle ascisse nel grafico a dispersione rappresenta la prima variabile l'asse delle ordinate nel grafico a dispersione rappresenta la prima variabile il grafico a dispersione è definito solo per caratteri quantitativi il grafico a dispersione è definito anche per caratteri qualitativi il grafico a dispersione non è un indice statistico ogni punto del grafico a dispersione rappresenta una sola unità Relazioni FALSO VERO FALSO VERO FALSO VERO FALSO VERO c2=0 → r=0 r=0 → c2=0 h2=0 → r=0 r=0 → h2=0 h2=1 → r=1 r=1 → h2=1 r>0 → c2>0 c2=1 → h2=1 h2>0 → c2>0 h2=0 → c2=0