Uploaded by manuelpbm05

FormulasEstatisticaDescritiva new1

advertisement
ESTATÍSTICA DESCRITIVA
ANÁLISE EXPLORATÓRIA DE DADOS
2. Coeficiente de assimetria de Fisher: g1 =
3/2
m2
x̄ − mo
3. Grau de assimetria de Pearson: g =
s
4. Grau de assimetria de Bowley:
(Q3 − me ) − (me − Q1 )
g0 =
(Q3 − me ) + (me − Q1 )
ˆ Regra de Sturges: m=1+[log(n)/log(2)]
ˆ Momento ordinário de ordem k

n
1X k


xi



 n i=1
m0k =

m
m

X

1X


fi xi k =
ni xi k

n
i=1
i=1
ˆ Medidas de kurtosis (ou excesso) e achatamento
m4
, onde m2 e m4 são o segundo e o quarto
m22
momentos centrais respectivamente.
1. b2 =
2. g2 = b2 − 3.
ˆ Momento central de ordem k

n
1X

k

(xi − x̄)



 n i=1
mk =

m
m

X

1X
k
k


fi (xi − x̄) =
ni (xi − x̄)

n
i=1
i=1
ˆ Detecção de outliers
1. Barreira externa superior: Q3 + 3AIQ
2. Barreira externa inferior: Q1 − 3AIQ
3. Barreira interna superior: Q3 + 1.5AIQ
4. Barreira interna inferior: Q1 − 1.5AIQ
5. Valor adjacente superior: observação que verifica
ˆ Mediana
me =
m3
max{xi : Q3 ≤ xi ≤ Q3 + 1.5AIQ}.


 x(k+1)
se n = 2k + 1

 x(k) + x(k+1)
2
se n = 2k
6. Valor adjacente inferior: observação que verifica
min{xi : Q1 − 1.5AIQ ≤ xi ≤ Q1 }.
ˆ Coeficiente de correlação de Pearson
Para dados classificados a mediana é o valor me tal
que F (me ) = 0.5 (dados contı́nuos) ou F (me ) ' 0.5
(dados discretos), onde F designa a função cumulativa de frequências.
n
r
ˆ Quantil de ordem α (0 < α < 1) – valor qα que
tem aproximadamente αn observações inferiores e
(1 − α) n observações superiores. 1 + (n − 1)α = r + ,
sendo qα = (1 − )x(r) + x(r+1) .
=
1X
xi yi − x̄ȳ
n i=1
sxy
v
=v
u n
u n
sx sy
u1 X
u1 X
2
2
t
xi − x̄ t
y 2 − ȳ 2
n i=1
n i=1 i
ˆ Comandos do R para algumas distribuições:
Para dados classificados, qα é tal que F (qα ) = α (dados contı́nuos) ou F (qα ) ' α (dados discretos).
1. Uniforme(a,b):
dunif(x,a,b), punif(x,a,b),
qunif(α,a,b), runif(dimamostra,a,b)
ˆ Moda – Para dados classificados contı́nuos, a moda
mo obtém-se, depois de identificada∗∗a classe modal,
pela fórmula de King: mo = ` + f ∗f+f ∗∗ × h
2. Binomial(n,p): dbinom(x,n,p), pbinom(x,n,p),
qbinom(α,n,p), rbinom(dimamostra,n,p)
3. Hipergeometrica(N,n,p):
dhyper(x,Np,Nq,n),
phyper(x,Np,Nq,n),
qhyper(α,Np,Nq,n),
rhyper(dimamostra,Np,Nq,n)
ˆ Amplitude do intervalo de variação:
AIV = max (xi ) − min (xi )
4. Poisson(λ): dpois(x,λ), ppois(x,λ), qpois(α,λ),
rpois(dimamostra,λ)
ˆ Amplitude interquartis: AIQ = Q3 − Q1
ˆ Desvio médio

n
1X


|xi − x̄|



 n i=1
d=

m
m

X

1X


f
|x
−
x̄|
=
ni |xi − x̄|

i
i
n i=1
i=1
5. Normal(µ,σ):
dnorm(x,µ,σ), pnorm(x,µ,σ),
qnorm(α,µ,σ), rnorm(dimamostra,µ,σ)
6. Exponencial(λ):
dpois(x,λ),
qpois(α,λ), rpois(dimamostra,λ)
ppois(x,λ),
ˆ Comandos do R para algumas representações gráficas:
barplot, pie, boxplot, stripchart, dotchart, plot.ecdf,
hist, stem
ˆ Coeficiente de dispersão: CD = s/x̄
ˆ Outros comandos do R: summary, quantile, median,
mean, var, sd, cor
ˆ Coeficiente de variação: CV = s/x̄ × 100%
ˆ Medidas de assimetria:
m23
, onde onde m2 e m3 são o segundo e o
m32
terceiro momentos centrais respectivamente.
1. b1 =
1
Download