ESTATÍSTICA DESCRITIVA ANÁLISE EXPLORATÓRIA DE DADOS 2. Coeficiente de assimetria de Fisher: g1 = 3/2 m2 x̄ − mo 3. Grau de assimetria de Pearson: g = s 4. Grau de assimetria de Bowley: (Q3 − me ) − (me − Q1 ) g0 = (Q3 − me ) + (me − Q1 ) Regra de Sturges: m=1+[log(n)/log(2)] Momento ordinário de ordem k n 1X k xi n i=1 m0k = m m X 1X fi xi k = ni xi k n i=1 i=1 Medidas de kurtosis (ou excesso) e achatamento m4 , onde m2 e m4 são o segundo e o quarto m22 momentos centrais respectivamente. 1. b2 = 2. g2 = b2 − 3. Momento central de ordem k n 1X k (xi − x̄) n i=1 mk = m m X 1X k k fi (xi − x̄) = ni (xi − x̄) n i=1 i=1 Detecção de outliers 1. Barreira externa superior: Q3 + 3AIQ 2. Barreira externa inferior: Q1 − 3AIQ 3. Barreira interna superior: Q3 + 1.5AIQ 4. Barreira interna inferior: Q1 − 1.5AIQ 5. Valor adjacente superior: observação que verifica Mediana me = m3 max{xi : Q3 ≤ xi ≤ Q3 + 1.5AIQ}. x(k+1) se n = 2k + 1 x(k) + x(k+1) 2 se n = 2k 6. Valor adjacente inferior: observação que verifica min{xi : Q1 − 1.5AIQ ≤ xi ≤ Q1 }. Coeficiente de correlação de Pearson Para dados classificados a mediana é o valor me tal que F (me ) = 0.5 (dados contı́nuos) ou F (me ) ' 0.5 (dados discretos), onde F designa a função cumulativa de frequências. n r Quantil de ordem α (0 < α < 1) – valor qα que tem aproximadamente αn observações inferiores e (1 − α) n observações superiores. 1 + (n − 1)α = r + , sendo qα = (1 − )x(r) + x(r+1) . = 1X xi yi − x̄ȳ n i=1 sxy v =v u n u n sx sy u1 X u1 X 2 2 t xi − x̄ t y 2 − ȳ 2 n i=1 n i=1 i Comandos do R para algumas distribuições: Para dados classificados, qα é tal que F (qα ) = α (dados contı́nuos) ou F (qα ) ' α (dados discretos). 1. Uniforme(a,b): dunif(x,a,b), punif(x,a,b), qunif(α,a,b), runif(dimamostra,a,b) Moda – Para dados classificados contı́nuos, a moda mo obtém-se, depois de identificada∗∗a classe modal, pela fórmula de King: mo = ` + f ∗f+f ∗∗ × h 2. Binomial(n,p): dbinom(x,n,p), pbinom(x,n,p), qbinom(α,n,p), rbinom(dimamostra,n,p) 3. Hipergeometrica(N,n,p): dhyper(x,Np,Nq,n), phyper(x,Np,Nq,n), qhyper(α,Np,Nq,n), rhyper(dimamostra,Np,Nq,n) Amplitude do intervalo de variação: AIV = max (xi ) − min (xi ) 4. Poisson(λ): dpois(x,λ), ppois(x,λ), qpois(α,λ), rpois(dimamostra,λ) Amplitude interquartis: AIQ = Q3 − Q1 Desvio médio n 1X |xi − x̄| n i=1 d= m m X 1X f |x − x̄| = ni |xi − x̄| i i n i=1 i=1 5. Normal(µ,σ): dnorm(x,µ,σ), pnorm(x,µ,σ), qnorm(α,µ,σ), rnorm(dimamostra,µ,σ) 6. Exponencial(λ): dpois(x,λ), qpois(α,λ), rpois(dimamostra,λ) ppois(x,λ), Comandos do R para algumas representações gráficas: barplot, pie, boxplot, stripchart, dotchart, plot.ecdf, hist, stem Coeficiente de dispersão: CD = s/x̄ Outros comandos do R: summary, quantile, median, mean, var, sd, cor Coeficiente de variação: CV = s/x̄ × 100% Medidas de assimetria: m23 , onde onde m2 e m3 são o segundo e o m32 terceiro momentos centrais respectivamente. 1. b1 = 1