Uploaded by lawey36930

10 Medidas de Tendência Central slides

advertisement
15/02/2023 01:32
10_Medidas_de_Tendência_Central (1) slides
UNIVERSIDADE FEDERAL DO AMAPÁ
Curso de Ciência da Computação
Probabilidade e Estatística
Medidas de Tendência Central
Dr. José Walter Cárdenas Sotil
file:///H:/AULAS-DISCIPLINAS/Probabilide_e_Estatística-CC/PE_2022-2_em_2023/10_Medidas_de_tendência_central/10_Medidas_de_Tendência_Central .slides.html#/26
1/70
15/02/2023 01:32
10_Medidas_de_Tendência_Central (1) slides
Os dados apresentados em tabelas ou gráficos permitem analisar o
comportamento de uma o várias variáveis;
Entretanto testes estatísticos precisam de um ou mais números que
simplifiquem os dados e sejam representativos destes.
Entre eles temos:
Médidas de tendência central;
Medidas de dispersão.
file:///H:/AULAS-DISCIPLINAS/Probabilide_e_Estatística-CC/PE_2022-2_em_2023/10_Medidas_de_tendência_central/10_Medidas_de_Tendência_Central .slides.html#/26
2/70
15/02/2023 01:32
10_Medidas_de_Tendência_Central (1) slides
Médidas de tendência central
As medidas de tendência central são indicadores que permitem
que se tenha uma primeira ideia, um resumo, de como se distribuem
os dados de um experimento,
informando o valor (ou faixa de valores) da variável aleatória que
ocorre mais tipicamente.
file:///H:/AULAS-DISCIPLINAS/Probabilide_e_Estatística-CC/PE_2022-2_em_2023/10_Medidas_de_tendência_central/10_Medidas_de_Tendência_Central .slides.html#/26
3/70
15/02/2023 01:32
10_Medidas_de_Tendência_Central (1) slides
Entre as medidas de tendência central, temos :
a média;
a mediana, e
a moda.
file:///H:/AULAS-DISCIPLINAS/Probabilide_e_Estatística-CC/PE_2022-2_em_2023/10_Medidas_de_tendência_central/10_Medidas_de_Tendência_Central .slides.html#/26
4/70
15/02/2023 01:32
10_Medidas_de_Tendência_Central (1) slides
A média aritmética
É a soma de todos os resultados dividida pelo número total de casos,
podendo ser considerada como o ponto de equilíbrio dos dados.
file:///H:/AULAS-DISCIPLINAS/Probabilide_e_Estatística-CC/PE_2022-2_em_2023/10_Medidas_de_tendência_central/10_Medidas_de_Tendência_Central .slides.html#/26
5/70
15/02/2023 01:32
10_Medidas_de_Tendência_Central (1) slides
A média aritmética como ponto de equilíbrio:
file:///H:/AULAS-DISCIPLINAS/Probabilide_e_Estatística-CC/PE_2022-2_em_2023/10_Medidas_de_tendência_central/10_Medidas_de_Tendência_Central .slides.html#/26
6/70
15/02/2023 01:32
10_Medidas_de_Tendência_Central (1) slides
Usualmente a média para populações é denotada pela letra grega μ;
enquanto a média aritmética para amostras é denotada por x̄.
file:///H:/AULAS-DISCIPLINAS/Probabilide_e_Estatística-CC/PE_2022-2_em_2023/10_Medidas_de_tendência_central/10_Medidas_de_Tendência_Central .slides.html#/26
8/70
15/02/2023 01:32
10_Medidas_de_Tendência_Central (1) slides
Dados discretos
Dada a lista x
1,
x2 , x3 , ⋯ , x n
x̄ =
, a média aritmética é definida como:
x1 + x2 + x3 + ⋯ + x n
n
file:///H:/AULAS-DISCIPLINAS/Probabilide_e_Estatística-CC/PE_2022-2_em_2023/10_Medidas_de_tendência_central/10_Medidas_de_Tendência_Central .slides.html#/26
9/70
15/02/2023 01:32
10_Medidas_de_Tendência_Central (1) slides
Exemplo 1
A média aritmética de 19, 5, 14, 5, 25, 5, 10, 12, 14, 5, 16, 4, 20, 21, 5 é:
19 + 5 + 14 + 5 + 25 + 5 + 10 + 12 + 14 + 5 + 16 + 4 + 20 + 21
x̄ =
15
180
x̄ =
= 12
15
file:///H:/AULAS-DISCIPLINAS/Probabilide_e_Estatística-CC/PE_2022-2_em_2023/10_Medidas_de_tendência_central/10_Medidas_de_Tendência_Central .slides.html#/26
10/70
15/02/2023 01:32
10_Medidas_de_Tendência_Central (1) slides
No R a média é calculada com a função mean()
file:///H:/AULAS-DISCIPLINAS/Probabilide_e_Estatística-CC/PE_2022-2_em_2023/10_Medidas_de_tendência_central/10_Medidas_de_Tendência_Central .slides.html#/26
11/70
15/02/2023 01:32
10_Medidas_de_Tendência_Central (1) slides
In [1]:
lista = c(19, 5, 14, 5, 25, 5, 10, 12, 14, 5, 16, 4, 20, 21, 5)
cat('média = ',mean(lista))
média =
12
file:///H:/AULAS-DISCIPLINAS/Probabilide_e_Estatística-CC/PE_2022-2_em_2023/10_Medidas_de_tendência_central/10_Medidas_de_Tendência_Central .slides.html#/26
12/70
15/02/2023 01:32
10_Medidas_de_Tendência_Central (1) slides
Dados discretos agrupados
Dados os valores x com frequência f , estes podem ser tabulados:
i
xi
i
fi
xi fi
x1
f1
x1 f 1
x2
f2
x2 f 2
⋮
⋮
fn
xn f n
⋮
xn
n
Total
n
∑ fi
∑ xi f i
i=1
i=1
file:///H:/AULAS-DISCIPLINAS/Probabilide_e_Estatística-CC/PE_2022-2_em_2023/10_Medidas_de_tendência_central/10_Medidas_de_Tendência_Central .slides.html#/26
13/70
15/02/2023 01:32
10_Medidas_de_Tendência_Central (1) slides
logo, a média aritmética é calculada como:
n
∑ (xi ⋅ fi )
x̄ =
i=1
n
∑ fi
i=1
file:///H:/AULAS-DISCIPLINAS/Probabilide_e_Estatística-CC/PE_2022-2_em_2023/10_Medidas_de_tendência_central/10_Medidas_de_Tendência_Central .slides.html#/26
14/70
15/02/2023 01:32
10_Medidas_de_Tendência_Central (1) slides
Exemplo 2
Os dados 19, 5, 14, 5, 25, 5, 10, 12, 14, 5, 16, 4, 20, 21, 5 podem ser
agrupados:
xi
fi
x i fi
4
1
4
5
5
25
10
1
10
12
1
12
14
2
28
16
1
16
19
1
19
20
1
20
21
1
21
file:///H:/AULAS-DISCIPLINAS/Probabilide_e_Estatística-CC/PE_2022-2_em_2023/10_Medidas_de_tendência_central/10_Medidas_de_Tendência_Central .slides.html#/26
15/70
15/02/2023 01:32
10_Medidas_de_Tendência_Central (1) slides
25
1
10
Total
21
10
∑ fi = 15
∑ xi fi = 180
i=1
i=1
file:///H:/AULAS-DISCIPLINAS/Probabilide_e_Estatística-CC/PE_2022-2_em_2023/10_Medidas_de_tendência_central/10_Medidas_de_Tendência_Central .slides.html#/26
16/70
15/02/2023 01:32
10_Medidas_de_Tendência_Central (1) slides
logo,
n
∑ xi ⋅ f i
x̄ =
180
i=1
n
∑ fi
=
= 12
15
i=1
file:///H:/AULAS-DISCIPLINAS/Probabilide_e_Estatística-CC/PE_2022-2_em_2023/10_Medidas_de_tendência_central/10_Medidas_de_Tendência_Central .slides.html#/26
17/70
15/02/2023 01:32
10_Medidas_de_Tendência_Central (1) slides
No R a média aritmética pode ser calculada diretamente com os dados
brutos:
file:///H:/AULAS-DISCIPLINAS/Probabilide_e_Estatística-CC/PE_2022-2_em_2023/10_Medidas_de_tendência_central/10_Medidas_de_Tendência_Central .slides.html#/26
18/70
15/02/2023 01:32
10_Medidas_de_Tendência_Central (1) slides
In [2]:
lista = c(19, 5, 14, 5, 25, 5, 10, 12, 14, 5, 16, 4, 20, 21, 5)
mean(lista)
12
file:///H:/AULAS-DISCIPLINAS/Probabilide_e_Estatística-CC/PE_2022-2_em_2023/10_Medidas_de_tendência_central/10_Medidas_de_Tendência_Central .slides.html#/26
19/70
15/02/2023 01:32
10_Medidas_de_Tendência_Central (1) slides
ou pode-se construir um dataframe e calcular a média:
file:///H:/AULAS-DISCIPLINAS/Probabilide_e_Estatística-CC/PE_2022-2_em_2023/10_Medidas_de_tendência_central/10_Medidas_de_Tendência_Central .slides.html#/26
20/70
15/02/2023 01:32
10_Medidas_de_Tendência_Central (1) slides
In [3]:
library(tidyverse)
-- Attaching packages ----------------------------------------------------------------------------- tidyverse 1.3.1 -v
v
v
v
ggplot2
tibble
tidyr
readr
3.3.5
3.1.2
1.1.3
2.0.0
v
v
v
v
purrr
dplyr
stringr
forcats
0.3.4
1.0.7
1.4.0
0.5.1
-- Conflicts -------------------------------------------------------------------------------- tidyverse_conflicts() -x dplyr::filter() masks stats::filter()
file:///H:/AULAS-DISCIPLINAS/Probabilide_e_Estatística-CC/PE_2022-2_em_2023/10_Medidas_de_tendência_central/10_Medidas_de_Tendência_Central .slides.html#/26
21/70
15/02/2023 01:32
10_Medidas_de_Tendência_Central (1) slides
In [4]:
tabela_freq <- function(lista){
tabe <- data.frame(t(table(lista)))[,-1]
names(tabe) <- c('Xi', 'Fi')
tabe <- tabe %>%
mutate(Xi.Fi = as.numeric(levels(Xi))*Fi) %>%
add_row(Xi = 'Total', Fi = sum(.$Fi), Xi.Fi = sum(.$Xi.Fi))
return(tabe)
}
file:///H:/AULAS-DISCIPLINAS/Probabilide_e_Estatística-CC/PE_2022-2_em_2023/10_Medidas_de_tendência_central/10_Medidas_de_Tendência_Central .slides.html#/26
23/70
15/02/2023 01:32
10_Medidas_de_Tendência_Central (1) slides
O código define uma função chamada "tabela_freq" que recebe como
entrada uma lista de dados chamada "lista".
A função cria uma tabela de frequência para a lista de dados, onde
cada valor único na lista é listado na coluna "Xi", o número de vezes
que cada valor aparece na lista é listado na coluna "Fi", e o produto
dos valores de "Xi" e "Fi" é listado na coluna "Xi.Fi".
file:///H:/AULAS-DISCIPLINAS/Probabilide_e_Estatística-CC/PE_2022-2_em_2023/10_Medidas_de_tendência_central/10_Medidas_de_Tendência_Central .slides.html#/26
24/70
15/02/2023 01:32
10_Medidas_de_Tendência_Central (1) slides
A expressão data.frame(t(table(lista))) cria uma tabela de frequência da
variável lista, convertendo-a em um data frame.
A função t() transpõe a tabela para que as categorias sejam as colunas.
O resultado é um data frame com uma coluna chamada Var1, que
contém os valores únicos da variável lista, e outra coluna chamada
Freq, que contém a contagem de cada valor.
O operador [,-1] é usado para excluir a primeira coluna (Var1) do data
frame resultante. Isso significa que a coluna Freq é mantida, mas a
coluna Var1 é removida.
file:///H:/AULAS-DISCIPLINAS/Probabilide_e_Estatística-CC/PE_2022-2_em_2023/10_Medidas_de_tendência_central/10_Medidas_de_Tendência_Central .slides.html#/26
25/70
15/02/2023 01:32
10_Medidas_de_Tendência_Central (1) slides
In [5]:
data.frame(t(table(lista)))
A data.frame: 10 × 3
Var1
lista
Freq
<fct>
<fct>
<int>
A
4
1
A
5
5
A
10
1
A
12
1
A
14
2
A
16
1
A
19
1
A
20
1
A
21
1
A
25
1
file:///H:/AULAS-DISCIPLINAS/Probabilide_e_Estatística-CC/PE_2022-2_em_2023/10_Medidas_de_tendência_central/10_Medidas_de_Tendência_Central .slides.html#/26
26/70
15/02/2023 01:32
10_Medidas_de_Tendência_Central (1) slides
In [6]:
data.frame(t(table(lista)))[,-1]
A data.frame: 10 ×
2
lista
Freq
<fct>
<int>
4
1
5
5
10
1
12
1
14
2
16
1
19
1
20
1
21
1
25
1
file:///H:/AULAS-DISCIPLINAS/Probabilide_e_Estatística-CC/PE_2022-2_em_2023/10_Medidas_de_tendência_central/10_Medidas_de_Tendência_Central .slides.html#/26
28/70
15/02/2023 01:32
10_Medidas_de_Tendência_Central (1) slides
A função também adiciona uma nova coluna chamada "Xi.Fi" que é o
produto dos valores de "Xi" e "Fi". Para isso, a função usa o operador
"%" para fazer uma multiplicação elemento por elemento de "Xi" e "Fi",
transforma "Xi" em um tipo numérico usando "as.numeric", e armazena
o resultado em "Xi.Fi".
Finalmente, a função adiciona uma nova linha na parte inferior da
tabela que contém a soma das frequências e dos valores de "Xi.Fi"
(coluna "Total").
A função retorna a tabela de frequência como um data frame.
O operador "%>%" é usado para encadear as operações na tabela e a
função "return" é usada para retornar a tabela final.
file:///H:/AULAS-DISCIPLINAS/Probabilide_e_Estatística-CC/PE_2022-2_em_2023/10_Medidas_de_tendência_central/10_Medidas_de_Tendência_Central .slides.html#/26
30/70
15/02/2023 01:32
10_Medidas_de_Tendência_Central (1) slides
In [7]:
lista = c(19, 5, 14, 5, 25, 5, 10, 12, 14, 5, 16, 4, 20, 21, 5)
tabela <- tabela_freq(lista)
tabela
A data.frame: 11 × 3
Xi
Fi
Xi.Fi
<chr>
<int>
<dbl>
4
1
4
5
5
25
10
1
10
12
1
12
14
2
28
16
1
16
19
1
19
20
1
20
21
1
21
file:///H:/AULAS-DISCIPLINAS/Probabilide_e_Estatística-CC/PE_2022-2_em_2023/10_Medidas_de_tendência_central/10_Medidas_de_Tendência_Central .slides.html#/26
31/70
15/02/2023 01:32
10_Medidas_de_Tendência_Central (1) slides
Xi
Fi
Xi.Fi
<chr>
<int>
<dbl>
25
1
25
Total
15
180
file:///H:/AULAS-DISCIPLINAS/Probabilide_e_Estatística-CC/PE_2022-2_em_2023/10_Medidas_de_tendência_central/10_Medidas_de_Tendência_Central .slides.html#/26
32/70
15/02/2023 01:32
10_Medidas_de_Tendência_Central (1) slides
In [8]:
n = nrow(tabela)
media <- tabela$Xi.Fi[n]/tabela$Fi[n]
media
12
file:///H:/AULAS-DISCIPLINAS/Probabilide_e_Estatística-CC/PE_2022-2_em_2023/10_Medidas_de_tendência_central/10_Medidas_de_Tendência_Central .slides.html#/26
33/70
15/02/2023 01:32
10_Medidas_de_Tendência_Central (1) slides
Dados Contínuos
Em muitos casos não dispomos dos dados brutos de uma variável
contínua e sim de classes de intervalos com sua frequência em cada
classe;
pelo qual temos que calcular a média para este tipo dados distribuidos
em classes de intervalos;
em outros casos o pesquisador explica seus dados com um histograma
(com os dados distribuidos em classes de intervalos) e complementa
sua explicação com medidas de tendência central e de dispersão.
file:///H:/AULAS-DISCIPLINAS/Probabilide_e_Estatística-CC/PE_2022-2_em_2023/10_Medidas_de_tendência_central/10_Medidas_de_Tendência_Central .slides.html#/26
34/70
15/02/2023 01:32
10_Medidas_de_Tendência_Central (1) slides
No caso de dados contínuos,
agrupamos os dados em classes;
cada classe é representada pelo seu ponto médio;
calculamos a média de forma similar aos dados agrupados.
file:///H:/AULAS-DISCIPLINAS/Probabilide_e_Estatística-CC/PE_2022-2_em_2023/10_Medidas_de_tendência_central/10_Medidas_de_Tendência_Central .slides.html#/26
35/70
15/02/2023 01:32
10_Medidas_de_Tendência_Central (1) slides
Classes
xi
fi
x i fi
a1 ⊢ b 1
x1
f1
x1 f 1
a2 ⊢ b 2
x2
f2
x2 f 2
⋮
⋮
⋮
⋮
an ⊢ b n
xn
fn
xn f n
n
Total
n
∑ fi
∑ xi f i
i=1
i=1
file:///H:/AULAS-DISCIPLINAS/Probabilide_e_Estatística-CC/PE_2022-2_em_2023/10_Medidas_de_tendência_central/10_Medidas_de_Tendência_Central .slides.html#/26
36/70
15/02/2023 01:32
10_Medidas_de_Tendência_Central (1) slides
logo,
n
∑ xi ⋅ fi
i=1
x̄ =
n
∑ fi
i=1
onde,
xi
é o ponto médio da i-ésima classe
Nota: A notação
aberto a direita.
ai ⊢ bi
equivale ao intervalo
[ai , bi )
fechado a esquerda e
file:///H:/AULAS-DISCIPLINAS/Probabilide_e_Estatística-CC/PE_2022-2_em_2023/10_Medidas_de_tendência_central/10_Medidas_de_Tendência_Central .slides.html#/26
37/70
15/02/2023 01:32
10_Medidas_de_Tendência_Central (1) slides
Exemplo 3
Calcular a média da seguinte distribuição de dados:
Classes
fi
1, 5 ⊢ 2, 0
3
2, 0 ⊢ 2, 5
16
2, 5 ⊢ 3, 0
31
3, 0 ⊢ 3, 5
34
3, 5 ⊢ 4, 0
11
4, 0 ⊢ 4, 5
4
4, 5 ⊢ 5, 0
1
file:///H:/AULAS-DISCIPLINAS/Probabilide_e_Estatística-CC/PE_2022-2_em_2023/10_Medidas_de_tendência_central/10_Medidas_de_Tendência_Central .slides.html#/26
38/70
15/02/2023 01:32
10_Medidas_de_Tendência_Central (1) slides
Solução
Calculamos o ponto médio
o ponto médio da classe
xi
de cada classe;
ai ⊢ bi
é:
xi =
ai + b1
2
file:///H:/AULAS-DISCIPLINAS/Probabilide_e_Estatística-CC/PE_2022-2_em_2023/10_Medidas_de_tendência_central/10_Medidas_de_Tendência_Central .slides.html#/26
39/70
15/02/2023 01:32
10_Medidas_de_Tendência_Central (1) slides
Classes
xi
fi
1, 5 ⊢ 2, 0
1,75
3
2, 0 ⊢ 2, 5
2,25
16
2, 5 ⊢ 3, 0
2,75
31
3, 0 ⊢ 3, 5
3,25
34
3, 5 ⊢ 4, 0
3,75
11
4, 0 ⊢ 4, 5
4,25
4
4, 5 ⊢ 5, 0
4,75
1
file:///H:/AULAS-DISCIPLINAS/Probabilide_e_Estatística-CC/PE_2022-2_em_2023/10_Medidas_de_tendência_central/10_Medidas_de_Tendência_Central .slides.html#/26
40/70
15/02/2023 01:32
10_Medidas_de_Tendência_Central (1) slides
calculamos para cada clase o produto
Classes
xi
fi
xi ⋅ f i
:
x i fi
1, 5 ⊢ 2, 0
1,75
3
5, 25
2, 0 ⊢ 2, 5
2,25
16
36, 00
2, 5 ⊢ 3, 0
2,75
31
85, 25
3, 0 ⊢ 3, 5
3,25
34
110, 50
3, 5 ⊢ 4, 0
3,75
11
41, 25
4, 0 ⊢ 4, 5
4,25
4
17, 00
4, 5 ⊢ 5, 0
4,75
1
4, 75
file:///H:/AULAS-DISCIPLINAS/Probabilide_e_Estatística-CC/PE_2022-2_em_2023/10_Medidas_de_tendência_central/10_Medidas_de_Tendência_Central .slides.html#/26
41/70
15/02/2023 01:32
10_Medidas_de_Tendência_Central (1) slides
calculamos as somas das colunas
Classes
xi
fi
fi
xi f i
:
x i fi
1, 5 ⊢ 2, 0
1,75
3
5, 25
2, 0 ⊢ 2, 5
2,25
16
36, 00
2, 5 ⊢ 3, 0
2,75
31
85, 25
3, 0 ⊢ 3, 5
3,25
34
110, 50
3, 5 ⊢ 4, 0
3,75
11
41, 25
4, 0 ⊢ 4, 5
4,25
4
17, 00
4, 5 ⊢ 5, 0
4,75
1
4, 75
100
300
Total
e
file:///H:/AULAS-DISCIPLINAS/Probabilide_e_Estatística-CC/PE_2022-2_em_2023/10_Medidas_de_tendência_central/10_Medidas_de_Tendência_Central .slides.html#/26
42/70
15/02/2023 01:32
10_Medidas_de_Tendência_Central (1) slides
logo, a média é:
n
∑ xi ⋅ f i
300
i=1
x̄ =
n
=
= 3
100
■
∑ fi
i=1
file:///H:/AULAS-DISCIPLINAS/Probabilide_e_Estatística-CC/PE_2022-2_em_2023/10_Medidas_de_tendência_central/10_Medidas_de_Tendência_Central .slides.html#/26
43/70
15/02/2023 01:32
10_Medidas_de_Tendência_Central (1) slides
Expectativa de vida do ano 2017 - Dados Gapminder
Analisaremos a média da expectativa de vida da população mundial e dos
continentes
file:///H:/AULAS-DISCIPLINAS/Probabilide_e_Estatística-CC/PE_2022-2_em_2023/10_Medidas_de_tendência_central/10_Medidas_de_Tendência_Central .slides.html#/26
44/70
15/02/2023 01:32
10_Medidas_de_Tendência_Central (1) slides
In [9]:
gapminder <- readRDS('gapminder_dados.rds')
file:///H:/AULAS-DISCIPLINAS/Probabilide_e_Estatística-CC/PE_2022-2_em_2023/10_Medidas_de_tendência_central/10_Medidas_de_Tendência_Central .slides.html#/26
45/70
15/02/2023 01:32
10_Medidas_de_Tendência_Central (1) slides
In [10]:
names(gapminder)
'pais' · 'continente' · 'região' · 'nivel_de_renda' · 'ano' · 'renda_per_capita' ·
'mortalidade_infantil' · 'expectativa_vida'
file:///H:/AULAS-DISCIPLINAS/Probabilide_e_Estatística-CC/PE_2022-2_em_2023/10_Medidas_de_tendência_central/10_Medidas_de_Tendência_Central .slides.html#/26
46/70
15/02/2023 01:32
10_Medidas_de_Tendência_Central (1) slides
In [11]:
ev_2017 <- gapminder %>%
filter(ano == 2017, !is.na(expectativa_vida) & !is.na(continente)) %>%
select(continente, expectativa_vida)
file:///H:/AULAS-DISCIPLINAS/Probabilide_e_Estatística-CC/PE_2022-2_em_2023/10_Medidas_de_tendência_central/10_Medidas_de_Tendência_Central .slides.html#/26
47/70
15/02/2023 01:32
10_Medidas_de_Tendência_Central (1) slides
O código em R tem como objetivo selecionar dados da base de dados
gapminder que se referem ao ano de 2017 e para as quais as variáveis
expectativa_vida e continente não estão faltando (NA).
O operador %>% é usado para encadear comandos, passando o
resultado de um comando como entrada para o próximo comando. Ele
é usado em conjunto com a biblioteca dplyr, que fornece um conjunto
de funções para manipulação de dados.
Na primeira linha do código, é usada a função filter do dplyr para
selecionar apenas as linhas da base de dados que correspondem ao
ano de 2017 e para as quais não há valores faltantes na variável
expectativa_vida e continente.
file:///H:/AULAS-DISCIPLINAS/Probabilide_e_Estatística-CC/PE_2022-2_em_2023/10_Medidas_de_tendência_central/10_Medidas_de_Tendência_Central .slides.html#/26
48/70
15/02/2023 01:32
10_Medidas_de_Tendência_Central (1) slides
Na segunda linha do código, é usada a função select do dplyr para
selecionar as colunas continente e expectativa_vida da base de dados.
O resultado final do código é um data frame chamado ev_2017 que
contém duas colunas: a primeira contendo informações sobre o
continente, e a segunda contendo informações sobre a expectativa de
vida em anos para cada país desse continente em 2017.
file:///H:/AULAS-DISCIPLINAS/Probabilide_e_Estatística-CC/PE_2022-2_em_2023/10_Medidas_de_tendência_central/10_Medidas_de_Tendência_Central .slides.html#/26
49/70
15/02/2023 01:32
10_Medidas_de_Tendência_Central (1) slides
In [12]:
head(ev_2017)
A tibble: 6 × 2
continente
expectativa_vida
<fct>
<dbl>
Asia
63.38
Europa
78.23
África
77.74
Europa
82.70
África
64.19
Américas
77.02
file:///H:/AULAS-DISCIPLINAS/Probabilide_e_Estatística-CC/PE_2022-2_em_2023/10_Medidas_de_tendência_central/10_Medidas_de_Tendência_Central .slides.html#/26
50/70
15/02/2023 01:32
10_Medidas_de_Tendência_Central (1) slides
Média global da expectativa de vida no ano 2017
file:///H:/AULAS-DISCIPLINAS/Probabilide_e_Estatística-CC/PE_2022-2_em_2023/10_Medidas_de_tendência_central/10_Medidas_de_Tendência_Central .slides.html#/26
51/70
15/02/2023 01:32
10_Medidas_de_Tendência_Central (1) slides
In [13]:
hist(ev_2017$expectativa_vida, main = 'Expectativa de vida global: ano 2017',
xlab = 'Expectativa de vida', ylab = 'Frequência', col = 'green')
file:///H:/AULAS-DISCIPLINAS/Probabilide_e_Estatística-CC/PE_2022-2_em_2023/10_Medidas_de_tendência_central/10_Medidas_de_Tendência_Central .slides.html#/26
52/70
15/02/2023 01:32
10_Medidas_de_Tendência_Central (1) slides
Este código em R cria um histograma da variável expectativa_vida do
conjunto de dados ev_2017.
O histograma representa a distribuição da expectativa de vida em todo
o mundo para o ano de 2017.
A função hist() é usada para criar o histograma. O argumento
ev_2017$expectativa_vida especifica a variável a ser plotada.
main é usado para definir o título do gráfico,
xlab e ylab são usados para rotular os eixos x e y, respectivamente, e
col é usado para definir a cor da plotagem do histograma (verde neste
caso).
file:///H:/AULAS-DISCIPLINAS/Probabilide_e_Estatística-CC/PE_2022-2_em_2023/10_Medidas_de_tendência_central/10_Medidas_de_Tendência_Central .slides.html#/26
53/70
15/02/2023 01:32
10_Medidas_de_Tendência_Central (1) slides
In [14]:
media_ev <- mean(ev_2017$expectativa_vida)
media_ev
72.8367724867725
file:///H:/AULAS-DISCIPLINAS/Probabilide_e_Estatística-CC/PE_2022-2_em_2023/10_Medidas_de_tendência_central/10_Medidas_de_Tendência_Central .slides.html#/26
54/70
15/02/2023 01:32
10_Medidas_de_Tendência_Central (1) slides
In [15]:
hist(ev_2017$expectativa_vida, main = 'Expectativa de vida global: ano 2017',
xlab = 'Expectativa de vida', ylab = 'Frequência', col = 'green')
abline(v=media_ev, col="red", lwd=3)
text(media_ev, 20, "média", col='red')
file:///H:/AULAS-DISCIPLINAS/Probabilide_e_Estatística-CC/PE_2022-2_em_2023/10_Medidas_de_tendência_central/10_Medidas_de_Tendência_Central .slides.html#/26
55/70
15/02/2023 01:32
10_Medidas_de_Tendência_Central (1) slides
abline(v = media_ev, col = "red", lwd = 3) desenha uma linha
vertical na posição da média da expectativa de vida, indicada pela
variável media_ev. O argumento v especifica que a linha deve ser
vertical. O argumento col especifica a cor da linha e o argumento lwd
especifica a largura da linha.
text(media_ev, 20, "média", col='red') adiciona um texto indicando
o valor da média da expectativa de vida. O argumento media_ev
especifica a posição vertical em que o texto será adicionado. O
argumento 20 especifica a posição horizontal. A string "média" é o
texto a ser exibido e col='red' especifica a cor do texto.
file:///H:/AULAS-DISCIPLINAS/Probabilide_e_Estatística-CC/PE_2022-2_em_2023/10_Medidas_de_tendência_central/10_Medidas_de_Tendência_Central .slides.html#/26
57/70
15/02/2023 01:32
10_Medidas_de_Tendência_Central (1) slides
Média por continente da expectativa de vida no ano 2017
file:///H:/AULAS-DISCIPLINAS/Probabilide_e_Estatística-CC/PE_2022-2_em_2023/10_Medidas_de_tendência_central/10_Medidas_de_Tendência_Central .slides.html#/26
58/70
15/02/2023 01:32
10_Medidas_de_Tendência_Central (1) slides
In [16]:
ev_2017 %>%
group_by(continente) %>%
summarise(Média = mean(expectativa_vida))
A tibble: 4 × 2
continente
Média
<fct>
<dbl>
África
65.35815
Américas
75.52471
Asia
73.71071
Europa
78.69267
file:///H:/AULAS-DISCIPLINAS/Probabilide_e_Estatística-CC/PE_2022-2_em_2023/10_Medidas_de_tendência_central/10_Medidas_de_Tendência_Central .slides.html#/26
59/70
15/02/2023 01:32
10_Medidas_de_Tendência_Central (1) slides
A primeira linha, ev_2017 %>%, indica que o dataframe ev_2017 é o
objeto que será manipulado. O operador %>% é usado para encadear
operações, facilitando a leitura do código.
A segunda linha, group_by(continente), agrupa os dados por
continente, ou seja, a média será calculada para cada grupo de países
que pertencem ao mesmo continente.
A terceira linha, summarise(Média = mean(expectativa_vida)),
calcula a média da expectativa de vida para cada grupo de
continentes. A função mean é usada para calcular a média, e o
resultado é armazenado na nova coluna Média.
O resultado dessa operação é um novo dataframe com duas colunas,
continente e Média, contendo a média da expectativa de vida para
cada continente.
file:///H:/AULAS-DISCIPLINAS/Probabilide_e_Estatística-CC/PE_2022-2_em_2023/10_Medidas_de_tendência_central/10_Medidas_de_Tendência_Central .slides.html#/26
60/70
15/02/2023 01:32
10_Medidas_de_Tendência_Central (1) slides
Renda per capita do ano 2017 - Dados Gapminder
Analisaremos a média da renda per capita da população mundial e dos
continentes
file:///H:/AULAS-DISCIPLINAS/Probabilide_e_Estatística-CC/PE_2022-2_em_2023/10_Medidas_de_tendência_central/10_Medidas_de_Tendência_Central .slides.html#/26
61/70
15/02/2023 01:32
10_Medidas_de_Tendência_Central (1) slides
In [17]:
rpc_2017 <- gapminder %>%
filter(ano == 2017, !is.na(renda_per_capita) & !is.na(continente)) %>%
select(continente, renda_per_capita)
file:///H:/AULAS-DISCIPLINAS/Probabilide_e_Estatística-CC/PE_2022-2_em_2023/10_Medidas_de_tendência_central/10_Medidas_de_Tendência_Central .slides.html#/26
62/70
15/02/2023 01:32
10_Medidas_de_Tendência_Central (1) slides
In [18]:
head(rpc_2017)
A tibble: 6 × 2
continente
renda_per_capita
<fct>
<dbl>
Asia
1758
Europa
11803
África
13876
Europa
49768
África
6045
Américas
22856
file:///H:/AULAS-DISCIPLINAS/Probabilide_e_Estatística-CC/PE_2022-2_em_2023/10_Medidas_de_tendência_central/10_Medidas_de_Tendência_Central .slides.html#/26
63/70
15/02/2023 01:32
10_Medidas_de_Tendência_Central (1) slides
Média global da renda per capita no ano 2017
file:///H:/AULAS-DISCIPLINAS/Probabilide_e_Estatística-CC/PE_2022-2_em_2023/10_Medidas_de_tendência_central/10_Medidas_de_Tendência_Central .slides.html#/26
64/70
15/02/2023 01:32
10_Medidas_de_Tendência_Central (1) slides
In [19]:
hist(rpc_2017$renda_per_capita, main = 'Renda per capita global: ano 2017',
xlab = 'Renda per capita', ylab = 'Frequência', col = 'green')
file:///H:/AULAS-DISCIPLINAS/Probabilide_e_Estatística-CC/PE_2022-2_em_2023/10_Medidas_de_tendência_central/10_Medidas_de_Tendência_Central .slides.html#/26
65/70
15/02/2023 01:32
10_Medidas_de_Tendência_Central (1) slides
In [20]:
media_rpc <- mean(rpc_2017$renda_per_capita)
media_rpc
18491.4871794872
file:///H:/AULAS-DISCIPLINAS/Probabilide_e_Estatística-CC/PE_2022-2_em_2023/10_Medidas_de_tendência_central/10_Medidas_de_Tendência_Central .slides.html#/26
66/70
15/02/2023 01:32
10_Medidas_de_Tendência_Central (1) slides
In [21]:
hist(rpc_2017$renda_per_capita, main = 'Renda per capita global: ano 2017',
xlab = 'Renda per capita', ylab = 'Frequência', col = 'green')
abline(v=media_rpc, col="red", lwd=3)
text(media_rpc, 50, "média", col='red')
file:///H:/AULAS-DISCIPLINAS/Probabilide_e_Estatística-CC/PE_2022-2_em_2023/10_Medidas_de_tendência_central/10_Medidas_de_Tendência_Central .slides.html#/26
67/70
15/02/2023 01:32
10_Medidas_de_Tendência_Central (1) slides
Média por continente da renda per capita no ano 2017
file:///H:/AULAS-DISCIPLINAS/Probabilide_e_Estatística-CC/PE_2022-2_em_2023/10_Medidas_de_tendência_central/10_Medidas_de_Tendência_Central .slides.html#/26
69/70
15/02/2023 01:32
10_Medidas_de_Tendência_Central (1) slides
In [22]:
rpc_2017 %>%
group_by(continente) %>%
summarise(Média = mean(renda_per_capita))
A tibble: 4 × 2
continente
Média
<fct>
<dbl>
África
5471.741
Américas
15873.486
Asia
20106.729
Europa
33372.277
file:///H:/AULAS-DISCIPLINAS/Probabilide_e_Estatística-CC/PE_2022-2_em_2023/10_Medidas_de_tendência_central/10_Medidas_de_Tendência_Central .slides.html#/26
70/70
Download