15/02/2023 01:32 10_Medidas_de_Tendência_Central (1) slides UNIVERSIDADE FEDERAL DO AMAPÁ Curso de Ciência da Computação Probabilidade e Estatística Medidas de Tendência Central Dr. José Walter Cárdenas Sotil file:///H:/AULAS-DISCIPLINAS/Probabilide_e_Estatística-CC/PE_2022-2_em_2023/10_Medidas_de_tendência_central/10_Medidas_de_Tendência_Central .slides.html#/26 1/70 15/02/2023 01:32 10_Medidas_de_Tendência_Central (1) slides Os dados apresentados em tabelas ou gráficos permitem analisar o comportamento de uma o várias variáveis; Entretanto testes estatísticos precisam de um ou mais números que simplifiquem os dados e sejam representativos destes. Entre eles temos: Médidas de tendência central; Medidas de dispersão. file:///H:/AULAS-DISCIPLINAS/Probabilide_e_Estatística-CC/PE_2022-2_em_2023/10_Medidas_de_tendência_central/10_Medidas_de_Tendência_Central .slides.html#/26 2/70 15/02/2023 01:32 10_Medidas_de_Tendência_Central (1) slides Médidas de tendência central As medidas de tendência central são indicadores que permitem que se tenha uma primeira ideia, um resumo, de como se distribuem os dados de um experimento, informando o valor (ou faixa de valores) da variável aleatória que ocorre mais tipicamente. file:///H:/AULAS-DISCIPLINAS/Probabilide_e_Estatística-CC/PE_2022-2_em_2023/10_Medidas_de_tendência_central/10_Medidas_de_Tendência_Central .slides.html#/26 3/70 15/02/2023 01:32 10_Medidas_de_Tendência_Central (1) slides Entre as medidas de tendência central, temos : a média; a mediana, e a moda. file:///H:/AULAS-DISCIPLINAS/Probabilide_e_Estatística-CC/PE_2022-2_em_2023/10_Medidas_de_tendência_central/10_Medidas_de_Tendência_Central .slides.html#/26 4/70 15/02/2023 01:32 10_Medidas_de_Tendência_Central (1) slides A média aritmética É a soma de todos os resultados dividida pelo número total de casos, podendo ser considerada como o ponto de equilíbrio dos dados. file:///H:/AULAS-DISCIPLINAS/Probabilide_e_Estatística-CC/PE_2022-2_em_2023/10_Medidas_de_tendência_central/10_Medidas_de_Tendência_Central .slides.html#/26 5/70 15/02/2023 01:32 10_Medidas_de_Tendência_Central (1) slides A média aritmética como ponto de equilíbrio: file:///H:/AULAS-DISCIPLINAS/Probabilide_e_Estatística-CC/PE_2022-2_em_2023/10_Medidas_de_tendência_central/10_Medidas_de_Tendência_Central .slides.html#/26 6/70 15/02/2023 01:32 10_Medidas_de_Tendência_Central (1) slides Usualmente a média para populações é denotada pela letra grega μ; enquanto a média aritmética para amostras é denotada por x̄. file:///H:/AULAS-DISCIPLINAS/Probabilide_e_Estatística-CC/PE_2022-2_em_2023/10_Medidas_de_tendência_central/10_Medidas_de_Tendência_Central .slides.html#/26 8/70 15/02/2023 01:32 10_Medidas_de_Tendência_Central (1) slides Dados discretos Dada a lista x 1, x2 , x3 , ⋯ , x n x̄ = , a média aritmética é definida como: x1 + x2 + x3 + ⋯ + x n n file:///H:/AULAS-DISCIPLINAS/Probabilide_e_Estatística-CC/PE_2022-2_em_2023/10_Medidas_de_tendência_central/10_Medidas_de_Tendência_Central .slides.html#/26 9/70 15/02/2023 01:32 10_Medidas_de_Tendência_Central (1) slides Exemplo 1 A média aritmética de 19, 5, 14, 5, 25, 5, 10, 12, 14, 5, 16, 4, 20, 21, 5 é: 19 + 5 + 14 + 5 + 25 + 5 + 10 + 12 + 14 + 5 + 16 + 4 + 20 + 21 x̄ = 15 180 x̄ = = 12 15 file:///H:/AULAS-DISCIPLINAS/Probabilide_e_Estatística-CC/PE_2022-2_em_2023/10_Medidas_de_tendência_central/10_Medidas_de_Tendência_Central .slides.html#/26 10/70 15/02/2023 01:32 10_Medidas_de_Tendência_Central (1) slides No R a média é calculada com a função mean() file:///H:/AULAS-DISCIPLINAS/Probabilide_e_Estatística-CC/PE_2022-2_em_2023/10_Medidas_de_tendência_central/10_Medidas_de_Tendência_Central .slides.html#/26 11/70 15/02/2023 01:32 10_Medidas_de_Tendência_Central (1) slides In [1]: lista = c(19, 5, 14, 5, 25, 5, 10, 12, 14, 5, 16, 4, 20, 21, 5) cat('média = ',mean(lista)) média = 12 file:///H:/AULAS-DISCIPLINAS/Probabilide_e_Estatística-CC/PE_2022-2_em_2023/10_Medidas_de_tendência_central/10_Medidas_de_Tendência_Central .slides.html#/26 12/70 15/02/2023 01:32 10_Medidas_de_Tendência_Central (1) slides Dados discretos agrupados Dados os valores x com frequência f , estes podem ser tabulados: i xi i fi xi fi x1 f1 x1 f 1 x2 f2 x2 f 2 ⋮ ⋮ fn xn f n ⋮ xn n Total n ∑ fi ∑ xi f i i=1 i=1 file:///H:/AULAS-DISCIPLINAS/Probabilide_e_Estatística-CC/PE_2022-2_em_2023/10_Medidas_de_tendência_central/10_Medidas_de_Tendência_Central .slides.html#/26 13/70 15/02/2023 01:32 10_Medidas_de_Tendência_Central (1) slides logo, a média aritmética é calculada como: n ∑ (xi ⋅ fi ) x̄ = i=1 n ∑ fi i=1 file:///H:/AULAS-DISCIPLINAS/Probabilide_e_Estatística-CC/PE_2022-2_em_2023/10_Medidas_de_tendência_central/10_Medidas_de_Tendência_Central .slides.html#/26 14/70 15/02/2023 01:32 10_Medidas_de_Tendência_Central (1) slides Exemplo 2 Os dados 19, 5, 14, 5, 25, 5, 10, 12, 14, 5, 16, 4, 20, 21, 5 podem ser agrupados: xi fi x i fi 4 1 4 5 5 25 10 1 10 12 1 12 14 2 28 16 1 16 19 1 19 20 1 20 21 1 21 file:///H:/AULAS-DISCIPLINAS/Probabilide_e_Estatística-CC/PE_2022-2_em_2023/10_Medidas_de_tendência_central/10_Medidas_de_Tendência_Central .slides.html#/26 15/70 15/02/2023 01:32 10_Medidas_de_Tendência_Central (1) slides 25 1 10 Total 21 10 ∑ fi = 15 ∑ xi fi = 180 i=1 i=1 file:///H:/AULAS-DISCIPLINAS/Probabilide_e_Estatística-CC/PE_2022-2_em_2023/10_Medidas_de_tendência_central/10_Medidas_de_Tendência_Central .slides.html#/26 16/70 15/02/2023 01:32 10_Medidas_de_Tendência_Central (1) slides logo, n ∑ xi ⋅ f i x̄ = 180 i=1 n ∑ fi = = 12 15 i=1 file:///H:/AULAS-DISCIPLINAS/Probabilide_e_Estatística-CC/PE_2022-2_em_2023/10_Medidas_de_tendência_central/10_Medidas_de_Tendência_Central .slides.html#/26 17/70 15/02/2023 01:32 10_Medidas_de_Tendência_Central (1) slides No R a média aritmética pode ser calculada diretamente com os dados brutos: file:///H:/AULAS-DISCIPLINAS/Probabilide_e_Estatística-CC/PE_2022-2_em_2023/10_Medidas_de_tendência_central/10_Medidas_de_Tendência_Central .slides.html#/26 18/70 15/02/2023 01:32 10_Medidas_de_Tendência_Central (1) slides In [2]: lista = c(19, 5, 14, 5, 25, 5, 10, 12, 14, 5, 16, 4, 20, 21, 5) mean(lista) 12 file:///H:/AULAS-DISCIPLINAS/Probabilide_e_Estatística-CC/PE_2022-2_em_2023/10_Medidas_de_tendência_central/10_Medidas_de_Tendência_Central .slides.html#/26 19/70 15/02/2023 01:32 10_Medidas_de_Tendência_Central (1) slides ou pode-se construir um dataframe e calcular a média: file:///H:/AULAS-DISCIPLINAS/Probabilide_e_Estatística-CC/PE_2022-2_em_2023/10_Medidas_de_tendência_central/10_Medidas_de_Tendência_Central .slides.html#/26 20/70 15/02/2023 01:32 10_Medidas_de_Tendência_Central (1) slides In [3]: library(tidyverse) -- Attaching packages ----------------------------------------------------------------------------- tidyverse 1.3.1 -v v v v ggplot2 tibble tidyr readr 3.3.5 3.1.2 1.1.3 2.0.0 v v v v purrr dplyr stringr forcats 0.3.4 1.0.7 1.4.0 0.5.1 -- Conflicts -------------------------------------------------------------------------------- tidyverse_conflicts() -x dplyr::filter() masks stats::filter() file:///H:/AULAS-DISCIPLINAS/Probabilide_e_Estatística-CC/PE_2022-2_em_2023/10_Medidas_de_tendência_central/10_Medidas_de_Tendência_Central .slides.html#/26 21/70 15/02/2023 01:32 10_Medidas_de_Tendência_Central (1) slides In [4]: tabela_freq <- function(lista){ tabe <- data.frame(t(table(lista)))[,-1] names(tabe) <- c('Xi', 'Fi') tabe <- tabe %>% mutate(Xi.Fi = as.numeric(levels(Xi))*Fi) %>% add_row(Xi = 'Total', Fi = sum(.$Fi), Xi.Fi = sum(.$Xi.Fi)) return(tabe) } file:///H:/AULAS-DISCIPLINAS/Probabilide_e_Estatística-CC/PE_2022-2_em_2023/10_Medidas_de_tendência_central/10_Medidas_de_Tendência_Central .slides.html#/26 23/70 15/02/2023 01:32 10_Medidas_de_Tendência_Central (1) slides O código define uma função chamada "tabela_freq" que recebe como entrada uma lista de dados chamada "lista". A função cria uma tabela de frequência para a lista de dados, onde cada valor único na lista é listado na coluna "Xi", o número de vezes que cada valor aparece na lista é listado na coluna "Fi", e o produto dos valores de "Xi" e "Fi" é listado na coluna "Xi.Fi". file:///H:/AULAS-DISCIPLINAS/Probabilide_e_Estatística-CC/PE_2022-2_em_2023/10_Medidas_de_tendência_central/10_Medidas_de_Tendência_Central .slides.html#/26 24/70 15/02/2023 01:32 10_Medidas_de_Tendência_Central (1) slides A expressão data.frame(t(table(lista))) cria uma tabela de frequência da variável lista, convertendo-a em um data frame. A função t() transpõe a tabela para que as categorias sejam as colunas. O resultado é um data frame com uma coluna chamada Var1, que contém os valores únicos da variável lista, e outra coluna chamada Freq, que contém a contagem de cada valor. O operador [,-1] é usado para excluir a primeira coluna (Var1) do data frame resultante. Isso significa que a coluna Freq é mantida, mas a coluna Var1 é removida. file:///H:/AULAS-DISCIPLINAS/Probabilide_e_Estatística-CC/PE_2022-2_em_2023/10_Medidas_de_tendência_central/10_Medidas_de_Tendência_Central .slides.html#/26 25/70 15/02/2023 01:32 10_Medidas_de_Tendência_Central (1) slides In [5]: data.frame(t(table(lista))) A data.frame: 10 × 3 Var1 lista Freq <fct> <fct> <int> A 4 1 A 5 5 A 10 1 A 12 1 A 14 2 A 16 1 A 19 1 A 20 1 A 21 1 A 25 1 file:///H:/AULAS-DISCIPLINAS/Probabilide_e_Estatística-CC/PE_2022-2_em_2023/10_Medidas_de_tendência_central/10_Medidas_de_Tendência_Central .slides.html#/26 26/70 15/02/2023 01:32 10_Medidas_de_Tendência_Central (1) slides In [6]: data.frame(t(table(lista)))[,-1] A data.frame: 10 × 2 lista Freq <fct> <int> 4 1 5 5 10 1 12 1 14 2 16 1 19 1 20 1 21 1 25 1 file:///H:/AULAS-DISCIPLINAS/Probabilide_e_Estatística-CC/PE_2022-2_em_2023/10_Medidas_de_tendência_central/10_Medidas_de_Tendência_Central .slides.html#/26 28/70 15/02/2023 01:32 10_Medidas_de_Tendência_Central (1) slides A função também adiciona uma nova coluna chamada "Xi.Fi" que é o produto dos valores de "Xi" e "Fi". Para isso, a função usa o operador "%" para fazer uma multiplicação elemento por elemento de "Xi" e "Fi", transforma "Xi" em um tipo numérico usando "as.numeric", e armazena o resultado em "Xi.Fi". Finalmente, a função adiciona uma nova linha na parte inferior da tabela que contém a soma das frequências e dos valores de "Xi.Fi" (coluna "Total"). A função retorna a tabela de frequência como um data frame. O operador "%>%" é usado para encadear as operações na tabela e a função "return" é usada para retornar a tabela final. file:///H:/AULAS-DISCIPLINAS/Probabilide_e_Estatística-CC/PE_2022-2_em_2023/10_Medidas_de_tendência_central/10_Medidas_de_Tendência_Central .slides.html#/26 30/70 15/02/2023 01:32 10_Medidas_de_Tendência_Central (1) slides In [7]: lista = c(19, 5, 14, 5, 25, 5, 10, 12, 14, 5, 16, 4, 20, 21, 5) tabela <- tabela_freq(lista) tabela A data.frame: 11 × 3 Xi Fi Xi.Fi <chr> <int> <dbl> 4 1 4 5 5 25 10 1 10 12 1 12 14 2 28 16 1 16 19 1 19 20 1 20 21 1 21 file:///H:/AULAS-DISCIPLINAS/Probabilide_e_Estatística-CC/PE_2022-2_em_2023/10_Medidas_de_tendência_central/10_Medidas_de_Tendência_Central .slides.html#/26 31/70 15/02/2023 01:32 10_Medidas_de_Tendência_Central (1) slides Xi Fi Xi.Fi <chr> <int> <dbl> 25 1 25 Total 15 180 file:///H:/AULAS-DISCIPLINAS/Probabilide_e_Estatística-CC/PE_2022-2_em_2023/10_Medidas_de_tendência_central/10_Medidas_de_Tendência_Central .slides.html#/26 32/70 15/02/2023 01:32 10_Medidas_de_Tendência_Central (1) slides In [8]: n = nrow(tabela) media <- tabela$Xi.Fi[n]/tabela$Fi[n] media 12 file:///H:/AULAS-DISCIPLINAS/Probabilide_e_Estatística-CC/PE_2022-2_em_2023/10_Medidas_de_tendência_central/10_Medidas_de_Tendência_Central .slides.html#/26 33/70 15/02/2023 01:32 10_Medidas_de_Tendência_Central (1) slides Dados Contínuos Em muitos casos não dispomos dos dados brutos de uma variável contínua e sim de classes de intervalos com sua frequência em cada classe; pelo qual temos que calcular a média para este tipo dados distribuidos em classes de intervalos; em outros casos o pesquisador explica seus dados com um histograma (com os dados distribuidos em classes de intervalos) e complementa sua explicação com medidas de tendência central e de dispersão. file:///H:/AULAS-DISCIPLINAS/Probabilide_e_Estatística-CC/PE_2022-2_em_2023/10_Medidas_de_tendência_central/10_Medidas_de_Tendência_Central .slides.html#/26 34/70 15/02/2023 01:32 10_Medidas_de_Tendência_Central (1) slides No caso de dados contínuos, agrupamos os dados em classes; cada classe é representada pelo seu ponto médio; calculamos a média de forma similar aos dados agrupados. file:///H:/AULAS-DISCIPLINAS/Probabilide_e_Estatística-CC/PE_2022-2_em_2023/10_Medidas_de_tendência_central/10_Medidas_de_Tendência_Central .slides.html#/26 35/70 15/02/2023 01:32 10_Medidas_de_Tendência_Central (1) slides Classes xi fi x i fi a1 ⊢ b 1 x1 f1 x1 f 1 a2 ⊢ b 2 x2 f2 x2 f 2 ⋮ ⋮ ⋮ ⋮ an ⊢ b n xn fn xn f n n Total n ∑ fi ∑ xi f i i=1 i=1 file:///H:/AULAS-DISCIPLINAS/Probabilide_e_Estatística-CC/PE_2022-2_em_2023/10_Medidas_de_tendência_central/10_Medidas_de_Tendência_Central .slides.html#/26 36/70 15/02/2023 01:32 10_Medidas_de_Tendência_Central (1) slides logo, n ∑ xi ⋅ fi i=1 x̄ = n ∑ fi i=1 onde, xi é o ponto médio da i-ésima classe Nota: A notação aberto a direita. ai ⊢ bi equivale ao intervalo [ai , bi ) fechado a esquerda e file:///H:/AULAS-DISCIPLINAS/Probabilide_e_Estatística-CC/PE_2022-2_em_2023/10_Medidas_de_tendência_central/10_Medidas_de_Tendência_Central .slides.html#/26 37/70 15/02/2023 01:32 10_Medidas_de_Tendência_Central (1) slides Exemplo 3 Calcular a média da seguinte distribuição de dados: Classes fi 1, 5 ⊢ 2, 0 3 2, 0 ⊢ 2, 5 16 2, 5 ⊢ 3, 0 31 3, 0 ⊢ 3, 5 34 3, 5 ⊢ 4, 0 11 4, 0 ⊢ 4, 5 4 4, 5 ⊢ 5, 0 1 file:///H:/AULAS-DISCIPLINAS/Probabilide_e_Estatística-CC/PE_2022-2_em_2023/10_Medidas_de_tendência_central/10_Medidas_de_Tendência_Central .slides.html#/26 38/70 15/02/2023 01:32 10_Medidas_de_Tendência_Central (1) slides Solução Calculamos o ponto médio o ponto médio da classe xi de cada classe; ai ⊢ bi é: xi = ai + b1 2 file:///H:/AULAS-DISCIPLINAS/Probabilide_e_Estatística-CC/PE_2022-2_em_2023/10_Medidas_de_tendência_central/10_Medidas_de_Tendência_Central .slides.html#/26 39/70 15/02/2023 01:32 10_Medidas_de_Tendência_Central (1) slides Classes xi fi 1, 5 ⊢ 2, 0 1,75 3 2, 0 ⊢ 2, 5 2,25 16 2, 5 ⊢ 3, 0 2,75 31 3, 0 ⊢ 3, 5 3,25 34 3, 5 ⊢ 4, 0 3,75 11 4, 0 ⊢ 4, 5 4,25 4 4, 5 ⊢ 5, 0 4,75 1 file:///H:/AULAS-DISCIPLINAS/Probabilide_e_Estatística-CC/PE_2022-2_em_2023/10_Medidas_de_tendência_central/10_Medidas_de_Tendência_Central .slides.html#/26 40/70 15/02/2023 01:32 10_Medidas_de_Tendência_Central (1) slides calculamos para cada clase o produto Classes xi fi xi ⋅ f i : x i fi 1, 5 ⊢ 2, 0 1,75 3 5, 25 2, 0 ⊢ 2, 5 2,25 16 36, 00 2, 5 ⊢ 3, 0 2,75 31 85, 25 3, 0 ⊢ 3, 5 3,25 34 110, 50 3, 5 ⊢ 4, 0 3,75 11 41, 25 4, 0 ⊢ 4, 5 4,25 4 17, 00 4, 5 ⊢ 5, 0 4,75 1 4, 75 file:///H:/AULAS-DISCIPLINAS/Probabilide_e_Estatística-CC/PE_2022-2_em_2023/10_Medidas_de_tendência_central/10_Medidas_de_Tendência_Central .slides.html#/26 41/70 15/02/2023 01:32 10_Medidas_de_Tendência_Central (1) slides calculamos as somas das colunas Classes xi fi fi xi f i : x i fi 1, 5 ⊢ 2, 0 1,75 3 5, 25 2, 0 ⊢ 2, 5 2,25 16 36, 00 2, 5 ⊢ 3, 0 2,75 31 85, 25 3, 0 ⊢ 3, 5 3,25 34 110, 50 3, 5 ⊢ 4, 0 3,75 11 41, 25 4, 0 ⊢ 4, 5 4,25 4 17, 00 4, 5 ⊢ 5, 0 4,75 1 4, 75 100 300 Total e file:///H:/AULAS-DISCIPLINAS/Probabilide_e_Estatística-CC/PE_2022-2_em_2023/10_Medidas_de_tendência_central/10_Medidas_de_Tendência_Central .slides.html#/26 42/70 15/02/2023 01:32 10_Medidas_de_Tendência_Central (1) slides logo, a média é: n ∑ xi ⋅ f i 300 i=1 x̄ = n = = 3 100 ■ ∑ fi i=1 file:///H:/AULAS-DISCIPLINAS/Probabilide_e_Estatística-CC/PE_2022-2_em_2023/10_Medidas_de_tendência_central/10_Medidas_de_Tendência_Central .slides.html#/26 43/70 15/02/2023 01:32 10_Medidas_de_Tendência_Central (1) slides Expectativa de vida do ano 2017 - Dados Gapminder Analisaremos a média da expectativa de vida da população mundial e dos continentes file:///H:/AULAS-DISCIPLINAS/Probabilide_e_Estatística-CC/PE_2022-2_em_2023/10_Medidas_de_tendência_central/10_Medidas_de_Tendência_Central .slides.html#/26 44/70 15/02/2023 01:32 10_Medidas_de_Tendência_Central (1) slides In [9]: gapminder <- readRDS('gapminder_dados.rds') file:///H:/AULAS-DISCIPLINAS/Probabilide_e_Estatística-CC/PE_2022-2_em_2023/10_Medidas_de_tendência_central/10_Medidas_de_Tendência_Central .slides.html#/26 45/70 15/02/2023 01:32 10_Medidas_de_Tendência_Central (1) slides In [10]: names(gapminder) 'pais' · 'continente' · 'região' · 'nivel_de_renda' · 'ano' · 'renda_per_capita' · 'mortalidade_infantil' · 'expectativa_vida' file:///H:/AULAS-DISCIPLINAS/Probabilide_e_Estatística-CC/PE_2022-2_em_2023/10_Medidas_de_tendência_central/10_Medidas_de_Tendência_Central .slides.html#/26 46/70 15/02/2023 01:32 10_Medidas_de_Tendência_Central (1) slides In [11]: ev_2017 <- gapminder %>% filter(ano == 2017, !is.na(expectativa_vida) & !is.na(continente)) %>% select(continente, expectativa_vida) file:///H:/AULAS-DISCIPLINAS/Probabilide_e_Estatística-CC/PE_2022-2_em_2023/10_Medidas_de_tendência_central/10_Medidas_de_Tendência_Central .slides.html#/26 47/70 15/02/2023 01:32 10_Medidas_de_Tendência_Central (1) slides O código em R tem como objetivo selecionar dados da base de dados gapminder que se referem ao ano de 2017 e para as quais as variáveis expectativa_vida e continente não estão faltando (NA). O operador %>% é usado para encadear comandos, passando o resultado de um comando como entrada para o próximo comando. Ele é usado em conjunto com a biblioteca dplyr, que fornece um conjunto de funções para manipulação de dados. Na primeira linha do código, é usada a função filter do dplyr para selecionar apenas as linhas da base de dados que correspondem ao ano de 2017 e para as quais não há valores faltantes na variável expectativa_vida e continente. file:///H:/AULAS-DISCIPLINAS/Probabilide_e_Estatística-CC/PE_2022-2_em_2023/10_Medidas_de_tendência_central/10_Medidas_de_Tendência_Central .slides.html#/26 48/70 15/02/2023 01:32 10_Medidas_de_Tendência_Central (1) slides Na segunda linha do código, é usada a função select do dplyr para selecionar as colunas continente e expectativa_vida da base de dados. O resultado final do código é um data frame chamado ev_2017 que contém duas colunas: a primeira contendo informações sobre o continente, e a segunda contendo informações sobre a expectativa de vida em anos para cada país desse continente em 2017. file:///H:/AULAS-DISCIPLINAS/Probabilide_e_Estatística-CC/PE_2022-2_em_2023/10_Medidas_de_tendência_central/10_Medidas_de_Tendência_Central .slides.html#/26 49/70 15/02/2023 01:32 10_Medidas_de_Tendência_Central (1) slides In [12]: head(ev_2017) A tibble: 6 × 2 continente expectativa_vida <fct> <dbl> Asia 63.38 Europa 78.23 África 77.74 Europa 82.70 África 64.19 Américas 77.02 file:///H:/AULAS-DISCIPLINAS/Probabilide_e_Estatística-CC/PE_2022-2_em_2023/10_Medidas_de_tendência_central/10_Medidas_de_Tendência_Central .slides.html#/26 50/70 15/02/2023 01:32 10_Medidas_de_Tendência_Central (1) slides Média global da expectativa de vida no ano 2017 file:///H:/AULAS-DISCIPLINAS/Probabilide_e_Estatística-CC/PE_2022-2_em_2023/10_Medidas_de_tendência_central/10_Medidas_de_Tendência_Central .slides.html#/26 51/70 15/02/2023 01:32 10_Medidas_de_Tendência_Central (1) slides In [13]: hist(ev_2017$expectativa_vida, main = 'Expectativa de vida global: ano 2017', xlab = 'Expectativa de vida', ylab = 'Frequência', col = 'green') file:///H:/AULAS-DISCIPLINAS/Probabilide_e_Estatística-CC/PE_2022-2_em_2023/10_Medidas_de_tendência_central/10_Medidas_de_Tendência_Central .slides.html#/26 52/70 15/02/2023 01:32 10_Medidas_de_Tendência_Central (1) slides Este código em R cria um histograma da variável expectativa_vida do conjunto de dados ev_2017. O histograma representa a distribuição da expectativa de vida em todo o mundo para o ano de 2017. A função hist() é usada para criar o histograma. O argumento ev_2017$expectativa_vida especifica a variável a ser plotada. main é usado para definir o título do gráfico, xlab e ylab são usados para rotular os eixos x e y, respectivamente, e col é usado para definir a cor da plotagem do histograma (verde neste caso). file:///H:/AULAS-DISCIPLINAS/Probabilide_e_Estatística-CC/PE_2022-2_em_2023/10_Medidas_de_tendência_central/10_Medidas_de_Tendência_Central .slides.html#/26 53/70 15/02/2023 01:32 10_Medidas_de_Tendência_Central (1) slides In [14]: media_ev <- mean(ev_2017$expectativa_vida) media_ev 72.8367724867725 file:///H:/AULAS-DISCIPLINAS/Probabilide_e_Estatística-CC/PE_2022-2_em_2023/10_Medidas_de_tendência_central/10_Medidas_de_Tendência_Central .slides.html#/26 54/70 15/02/2023 01:32 10_Medidas_de_Tendência_Central (1) slides In [15]: hist(ev_2017$expectativa_vida, main = 'Expectativa de vida global: ano 2017', xlab = 'Expectativa de vida', ylab = 'Frequência', col = 'green') abline(v=media_ev, col="red", lwd=3) text(media_ev, 20, "média", col='red') file:///H:/AULAS-DISCIPLINAS/Probabilide_e_Estatística-CC/PE_2022-2_em_2023/10_Medidas_de_tendência_central/10_Medidas_de_Tendência_Central .slides.html#/26 55/70 15/02/2023 01:32 10_Medidas_de_Tendência_Central (1) slides abline(v = media_ev, col = "red", lwd = 3) desenha uma linha vertical na posição da média da expectativa de vida, indicada pela variável media_ev. O argumento v especifica que a linha deve ser vertical. O argumento col especifica a cor da linha e o argumento lwd especifica a largura da linha. text(media_ev, 20, "média", col='red') adiciona um texto indicando o valor da média da expectativa de vida. O argumento media_ev especifica a posição vertical em que o texto será adicionado. O argumento 20 especifica a posição horizontal. A string "média" é o texto a ser exibido e col='red' especifica a cor do texto. file:///H:/AULAS-DISCIPLINAS/Probabilide_e_Estatística-CC/PE_2022-2_em_2023/10_Medidas_de_tendência_central/10_Medidas_de_Tendência_Central .slides.html#/26 57/70 15/02/2023 01:32 10_Medidas_de_Tendência_Central (1) slides Média por continente da expectativa de vida no ano 2017 file:///H:/AULAS-DISCIPLINAS/Probabilide_e_Estatística-CC/PE_2022-2_em_2023/10_Medidas_de_tendência_central/10_Medidas_de_Tendência_Central .slides.html#/26 58/70 15/02/2023 01:32 10_Medidas_de_Tendência_Central (1) slides In [16]: ev_2017 %>% group_by(continente) %>% summarise(Média = mean(expectativa_vida)) A tibble: 4 × 2 continente Média <fct> <dbl> África 65.35815 Américas 75.52471 Asia 73.71071 Europa 78.69267 file:///H:/AULAS-DISCIPLINAS/Probabilide_e_Estatística-CC/PE_2022-2_em_2023/10_Medidas_de_tendência_central/10_Medidas_de_Tendência_Central .slides.html#/26 59/70 15/02/2023 01:32 10_Medidas_de_Tendência_Central (1) slides A primeira linha, ev_2017 %>%, indica que o dataframe ev_2017 é o objeto que será manipulado. O operador %>% é usado para encadear operações, facilitando a leitura do código. A segunda linha, group_by(continente), agrupa os dados por continente, ou seja, a média será calculada para cada grupo de países que pertencem ao mesmo continente. A terceira linha, summarise(Média = mean(expectativa_vida)), calcula a média da expectativa de vida para cada grupo de continentes. A função mean é usada para calcular a média, e o resultado é armazenado na nova coluna Média. O resultado dessa operação é um novo dataframe com duas colunas, continente e Média, contendo a média da expectativa de vida para cada continente. file:///H:/AULAS-DISCIPLINAS/Probabilide_e_Estatística-CC/PE_2022-2_em_2023/10_Medidas_de_tendência_central/10_Medidas_de_Tendência_Central .slides.html#/26 60/70 15/02/2023 01:32 10_Medidas_de_Tendência_Central (1) slides Renda per capita do ano 2017 - Dados Gapminder Analisaremos a média da renda per capita da população mundial e dos continentes file:///H:/AULAS-DISCIPLINAS/Probabilide_e_Estatística-CC/PE_2022-2_em_2023/10_Medidas_de_tendência_central/10_Medidas_de_Tendência_Central .slides.html#/26 61/70 15/02/2023 01:32 10_Medidas_de_Tendência_Central (1) slides In [17]: rpc_2017 <- gapminder %>% filter(ano == 2017, !is.na(renda_per_capita) & !is.na(continente)) %>% select(continente, renda_per_capita) file:///H:/AULAS-DISCIPLINAS/Probabilide_e_Estatística-CC/PE_2022-2_em_2023/10_Medidas_de_tendência_central/10_Medidas_de_Tendência_Central .slides.html#/26 62/70 15/02/2023 01:32 10_Medidas_de_Tendência_Central (1) slides In [18]: head(rpc_2017) A tibble: 6 × 2 continente renda_per_capita <fct> <dbl> Asia 1758 Europa 11803 África 13876 Europa 49768 África 6045 Américas 22856 file:///H:/AULAS-DISCIPLINAS/Probabilide_e_Estatística-CC/PE_2022-2_em_2023/10_Medidas_de_tendência_central/10_Medidas_de_Tendência_Central .slides.html#/26 63/70 15/02/2023 01:32 10_Medidas_de_Tendência_Central (1) slides Média global da renda per capita no ano 2017 file:///H:/AULAS-DISCIPLINAS/Probabilide_e_Estatística-CC/PE_2022-2_em_2023/10_Medidas_de_tendência_central/10_Medidas_de_Tendência_Central .slides.html#/26 64/70 15/02/2023 01:32 10_Medidas_de_Tendência_Central (1) slides In [19]: hist(rpc_2017$renda_per_capita, main = 'Renda per capita global: ano 2017', xlab = 'Renda per capita', ylab = 'Frequência', col = 'green') file:///H:/AULAS-DISCIPLINAS/Probabilide_e_Estatística-CC/PE_2022-2_em_2023/10_Medidas_de_tendência_central/10_Medidas_de_Tendência_Central .slides.html#/26 65/70 15/02/2023 01:32 10_Medidas_de_Tendência_Central (1) slides In [20]: media_rpc <- mean(rpc_2017$renda_per_capita) media_rpc 18491.4871794872 file:///H:/AULAS-DISCIPLINAS/Probabilide_e_Estatística-CC/PE_2022-2_em_2023/10_Medidas_de_tendência_central/10_Medidas_de_Tendência_Central .slides.html#/26 66/70 15/02/2023 01:32 10_Medidas_de_Tendência_Central (1) slides In [21]: hist(rpc_2017$renda_per_capita, main = 'Renda per capita global: ano 2017', xlab = 'Renda per capita', ylab = 'Frequência', col = 'green') abline(v=media_rpc, col="red", lwd=3) text(media_rpc, 50, "média", col='red') file:///H:/AULAS-DISCIPLINAS/Probabilide_e_Estatística-CC/PE_2022-2_em_2023/10_Medidas_de_tendência_central/10_Medidas_de_Tendência_Central .slides.html#/26 67/70 15/02/2023 01:32 10_Medidas_de_Tendência_Central (1) slides Média por continente da renda per capita no ano 2017 file:///H:/AULAS-DISCIPLINAS/Probabilide_e_Estatística-CC/PE_2022-2_em_2023/10_Medidas_de_tendência_central/10_Medidas_de_Tendência_Central .slides.html#/26 69/70 15/02/2023 01:32 10_Medidas_de_Tendência_Central (1) slides In [22]: rpc_2017 %>% group_by(continente) %>% summarise(Média = mean(renda_per_capita)) A tibble: 4 × 2 continente Média <fct> <dbl> África 5471.741 Américas 15873.486 Asia 20106.729 Europa 33372.277 file:///H:/AULAS-DISCIPLINAS/Probabilide_e_Estatística-CC/PE_2022-2_em_2023/10_Medidas_de_tendência_central/10_Medidas_de_Tendência_Central .slides.html#/26 70/70