Introdução ao Método Estatístico PROFESSOR: DR. CARLOS ROBERTO DA SILVA MAIA ROBERTOECO84@GMAIL.COM Objetivos da aula ❖ Compreender o que é a ciência estatística e o seu método; ❖ Conhecer os seus conceitos básicos; ❖ Esboçar o planejamento de um experimento estatístico; Uma definição de estatística Por definição, ela pode ser considerada a ciência que trata de métodos científicos para coleta, organização, descrição, análise e interpretação, (conclusão) de um conjunto de dados, visando à tomada de decisões (LARSON; FABER, 2015). Uma definição de estatística “[Mulheres] que fumaram de um a 14 cigarros por dia tinham, aproximadamente, o dobro de risco de morte cardíaca repentina do que as não Fumantes. “O desperdício de alimentos [nos Estados Unidos], em relação ao suprimento disponível, tem aumentado progressivamente de aproximadamente 30% em 1974 para quase 40% em anos recentes.” “O percentual de estudantes de Detroit que alcançaram nível igual ou acima de proficiência [em leitura] foi de 7% [em um ano recente].” Uma definição de estatística “[...] ao contrário do que alguns imaginam, a estatística não é um ramo da matemática onde se investigam os processos de obtenção, organização e análise de dados sobre uma determinada população. Também não se limita a um conjunto de elementos numéricos relativos a um fato social, nem a tabelas e gráficos usados para o resumo, a organização e apresentação dos dados de uma pesquisa, embora este seja um aspecto da estatística que pode ser facilmente percebido no cotidiano” (IGNÁCIO, 2010). Uma definição de estatística Ela é ciência quando suas teorias permitem o estudo de grandes conjuntos de dados, independentemente da natureza destes, sendo autônoma e universal. É método quando serve de instrumento particular a uma determinada ciência. É arte, quando aplicada visando à construção de modelos para representar a realidade (LOPES, 2005). Uma definição de estatística Como conjunto de métodos e técnicas, a estatística envolve todas as etapas de uma pesquisa e ou experimento: Planejamento; Coordenação; Levantamento de amostragem, a partir de pesquisas ou experimentos; dados por Aplicação de questionários; Entrevistas e medições; Análise de consistência, processamento, organização e interpretação de dados para explicar fenômenos sociais e naturais; Inferência, cálculo do nível de confiança e do erro existente na resposta para uma determinada variável. Aplicações no mundo dos negócios ❖ Identificar situações problemáticas através de análise de clima organizacional; ❖ Entender melhor o que acontece em seus negócios e melhorar a qualidade de suas decisões; ❖ Entender o comportamento das vendas de produtos ou serviços; ❖ Identificar causas de defeitos ou motivadoras da baixa qualidade; ❖ Entender o comportamento dos clientes frente à empresa e aos seus produtos. Aplicações no mundo dos negócios Finanças – índices de preço, comportamentos modais, médias de mercado, comportamento do crédito e da inadimplência, previsões de taxas de juros, etc. Marketing – pesquisas de mercado para entendimento sobre o comportamento do consumidor, resultado e tendência das vendas de determinado segmento. Conceitos Básicos da Estatística Estatística Descritiva: técnicas de organizar, resumir, analisar e interpretar observações disponíveis. Probabilidade: nos permite descrever os fenômenos aleatórios, ou seja, aqueles em que está presente a incerteza. Estatística Inferencial: obter respostas corretas de questões especificas, atendendo a um determinado grau de acerto. Conceitos Básicos da Estatística ❖ Dado é um resultado de investigações, contagens, medições, cálculos ou pesquisas que nos permitam representar o estado de fenômenos e processos. ❖ Variável é toda característica que pode assumir diversos valores conforme a pessoa, objeto ou coisa que se está analisando. ❖ Um parâmetro é a descrição numérica de uma característica populacional. ❖ Uma estatística é a descrição numérica de uma característica amostral. Conceitos Básicos da Estatística Qualitativa • Ordinal: Grau de escolaridade; Estágio de um processo, etc. • Nominal: Sexo; Religião, Estado civil; Gênero; Raça, etc. Quantitativa • Discretas: Nº de filhos; Contagem de bactérias; Nº de diabéticos, etc. • Contínuas: Peso; Altura; Tempo; Pressão Conceitos Básicos da Estatística Escala Nominal • 1 = Rio de Janeiro • 2 = Santa Catarina • 3 = Ceará • 4 = São Paulo • 5 = Pará Escala Ordinal • 1 = Sem Instrução • 2 = Primeiro Grau • 3 = Segundo grau • 4 = Superior • 5 = Mestrado Escala Intervalar • Variações de temperatura • Intervalos temporais Escala Proporcional • Medidas de comprimento; • Medidas de valor; • Medidas de quantida Conceitos Básicos da Estatística Tente você mesmo! A ANP conduz pesquisas semanais em aproximadamente 800 postos de gasolina no Brasil para determinar o preço médio por litro de gasolina comum. Em Maio de 2018, o preço médio era R$ 4,79. Identifique: a população e a amostra. População – preço do litro de gasolina em todos dos postos de abastecimento no Brasil. Amostra - preços do litro de gasolina nos 800 postos pesquisados. Tente você mesmo! O quê se pode inferir, a partir dos seguintes casos: Caso 1 - Uma grande amostra de homens com 48 anos de idade foi estudada durante 18 anos. Observou-se que, para os solteiros, aproximadamente 70% estavam vivos aos 65 anos, e para os casados, 90%. Caso 2 - Em uma amostra de analistas de Wall Street, a percentagem dos que previram incorretamente os lucros de empresas de alta tecnologia em um ano recente foi de 44%. Conceitos Básicos da Estatística Há dois tipos de conjuntos de dados usados em estatística: População é a coleção de todos os resultados, respostas, medições ou contagens que são de interesse. Amostra é um subconjunto ou parte de uma população. Uma estatística amostral pode diferir de uma amostra para outra, enquanto um parâmetro populacional é constante para uma população. Tente você mesmo! Determine se o valor numérico descreve um parâmetro populacional ou uma estatística amostral. 1. Uma pesquisa recente com aproximadamente 400.000 empregadores reportou que o salário médio inicial para um especialista em marketing é de R$ 53.400 por ano. 2. A nota média de matemática obtida no vestibular pelos calouros de uma universidade é 7,14. 3. Em uma checagem aleatória de 400 lojas varejistas, descobriu-se que 34% das lojas não estavam estocando peixes na temperatura apropriada. 4. No ano passado, uma empresa com 65 funcionários teve um gasto total de US$ 5.150.694 com salários. Planejamento de experimentos e Coleta de dados. Planejando um estudo estatístico 1. Identifique as variáveis de interesse (o foco) e a população do estudo. 2. Desenvolva um plano detalhado para a coleta de dados. Se usar uma amostra, certifique-se de que a amostra é representativa da população. 3. Colete os dados. 4. Descreva os dados usando técnicas de estatística descritiva. 5. Interprete os dados e tome as decisões sobre a população usando estatística inferencial. 6. Identifique quaisquer erros possíveis. Em um estudo observacional, um pesquisador não influencia as respostas. Em um experimento, um pesquisador aplica um tratamento antes de observar as respostas. Planejamento de experimentos e Coleta de dados. 1. 2. Simulação: é o uso de um modelo matemático ou físico para reproduzir as condições de uma situação ou processo. Pesquisa: é uma investigação de uma ou mais características de uma população, realizada com pessoas, por meio de perguntas (entrevistas). Para produzir resultados significativos e não tendenciosos, os experimentos devem ser cuidadosamente planejados e executados. É importante saber quais passos devem ser realizados para que os resultados sejam válidos. Três elementos de um experimento bem planejado são controle, aleatorização e replicação. Planejamento de experimentos e Coleta de dados. Controle – tem por finalidade evitar a ocorrência de variáveis “confusão”; efeito placebo e ou efeito Hawthorne; Aleatorização – tem por finalidade designar indivíduos aleatoriamente para diferentes grupos de tratamento; Replicação – é a possibilidade de repetição de um experimento sob condições iguais ou semelhantes. Planejamento de experimentos e Coleta de dados. Amostragem ❖Uma amostragem é uma contagem ou medição de parte de uma população. ❖O tamanho da amostra, que é o número de indivíduos em um estudo, é outra parte importante do planejamento experimental. ❖Técnicas de amostragem apropriadas devem ser utilizadas para garantir que as inferências sobre a população sejam válidas. ❖São elas: aleatória simples; aleatória estratificada; por conglomerados; sistemática; por conveniência; por julgamento e por saturação. Planejamento de experimentos e Coleta de dados. Amostragem aleatória simples é aquela na qual cada elemento de determinada população tem a mesma chance de ser selecionado. Amostragem estratificada é aquela em que importa ter elementos de cada segmento da população. Assim, a população é dividida em dois ou mais subconjuntos, chamados de estratos, que compartilham uma característica similar (gênero, idade, etnia, etc.), de cada um deles é então selecionada aleatoriamente uma amostra. Amostragem por conglomerado é aquela na qual a população recai em subgrupos, agrupamentos geográficos, nos quais em cada um estão contidas todas as características da população. Planejamento de experimentos e Coleta de dados. Tente você mesmo! Há 731 estudantes matriculados em um curso de estatística em uma faculdade. Você deseja formar uma amostra de oito estudantes para responder às questões de uma pesquisa. Selecione os estudantes que pertencerão à amostra aleatória simples. Ver quadro de números aleatórios! Vamos tomar como ponto de partida aleatório a terceira fileira da tabela, no começo da segunda coluna. Leia os dígitos em grupos de 3 (porque 731 é um número de 3 dígitos). Tente você mesmo! Uma empresa emprega 79 pessoas. Escolha uma amostra aleatória simples, composta de cinco pessoas para pesquisar. Planejamento de experimentos e Coleta de dados. Distribuição de frequência Quando um conjunto de dados tem muitos valores, pode ser difícil de observar padrões. Assim, se faz necessário organizar conjuntos de dados agrupando-os em intervalos chamados de classes para a formação de distribuições de frequência e construção de gráficos. Uma distribuição de frequência é uma tabela que mostra classes ou intervalos dos valores com a contagem do número de ocorrências em cada classe ou intervalo. A frequência f de uma classe é o número de ocorrências de dados na classe. Distribuição de frequência Base de assinaturas de jornais locais Número de assinantes Número de Pessoas Menos de 1.000 244 1.000 - 3.499 157 3.500 - 9.999 96 10.000 - 19.999 37 20.000 - 49.999 24 50.000 ou mais 6 Total 564 Características de conforto nos aviões de uma companhia aérea Natureza Reclamações 719 Espaço insuficiente 914 Assentos desconfortáveis 146 Corredores estreitos Espaço insuficiente para bagagem de mão Banheiros insuficientes Outras queixas Total 218 58 384 2439 Distribuição de frequência Construindo uma distribuição de frequência com base em um conjunto de dados: 1. 2. 3. 4. 5. Decida o número de classes (usualmente entre 5 e 20) da distribuição de frequência. Encontre a amplitude de classe. Determine a amplitude dos dados, divida a amplitude pelo número de classes e arredonde para um número próximo mais conveniente. Encontre os limites de classe. Para encontrar os demais limites inferiores, adicione a amplitude de classe ao limite inferior da classe precedente. Faça uma marca de contagem para cada registro na linha da classe apropriada. Conte as marcas para encontrar a frequência total f para cada classe. Distribuição de frequência Distribuição de frequência O conjunto de dados a seguir lista os preços em dólar de 30 aparelhos GPS portáteis. Construa uma distribuição de frequência. Distribuição de frequência Distribuição de Frequências Um histograma de frequência é um diagrama de barras que representa a distribuição de frequência de um conjunto de dados. Um histograma tem as seguintes propriedades: 1. A escala horizontal indica os valores absolutos dos dados. 2. A escala vertical indica as frequências das classes. 3. Barras consecutivas devem estar encostadas umas nas outras. Distribuição de Frequências Distribuição de Frequências Histograma de Frequência Relativa Distribuição de Frequências Polígono de Frequências Gráfico de Distribuição de Frequências Ogiva de frequência acumulada Tente você mesmo! Construa uma distribuição de frequência para as quantidades (em toneladas) de óxido de enxofre emitidas por um processo produtivo industrial 15,8 22,7 26,8 19,1 18,5 8,3 25,9 26,4 9,8 22,7 15,2 23 21,9 10,5 17,3 6,2 18 22,9 24,6 12,3 15,9 11,2 14,7 20,5 26,6 20,1 22,3 27,5 23,9 17,5 11 20,4 16,2 13,3 18,1 24,8 26,1 20,9 21,4 18 11,8 17,9 18,7 12,8 15,5 19,2 7,7 19,3 9,4 13,9 28,6 19,4 21,6 13,5 20 24,1 9 17,6 16,7 16,9 23,5 25,7 20,1 13,2 23,7 10,7 19 14,5 31,8 28,5 Medidas de Tendência Central Uma medida de tendência central é um valor que representa uma observação típica ou central de um conjunto de dados. As três medidas da tendência central mais comumente usadas, são: média, mediana e moda. A média de um conjunto de dados é a soma dos valores dos dados dividida pelo número de observações. Para determinar a média de um conjunto de dados, use uma das fórmulas a seguir. Medidas de Tendência Central Medidas de Tendência Central A mediana de um conjunto de dados é um valor que está no meio dos dados quando o conjunto está ordenado. A mediana indica o centro de um conjunto de dados ordenado, dividindo-o em duas partes com quantidades iguais de valores. A moda de um conjunto de dados é o valor que ocorre com a maior frequência. No exemplo prático, dentre os 30 valores, dois ocorrem com maior frequência: 150 e 200. Portanto, se trata de um conjunto bimodal de dados. Medidas de Tendência Central