Uploaded by Suyanne França

Aula 00 - Introdução ao curso.pptx

advertisement
Introdução ao Método
Estatístico
PROFESSOR: DR. CARLOS ROBERTO DA SILVA MAIA
ROBERTOECO84@GMAIL.COM
Objetivos da aula
❖ Compreender o que é a ciência estatística e o seu
método;
❖ Conhecer os seus conceitos básicos;
❖ Esboçar o planejamento de um experimento
estatístico;
Uma definição de estatística
Por definição, ela pode ser considerada a
ciência que trata de métodos científicos para
coleta, organização, descrição, análise e
interpretação, (conclusão) de um conjunto de
dados, visando à tomada de decisões
(LARSON; FABER, 2015).
Uma definição de estatística
“[Mulheres] que fumaram de um a 14 cigarros por dia tinham,
aproximadamente, o dobro de risco de morte cardíaca repentina
do que as não Fumantes.
“O desperdício de alimentos [nos Estados Unidos], em relação ao
suprimento disponível, tem aumentado progressivamente de
aproximadamente 30% em 1974 para quase 40% em anos
recentes.”
“O percentual de estudantes de Detroit que alcançaram nível igual
ou acima de proficiência [em leitura] foi de 7% [em um ano
recente].”
Uma definição de estatística
“[...] ao contrário do que alguns imaginam, a estatística não é um
ramo da matemática onde se investigam os processos de
obtenção, organização e análise de dados sobre uma determinada
população. Também não se limita a um conjunto de elementos
numéricos relativos a um fato social, nem a tabelas e gráficos
usados para o resumo, a organização e apresentação dos dados
de uma pesquisa, embora este seja um aspecto da estatística que
pode ser facilmente percebido no cotidiano” (IGNÁCIO, 2010).
Uma definição de estatística
Ela é ciência quando suas teorias
permitem o estudo de grandes conjuntos
de dados, independentemente da
natureza destes, sendo autônoma e
universal.
É método quando serve de
instrumento particular a
uma determinada ciência.
É arte, quando aplicada
visando à construção de
modelos para representar a
realidade (LOPES, 2005).
Uma definição de estatística
Como conjunto de métodos e técnicas, a estatística envolve todas
as etapas de uma pesquisa e ou experimento:
Planejamento; Coordenação; Levantamento de
amostragem, a partir de pesquisas ou experimentos;
dados
por
Aplicação de questionários; Entrevistas e medições; Análise de
consistência, processamento, organização e interpretação de dados
para explicar fenômenos sociais e naturais;
Inferência, cálculo do nível de confiança e do erro existente na
resposta para uma determinada variável.
Aplicações no mundo dos negócios
❖ Identificar situações problemáticas através de análise de clima
organizacional;
❖ Entender melhor o que acontece em seus negócios e melhorar a
qualidade de suas decisões;
❖ Entender o comportamento das vendas de produtos ou serviços;
❖ Identificar causas de defeitos ou motivadoras da baixa qualidade;
❖ Entender o comportamento dos clientes frente à empresa e aos
seus produtos.
Aplicações no mundo dos negócios
Finanças – índices de preço, comportamentos modais, médias de
mercado, comportamento do crédito e da inadimplência, previsões
de taxas de juros, etc.
Marketing – pesquisas de mercado para entendimento sobre o
comportamento do consumidor, resultado e tendência das vendas
de determinado segmento.
Conceitos Básicos da Estatística
Estatística Descritiva: técnicas de organizar, resumir, analisar e
interpretar observações disponíveis.
Probabilidade: nos permite descrever os fenômenos aleatórios,
ou seja, aqueles em que está presente a incerteza.
Estatística Inferencial: obter respostas corretas de questões
especificas, atendendo a um determinado grau de acerto.
Conceitos Básicos da Estatística
❖ Dado é um resultado de investigações, contagens, medições, cálculos
ou pesquisas que nos permitam representar o estado de fenômenos e
processos.
❖ Variável é toda característica que pode assumir diversos valores
conforme a pessoa, objeto ou coisa que se está analisando.
❖ Um parâmetro é a descrição numérica de uma característica
populacional.
❖ Uma estatística é a descrição numérica de uma característica
amostral.
Conceitos Básicos da Estatística
Qualitativa
• Ordinal:
Grau
de
escolaridade; Estágio de
um processo, etc.
• Nominal: Sexo; Religião,
Estado civil; Gênero; Raça,
etc.
Quantitativa
• Discretas: Nº de filhos;
Contagem de bactérias;
Nº de diabéticos, etc.
• Contínuas: Peso; Altura;
Tempo; Pressão
Conceitos Básicos da Estatística
Escala Nominal
• 1 = Rio de
Janeiro
• 2 = Santa
Catarina
• 3 = Ceará
• 4 = São Paulo
• 5 = Pará
Escala Ordinal
• 1 = Sem
Instrução
• 2 = Primeiro
Grau
• 3 = Segundo
grau
• 4 = Superior
• 5 = Mestrado
Escala
Intervalar
• Variações de
temperatura
• Intervalos
temporais
Escala
Proporcional
• Medidas de
comprimento;
• Medidas de
valor;
• Medidas de
quantida
Conceitos Básicos da Estatística
Tente você mesmo!
A ANP conduz pesquisas
semanais em
aproximadamente 800
postos de gasolina no Brasil
para determinar o preço
médio por litro de gasolina
comum. Em Maio de 2018, o
preço médio era R$ 4,79.
Identifique: a população e a
amostra.
População – preço do litro de gasolina em todos dos postos
de abastecimento no Brasil.
Amostra - preços do litro de
gasolina nos 800 postos
pesquisados.
Tente você mesmo!
O quê se pode inferir, a partir dos seguintes casos:
Caso 1 - Uma grande amostra de homens com 48 anos de idade foi
estudada durante 18 anos. Observou-se que, para os solteiros,
aproximadamente 70% estavam vivos aos 65 anos, e para os casados,
90%.
Caso 2 - Em uma amostra de analistas de Wall Street, a percentagem
dos que previram incorretamente os lucros de empresas de alta
tecnologia em um ano recente foi de 44%.
Conceitos Básicos da Estatística
Há dois tipos de conjuntos de dados usados em estatística:
População é a coleção de todos os resultados, respostas,
medições ou contagens que são de interesse.
Amostra é um subconjunto ou parte de uma população.
Uma estatística amostral pode diferir de uma amostra para outra,
enquanto um parâmetro populacional é constante para uma
população.
Tente você mesmo!
Determine se o valor numérico descreve um parâmetro populacional ou uma
estatística amostral.
1. Uma pesquisa recente com aproximadamente 400.000 empregadores
reportou que o salário médio inicial para um especialista em marketing é
de R$ 53.400 por ano.
2. A nota média de matemática obtida no vestibular pelos calouros de uma
universidade é 7,14.
3. Em uma checagem aleatória de 400 lojas varejistas, descobriu-se que 34%
das lojas não estavam estocando peixes na temperatura apropriada.
4. No ano passado, uma empresa com 65 funcionários teve um gasto total de
US$ 5.150.694 com salários.
Planejamento de experimentos e
Coleta de dados.
Planejando um estudo estatístico
1. Identifique as variáveis de interesse (o foco) e
a população do estudo.
2. Desenvolva um plano detalhado para a coleta
de dados. Se usar uma amostra, certifique-se de
que a amostra é representativa da população.
3. Colete os dados.
4. Descreva os dados usando técnicas de
estatística descritiva.
5. Interprete os dados e tome as decisões sobre a
população usando estatística inferencial.
6. Identifique quaisquer erros possíveis.
Em um estudo observacional,
um pesquisador não influencia
as respostas.
Em um experimento, um
pesquisador aplica um
tratamento antes de observar
as respostas.
Planejamento de experimentos e
Coleta de dados.
1.
2.
Simulação: é o uso de um modelo
matemático ou físico para reproduzir as
condições de uma situação ou processo.
Pesquisa: é uma investigação de uma ou
mais características de uma população,
realizada com pessoas, por meio de
perguntas (entrevistas).
Para produzir resultados
significativos e não tendenciosos, os
experimentos devem ser
cuidadosamente planejados e
executados. É importante saber
quais passos devem ser realizados
para que os resultados sejam
válidos. Três elementos de um
experimento bem planejado são
controle, aleatorização e
replicação.
Planejamento de experimentos e
Coleta de dados.
Controle – tem por finalidade evitar a ocorrência de variáveis
“confusão”; efeito placebo e ou efeito Hawthorne;
Aleatorização – tem por finalidade designar indivíduos
aleatoriamente para diferentes grupos de tratamento;
Replicação – é a possibilidade de repetição de um experimento
sob condições iguais ou semelhantes.
Planejamento de experimentos e
Coleta de dados.
Amostragem
❖Uma amostragem é uma contagem ou medição de parte de uma
população.
❖O tamanho da amostra, que é o número de indivíduos em um estudo, é
outra parte importante do planejamento experimental.
❖Técnicas de amostragem apropriadas devem ser utilizadas para garantir
que as inferências sobre a população sejam válidas.
❖São elas: aleatória simples; aleatória estratificada; por conglomerados;
sistemática; por conveniência; por julgamento e por saturação.
Planejamento de experimentos e
Coleta de dados.
Amostragem aleatória simples é aquela na qual cada elemento de
determinada população tem a mesma chance de ser selecionado.
Amostragem estratificada é aquela em que importa ter elementos de cada
segmento da população. Assim, a população é dividida em dois ou mais
subconjuntos, chamados de estratos, que compartilham uma característica
similar (gênero, idade, etnia, etc.), de cada um deles é então selecionada
aleatoriamente uma amostra.
Amostragem por conglomerado é aquela na qual a população recai em
subgrupos, agrupamentos geográficos, nos quais em cada um estão contidas
todas as características da população.
Planejamento de experimentos e
Coleta de dados.
Tente você mesmo!
Há 731 estudantes matriculados em um curso
de estatística em uma faculdade. Você deseja
formar uma amostra de oito estudantes para
responder às questões de uma pesquisa.
Selecione os estudantes que pertencerão à
amostra aleatória simples.
Ver quadro de números aleatórios!
Vamos tomar como
ponto
de
partida
aleatório a terceira
fileira da tabela, no
começo da segunda
coluna. Leia os dígitos
em grupos de 3 (porque
731 é um número de 3
dígitos).
Tente você mesmo!
Uma empresa emprega 79 pessoas. Escolha uma amostra
aleatória simples, composta de cinco pessoas para
pesquisar.
Planejamento de experimentos e
Coleta de dados.
Distribuição de frequência
Quando um conjunto de dados tem muitos valores, pode ser difícil de
observar padrões. Assim, se faz necessário organizar conjuntos de dados
agrupando-os em intervalos chamados de classes para a formação de
distribuições de frequência e construção de gráficos.
Uma distribuição de frequência é uma tabela que mostra classes ou
intervalos dos valores com a contagem do número de ocorrências em
cada classe ou intervalo. A frequência f de uma classe é o número de
ocorrências de dados na classe.
Distribuição de frequência
Base de assinaturas de jornais locais
Número de assinantes Número de Pessoas
Menos de 1.000
244
1.000 - 3.499
157
3.500 - 9.999
96
10.000 - 19.999
37
20.000 - 49.999
24
50.000 ou mais
6
Total
564
Características de conforto nos aviões de
uma companhia aérea
Natureza
Reclamações
719
Espaço insuficiente
914
Assentos desconfortáveis
146
Corredores estreitos
Espaço insuficiente para
bagagem de mão
Banheiros insuficientes
Outras queixas
Total
218
58
384
2439
Distribuição de frequência
Construindo uma distribuição de frequência com base em um conjunto de dados:
1.
2.
3.
4.
5.
Decida o número de classes (usualmente entre 5 e 20) da distribuição de
frequência.
Encontre a amplitude de classe. Determine a amplitude dos dados, divida a
amplitude pelo número de classes e arredonde para um número próximo mais
conveniente.
Encontre os limites de classe. Para encontrar os demais limites inferiores,
adicione a amplitude de classe ao limite inferior da classe precedente.
Faça uma marca de contagem para cada registro na linha da classe apropriada.
Conte as marcas para encontrar a frequência total f para cada classe.
Distribuição de frequência
Distribuição de frequência
O conjunto de dados a seguir lista os preços em
dólar de 30 aparelhos GPS portáteis. Construa
uma distribuição de frequência.
Distribuição de frequência
Distribuição de Frequências
Um histograma de frequência é um diagrama de barras que
representa a distribuição de frequência de um conjunto de
dados.
Um histograma tem as seguintes propriedades:
1. A escala horizontal indica os valores absolutos dos dados.
2. A escala vertical indica as frequências das classes.
3. Barras consecutivas devem estar encostadas umas nas
outras.
Distribuição de Frequências
Distribuição de Frequências
Histograma de Frequência Relativa
Distribuição de Frequências
Polígono de Frequências
Gráfico de Distribuição de Frequências
Ogiva de frequência acumulada
Tente você mesmo!
Construa uma distribuição de frequência para as quantidades (em toneladas) de óxido
de enxofre emitidas por um processo produtivo industrial
15,8
22,7
26,8
19,1
18,5
8,3
25,9
26,4
9,8
22,7
15,2
23
21,9
10,5
17,3
6,2
18
22,9
24,6
12,3
15,9
11,2
14,7
20,5
26,6
20,1
22,3
27,5
23,9
17,5
11
20,4
16,2
13,3
18,1
24,8
26,1
20,9
21,4
18
11,8
17,9
18,7
12,8
15,5
19,2
7,7
19,3
9,4
13,9
28,6
19,4
21,6
13,5
20
24,1
9
17,6
16,7
16,9
23,5
25,7
20,1
13,2
23,7
10,7
19
14,5
31,8
28,5
Medidas de Tendência Central
Uma medida de tendência central é um valor que representa
uma observação típica ou central de um conjunto de dados.
As três medidas da tendência central mais comumente
usadas, são: média, mediana e moda.
A média de um conjunto de dados é a soma dos valores dos dados
dividida pelo número de observações. Para determinar a média de
um conjunto de dados, use uma das fórmulas a seguir.
Medidas de Tendência Central
Medidas de Tendência Central
A mediana de um conjunto de dados é
um valor que está no meio dos dados
quando o conjunto está ordenado. A
mediana indica o centro de um conjunto
de dados ordenado, dividindo-o em duas
partes com quantidades iguais de
valores.
A moda de um conjunto de dados
é o valor que ocorre com a maior
frequência.
No exemplo prático, dentre os 30
valores, dois ocorrem com maior
frequência: 150 e 200. Portanto, se
trata de um conjunto bimodal de
dados.
Medidas de Tendência Central
Download