Uploaded by Bruno rged

toaz.info-adriotti-fundamentos-da-estatistica-e-da-geoestatistica-pr 4710e9803fdc81d896580098a1b73bae

advertisement
Fundamentos de
Estatística e
Geoestotístico
José Leonardo Silva Andriotti
5501
A5fl,
535$
ISBN05-743ú71-5
9 778574 311716
Fundamentos de Estatística e
Geoestatística
Sobre o autor
José Leonardo Silvo Andriotti
graduou-seem Geologtc pela UFRGS,
em
J975, e obteve o títulode doutor
pelo mesmo universidade em 1999,
com tese versando sobre Estatisticae
Na França especializou-se
em Geoestafi5ticae depois em
EypioroçöoMineral. Tem atuado como
docef"tede grudooçáo e pós-groduaçáo
na UFRGS, no UNIS/NOS e no FARGS
bem como em mstitwçöes de
outrospoises
LeonardoSilva Andriotti
0 2003José
e Geoestatística
Fstatística
Fundamentos de
reservados
2003Direitos
Universidade do Vale do Rio dos Sinos
à Editora da
UNIStNOS
EnrT0RA
Universitário
Manual
Colesäo
ISBNs-7431-171$
veräo de 2004.
Impressão,
Class
Tomb(
Revisão
Rui Bender
53538
Editoração
Rafael Tarcísio Forneck
Capa
Gabnel Neto
A reproduçäo, ainda que parcial, por qualquer meio, das páginas que
compõem este livro, para uso nao-individual, mesmo para fins
didåhcos,sem autonzaçä0 escrita do editor é ilícita e se
constitui numa contrafaçäo danosdà
Itura.
Foifeitoodepósito legal, z/
Editorada Universidade do Vale do Rio dos Sinos
EDITORA UNISINOS
AV Unisinos, 950
93022-000
RS Brasil
Telef: 51. 5908239
Fax: 51. 5908238
editora@unisinos.br
Para Elma, minha mãe, para Eleonora,nttnha
companheira, e para Rafael, meu filho, que são
as pessoas que melhor representam três
gerações que envolvema minha vtda:
a anterior, a atual e a próxnna.
SUMÁRIO
Introduçäo à Estatística .
1.1 —Estatística e Teoria das Probabilidades —um Breve Histórico
1.2 —Pesquisas de Opiniäo...„......
1.3 —Medidas de Tendência Central 1.3A —Média Aritmética (também referida como média,
simplesmente).
132 —Média Ponderada ....
1.3.3 —Média
1.3.4 —Média Geométrica .....„....
135 —Mediana, Quartis, Decis, Percentis
136 - Moda
1.4 —Medidas de Dispersão
1.4.1- Amplitude .
14.2 —Variância.
1.4.3 —Desvio-padräo .
17
17
20
25
25
26
27
27
28
29
.
1.4.4 —Coeficiente de Variação (CV) .
1.4.5 —Assimetria........
14.6 —Curtose........
1.4.7 —Erro-padräo da Média
1.4.8 —Desvio Entre Quartis.................„...... .. „
1.5 —Representação Gráfica
Distribuições e Testes de Hipótese .
2.1 —Distribuição Normal de Probabilidade........„................
2.2 - Distribuição z....
2.3 - Intervalos de Confiança................
2.4 - Testes de Hipótese
2.5 —Testes de Hipótese com as Distribuiçöes z e t—
2.6 - Distribuição t.....
2.7 —Tamanho Mínimo de uma Amostra
31
31
31
33
33
33
34
35
35
36
41
41
47
52
55
59
61
65
10
Arx-ncA
r
e Rcgres.såo
3- Correlaçio
Linear Simples
Corrclaçä0
3A Linear Simples .
3 2 - Regressão Aplicaçä0.
de
33 - Exemplos
Linear Simples.
68
68
71
3.31 - Correlaçä0
Linear Simples
332 - Regressão
Interpolaçåo
4- Métodos de
77
• 79
e Variáveis Regionalizadas
.
81
— Matematiquices„.
4A
da Quantificação em Geociências
42 - A Importância
a Escolha de Métodos de Grid..„...
43 - ComentánosSobre
Algumas Técmcas de Geraçäo de Grids
4 4 - Comentános Sobre
45 - Geoestatística
•
4 6- VariáveisRegionalizadas..—..
4.7- H:potesesRestnnvas
5- Vanogramas
5A - Conceituaçãode
52 -
5 6 - Análise Esb-utural
5 7- Modelos Teóncos de Variogramas
..
5.71 - Esquema Esférico (de Matheron)
5.72 - EsquemaExponencial (de Formery) .
573 - Esquema de Gauss (Parabólico)
..
5.75 - EsquemaLogarítmtco (de WIjs)
5 7.6 - Outros Modelos
5.8 - Efeito Proporcional .
5 9 - Estruturas Imbncadas
5A0- Efeito Buraco...
511 - Presença de Deriva...
512- Anisotropias.„
5121 - Anisotropia Geométrica ..
5122 - Anisotropia Zonal .
513 - Cruz Geoestatístlca...„
85
• 89
93
95
99
99
53 - Variogramaou Semivanograma—
5 4 - Comportamentona Vizinhança da Ongem
55 - Construçãode Semivariogramas Experimentais............
5.7 4 - Esquema Linear
81
82
100
104
105
108
112
114
115
116
117
119
120
121
121
12
123
125
125
125
12.7
127
Estimaçao Geoestatística .
6.1 —Variâncias de Estimação e de
6.2 —Kngagem....
6.3 —Krigagem Universal
6.4 - Krigagem da
6.5 —Cokrigagem..
6.6 - Validaçäo Cruzada
6.7 —Simulaçðes Condicionais ...„
Vocabulário.
129
129
134
149
150
151
152
153
156
8- Referências
8.1 —Estatística...........
11
.
.
82 - Geoestatística
Anexos.....„..........
Tabela t„....
Tabela z
Valores Críticos —Coeficiente de Correlação r de Pearson
158
158
159
161
163
164
165
16
glossáriocontendo algumas expressöes de
Apresentamosum
Geoestatística, apontando as
Estatísticae
comum em
Inglês e francês. bibliográficas, listamos as
fontes de
em português.
às referenoas
ComrelaçåO
como sempre que se faz uma relaçao
mas,
importantes
obras e documentos de excelente
sulta Julgadas
falha de omitir
1 INTRODUÇÃO À ESTATÍSTICA
na
quase tipo incorre-se
de que, se isso ocorreu, deveu-se ao fato de
certeza
a
leitor
lidade, tenha o
tudo o que existe de qualidade sobre
Impossível listar
praticamente
ser
asunto.
a todos os que nos honrarem ao consultar
Por fim. agradecemos
disposiçä0 para que nos selam encaminhadas
1.1 Estatística e teoria das probabilidades
à
esta obra e colocamo-nos
de outras possíveis edições, pelo endereço
melhoria
à
sugestöes que Visem
eletrOmcoandn@portoweb.com.br
Porto Alegre/ RS, outubro de 2003
Um breve histórico
O aparecimento da palavra Estatística deve-se ao fato de que os
chefes de Estado ou seus equivalentes na época (antes da era cristã) desejavam conhecer os dados q ue julgavam necessános para avaliar a sua potência, dados como população, potencial militar, riquezas e outros
Os primeiros recenseamentos de que se tem referêncta ocorreram
na época da civilizaçäo suméria, de 5000 a 2000 anos antes de Cristo (a. C,)
(a contagem das pessoas passou a ser regular na Mesopotâmia em 3000
C), O Egito parece ter sido a primeira naçäo a ter recenseamentos sistemáticos da população desde 2900 a. C. Os recenseamentos, entretanto, continuaram sendo raros ainda por muitos séculos, sendo um dos mais conhecidos o de Paris no ano de 1590 da nossa era (quando foram recenseados
aproximadamente 200 mil habitantes) Os progressos fundamentajs da
Estatística däo-se especialmente na segunda metade do século 17 (a partir
de 1650, aproximadamente), com a necessidade que os monarcas da época
tinham de conhecer e explicar os fenómenos sociais e econômicos que es-
tavam ocorrendo.
No início, a teoria das probabilidades estava relacionada com os jogos de azar, especialmente com os jogos de dados. As informaçöes mais
antigas de que se tem notícia são provenientes da Mesopotâmia e datam
do início do século três. Os Jogos de dados unham um aspecto lúdico, tendo tido também utilização para fins religiosos, uma vez que a populaçäo
da época acreditava que os dados poderiam permitir que se conhecesse a
vontade dos deuses, com a evolução do cristianismo, esse pensamento
acabou, pois ele se opunha idéia de uma divindade todo-poderosa, e seu
uso com esse fim foi condenado pela Igreja.
probabilidades deve-se a Blaise Pascal
to da teona das(1601-1665). Pascal tinha interesse em
Ptèrre de Fermat azar que se desenvolv„am em Várias
(1623-1662) e a
dos ,ogos de
um jogo antes que um dos
decifrar um problema
necessáriointerromper
ser
de
caso
melhor maneira de efetuar a divtsao do
partE no
vitórta,qual a
à
chegasse
reflexöes sobre esse tema e as exgadores
Pascalfez Inúmeras
apostado?
dmherro
a Fermat
pôs em cartas ermadas ennqueceuelaborando esquema para ganhar a
Em 1729,Voltaire prémios ultrapassava o preço de todos os bis
valor dos
loteria de Pans- O
grupo que comprava todos os biVoltatrea formar um
levou
durante mais de um ano.
lhetesto que
més e, asstm. ganhou-a
lhetes da lotena de um tambémteve importancia na evolução da teona
A famíliaBernoulli
(Suíça) Jacques (1654Essafamíliaera da Basiléia
das probabilidades levaram até o primeiro teorema-limite (a lei dos
1748)fez estudosque o
é conhecido pelo
Daruel (1700-1782), seu sobrinho,
grandes números), e
matemáticainfinita e também por estudos da
problemada esperança
de observação em Astronomia. Um sobrinho
na probabilísticados erros
(1744- 1807), também se ocupou com a teoria
de DaruebJean Bernoulli
das probabilidades.
de densidade contínuas,
as curvas
Lambert (1728- 1777)estudou
de máxima verosimilhanconceito
o
Introdunu
e
e unimodals
centro de uma distribuição contínua simétriça ao pesquisar a posição do
da Demografia, e o cálculo
No início do século 19 aparece a prática
que os estados tinecessidade
da
função
de probabilidades avança em
Em março de
nham em possutr dados numéricosde suas populações.
1800,o Ministro do Intenor da França cria um Bureau de Estatísticm No século 19,houve uma retomadados recenseamentos, que foram pouco numerosos no século anterior (em1801foram recenseadas as populações da
Inglaterra, Dinamarca, França e Noruega).
Entre 1885e 1925,a Estatísticatoma forma como uma teoria coerente. Entre 1920 e 1924,o inglês Arthur Bowley (1869 —1957) desenvolve a
amostragem aleatória, a estratlficaçäo,estabelece a equação da Análise de
Variânciaem universos estratificadose as fórmulas da variância nos casos
Simples e estratificado.A partir de 1925,as discussões sobre a representauvidade das amostras não se centram mais sobre seus princípios, já untversalmenteaceitos,mas sobreseus modos de aplicação.
Os astrônomosdo século 18 utilizaram medidas experimentais
para deterrrunar a posição dos objetos celestes, o que se constituiu num estudo da distribuição dos erros de medida.
19
No século 19, houve o surgimento dos estudos sobre a variância
com os mínimos quadrados, mas os nomes adotados atualmentenio são
tao antigos; Karl Pearson (em 1893) introdunu o termo desvio-padräo, e
Carl Fnednch Gauss (em 1816) propôs a expressão numénca para a mensuraçäo das variaçöes dos erros de medida em Astronomia
As principais medidas de assimetria e de curtose (parâmetros de
forma) surgiram pelos estudos desenvolvtdos por Karl Pearson e Ronald
Aylmer Fisher; Pearson introduziu, no ano de 1895, um parâmetro basea-
do na posiçäo relativa da média aritmética,da moda e da mediana.
Em 9 de fevereiro de 1877,Francis Galton (que em 1875 desenvolvera o emprego da mediana) faz uma exposição na RoyalInstituhon ofGreat
Britam intitulada Típicas Leis de Hereditariedadeno Homem, em que apresenta o coeficientede reversãor, que indicava a redução de variabilidade da família, termo que se transformou em Regressäo. Em 1896,Pearson, baseandose nos conceitos de Galton, formula o que atualmente se conhecepelo
nome de Teoria da Regressão,estabelecendotambéma correlação,e, em
1904, Pearson introduzru o conceito do Qui Quadrado,
Em 1922, A. Fisher escreve "O obJetivodo método estatísticoé a
redução dos dados. Uma massa de dados deve ser substituída por um pequeno número de quantidades representando corretamente essa massa, e
contendo tanto quanto possível a totalidade da informaçäo pertinente
contida dentro dos dados originais"
Os fundadores da teoria dos testes de hipóteses são Jerzy Neyman
e Egon Pearson (filho de Karl Pearson), e ISSOocorreu entre 1926e 1933.
Em 1928, aparecem os conceitos de hipóteses nula e alternativa.
A partir do fim do século 19, a lei normal passou a ter grande desenvolvimento graças aos estudos desenvolvidos por Karl Pearson e Francis Galton (primo de Charles Darwin) L
A Distribuiçåo Normal é, com freqüência. atribuída a Laplace e a
Gauss, a quem ela deve seu nome, mas sua origem é antenor e está descrita nos trabalhos de Jacques Bernoulli, que estabeleceu que, em se repettndo um lançamento de uma peça de duas faces, por exemplo, a freqtiêncta
de apariçä0 de uma face determinada se aproxima de um certo valor suscetível de ser qualificado de probabilidade de se obter esse resultado. A lei
normal foi introduztda por Gauss, que recorreu ao método dos rnfnrmos
quadrados, e o avanço devido a Gauss está relacionado ao caráter probabilístico de sua abordagem. Segundo ele, " ...se uma quantidade foi determinada por muitas observações diretas efetuadas nas mesmas condiçöese
consticom o mesmo obyetivo,a média aritmética dos valores observados
tui o valor mais provável,se nä0 rigorosamentepelomenoscom murta
de se
correto
proximidade, de modo que ela possa sempre ser o valor mais
pauta foi denominada de Normal por
p
A
emIS93,
de Estatística
Congresso Internacional
ocorreu
emB
O primeiro
1853
em
(Bélgca)
e
da
Estatistica
Teoria
xelas
das
aplicaçöesda
Os usose
primeira metade doProbabilid
da
partir
a
avanços
Século
tiveramgrandesaté o presente Os campos de aplicação e a
aceitaçao
quaiscontinuam
sio cada vez mais amplos.
gerados
resultadospor elas
opinião
1.2Pesquisas de
Segundo as histónas de Sherazade, contidas em As mil e uma
vestia de beduíno à noite e, sem
ocalifaHaraum-al-Rachidse
ser identid
e
ado, ia de porta em porta, em Bagdá, perguntava aos moradores a
niäo sobre seu governo.
O papelpnnapal das pesquisas de opinião cabe aos EstadosUm.
dospormuo das pesqursasde opinião pública que foram realizadas
paisem grandequantidade.Os Estados Unidos são, assim, o berço
das
de opiniäo,sobretudoem suas
pesqutsas
aplicações às eleiçöespresi-
dencms nas coberturas feitas pela imprensa
No dia 3 de março de 1936, foram publicados nos Estados
Unidos
os resultadosdas eleiçöespresidenciais. Literary Digest previu
vitóna de
Alfred Landon, mas F. D. Roosevelt foi eleito com 61 % dos
votos, vitóna
previstapor três outras sondagens, uma delas executada
por George GaL
lup, que cnou seu própno instituto de pesquisas em
1935. O LiteraryDigest havia previsto com acerto as eleições
presidenciais americanas de
1924,1928e 1932;suas pesquusas baseavam-se
em questionários
enviados
apenas para os propnetários de
automóveis e telefones. Quanto
a
os questionárioseram enviados
Gallup,
a apenas 1.500 pessoas; ele
acertou tatrr
bém os resultados das eleiçöes
de 1940 e 1944 e chegou a ser
chamado de
mágicopelos norte-americanos.
Em 1948, entretanto, previu a
ThomasDeweycontra Harry
vitória de
Truman por 49% a 46%, mas o
50%a 45%a
resultado foi
favorde HarryTruman.
Segunda Guerra
O que ocorreu foi que, em razãoda
Mundial, as mudanças
demográficas
forammarcantes,
dos Estados Unidos
e as cotasconsideradas
se baseavam no censo de 1940,
aiemdea pesquisater
realizada muito antes do dia
da votação.
pesquisaseleitorais
do 0
tiveram seu início em 1945,quan•
(InstitutoBrasileiro
de Opinião Pública
e Estatística, fundado
21
em 1942) previu a vitória de Eurico Gaspar Dutra sobre Eduardo Gomes
para a presidência da República.
O Instituto Karolinska (Suécia), por exemplo, pesqursou 500.000
suecos que viviam a 300 metros de uma linha de alta tensão por um período de 25 anos e foi constatado que as crianças tinham maior incidènaa de
leucemia A revista Time publicou que "embora a pesquisa näo prove relaç50 de causa e efeito, mostra uma clara correlação entre o grau de exposiçåo e o risco de leucemia infantil". O governo sueco legislou reduzrndo o
número de residências na proximidade das linhas de alta tensão.
Durante a Segunda Guerra Mundial, os aliados deseyavamsaber
quantos tanques os alemäes tinham em operação e para isso utilizaram os
conceitos de Probabilidades e Estatística,por meio de amostragem fizeram inferências, obtendo resultados muito próximos da realidade.
Esses estudos evoluíram de tal forma que, no final do século 20, os
norte-americanos definiram o seu adadão médiopor meio de tabulação feita de dados obtidos por meio de amostragem criteriosa; esse cidadãose
chama Robert, tem 31 anos de idade, estatura de 1,75 m, pesa 78 kg, veste
manequim 48, sapatos número 43, tem 85 centímetros de cintura e termina
o seu dia dormindo 7,7 horas, começando o dia segurnte com 21 mmutos
de transporte para o trabalho
Quando a Meteorologia afirma que há 90% de possibilidades de
ocorreremchuvas em determmado período,ela está utilizando um conceito mediante o qual se pode afirmar que, sob as mesmas condlçöes meteorológicas reinantes, deve chover em 90% dos casos. Isso quer dizer que
previsöes desse tipo se baseiam em uma metodologia que fornece resultados corretos em 90% dos casos
Inferência Estatísticaé o nome dado à generalizaçãode resultados
de uma parte (ou seja, de uma amostra) para o todo (ou seja, para o universo ou população), sendo também o conjunto de procedimentos utilizados
na verificação da validade de uma hipótese para a população a partir dos
dados disponibilizados por uma amostra.
2
23
Sebç•o da
AmM'ra
Vabre• da Armstra
dc fazer parte da amostra, e cada indivíduo pertencente à população tem,
também, a mesma probabilidade de pertencer à amostra.
Na amostragem estratificada, a população é dividida em subgrupos (denominados estratos), internamente mais homogéneos do que a po-
pulação total; os estratos devem ser os mals homogéneos possíveis no
Partrr•tro
da Populaçåo
amostra e
Figura1 - Relaçioentre
populaçå0
todo.
sabemos como um processo funciona e desgaEm Probabilidades,
mos predizer seus resultados,
comportamento da variável estudada, o que demanda um conhecrmento
prévio da população.
Embora a amostragem sep contestada em alguns casos, sendo acunåo representar com fidelidade a população à qual pertence, em
de
sada
não ocorre, como nos casos de exames de sangue, por exemplo,
isso
outros
algumas gotas são consideradas suficientes para retratar o
apenas
que
em
em Estatisttca, não sabemos como funciona e
Um caso tíPIC0de estudo feito por amostragem, cujos resultados
säO utilizados para fazer inferências em Estatística, é o das pesquisas eleitorais.
resultados observados (obtidos por amostra.
buscamos,por mao dos
processo.
gem), conhecer a natureza do
Em termos de probabilidade, há três tipos de eventos, que são os
mutuamenteexclusivos(em que a ocorrência de um exclui a ocorrência do
POPULAÇAO- eleitores
AMOSTRAGEM
outro), os independentes (a ocorrência de um evento não influencia a probabilldadede ocorrênciado outro) e os dependentes (a ocorrência de um
evento Influenciaa probabilidade de ocorrência do outro).
AMOSTRA
dos eleitores
Estatísticaé qualquer característica descritiva dos elementos de
uma amostra,enquanto que parâmetro é uma característica descritiva dos
elementosde uma população.Se uma estatística é usada para avaliar ou
estimar o valor de algum parâmetro, é chamada de estimador Assim, parametro se refere à população e estatística se refere à amostra.
Variáveissão as característicasmensuráveis em cada indivíduo
que faz parte da população, mantidas as mesmas condições.
A qualidade de uma estimativa depende basicamente da representativ:dade da amostra, ou sela, da condiçäo que tem essa amostra de reprodumras característicasda população à qual ela pertence.
Amostragem pode não ser a melhor solução em determinadas situaçöes.Um desses casos é a existênciade uma
população pequena, na qual
não seyadifíciluma avaliaçãocompleta, ou
em casos em que uma precisão
multo elevada,exatidãomesmo, sela
exigida (caso dos recenseamentos ou
de eleiçöespara preenchimento
de cargos na esfera política)
Na amostragem aleatória
simples, qualquer subcorwnto da popu•
lação .com o mesmo número
de indivíduos) tem a mesma probabilidade
iNFERËNClA
Figura 2 —Inferêncta em pesquisas eleitorais (adaptado de Barbctta, 2001)
Variáveis Contínuas são as que podem assumir qualquer valor no
seu intervalo de vanaçäo, entre seus valores máximo e mínimo. Aí se incluem pesos e estaturas de pessoas de um certo grupo populacional, valo-
de certo
resem reas
produto que
varia de preço no mercado,
25
1.3 Medidas de tendência central
exemplo, o número de gols de um jogo de futecomo,por
a quantidade de escolas
de
filhosde uma
fazem parte de uma região um
que
cidades
de
quantidade
propriedades aritméticas; se
municípioe a
nä0 têm certas
regis.
Nomtnms
Dados
1, 2, 3 e 4, não valem as propnedades
como
raças
exemplo, as
de dureza dos minerais,
trarmos, por
os valo.
outras, Na escala
1+3= 4e
2<3,
7
< 9, sendo, entretanto, falso
tipo
ou
3
do
>
6
de
afira propnedade
res 1 a 10 tem
diferença de dureza entre o diamante e o
a
POIS
I,
=2
mar que IO- 9
10e 9) não equivale à diferença de dureza entre a
(respectivamente
nndo
(respectivamente2 e I - a pnmeira diferença é maior).
gtpsttae o talco
topázio é duas vezes mais
sentidodizer-seque o
duro
Tambémnão tena
valores são 8 e 4. Os da.
respectivos
seus
porque
apenas
do que a fluonta
por nomes ou categorias, não podem ser ordena.
representados
dos sä0
preferência clubística,
se pode citar
dos Como exemplos
equipamentos.
pessoas, países, tipos de
sim/näo,
sexo de
podem-se formar diferenças, mas
não
Com DadosIntervalares,
de temperaturas de dez graus as.
multiplicarou dividir.Duasdiferenças
mesma quantidade de calor
semelham-setäo-somentepor demandar a
exemplo,
IO para 20 ou de 30 para 40
por
de,
parase elevarà temperatura
não
representa
um calor duas vezes
graus
40
graus.Uma temperaturade
maior do que o existente a 20 graus,
Dados de Razão são os obtidos por meio dedivisöes, como é o caso
(em que a referência é o metro, por exemplo), peso (a uni.
comprimento
de
volumes (metro cúbico), áreas (metro quadrado), tempo
grama),
é
o
dade
(segundos, ou horas, ou anos) e muitos outros. Nesse tipo de dado, as diferenças e as razões têm significado,
DadosOrdinaisestabelecemordem, não havendo sentido, entretanto,entre as diferençasde valores.A diferença entre primeiro e terceiro
colocadosem um rankingnão equivale à diferença entre o sexagésimo e o
sexagéstmo segundo do mesmo ranking.
1.3.1 Média Aritmética
(também referida como média,
simplesmente)
É representada por X (que se lê X barra)
para a amostra e
por para
a população; é obtida somando todos os valores
disponíveis e dividindo o
resultado por n, que representa a quantidade de
valores
seja, a quantidade de valores somados. Quatro pessoas disponíveis, ou
com idades de 20.
22, 26 e 28 anos teräo uma média de idades igual a
X = (20 +22 +26 + 28) / 4 = 24 anos
Para um dado conjunto de dados, a média sempre
existe, tem valor
único e é sensível à presença de valores extremos; uma de suas
vantagens
é a facilidade de cálculo. A fórmula da média aritmética é dada
por
onde Xirepresenta cada uma das n observaçöes disponíveis na
amostra, i
varia de 1 (primeira observação) até n (última observação).
A média aritmética é uma medida de fácilcompreensão e aplicaçåo,
usa todos os valores da amostra, é valor único e fácilde incluir em
fórmulas
matemáticas, tendo a desvantagem de ser afetada por valores extremos.
Consideremos um conjunto de valores que representam uma determinada populaçåo composta pelos 50 valores que seguem. 34B / 35,5 /
28,6/ 29,4 / 41,5 / 36,8 / 33,4 / 36,0/ 30,2 / 33,2 / 33,7 / 34,3 /
/ 31,0
/ 27,4/ 33,9/ 37,6/ 39,9/ 27,2/34,2/ 30,2/ 30,4/ 39.9/ 40,0/ 40,6/
33,9/ 325 / 29,6/ 30,6/ 40,4/ 30,1/ 35,3/ 41,4/ 28,5/ 40,1/
/
31,6
/ 395/ 34,8/ 29,9/ 37,8/ 29/ / 37,4/ 27,4/ 365/ 40,8/ 32,9/ 40,0
/
44,1 / 41,4. Essa populaçao tem como valor mínimo 24,4e como valor máximo 44,1 e média aritmética igual a 34,5. A partir desse conjunto de valores, foram tomadas aleatoriamente doze amostras, e sobre elas se fez um
estudo do comportamento dos valores da média aritmética Foram tornadas três amostras de 25 valores, uma amostra com 24 valores, duas amostras com 17 valores, duas com 13 valores, duas com 10 valores, uma com 9
valores e outra com 7 valores. Os valores obtidos para a média aritmética
foram, respectivamente,
34,2, 34,2, 34,8, 34,9, 33,5, 35,8, 36,3, 355, 33,6,
Download