Prévia do material em texto
UNIVERSIDADE FEDERAL DO MARANHÃO
CENTRO DE CIÊNCIAS AGRÁRIAS E AMBIENTAIS
Estatística Básica
Emmanuel Arnhold
Professor Adjunto (UFMA/CCAA)
Chapadinha - Maranhão
2007
Apresentação
Atualmente encontram-se um grande número de livros abordando aspectos introdutórios de
estatística. No entanto, são raros os materiais didáticos introdutórios aplicados à área de ciências
agrárias. Visando estimular o aprendizado com uma linguagem mais simples e aplicada, com
exemplos práticos voltados, principalmente, as áreas de ciências agrárias e biológicas, o presente
material foi desenvolvido para auxiliar o aprendizado dos alunos de agronomia, biologia e zootecnia
do campus de Ciências Agrárias e Ambientais (CCAA). Portanto, esta apostila será utilizada como
apoio didático nas disciplinas de introdução à estatística destes cursos.
A apostila esta distribuída em quatro capítulos. O Capítulo I trata da Estatística Descritiva,
iniciando com somatório e, em seqüência, abordando variáveis, tabelas de freqüência, gráficos,
medidas de posição, dispersão, correlação e regressão linear simples. O Capítulo II aborda
Probabilidade e seus conceitos e teoremas. O Capítulo III aborda as principais distribuições de
probabilidade, como as distribuições binomial, multinomial, poisson, normal e normal padronizada.
O Capítulo IV aborda a Inferência Estatística, iniciando com amostragem e, em seqüência,
estimação intervalar e testes de hipóteses como os testes F, t e qui-quadrado. Neste material também
estão inclusos exercícios e tabelas estatísticas.
O autor
Sumário
Página
Introdução 1
Capítulo 1 – Estatística Descritiva 2
Capítulo II - Probabilidade 38
Capítulo III – Distribuições de Probabilidade 51
Capítulo IV – Inferência Estatística 65
Tabelas 103
1
Introdução
O que é estatística?
Estatística é parte da matemática em que se investigam os processos de obtenção,
organização e análise de dados sobre uma população ou sobre uma coleção de seres quaisquer, e os
métodos de tirar conclusões e fazer predições com base nesses dados.
A Estatística pode ser aplicada em praticamente todas as áreas do conhecimento humano e,
em algumas áreas, recebe um nome especial. Este é o caso da Bioestatística, que trata de aplicações
da Estatística em Ciências Biológicas e da Saúde.
A palavra "Estatística" tem pelo menos três significados:
1) coleção de informações numéricas ou dados,
2) medidas resultantes de um conjunto de dados, como por exemplo médias,
3) métodos usados na coleta e interpretação de dados.
A estatística compreende três ramos: a) Estatística descritiva; b) Probabilidade e: c)Inferência
Estatística.
a) Estatística Descritiva
A estatística descritiva compreende a organização, o resumo e, em geral, a simplificação de
informações através de tabelas, gráficos e de medidas de posição, dispersão e correlação. Por
exemplo: a apresentação gráfica do número de brasileiros em diferentes classes sociais.
b) Probabilidade
A probabilidade é utilizada para analisar situações que envolvem o acaso. Por exemplo: a
probabilidade de ganhar na loteria.
c) Inferência Estatística
A inferência estatística é utilizada para estimar valores populacionais a partir de amostras.
Por exemplo: a intenção de votos em determinada eleição com base em uma amostra; a altura média
dos brasileiros com base em uma amostra.
2
Capítulo I
Estatística Descritiva
3
1.1. Introdução
A estatística descritiva compreende a apresentação, organização e resumo dos dados. Faz-se
isso com o objetivo de facilitar a interpretação e discussão do fenômeno que se esta analisando.
Neste capítulo serão abordados os diferentes tipos de variáveis e sua forma de apresentação
em tabelas e gráficos e, a forma de obtenção de medidas que resume de maneira muito informativa
o conjunto de dados.
Primeiramente será apresentada uma ferramenta bastante útil em análises estatísticas, o
somatório.
1.2. Somatório
A notação de “soma” é representada por Σ (sigma maiúscula). Assim, tem-se a seguinte
notação:
n
n
i
i X...XXXX ++++= 321
1=
∑
onde:
i = limite inferior;
n = limite superior do somatório
Algumas representações de soma são:
n
n
i
i X...XXXX ++++= 321
1=
∑ (soma simples)
22
3
2
2
2
1
1=
2 ++++=∑ nn
i
i X...XXXX (soma de quadrados)
2
321
2
1=
++++=⎟⎠
⎞⎜⎝
⎛∑ )X...XXX(X nn
i
i (quadrado da soma)
nni
n
i
i YX...YXYXYXYX ++++= 332211
1=
∑ (soma de produtos)
)Y...YYY)(X...XXXYX nn
n
i
i
n
i
i ++++++++= 321321
1=1=
∑∑ (produto das somas)
Exemplo
Considere as variáveis X e Y que representam as notas de duas disciplinas em uma turma de
6 alunos.
X = {90, 95, 97, 98, 100, 60}
Y = {60, 70, 80, 60, 90, 75}
4
Calcule:
a) =∑6
1=i
iX 540=60+100+98+97+95+90=+++++ 654321 XXXXXX
b) =∑6
1=
2
i
iX
2
6
2
5
2
4
2
3
2
2
2
1 +++++ XXXXXX
73849=60+100+98+97+95+90= 222222 .)()()()()()(
c) =⎟⎠
⎞⎜⎝
⎛ 26
1=
∑
i
iX ( ) ( ) 600291=540=+++++ 22654321 .XXXXXX
d) =+++++= 665544332211
6
1=
∑ YXYXYXYXYXYXYX i
i
i
= (90.60)+(95.70)+(97.80)+(98.60)+(100.90)+(60.75) = 39.190
e) =∑∑ 6
1=
6
1= i
i
i
i YX ( )654321 +++++ XXXXXX ( )654321 +++++ YYYYYY
=(540).(435)=234.900
O número de termos de um somatório é:
N =Ls – Li + 1
onde:
Ls é o limite superior
Li é o limite inferior
Assim, o somatório 54321
5
1=
++++=∑ XXXXXX
i
i terá N = 5-1+1 = 5 termos.
Em alguns casos podem ocorrer restrições no somatório, como no seguinte exemplo:
5421
5
3≠1=
+++=∑ XXXXX
i
i
i . Assim, o número de termos é obtido por: N =Ls – Li + 1 – r, onde r é
o número de restrições. Assim, o número de termos deste somatório é N = 5 – 1 +1 – 1 = 4.
Propriedades do somatório
As propriedades do somatório facilitam o desenvolvimento das expressões algébricas com a
notação de somatório. O objetivo é desenvolver expressões até chegar às somas simples ou somas
de quadrados.
a) Somatório de uma constante (k)
O somatório de uma constante é igual ao produto da constante pelo número de termos do
somatório.
5
nkk...kkkk
n
i
=++++=∑
1=
Exemplo
50=105=10+10+10+10+10=10∑5
1=
.
i
b) Somatório do produto de uma constante por uma variável
O somatório do produto de uma constante por uma variável é igual ao produto da constante
pelo somatório da variável.
∑∑
1=
321321
1=
=++++=++++=
n
i
inni
n
i
Xk)X...XXX(kkX...kXkXkXXk
Exemplo
X = {2 3 4 5 6}
40=2=6++4+3+22=62++42+32+22=2 ∑∑
1=
5
1=
n
i
ii
i
X)...(.......X.
c) Somatório de uma soma ou subtração de variáveis
O somatório de uma soma ou subtração de variáveis é igual à soma ou subtração dos
somatórios dessas variáveis.
)Z...ZZZ()Y...YYY()X...XXX()ZYX( nnn
n
i
ii
n
i
i ++++++++++++++=++ 32132132
1=
1
1=
∑∑
∑∑∑
1=1=1=
++=
n
i
i
n
i
i
n
i
i ZYX
Exemplo
X = {2 3 4 5}; Y = {1 1 2 4}; Z = {4 3 2 2}
)()()()ZYX(
i
ii
n
i
i 2+2+3+4+4+2+1+1+5+4+3+2=++ ∑∑ 4
1=1=
∑∑∑
1=1=1=
33=11+8+14=++=
n
i
i
n
i
i
n
i
i ZYX
Observações importantes
A soma de quadrados é diferente do quadrado da soma :
2
1=1=
2 ⎟⎠
⎞⎜⎝
⎛≠ ∑∑ n
i
i
n
ii XX
A soma dos produtos é diferente do produto de duas somas
( ) ⎟⎠
⎞⎜⎝
⎛⎟⎠
⎞⎜⎝
⎛≠ ∑∑∑
1=1=1=
n
i
i
n
i
i
n
i
ii Y.XY.X
6
O somatório de um quociente é diferente do cociente de duas somas
∑
∑∑
1=
1=
1=
≠ n
i
i
n
i
in
i i
i
Y
X
Y
X
1.3. Tipos de variáveis
A correta definição das variáveis é fundamental na pesquisa e no uso correto e eficiente de
análises estatísticas. Os diferentes tipos de variáveis levam a tomar diferentes decisões na forma de
proceder à pesquisa, a apresentação, as análises, as discussões e as conclusões sobre um
determinado fenômeno.
Constante
Uma constante é uma observação de medida ou classificação que apresenta valor (ou
categoria) fixo (invariável).
Exemplos: Peso de caixas de leite de determinada marca, volume de refrigerantes em lata de uma
mesma marca, o sexo em uma turma de 30 meninas de um grupo de dança.
Note que todas estas observações apresentam valores iguais. Os pesos das caixas de leite não
variam, assim como o volume de refrigerantes e a classificação quanto ao sexo no grupo de dança.
Portanto, são constantes.
Variável
Uma variável é uma observação de medida ou classificação que apresenta valor (ou
categoria) variável. Portanto, uma variável pode ter ou assumir diferentes valores, diferentes
aspectos, diferentes categorias.
Exemplos: Peso de 30 alunos de agronomia, sexo de uma turma de 30 alunos de biologia.
Note que em uma turma de trinta alunos de agronomia o peso é diferente em cada aluno. No
caso da turma de 30 alunos de biologia, a variável apresenta duas categorias (masculino e feminino)
e, portanto, também é variável.
Observação importante: É importante destacar que tanto uma constante como uma variável pode
assumir valores numéricos ou não numéricos (palavras, letras, símbolos etc).
As variáveis podem ser classificadas da seguinte forma:
Variáveis Qualitativas (ou categóricas): são variáveis onde os diferentes níveis não podem ser
medidos e, portanto, são classificados em categorias distintas com base em critérios subjetivos.
Podem ser nominais ou ordinais.
7
Variáveis nominais: não existe ordenação dentre as categorias. Exemplos: sexo (masculino
e feminino), altura (alto e baixo), cor dos olhos (azul, verde, marrom), diagnóstico (doente
ou sadio; +/-).
Variáveis ordinais: existe uma ordenação entre as categorias. Exemplos: escolaridade (1o,
2o, 3o graus), estágio da doença (inicial, intermediário, terminal), mês de observação
(janeiro, fevereiro,..., dezembro), altura (alto, médio e baixo).
Observação importante: Variáveis qualitativas podem assumir valores numéricos, desde que, não
exista distância matemática entre os diferentes valores. Por exemplo: Notas do grau de doença foliar
em plantas de milho variando de 1 a 5. Cada nota (1 a 5) representa uma avaliação subjetiva com
base em alguns critérios dada a cada planta de milho. Assim, a distância entre a nota 1 e a nota 2
não pode ser considerada como exata, uma vez que a diferença é subjetiva e não matemática.
Portanto, tem-se uma variável ordinal onde a nota 5 é superior a 4 que é superior a 3 e assim
sucessivamente. Outros exemplos são o número do telefone de uma pessoa, o número da casa, o
número de sua identidade. Às vezes o sexo do indivíduo é registrado na planilha de dados como 1
se macho e 2 se fêmea. Isto não significa que a variável sexo passou a ser quantitativa!!!!!!!!
Variáveis Quantitativas: são variáveis que podem ser medidas, ou seja, apresentam valores
numéricos obtidos de maneira objetiva por contagem ou com auxílio de algum instrumento. Podem
ser contínuas ou discretas.
Variáveis discretas: características mensuráveis que podem assumir apenas um número
finito ou infinito contável de valores e, assim, somente fazem sentido valores inteiros. São
obtidas através de contagens. Exemplos: número de filhos por casal, número de bactérias por
litro de leite, número de cigarros fumados por dia, número de caras em 10 lançamentos de
uma moeda.
Variáveis contínuas, características mensuráveis que assumem infinitos valores em uma
escala contínua (na reta real), para as quais valores fracionários fazem sentido. Usualmente
devem ser medidas através de algum instrumento (régua, balança, relógio, proveta,
velocímetro, etc). Exemplos: peso (balança), altura (régua), tempo (relógio), pressão
arterial, idade, etc.
Observações importantes:
1) Como podem existir infinitos valores entre 10 e 20 kg?
Isso ocorre porque o instrumento é limitado. Se for avaliado em grama ou outras medidas
mais sensíveis, pode-se diferencias objetos que teriam o mesmo peso quando avaliados em kg.
8
Ex. Dois cachorros podem pesar 15 kg. Porém, se a balança for mais precisa pode-se detectar
diferenças em grama e assim sucessivamente.
2) Uma variável originalmente quantitativa pode ser coletada de forma qualitativa. Depende da
escala de mensuração.
a) Exemplo:
altura em escala de mensuração nominal (alto/baixo)
altura em escala de mensuração ordinal (alto/médio/baixo)
altura em escala métrica (1,75m; 1,65m; 1,82m; 1,72m; etc)
b) Exemplo:
A variável idade, medida em anos completos é quantitativa; mas, se for informada apenas a
faixa etária (0 a 5 anos, 6 a 10 anos, etc...), é qualitativa (ordinal).
c) Outro exemplo é o peso dos lutadores de boxe, uma variável quantitativa (contínua) se for
utilizado o valor obtido na balança, mas qualitativa (ordinal) se classificado nas categorias do boxe
(peso-pena, peso-leve, peso-pesado, etc.).
É importante destacar que:
O nível de informação é sempre maior quando proveniente de variáveis quantitativas.
Assim, a variável altura pode apresentar níveis crescentes de informação. A altura categorizada em
duas classes (altos e baixos) caracteriza uma variável qualitativa nominal. É menos informativa do
que a altura categorizada em altos médios e baixos (qualitativa ordinal). Que, por sua vez, é menos
informativa do que a altura em metros (quantitativa contínua).
1.4. Apresentação gráfica e tabular
Como já sabemos, as variáveis de um estudo podem ser classificadas em quatro tipos:
qualitativas (nominais e ordinais) e quantitativas (discretas e contínuas). Os dados gerados por esses
tipos de variáveis são de naturezas diferentes e, portanto, devem receber tratamentos diferentes.
Portanto, inicialmente vamos estudar as ferramentas - tabelas e gráficos - mais adequadas para cada
tipo de variáveis.
Variáveis qualitativas - nominais e ordinais
Iniciaremos essa apresentação com os dados de natureza qualitativa, que são os mais fáceis
de tratar do ponto de vista da análise descritiva.
Para organizar os dados provenientes de uma variável qualitativa, é usual fazer uma tabela
de freqüências, como a Tabela 1, onde estão apresentadas as freqüências com que ocorre cada um
dos grupos sanguíneos observados.
9
Tabela 1. Distribuições de freqüências de um grupo de indivíduos amostrados de uma população A,
segundo o grupo sanguíneo
Grupo
Sanguíneo
Freqüências
absolutas
Freqüências
relativas
Freqüências
percentuais
A 4 0,20 20%
B 6 0,30 30%
AB 5 0,25 25%
O 5 0,25 25%
Total (n) 20 1,00 100%
Note que a variável (grupo sanguíneo) é qualitativa nominal com quatro categorias (A, B,
AB e O). É interessante computar também, as freqüências absolutas, relativas e percentuais,
definidas a seguir:
Freqüência absoluta é o número de vezes que uma categoria da variável aparece em uma
experiência ou numa observação de caráter estatístico.
Freqüência relativa é a razão (divisão) da freqüência pelototal de observações (n):
n
absolutaFrequênciarelativaFrequência =
Freqüência percentual (%) é a freqüência relativa multiplicada por 100:
100×=
n
absolutaFrequência%percentualFrequência
Observação importante: A freqüência relativa ou a percentual são úteis na comparação de dois
conjuntos de dados distintos.
Exemplo: Compare os dados apresentados nas Tabelas 1 e 2.
Tabela 2. Distribuições de freqüências de um segundo grupo de indivíduos amostrados de uma
população B, segundo o grupo sanguíneo
Grupo
Sanguíneo
Freqüências
absolutas
Freqüências
relativas
Freqüências
percentuais
A 10 0,25 25%
B 10 0,25 25%
AB 8 0,20 20%
O 12 0,30 30%
Total (n) 40 1,00 100%
Note que o tamanho das amostras é diferente e, a freqüência absoluta de cada tipo sanguíneo
também. Neste caso, o correto é fazer a comparação com as freqüências relativas ou percentuais. No
caso do tipo AB, por exemplo, tem-se maior freqüência absoluta na amostra da população B. No
entanto, a freqüência relativa e percentual são maiores na população A.
Para as variáveis qualitativas ordinais a representação é semelhante, como exemplificado na
Tabela 3 para a variável altura.
10
Tabela 3. Distribuição de freqüências de alunos segundo categorias de altura
Categorias de
altura
Freqüências
absolutas
Freqüências
relativas
Freqüências
percentuais
alto 10 0,25 25%
médio 18 0,45 45%
baixo 12 0,30 30%
Total (n) 40 1,00 100%
É importante destacar que as tabelas não devem ter linhas verticais. Devem apresentar texto
na parte superior (cabeçalho) e, devem ser auto-explicativas (na medida do possível).
A visualização da distribuição de freqüências de uma variável fica mais fácil se fizermos um
gráfico a partir da tabela de freqüências. Para as variáveis do tipo qualitativas (nominal e ordinal),
abordaremos dois tipos de gráficos: gráficos de setores e gráficos de barras.
Os gráficos de setores, mais conhecidos como gráficos de pizza ou torta, são construídos
dividindo-se um círculo (pizza) em setores (fatias), um para cada categoria, que serão proporcionais
à freqüência daquela categoria.
Graficamente os dados contidos nas Tabelas 1 e 3 podem ser visualizados, respectivamente
nas Figuras 1 e 2.
Figura 1. Gráficos de setores da distribuição de freqüências de um grupo de indivíduos amostrados
de uma população A, segundo o grupo sanguíneo.
11
Figura 2. Gráfico de setores da distribuição de freqüência de alunos segundo categorias de altura.
Nas Figuras 3 e 4 pode-se observar os dados das Tabelas 1 e 3 representados em gráficos de barras.
Figura 3. Gráfico de barras para as distribuições de freqüências de um grupo de indivíduos
amostrados de uma população A, segundo o grupo sanguíneo.
12
Figura 4. Gráfico de barras da distribuição de freqüência de alunos segundo categorias de altura.
No gráfico de barras podem-se visualizar dados de amostras distintas. Assim, as Tabelas 1 e
2 podem ser visualizadas e comparas no mesmo gráfico, como exemplificado na Figura 5.
Figura 5. Gráfico de barras para as distribuições de freqüências de indivíduos amostrados de duas
populações, segundo o grupo sanguíneo.
No caso dos gráficos, o texto deve ser localizado, preferencialmente, na parte inferior da
figura.
Variáveis Quantitativas Discretas
Quando estamos trabalhando com uma variável quantitativa discreta que assume poucos
valores, podemos dar a ela o mesmo tratamento dado às variáveis qualitativas ordinais, assumindo
que cada valor é uma classe e que existe uma ordem natural nessas classes.
13
Assim, variáveis quantitativas discretas com poucas classes também são normalmente
representadas em tabelas de freqüência (Tabela 4) e gráficos de setores e barras.
Tabela 4. Distribuição de freqüências do número de filhos por família em uma localidade (25 lares)
Número
de
filhos
Freqüência
absoluta
Freqüência
percentual %
Freqüência
percentual
acumulada
Freqüência
percentual
acumulada inversa
0 1 4,0 4,0 100,0
1 4 16,0 20,0 96,0
2 10 40,0 60,0 80,0
3 6 24,0 84,0 40,0
4 2 8,0 92,0 16,0
5 2 8,0 100,0 8,0
Total 25 100 --- ---
Analisando a Tabela 4, pode-se perceber que as famílias mais freqüentes são as de dois
filhos (40%), seguida pelas famílias de três filhos.
Para variáveis quantitativas discretas, além das freqüências absolutas, relativa e percentual,
também é interessante computar a freqüência acumulada. A freqüência acumulada da à proporção
dos dados que superam um determinado valor, ou são inferiores a determinado valor.
No exemplo da Tabela 4 tem-se 60% das famílias com dois filhos ou menos e, 40% das
famílias com três a cinco filhos.
As freqüências absolutas dos dados da Tabela 4 estão representadas graficamente na Figura
6.
Figura 6. Número de filhos por família em 25 lares.
14
Quando trabalhamos com uma variável quantitativa discreta que pode assumir um grande
número de valores distintos como, por exemplo, o número de ovos que um determinado inseto põe
durante sua vida, a construção da tabela de freqüências e de gráficos considerando cada valor como
uma categoria fica inviável. A solução é agrupar os valores em classes. Esse procedimento será
abordado a seguir, juntamente com as variáveis quantitativas contínuas.
Variáveis Quantitativas contínuas
Analisando os dados da Tabela 5, verifica-se que não é possível efetuar o mesmo tipo de
tratamento dispensado aos dados qualitativos e aos dados quantitativos discretos com poucos
valores.
Tabela 5. Peso ao abate em uma amostra de 25 caprinos
Animal Peso ao abate em kg
1 9,0
2 9,5
3 9,7
4 10,9
5 11,5
6 12,0
7 14,5
8 15,0
9 16,0
10 17,0
11 17,5
12 17,6
13 18,0
14 18,3
15 18,4
16 18,5
17 18,9
18 19,0
19 20,0
20 21,0
21 23,0
22 24,0
23 28,0
24 29,0
25 34,0
Para uma análise gráfica mais apropriada, estes dados devem ser agrupados em classes de
valores (Tabela 6). A escolha do número de classes e do tamanho das classes depende da amplitude
dos valores a serem representados e da quantidade de observações no conjunto de dados. O
intervalo de classes deve ser preferencialmente igual.
15
Tabela 6. Distribuição de freqüências de classes do peso ao abate em kg obtido de uma amostra de
25 caprinos ao abate
Intervalos
de
Classes
Ponto
médio da
classe
Freqüência
absoluta
Freqüência
percentual
Freqüência
percentual
acumulada
Freqüência
percentual
acumulada
inversa
5 |— 10 7,5 3 12 12 100
10 |— 15 12,5 4 16 28 88
15 |— 20 17,5 11 44 72 72
20 |— 25 22,5 4 16 88 28
25 |— 30 27,5 2 8 96 12
30 |— 35 32,5 1 4 100 4
Total - 25 100 --- ---
Intervalos de classe muito grandes resumem demais a informação contida nos dados, pois
forçam a construção de poucas classes. Intervalos de classes muito pequenos levam a formação de
muitas classes, dificultando a observação gráfica.
O número de classes pode ser obtido pelo uso de algumas fórmulas ou pela experiência ou o
bom senso do pesquisador. Uma vez decidido pelo número de classes, pode-se obter o comprimento
de cada classe dado por:
k
Ac = onde A é a amplitude total, obtida pela diferença entre o maior e o menor valor observado e,
k é o número de classes estabelecido.
No exemplo da Tabela 5 a amplitude é A= 34 - 9 = 25. No entanto, pode-se considerar o
limite inferior como igual a 5 e o superior igual 35 para facilitar a interpretação. Assim, a amplitude
considerada é 30. Considerando K = 6, tem-se um intervalo de classe c= 5.
O símbolo ׀—indica que o limite inferior pertence a classe em questão e o limite superior
não pertence a esta classe.
O ponto médio de cada classe é obtido por:
Ponto médio de classe =
2
LSLI − onde LI e LS são, respectivamente, os limites inferior e superior
da classe cujo ponto médio pretende-se obter.
Os limites inferiores e superiores de cada classe dependem do tamanho (amplitude) de classe
escolhido, que deve ser, na medida do possível, igual para todas as classes. Isso facilita a
interpretação da distribuição de freqüências da variável em estudo.
Observação: a alteração ou não dos limites superior e inferior pode ficar a critério do
pesquisador.
16
As variáveis quantitativas contínuas agrupadas em classes são representadas graficamente
pelo histograma de freqüência e pelo polígono de freqüências (Figura 7). Obs.: As variáveis
quantitativas discretas com grande número de valores distintos também podem ser representadas
desta forma quando agrupadas em classes.
Histograma e Polígono de Frequência
0
2
4
6
8
10
12
2.5 7.5 12.5 17.5 22.5 27.5 32.5 37.5
Peso de Caprinos ao Abate em kg
Fr
eq
uê
nc
ia
A
bs
ol
ut
a
Figura 7. Histograma e polígono de freqüências absolutas do peso de caprinos ao abate em kg.
O histograma é semelhante ao gráfico de barras, com a altura de cada coluna correspondente
a freqüência da classe que ela representa e a base a amplitude de classe (comprimento de classe =
c).
O polígono de freqüências é constituído de segmentos de retas que unem os pontos médios
de cada classe de freqüência.
Observação importante: Quando os intervalos de classe são diferentes, deve-se utilizar a
densidade ao invés das freqüências na construção gráfica. A densidade é obtida por:
ervaloint
absolutafrequênciaabsolutadensidade =
ervaloint
relativafrequência
relativadensidade =
17
ervaloint
percentuafrequência
(%)empercentagemrelativadensidade =
As freqüências acumuladas dos dados da Tabela 6 estão representadas nos gráficos do tipo
ogiva (Figuras 8 e 9).
Ogiva de Frequência Percentual Acumulada
0
20
40
60
80
100
120
2.5 7.5 12.5 17.5 22.5 27.5 32.5
Peso de caprinos ao abate em kg
Fr
eq
uê
nc
ia
a
cu
m
ul
ad
a
(%
)
Figura 8. Freqüências acumuladas do peso de caprinos ao abate em kg
Ogiva de Frequência Percentual Acumulada (inversa)
0
20
40
60
80
100
120
2.5 7.5 12.5 17.5 22.5 27.5 32.5
Peso de caprinos ao abate em kg
Fr
eq
uê
nc
ia
a
cu
m
ud
a
in
ve
rs
a
(%
)
Figura 9. Freqüências acumuladas (inversa) do peso de caprinos ao abate em kg
A observação gráfica simultânea de duas variáveis quantitativas (x,y) também é interessante,
pois permite a visualização gráfica da associação (correlação) entre as duas variáveis. Estes gráficos
são chamados de diagrama de dispersão e serão abordados mais adiante.
18
1.5. Medidas de posição
Medidas de posição são aquelas que visam representar a tendência central de uma
distribuição, isto é, um valor em torno do qual os dados se distribuem.
Média aritmética
A média aritmética é uma medida de posição que pode ser utilizada para variáveis
quantitativas. Dado um conjunto de n observações X1, X2, X3, ..., Xn, define-se a média aritmética
por:
n
X
n
X...XXX
X
n
i
i
n
∑
1=321 =++++= (1)
Se os valores X1, X2, X3, ..., Xn ocorrem com as respectivas freqüências f1, f2, f3, ..., fn tem-
se a média aritmética ponderada:
∑
∑
1=
1=332211 =++++= n
i
i
n
i
ii
nn
f
Xf
n
Xf...XfXfXf
X (2)
Exemplo
Os dados abaixo se referem ao número de espigas em 22 plantas de milho-pipoca:
0 1 1 1 1 1 2 2 2 2 2 2 3 3 3 3 4 4 4 5 5 6
A média destes valores é obtida pela equação (1):
=22
6++1+1+0==
∑
1= ...
n
X
X
n
i
i
2,59
Tem-se uma média de 2,59 espigas por planta.
Estes valores podem ser apresentados em uma tabela de freqüência, como no exemplo a
seguir:
Número de espigas/planta Freqüência absoluta (fi)
0 1
1 5
2 6
3 4
4 3
5 2
6 1
Total 22
Neste caso a média pode ser obtida pela equação (2):
19
592=22
61++26+15+01==++++=
∑
∑
1=
1=332211 ,).(...).().().(
f
Xf
n
Xf...XfXfXf
X n
i
i
n
i
ii
nn
Esta média também é chamada de média ponderada, pois cada valor é ponderado por um
peso, que neste caso é a freqüência.
Propriedades da média aritmética
a) A soma algébrica dos desvios em relação à média aritmética é nula;
0=−=−=−= ∑∑∑
1=1=1=
XnXnXX)XX(SD
n
i
n
i
i
n
i
i
b) Somando-se ou subtraindo-se uma constante a cada um dos valores da série X1, X2, X3,
..., Xn, a média destes valores fica somada ou subtraída da constante; ;
kX
n
nkX
n
k
n
X
n
)kX(
n
i
n
i
i
n
i
i
±=±=±=
± ∑∑∑
1=1=1=
c) Multiplicando-se ou dividindo-se cada um dos valores da série X1, X2, X3, ..., Xn, a média
destes valores fica multiplicada ou dividida pela constante;
X.k
n
X
k
n
kX
k
XX.
kn
X
kn
k
X
n
i
i
n
i
i
n
i
i
n
i
i
==
=1=1=
∑∑
∑∑
1=1=
1=1=
d) A soma de quadrados dos desvios (SQD) em relação a média é um mínimo;
∑
1=
2−=
n
i
i )XX(SQD é um mínimo
Seja ∑
1=
2
00 −=
n
i
i )XX()X(f
∑ ∑∑
1= 1=
0
1=
00 2+2−=1−−2=
n
i
n
i
i
n
i
i XX)()XX()X('f
nnXXXX'f)X(''f
X
n
X
X
nXXXXXX)X('f
n
i
oi
n
i
n
i
i
n
i
i
o
n
i
i
n
i
n
i
i
n
i
n
i
i
2=2+2−=⎟⎠
⎞⎜⎝
⎛ 2+2−=
==
=⇒=⇒0=2+2−⇒0=
∑∑ ∑
∑
∑∑ ∑∑ ∑
1=1= 1=
00
1=
1=
0
1= 1=
0
1= 1=
00
20
Logo, tem-se um ponto de mínimo para o valor de X0 = média.
Moda
A moda de um conjunto de dados é o valor que ocorre com maior freqüência.
Por exemplo: Considere o seguinte conjunto de observações:
2, 4, 3, 4, 1, 1, 2, 2,
Neste caso a moda é 2 (Mo = 2), que é o valor que ocorre com maior freqüência.
Considere agora a seguinte distribuição de freqüência de tipos sanguíneos:
Tipos Sanguíneos
A B AB O
Freqüência Absoluta 10 13 8 14
Neste caso a moda é o tipo sanguíneo O, que ocorre com maior freqüência.
Nestes dois exemplos têm-se séries unimodais, ou seja, possuem uma única moda. Quando
uma série possui mais de uma moda ela é dita multimodal e, quando não possui moda é dita
amodal.
Note que no primeiro exemplo a variável é quantitativa discreta e no segundo a variável é
qualitativa. Para variáveis quantitativas contínuas pode-se obter a moda quando os dados são
agrupados em classes ou, obtendo-se o ponto de máximo da função de freqüência, como no
exemplo a seguir.
Considere a seguinte função de freqüência: f(x) = X – X 2
Derivando-se esta função e igualando a zero, se obtém um ponto de máximo ou mínimo.
f’(x) = 1 – 2x
f’(x) = 0
1 – 2x = 0 → x = ½
Este ponto será um máximo se a segunda derivada for negativa e um mínimo se a segunda
derivada for positiva.
f”(x) = -2
Como a segunda derivada é negativa, o ponto x = ½ é de máximo.
Mediana
A mediana de um conjunto de dados ordenados em ordem crescente ou decrescente de
grandeza é o valor abaixo e acima do qual se tem a metade dos dados. Assim, a mediana divide o
conjunto ordenado em duas partes com igual número de dados.
Há dois casos a considerar:
21
a) n é impar: a mediana será o valor que ocupa a posição 2
1+Pn de um rol estatístico.
Ex.: 5, 4, 2, 6, 3, 7, 9; n = 7
rol.: 2, 3,4, 5, 6, 7, 9
4=2
1+7=2
1+ PPPn , ou seja, P4 = elemento do rol que ocupa a quarta posição = 5
b) n é par: a mediana será a média dos valores que ocupam as posições 2
Pn e 2
2+ )n(P de um
rol estatístico.
Ex.: 7, 6, 1, 4, 8, 9, 3, 2; n = 8
rol.: 1, 2, 3, 4, 6, 7, 8, 9
6+4=5+4=2
2++2 PP
)n(PPn , a mediana é a média dos valores que ocupam a posição 4
e 5. Assim, Med = (4+6)/2=5.
A mediana é uma medida de posição, em geral, menos informativa que a média, pois só
considera os ranques (postos ou posições) das observações e não o valor, como faz à média. No
entanto, em algumas ocasiões à mediana pode ser mais vantajosa pelo fato de não ser afetada pelos
extremos. Considere o exemplo a seguir:
1 2 3 4 5 6 7 8 9 10 11
Note que a média e a mediana deste conjunto de dados é igual a 6. Vamos supor agora o
seguinte conjunto de dados onde ocorreu um valor extremo:
1 2 3 4 5 6 7 8 9 10 40
Note que a mediana não foi alterada, continua sendo igual a 6. No entanto, a média neste
caso é igual a 8,64 devido ao valor extremo igual a 40.
A mediana também tem a vantagem de poder ser aplicada a variáveis qualitativas ordinais.
1.6. Medidas de dispersão
As medidas de dispersão medem a variabilidade dos dados. Entre as várias medidas
existentes veremos apenas as mais importantes.
Variância
A variância mede a variabilidade dos dados em torno da média. Dada uma amostra de n
valores X1, X2, X3, ..., Xn define-se a variância de x por:
1−==== 22 nGL;
GL
SQDSσˆ)X(V
22
1−
−
===
∑
1=
2
22
n
)XXi(
Sσˆ)X(V
n
i
∑ ∑
1= 1=
222 +2−=−=
n
i
n
i
ii )XXXX()XXi(SQD
Aplicando propriedades do somatório tem-se:
n
X
X
n
Xn
n
XX
X
XnX.
n
X
XXXXXSQD
n
i
in
i
i
n
i
i
n
i
i
n
i
in
i
i
n
i
i
n
i
in
i
i
n
i
n
i
i
n
i
i
2
1=
1=
2
2
2
1=1=1=
1=
2
2
1=
1=
1=
2
1=
2
1=1=
2
⎟⎠
⎞⎜⎝
⎛
−=
⎟⎠
⎞⎜⎝
⎛
+
⎟⎠
⎞⎜⎝
⎛⎟⎠
⎞⎜⎝
⎛2
−
+2−=+2−=
∑∑∑∑∑∑
∑∑∑∑∑∑
Se os valores X1, X2, X3, ... Xn ocorrem com as respectivas freqüências f1, f2, f3,..., fn a soma
de quadrados dos desvios será:
SQD =
∑
∑∑
1=
2
1=
1=
2
⎟⎠
⎞⎜⎝
⎛
− n
i
i
n
i
iin
i
ii
f
Xf
Xf
Assim, a variância de um conjunto de dados quantitativos pode ser obtida por:
1−
⎟⎠
⎞⎜⎝
⎛
−
=
2
1=
1=
2
2
∑∑
n
n
X
X
S
n
i
in
i
i
(3)
Se os dados estão organizados em tabelas de freqüência a variância pode ser obtida por:
1−⎟⎠
⎞⎜⎝
⎛
⎟⎠
⎞⎜⎝
⎛
−
=
∑
∑
∑∑
1=
1=
2
1=
1=
2
2
n
i
i
n
i
i
n
i
iin
i
ii
f
f
Xf
Xf
S (4)
Exemplo
Considerando novamente os dados que se referem ao número de espigas em 22 plantas de milho-
pipoca:
0 1 1 1 1 1 2 2 2 2 2 2 3 3 3 3 4 4 4 5 5 6
A variância destes valores é obtida pela equação (3):
23
442=1−22
22
57−6++1+1+0
=1−
⎟⎠
⎞⎜⎝
⎛
−
=
2
2222
2
1=
1=
2
2
∑∑
,
)(...
n
n
X
X
S
n
i
in
i
i
Estes valores podem ser apresentados em uma tabela de freqüência, como no exemplo a
seguir:
Número de espigas/planta Freqüência absoluta (Fi)
0 1
1 5
2 6
3 4
4 3
5 2
6 1
Total 22
Neste caso a variância pode ser obtida pela equação (4):
442=1−22
22
57−61++26+15+01
=
1−⎟⎠
⎞⎜⎝
⎛
⎟⎠
⎞⎜⎝
⎛
−
=
2
2222
1=
1=
2
1=
1=
2
2
∑
∑
∑∑
,
).(...).().().(
f
f
Xf
Xf
S
n
i
i
n
i
i
n
i
iin
i
ii
Propriedades da variância
a) Variância de uma constante (k) é igual a zero: V(k) = 0.
b) Somando-se ou subtraindo-se uma constante a cada um dos valores da série, a variância
não se altera: )X(V)kX(V =± .
c) Multiplicando-se ou dividindo-se cada um dos valores da série por uma constante, a
variância fica multiplicada ou dividida pelo quadrado da constante.
2
2 =⎟⎠
⎞⎜⎝
⎛=
k
)X(V
k
XV);X(Vk)kX(V
Desvio Padrão
O desvio padrão é simplesmente a raiz quadrada da variância, obtido por:
)X(VSσˆ ==
O desvio padrão para o número de espigas/planta de milho-pipoca é:
561=442== ,,Sσˆ
24
Observação
A unidade de medida da variável que se estima a variância fica elevada ao quadrado, assim,
por exemplo, uma medida em metros (m) fica m2. No desvio padrão a variável ficaria em m.
Erro Padrão da Média
É uma medida de dispersão que mede a precisão da média aritmética. Quanto menor o
desvio padrão e maior a amostra, menor é o erro padrão da média e mais precisa será a média.
A equação que nos dá essa relação é:
n
)X(S)X(S =
O erro padrão da média para o número de espigas/planta de milho-pipoca é:
330=22
561== ,,
n
)X(S)X(S
Coeficiente de Variação
O coeficiente de variação é uma medida de dispersão relativa. Sua vantagem é o fato de ser
uma medida adimensional, assim, independe das unidades usadas e é importante para comparar a
dispersão de amostras de médias ou unidades de medida diferentes.
O coeficiente de variação é obtido pela razão do desvio padrão pela média:
100= x
X
)X(S(%)CV
O coeficiente de variação para o número de espigas/planta de milho-pipoca é:
%,x
,
,(%)CV 3160=100592
561=
Observação importante
Para comparar duas amostras com relação a homogeneidade, temos dois casos a considerar:
a) As médias das amostras são iguais BA XX = . Neste caso a mais homogênea é aquela que
possui a menor variância, desvio padrão ou coeficiente de variação. Qualquer destas medidas pode
ser utilizada.
b) Se as médias de duas amostras são diferentes, ou ainda, se as duas amostras possuem
unidades de medida diferente, deve-se utilizar o coeficiente de variação. Assim, a amostra de menor
coeficiente de variação é a mais homogênea.
25
1.7. Medidas de correlação
As medidas de correlação medem o grau de associação entre duas variáveis.
Por exemplo:
altura da planta x peso de grãos
tempo de treinamento x rendimento do atleta
quantidade de adubo x produtividade
Note que, em todos estes exemplos, as variáveis são quantitativas. Nestes casos pode-se
obter um valor que nos dá o grau de associação entre duas variáveis. A medida em questão é
chamada de correlação de Pearson e, pode ser obtida pela seguinte equação:
YXn
i
i
n
i
i
n
i
ii
xy SQD.SQD
)Y,X(SPD
)YY(.)XX(
)YY)(XX(
)Y(Vˆ).X(Vˆ
)Y,X(VOˆCr =
−−
−−
== 2
1=
2
1=
1=
∑∑
∑
onde
n
YX
YX)Y,X(SQP
n
i
i
n
i
in
i
ii
⎟⎠
⎞⎜⎝
⎛⎟⎠
⎞⎜⎝
⎛
−=
∑∑∑ 1=1=
1=
n
X
XSQD
n
i
in
i
iX
2
1=
1=
2
⎟⎠
⎞⎜⎝
⎛
−=
∑∑
n
Y
YSQD
2n
1i
in
1i
2
iY
⎟⎠
⎞⎜⎝
⎛
−=
∑∑ =
=
O valor da correlação ( xyr ) entre duas variáveis varia de -1 a 1. Quando o valor é positivo,
uma variável cresce e a outra, em média, também cresce. Isto é, as duas variáveis variam no mesmo
sentido. Quando o valor é negativo uma variável cresce e a outra, em média, decresce. Neste caso as
variáveis variam em sentido contrário. Quando a correlação é nula as variáveis não estão
relacionadas.
Exemplo
Os dados a seguir referem-se a altura média AP (m) e a produtividade de grãos PG (g) de 8
famílias de milho-pipoca.
26
Variáveis Família AP (m) PG (g)
1 2,08 627
2 2,22 913
3 2,21 1391
4 2,02 903
5 1,90 655
6 1,99 786
7 1,98 625
8 1,94 975
Neste caso podem-se fazer as seguintes perguntas:
Será que a altura de plantas esta correlacionada coma produtividade?
Será que plantas mais altas são mais produtivas?
Neste caso, se a correlação for positiva, ou seja, o valor obtido estiver no intervalo entre 0 e
1, pode-se concluir que, em geral, plantas mais altas são mais produtivas. Quanto mais a correlação
se aproxima de 1, maior é a correlação, ou seja, tem-se uma tendência mais acentuada de plantas
mais altas serem mais produtivas.
Para obter o valor da correlação vamos utilizar a fórmula a seguir:
YX
xy SQD.SQD
)Y,X(SPDr =
n
YX
YX)Y,X(SPD
n
i
i
n
i
in
i
ii
⎟⎠
⎞⎜⎝
⎛⎟⎠
⎞⎜⎝
⎛
−=
∑∑∑ 1=1=
1=
9117414=975941++913212+627082=∑
1=
,.).,(...).,().,(YX
n
i
ii
∑
1=
3516=941++212+082=
n
i
i ,),...,,(X
∑
1=
8756=975++913+627=
n
i
i .)...(Y
( )( ) 13124=8
87563516−9117414= ,.,,.)Y,X(SPD
n
X
XSQD
n
i
in
i
iX
2
1=
1=
2
⎟⎠
⎞⎜⎝
⎛
−=
∑∑
5133=941++212+082=∑
1=
2222 ,),(...),(),(X
n
i
i
27
( ) 0950=8
3516−5133=
2
,,,SQDX
n
Y
YSQD
n
i
in
i
iY
2
1=
1=
2
⎟⎠
⎞⎜⎝
⎛
−=
∑∑
0593656=975++913+627=∑
1=
2222 ..)(...)()(Y
n
i
i
( ) 856456=8
8756−0593656=
2
....SQDY
( )( ) 600=208
13124=8564560950
13124== ,,
..,
,
SQD.SQD
)Y,X(SPDr
YX
xy
Portanto, a altura de planta esta correlacionada com a produtividade. Como o valor é
positivo (0,60), pode-se dizer que existe uma tendência de magnitude razoável de plantas mais altas
serem mais produtivas.
Se o valor fosse negativo (-0,60) ter-se-ia tendência de plantas mais baixas serem mais
produtivas. Se o valor fosse zero ou de próximo de zero, a tendência seria nula ou muito baixa.
A correlação pode ser visualizada em gráficos chamados de diagrama de dispersão. Os
gráficos abaixo representam os valores de duas variáveis (X,Y) plotados no eixo cartesiano:
a) correlação positiva (0,99) b) correlação negativa (-0,99) c) ausência de correlação (0,00)
1.8. Regressão linear simples
Como abordado anteriormente, duas variáveis quantitativas podem apresentar diferentes
níveis de associação ou, muitas vezes, nem estarem associadas. A simples existência de associação
indica que uma variável pode estar influenciando à outra em uma relação de causa e efeito. Por
28
exemplo, considere o gráfico de dispersão abaixo em que as duas variáveis estão muito
correlacionadas (0,99).
Esta relação pode indicar uma influencia de causa e efeito da variável X sobre a variável Y.
Suponha que X seja a quantidade de determinado fertilizante e Y a produtividade de determinada
cultura. Assim, a influencia de causa e efeito do adubo sobre a produtividade poderia ser
quantificada. Note que o gráfico indica uma resposta linear e, portanto, pode-se adotar um modelo
linear para quantificar a resposta da produção em relação à quantidade de adubo. O modelo
matemático em questão, já bastante conhecido, é a equação da reta:
y = a + bx
Note que para cada quantidade de adubo (x), ter-se-ia uma resposta em y. Se a quantidade de
adubo fosse igual à zero, ainda assim haveria produção. Neste caso y = a.
No entanto, a equação apresentada trata-se de um modelo matemático (exato). Para
representar os dados utilizaremos um modelo estatístico dado por:
y = a + bx + erro
Este modelo é equivalente a:
iioi eXββY ++= 1
Este é um modelo estatístico que representa uma relação linear de causa e efeito entre duas
variáveis quantitativas. O coeficiente oβ nada mais é do que o coeficiente linear da reta (a). O
coeficiente 1β nada mais é do que o coeficiente angular da reta (b), também chamado de regressor.
Então, a diferença do modelo estatístico para o matemático é a consideração do erro (ei) no modelo
estatístico. Como a produtividade depende de outros fatores (chuva, ataque de pragas, etc) além da
quantidade de adubo, a resposta não é perfeitamente linear. Assim, a influencia de variáveis
desconhecidas é quantificada no erro.
29
Para ficar mais claro esta abordagem, vejamos o exemplo a seguir, onde se tem a
produtividade de milho em função de diferentes quantidades de adubo (dados hipotéticos):
NPK em kg/ha Produção de milho em kg/ha
0 5.230
50 5.980
100 6.210
150 7.450
200 8.123
250 8.756
300 9.020
350 9.800
400 9.899
450 10.330
Note que, parece haver uma relação entre as variáveis, ou seja, quanto maior a quantidade de
adubo, maior é a produtividade. Realmente, a correlação de Pearson para estes dados é de 0,986.
Analisando o gráfico abaixo, também se pode visualizar que a associação é linear e sugere um tipo
de ralação de causa e efeito entre as variáveis.
Portanto, o modelo estatístico que representa estes dados é:
iioi eXββY ++= 1
Assim, o objetivo da regressão é obter o melhor modelo (matemático) que se ajuste aos
dados, que é aquele que minimiza a soma de quadrados dos erros (ei). Este método é denominado
método dos mínimos quadrados. Para obter o modelo ajustado, podem-se adotar os seguintes
passos:
a) Isolar o erro (ei) na equação: ioii XββYe 1−−=
b) Elevar ambos os membros da equação ao quadrado: ( )212 −−= ioii XββYe
c) Aplicar somatório: ( )∑∑
1=
2
1
1=
2 −−=
n
i
ioi
n
i
i XββYe
30
d) Derivar a equação em relação a βo e β1 e igualar a zero:
( ) ( )
( ) ( )⎪⎪
⎪
⎩
⎪⎪
⎪
⎨
⎧
0=−−⇒0=−−−2⇒0=∂
∂
0=−−⇒0=1−−−2⇒0=∂
∂
∑∑∑
∑∑∑
1=
1
1=
1
1
1=
2
1=
1
1=
1
0
1=
2
n
i
iioi
n
i
iioi
n
i
i
n
i
ioi
n
i
ioi
n
i
i
)X(XβˆβˆY)X(XβˆβˆY
β
e
XβˆβˆY)(XβˆβˆY
β
e
e) Aplicar propriedades do somatório:
⎪⎪⎩
⎪⎪⎨
⎧
0=−−⇒0=−−
0=−−⇒0=−−
∑ ∑ ∑∑∑∑
∑ ∑ ∑∑∑
1= 1= 1=
2
1
1=
0
2
1=
1
1=
0
1= 1= 1=
10
1=
1
1=
0
n
i
n
i
n
i
i
n
i
iiii
n
i
n
i
iii
n
i
n
i
n
i
iii
n
i
n
i
i
XβˆXβˆXYXβˆXβˆXY
XβˆβˆnYXβˆβˆY
⎪⎪⎩
⎪⎪⎨
⎧
+=
+=
∑ ∑∑
∑ ∑
1= 1=
2
1
1=
0
1= 1=
10
n
i
n
i
i
n
i
iii
n
i
n
i
ii
XβˆXβˆXY
XβˆβˆnY
f) Resolver o sistema resultante obtendo 0βˆ e 1βˆ :
∑ ∑
∑ ∑ ∑
1=
2
1=2
1=
1= 1=
1
⎟⎠
⎞⎜⎝
⎛
−
−
=
n
i
n
i
i
i
n
i
n
i
n
i
ii
ii
n
X
X
n
YX
YX
βˆ
XβˆY
n
X
βˆ
n
Y
βˆ
n
i
i
n
i
i
1
1=
1
1=
0 −=−=
∑∑
Assim, parte-se de um modelo estatístico e obtém-se um modelo matemático, que é a
equação ajustada dada por:
ii XβˆβˆYˆ 10 +=
Esta equação é equivalente a equação da reta y = a + bx.
Agora podemos aplicar estes conhecimentos nos dados de adubação e produção do milho e
obter uma equação que melhor se ajusta aos dados. O primeiro passo é a obtenção dos seguintes
valores:
2502=450++100+50+0=∑
1=
.)...(X
n
i
i
31
79880=33010++2106+9805+2305=∑
1=
.).......(Y
n
i
i
20059520=10330450++6210100+598050+52300=∑
1=
..)*(...)*()*()*(YX
n
i
ii
500712=450++100+50+0= 2222
1=
2∑ .)(...)()()(Xn
i
i
5000625=2502=⎟⎠
⎞⎜⎝
⎛ 22
1=
∑ ..).(Xn
i
i
225=X
80798= ,.Y
Agora é só utilizar as fórmulas obtidas pelas derivadas parciais para estimar os valores de βo
e β1.
( )( )
7111=
10
5000625−500712
10
798802502−20059520
=
⎟⎠
⎞⎜⎝
⎛
−
−
=
∑ ∑
∑ ∑ ∑
1=
2
1=2
1=
1= 1=
1 ,...
....
n
X
X
n
YX
YX
βˆ
n
i
n
i
i
i
n
i
n
i
n
i
ii
ii
055445=2257111−88079=−=−= 11=11=0
∑∑
,*,,XβˆY
n
X
βˆ
n
Y
βˆ
n
i
i
n
i
i
Omodelo ajustado ( ii XβˆβˆYˆ 10 += ) fica:
ii X,,Yˆ 7111+055445=
Assim, para cada acréscimo em uma unidade de X, tem-se um acréscimo de 11,71 unidades
em Y, ou seja, para cada 1 kg/ha de adubo (NPK), tem-se um acréscimo de 11,71 kg/ha na produção
de milho. Se a quantidade de adubo for igual à zero, a produtividade é igual a 5445,05 kg/ha.
Colocando todos os valores de X na equação e obtendo os respectivos valores de Y, obtém-se a reta
do gráfico abaixo, que é aquela que melhor se ajusta aos dados:
32
Observações importantes:
Aqui foi apresentado apenas o modelo de uma regressão linear simples. Isso porque a
variável resposta Y esta em função de apenas uma variável (X). Quando a variável resposta (Y) esta
em função de duas ou mais variáveis, em um modelo linear, tem-se os modelos de regressão linear
múltipla. No entanto, nem sempre a natureza de uma interação é linear. Para estes casos existem
outros tipos de regressão, como a regressão quadrática, cúbica, exponencial etc.
A equação ajustada só deve ser utilizada para valores de X do intervalo avaliado, ou seja,
neste exemplo os valores de X devem ficar entre 0 e 450. Para melhor entendermos esta colocação,
vamos raciocinar o seguinte. Suponha que sejam aplicadas quantidades de adubo superior a 450
kg/ha. Pode-se pensar que a produtividade irá aumentar. Porém, não sabemos a natureza da resposta
neste caso, pois ela não foi avaliada. Uma quantidade de adubo acima de 450 kg/ha pode acarretar
uma resposta nula, não linear ou até mesmo negativa. Portanto, não é adequado prever valores de Y
fora do intervalo de valores de X utilizados para a obtenção da equação ajustada.
Duas variáveis podem ter correlação aproximadamente nula e terem uma relação de causa e
efeito. Estes casos não foram abordados aqui, como por exemplo, a regressão polinomial quadrática
representada abaixo, onde a correlação é -0,04:
33
Exercícios – Estatística Descritiva
Somatório
1) Obter o número de termos para os seguintes somatórios:
∑ =8 3) i iXa
∑ ≠=15 11,93) ii iXb
Respostas
a) 6 e; b) 11
2) Seja uma variável X, assumindo os seguintes valores:
X = {5, 2, 3, 0, 1, 2, 6, 9, 4, 8} n = 10 Calcule:
∑10
1=i
iX)a
2
10
1
)∑
=i
iXb
210
1
) ⎟⎠
⎞⎜⎝
⎛∑
=i
iXc
110
10)
210
12
10
1
−
⎟⎠
⎞⎜⎝
⎛
−
∑∑ =
=
i
i
i
i
X
X
d
)4()
10
1
−∑
=i
iXe
2
10
1
)4() −∑
=i
iXf
110
)4(
)
2
10
1
−
−∑
=i
iX
g
10
)
10
1
∑
=i
iX
h
Respostas
a) 40; b) 240; c) 1600; d) 80/9; e) 0; f) 80; g) 80/9 e; h) 4
3) Calcule X1 e X3, dado que:
∑
=
=
6
1
42
i
iX
∑
=
=
6
1
2 364
i
iX
∑
≠=
=
6
3,1
1
34
i
i
iX
∑
≠=
=
6
3,1
1
2 324
i
i
iX
Respostas
X1 = 6 e X3 = 2 ou X1 = 2 e X3 = 6
4) Sabendo-se que ∑
=
−=
5
1
6
i
iX e ∑
=
=
5
1
2 12
i
iX , calcule:
∑
=
+
5
1
)54()
i
iXa
∑
=
−
5
1
)2()
i
ii XXb
2
5
1
)3()∑
=
−
i
iXc
Respostas
a) 1; b) 24 e; c) 93
34
Tipos de variáveis,tabelas de freqüência e gráficos
1) Um pesquisador solicita a sua equipe que coletem os seguintes dados sobre 14 leitões recém
nascidos:
a) Peso de leitões ao nascer e; b) sexo dos leitões.
Como você classificaria cada uma destas variáveis?
Qual a sua sugestão de análise gráfica para cada uma destas variáveis?
2) Um professor pede a seus estagiários que coletem os seguintes dados de plantas de feijão:
a) Altura da planta em cm; b) número de vagens por planta; c) peso de grãos de cada planta
(g/planta); d) ciclo (tempo, em dias, da germinação até a colheita) e; d) cor da flor. Pede-se:
Como você classificaria cada uma destas variáveis?
Qual a sua sugestão de análise gráfica de cada uma destas variáveis?
4) Qual das seguintes amostras (A e B) tem maior porcentagem de mulheres infectadas pelo vírus
HPV?
Amostra da população A: 400 mulheres (113 HPV positivo; 287 HPV negativo).
Amostra da população B: 300 mulheres (97 HPV positivo; 203 HPV negativo).
R. População B tem maior porcentagem de mulheres infectadas.
4) Um grande produtor de leite do interior de Minas Gerais avaliou a genealogia de 200 fêmeas e
classificou-as em relação a pureza genética (sem raça definida (SRD); meio-sangue Pardo-Suíço e
pura Pardo-Suíço). O produtor obteve os seguintes números: 22 SRD, 44 meio-sangue e 134 de raça
pura. Apresente estes dados em uma tabela de freqüência com as seguintes informações: Freqüência
absoluta, freqüência relativa e freqüência percentual.
5) Complete a tabela abaixo.
Número de
leitões/parto
Freqüência
absoluta (Fi)
Freqüência
percentual
Freqüência
percentual
acumulada
Freqüência
percentual acumulada
(inversa)
9 3
10 4
11 7
12 3
13 2
14 1
Total 20
35
6) Os gráficos abaixo correspondem às notas de alunos(as) de agronomia da UFMA na primeira
prova de Introdução a Estatística.
Com as informações contidas nestes gráficos complete as seguintes tabelas:
Notas Ponto Médio
Freqüência
absoluta
Freqüência
percentual
Freqüência
percentual
acumulada
Freqüência
percentual
acumulada
(inversa)
45 ׀─ 50
50 ׀─ 55
55 ׀─ 60
60 ׀─ 65
65 ׀─ 70
70 ׀─ 75
75 ׀─ 80
80 ׀─ 85
85 ׀─ 90
90 ׀─ 95
95 ׀─ 100
Total
Notas Ponto Médio
Freqüência
absoluta
Freqüência
percentual
Freqüência
percentual
acumulada
Freqüência
percentual
acumulada
(inversa)
40 ׀─ 50
50 ׀─ 60
60 ׀─ 70
70 ׀─ 80
80 ׀─ 90
90 ׀─ 100
Total
36
Com as informações contidas nestes gráficos e tabelas responda as seguintes perguntas:
a) Qual o número de alunos(as) com nota abaixo de 70?
b) Qual a porcentagem de alunos(as) com notas abaixo de 70?
c) Qual o número de alunos(as) com nota acima de 90?
d) Qual a porcentagem de alunos(as) com nota entre 70 e 80?
e) Qual a porcentagem de alunos(as) com nota entre 85 e 90?
f) Qual dos dois gráficos é mais informativo? Justifique sua resposta.
Medidas de posição, dispersão e correlação
1) Os dados abaixo se referem às medidas tomadas em uma amostra de 10 cães:
Cão 1 2 3 4 5 6 7 8 9 10
Peso (kg) 23,0 22,7 21,2 21,5 17,0 28,4 19,0 14,5 18,9 19,5
Comprimento (cm) 104,1 105,1 103,0 105,0 100,1 104,0 100,0 91,0 102,0 99,0
Para as características avaliadas (peso e comprimento) pede-se:
a) Média;
b) Variância;
c) Desvio-padrão;
d) Erro padrão da média;
e) Coeficiente de variação;
f) Qual das duas características é mais homogênea;
g) Mediana;
h) Coeficiente de correlação entre as duas características;
i) Compare o valor da média e da mediana de cada característica;
Respostas
Estatística Peso (kg) Comprimento (cm)
Média 20,57 kg 101,33 cm
Variância 14,33 kg2 17,91 cm2
Desvio-padrão 3,79 kg 4,23 cm
Erro padrão da média 1,20 kg 1,33 cm
Coeficiente de variação 18,41 % 4,18 %
Mediana 20,35 kg 102,50 kg
Correlação 0,77
2) Um pesquisador dispõe das seguintes informações, a respeito dos valores de uma amostra:
- a média de todos os valores é igual a 50,34;
- a soma dos quadrados dos valores é igual a 150.000;
- a amostra é constituída de 52 valores distintos.
Pergunta-se:
Com essas informações é possível obter alguma medidade dispersão dos valores amostrais? Em
caso afirmativo, efetue os cálculos e obtenha alguma medida.
Resposta
S2 = 357,37; S = 18,90; CV(%) = 37,55%
37
3) Duas turmas A e B com nA =50 e nB = 80 apresentaram médias de 65=AX e 70=BX e
variâncias Var (A) = 225 e Var (B) = 235. Qual é a turma mais homogênea.
Resposta: A turma B é mais homogênea.
4) O quadro abaixo contém o número de leitões/parto em uma amostra de 20 partos ocorridos
durante o ano de 2006 em uma suinocultura.
Número de leitões/parto Freqüência Absoluta (Fi)
9 3
10 4
11 7
12 3
13 2
14 1
Total 20
Pede-se:
Qual a média de leitões/parto? Resposta: 11 leitões
Qual o número de leitões/parto mais freqüente (moda)? Resposta: 11 leitões
Qual é a mediana? Resposta: 11 leitões
Compare o valor da média, da mediana e da moda.
Obtenha a variância. Resposta: S2 = 1,90
5) Foram amostrados cinco produtores de milho. A área plantada de cada produtor foi 2, 5, 10, 35 e
75 hectares. A produtividade média/hectare de cada produtor foi de 3000, 4000, 5000, 6000 e 7000
kg. Pergunta-se:
Qual a média de hectares plantados com milho? Resposta: 25,4 hectares.
Qual a média de produtividade dos produtores amostrados? Respostas: 5000 kg/ha.
Qual a média de produtividade por hectare plantado? Resposta: 6386 kg/ha.
Regressão linear simples
1) Qual a diferença entre um modelo matemático e estatístico?
2) Os dados abaixo se referem aos pesos ao nascer (X) e peso na desmama (Y) de 6 bezerros da raça
guzerá.
X Y
25,3 48,4
26,9 49,7
26,5 49,2
27,4 50,0
27,9 50,6
25,8 48,7
a) Obtenha a equação ajustada para estes dados. Resposta: ii X,,Yˆ 84210+004927=
b) Plote os pontos da tabela acima em um diagrama de dispersão.
c) No mesmo gráfico da letra b, plote os pontos de X e Y a partir da equação ajustada.
38
Capítulo II
Probabilidade
39
2.1. Introdução
A probabilidade teve sua origem no século XVI. As aplicações iniciais referem-se
principalmente aos jogos de azar. Mesmo hoje há muitas aplicações que envolvem jogos de azar
como as loterias e corridas de cavalo, etc.
Atualmente a teoria das probabilidades é utilizada por governos, empresas, pesquisadores
etc, nas mais diversas áreas. Independente de qual seja a aplicação, a probabilidade nos dá uma
quantificação da chance de ocorrência ou não de um evento futuro. Assim, pode-se utilizar a teoria
das probabilidades para prever a chance de uma pessoa contrair determinada doença, fazer
previsões do tempo e prever as chances de uma criança nascer com determinado defeito.
Para melhor entendermos a aplicação da teoria das probabilidades, primeiramente vejamos
alguns conceitos.
2.2. Conceitos
A Probabilidade é o estudo de experimentos aleatórios ou não determinísticos.
Experimentos determinísticos:
São aqueles que, repetidos sob as mesmas condições dão resultados, em geral, idênticos.
Como por exemplo, um experimento onde se avalia o teor de proteína de determinado produto.
Experimentos aleatórios:
São aqueles que repetidos sob as mesmas condições dão resultados, em geral, distintos.
Como por exemplo, um experimento onde uma moeda é lançada dez vezes e o número de caras é
observado. Note que cada vez que for repetido o mesmo experimento, em geral, o resultado será
diferente.
Espaço amostral (S)
É o conjunto de resultados possíveis de um experimento aleatório. O espaço amostral pode
ser classificado em:
Finito
Número limitado de elementos.
Exemplo.: Considere o lançamento de um dado. Assim, podem ocorrer seis resultados:
S = {1, 2, 3, 4, 5, 6}
Infinito
Número ilimitado de elementos. Pode ser subdividido em:
a - Enumerável
40
É o caso das variáveis aleatórias discretas, como por exemplo, jogar uma moeda infinitas
vezes e observar o número de caras. Note que é possível enumerar os possíveis resultados em um
determinado intervalo.
b - Não Enumerável
É o caso de variáveis aleatórias contínuas. Neste caso existem infinitos resultados em
qualquer intervalo.
Evento (E)
Um evento (E) é qualquer subconjunto de um espaço amostral (S).
Considere como exemplo o seguinte experimento aleatório: Selecionar, ao acaso, três peças de uma
linha de produção. Classificar cada item conforme ele seja perfeito ou defeituoso:
P = perfeito;
D = defeituoso
O espaço amostral (S) neste caso será:
S = {PPP, PPD, PDP, PDD, DDD, DPD, DDP, DPP}
Assim, um evento (E) pode ser qualquer subconjunto de S. Vamos considerar os eventos A e
B a seguir:
A = retirar duas peças defeituosas: A = {PDD, DPD, DDP}
B = retirar três peças defeituosas B = {DDD}.
2.3. Probabilidade de um evento
A probabilidade de um evento A, em que todos os resultados possíveis do espaço amostral
(S) são igualmente prováveis pode ser obtida por:
)S(possíveisresultadosdetotalnúmero
)A(eventoaofavoráveisresultadosdenúmero)A(P =
Considere o exemplo em que um dado é lançado. Qual a probabilidade de ocorrer o número
5?
Neste caso o evento A = {5} é um subconjunto do espaço amostral S = {1, 2, 3, 4, 5, 6}. A
probabilidade é obtida pelo conceito clássico de probabilidade apresentado acima:
6
1==
)S(possíveisresultadosdetotalnúmero
)A(eventoaofavoráveisresultadosdenúmero)A(P
Considere agora a probabilidade de lançar o dado e ocorrer um número par. Neste caso o
evento A = {2, 4, 6}. A probabilidade é novamente obtida pelo conceito clássico de probabilidade:
50=2
1=6
3== ,
)S(possíveisresultadosdetotalnúmero
)A(eventoaofavoráveisresultadosdenúmero)A(P
2.4. Probabilidade de dois ou mais eventos (teorema do produto)
Acima foi apresentada a forma de obter a probabilidade de ocorrência de um evento A
qualquer. Aqui vamos conhecer uma maneira de obter a probabilidade de ocorrência de eventos
41
simultâneos ou em seqüência. Sejam A1, A2, A3, ..., An n eventos independentes. Então, a
probabilidade destes eventos ocorrerem simultaneamente ou em seqüência é:
)A(P....).A(P).A(P).A(P)Ae...eAeAeA(P nn 321321 =
Pode-se representar também pela seguinte notação:
)A(P....).A(P).A(P).A(P)A...AAA(P nn 321321 =∩∩∩∩
O símbolo ∩ significa interseção. Para melhor exemplificar, vamos considerar o diagrama
de Venn abaixo:
Neste diagrama a área do retângulo representa o espaço amostral S e a área dos círculos A1 e
A2 representam dois subconjuntos que são os eventos A1 e A2 respectivamente. A área sobreposta
representa um subconjunto onde A1 e A2 ocorrem simultaneamente, ou seja, A1 interseção A2, que é
representado por 21 ∩ AA . Assim, a probabilidade de ocorrer A1 e A2 simultaneamente pode ser
obtida por:
)A(P).A(P)AeA(P)AA(P 212121 ==∩
Exemplo 1. Considere que a probabilidade de um casal ter uma criança albina seja igual a
1/4 e, a probabilidade de nascer menina seja igual a 1/2. Assim, a probabilidade de nascer uma
menina albina é:
8
1=2
1
4
1==∩ 2121 .)AeA(P)AA(P
onde:
A1 é o evento “nascer uma criança albina” e;
A2 é o evento “nascer uma menina”.
Exemplo 2. Considere o lançamento de uma moeda três vezes. Qual a probabilidade de
ocorrer três caras?
A probabilidade de ocorrer uma cara é 0,5. Então, a probabilidade de ocorrer três caras, pelo
teorema do produto é:
8
1=2
1
2
1
2
1==∩∩ 321321 ..)eAAeA(P)AAA(P
A2 A1 A1∩A2
S
42
A probabilidade de ocorrer quatro caras em quatro lançamentos de uma moeda é:
16
1=2
1
2
1
2
1
2
1=∩∩∩ 4321 ...)AAAA(P
Estes eventos são independentes, ou seja, a probabilidade da ocorrência de um evento não
depende da ocorrência de outro. No entanto, em alguns casos, a probabilidadede ocorrência de um
evento depende da ocorrência de outro. Então, a probabilidade de ocorrência de n eventos
dependentes A1, A2, A3, ..., An é obtida por:
)Ae...eAeAeA/A(P....).AeA/A(P).A/A(P).A(P)Ae...eAeAeA(P nnn 1−321213121321 =
ou
)A...AAA/A(P....).AA/A(P).A/A(P).A(P)A...AAA(P nnn 1−321213121321 ∩∩∩∩∩=∩∩∩∩
em que, por exemplo, P(A2/A1) é a probabilidade do evento A2 ocorrer dado que o evento A1 tenha
ocorrido, onde:
)A(P
)AA(P
)A(P
)AA(P)A/A(P
1
12
1
21
12
∩=∩= (teorema da probabilidade condicional)
Exemplo 3. Considere que a probabilidade de um casal ter uma criança com determinada
doença é 3/4 se for menino e 1/4 se for menina. Então, qual é a probabilidade nascer uma criança
doente e do sexo masculino?
Neste caso vamos estipular que o evento A1 é o nascimento de um menino e o evento A2 é a
ocorrência da doença. Como a ocorrência da doença depende do sexo, os eventos são dependentes e
o calculo da probabilidade deve ser feito da seguinte forma:
8
3=4
3
2
1==∩ 12121 .)A/A(P).A(P)AA(P
Exemplo 4. Em uma determinada região, 30% dos produtores plantaram milho, 20%
plantaram soja e 10% plantaram soja e milho. Um produtor é amostrado aleatoriamente.
Vamos considerar que:
P(A1) = probabilidade de amostrar um produtor que plantou milho = 0,30
P(A2) = probabilidade de amostrar um produtor que plantou soja = 0,20
P(A1 e A2) = P(A1 ∩ A2) = probabilidade de amostrar um produtor que plantou milho e soja =
0,10
a) Se ele planta soja, qual a probabilidade de ter plantado milho?
Pelo teorema da probabilidade condicional temos que:
2
1=200
100=∩=
2
21
21 ,
,
)A(P
)AA(P
)A/A(P
b) Se ele planta milho, qual a probabilidade de ter plantado soja?
43
Pelo teorema da probabilidade condicional temos que:
3
1=300
100=∩=
1
12
12 ,
,
)A(P
)AA(P)A/A(P
Note que a probabilidade P(A1 e A2) foi fornecida. Caso ela não tivesse sido fornecida, poder-
se-ia calcular P(A1 e A2) = P(A1) . P(A2) = 0,3 . 0,2 = 0,06. Este seria o valor esperado que, nem
sempre coincide com o valor observado.
2.5. Eventos disjuntos ou mutuamente exclusivos
Eventos disjuntos ou mutuamente exclusivos são eventos que não podem ocorrer
simultaneamente ou em seqüência, ou seja, 0=∩ 21 )AA(P .
Como exemplo, considere o diagrama de Venn abaixo:
Note que os eventos A1 e A2 não podem ocorrer simultaneamente (não existe sobreposição
entre os dois subconjuntos). Neste caso é dito que os dois eventos são mutuamente exclusivos ou
disjuntos.
Considere que o evento A1 no diagrama acima seja o subconjunto relativo ao número de
pessoas com a doença X e, o evento A2 o número de pessoas com a doença Y, em um espaço
amostral S onde S – A1 – A2 fornece o número de pessoas sadias. Considere que a doença X só
ocorre em homens e a doença Y só ocorre em mulheres. Então, as duas doenças não podem ocorrer
simultaneamente em um mesmo indivíduo e, portanto, os dois subconjuntos não se sobrepõem,
sendo que, a probabilidade 0=∩ 21 )AA(P .
2.6. Probabilidade de um evento satisfeito por vários outros (teorema da soma)
Vamos considerar que os eventos A1 e A2 são subconjuntos de indivíduos com a doença X e
Y, respectivamente. Considere que os eventos são não disjuntos, ou seja, existe a probabilidade de
ocorrência da doença X e Y simultaneamente. Logo, a probabilidade de ocorrência dos eventos A1
ou A2 pode ser obtida por:
Evento A1
Evento A2
S
44
)AeA(P)A(P)A(P)AouA(P 212121 −+=
Note que usamos “ou” no lugar de “e”. Portanto, a probabilidade a ser obtida é a ocorrência
de A1 ou de A2. Neste caso pode-se substituir “ou” pelo símbolo ∪ , que significa união, onde a
probabilidade acima fica:
)AA(P)A(P)A(P)AA(P 212121 ∩−+=∪
Observe novamente, com a ajuda do diagrama de Venn abaixo, que os eventos podem
ocorrer simultaneamente. Porém, o que se quer é a probabilidade de ocorrer A1 ou A2. Note que a
área da interseção 21 ∩ AA é incluída duas vezes no calculo da probabilidade
)A(P)A(P)AA(P 2121 +=∪ e, portanto, é necessário fazer a subtração, obtendo o calculo correto
dado por: )AA(P)A(P)A(P)AA(P 212121 ∩−+=∪ .
Exemplo 5. Vamos considerar o exemplo em que a probabilidade de nascer menino (A1) é igual a
1/2 e a probabilidade de nascer albino (A2) é igual a 1/4. Então, qual é a probabilidade de uma
criança recém nascida ser menino ou albina?
85=81−41+21=∩−+=∪ 212121 ////)AA(P)A(P)A(P)AA(P
Exemplo 6. Em uma determinada região, 30% dos produtores plantaram milho, 20% plantaram soja
e 10% plantaram soja e milho. Um produtor é amostrado aleatoriamente. Qual a probabilidade de
ter plantado somente soja ou somente milho?
Vamos considerar que:
P(A1) = probabilidade de amostrar um produtor que plantou milho = 0,30
P(A2) = probabilidade de amostrar um produtor que plantou soja = 0,20
P(A1 e A2) = P(A1 ∩ A2) = probabilidade de amostrar um produtor que plantou milho e soja =
0,10
Então, a probabilidade do produtor amostrado ter plantado somente soja ou somente milho é:
400=100−200+300=∩−+=∪ 212121 ,,,,)AA(P)A(P)A(P)AA(P
Vamos considerar agora a ocorrência de 3 eventos não disjuntos. No diagrama de Venn este
eventos ficam:
A2 A1 A1∩A2
S
45
:
Para obter a probabilidade de ocorrência de A1 “ou” A2 “ou” A3 devem-se somar as três
probabilidades P(A1) + P(A2) + P(A3). No entanto, neste caso a probabilidade de cada interseção
dois a dois é somada duas vezes e deve ser subtraída. No entanto, com este procedimento “elimina-
se” a probabilidade da interseção tripla. Portanto, a mesma deve ser somada, obtendo-se o seguinte
calculo de probabilidade:
)AAA(P)AA(P)AA(P)AA(P)A(P)A(P)A(P)AAA(P 321323121321321 ∩∩+∩−∩−∩−++=∪∪
Para obter a probabilidade de três ou mais eventos o calculo fica bem mais complicado. No
entanto, se n eventos A1, A2, A3, ..., An são disjuntos, ou seja, não existem interseções, a
probabilidade seria obtida simplesmente por:
)A(P...)A(P)A(P)A(P)A...AAA(P nn ++++=∪∪∪∪ 321321
Exemplo 7. Considere que, em um determinado nascimento, a criança tenha 1/2 de probabilidade
de apresentar a doença X e tenha 1/4 de probabilidade de apresentar a doença Y. Considere que as
mesmas não podem ocorrer simultaneamente. Qual seria a probabilidade de ocorrência da doença X
ou Y?
43=41+21=+=∪ 2121 ///)A(P)A(P)AA(P
Exemplo 6. Considere o lançamento de um dado. Qual a probabilidade de sair 1 ou 4 ou 5?
Considere que:
P(A1) = probabilidade de sair 1 = 1/6
P(A2) = probabilidade de sair 4 = 1/6
P(A3) = probabilidade de sair 5 = 1/6
Como são eventos disjuntos, pelo teorema da soma temos:
63=61+61+61=++=∪∪ 321321 ////)A(P)A(P)A(P)AAA(P
A2
A1
S
A1∩A2A3∩A2
A3∩A1
A1∩A2∩A3
A3
46
2.7. Teorema da probabilidade total
Considere agora um evento B em S, representado no digrama de Venn abaixo pelo círculo. E
considere também n eventos A1, A2, A3, ..., An como partição do espaço amostral S, satisfazendo as
seguintes condições: i) 0=∩ 21 )AA(P ; ii) SA
n
i
i =∑
1=
e; iii) P(Ai)>0.
Então, pelo teorema da probabilidade total, a probabilidade de B pode ser obtida pela soma
das probabilidades das interseções .BAi ∩ Assim, tem-se a probabilidade de B dada por:
)BA(...)BA()BA()BA()B(P n ∩++∩+∩+∩= 321 (1)
Pelo teorema da probabilidade condicional temos que:
)A(P
)BA(P)A/B(P
1
1
1
∩=
Assim, isolando )BA(P ∩1 temos que:
)A(P).A/B(P)BA(P 111 =∩
Aplicando em todas as interseções da equação (1), temos que:
)A(P).A/B(P)BA(P 111 =∩
)A(P).A/B(P)BA(P 222 =∩
)A(P).A/B(P)BA(P 333 =∩
47
.
.
.
)A(P).A/B(P)BA(P nnn =∩
)A(P).A/B(P...)A(P).A/B(P)A(P).A/B(P)A(P).A/B(P)B(Pnn++++= 332211
∑
1=
=
n
i
ii )A(P).A/B(P)B(P
2.8. Teorema de Bayes
O teorema de Bayes envolve o conhecimento dos teoremas da probabilidade condicional e
total, apresentados anteriormente. Então, vamos considerar novamente n eventos A1, A2, A3, ..., An
como partição do espaço amostral S, satisfazendo as seguintes condições: i) 0=∩ 21 )AA(P ; ii)
SA
n
i
i =∑
1=
e; iii) P(Ai)>0. Pelo teorema da probabilidade condicional temos que:
=∩ )BA(P i )A(P).A/B(P)B(P).B/A(P iii =
Então:
)B(P
)BA(P)B/A(P ii
∩=
Pelo teorema da probabilidade total temos que:
)A(P).A/B(P...)A(P).A/B(P)A(P).A/B(P)A(P).A/B(P)B(P nn++++= 332211
Então, obtém-se o teorema de Bayes dado por:
)A(P).A/B(P...)A(P).A/B(P)A(P).A/B(P)A(P).A/B(P
)A(P).A/B(P
)B(P
)BA(P
)B/A(P
nn
iii
i ++++=
∩=
332211
ou
∑
=
=∩= n
1i
ii
iii
i
)A(P).A/B(P
)A(P).A/B(P
)B(P
)BA(P)B/A(P
Para exemplificar, considere uma fábrica onde as máquinas A, B e C produzem,
respectivamente, 30%, 25% e 45% do total. A porcentagem de defeitos nas peças produzidas pelas
máquinas A, B e C é, respectivamente, 1%, 1,2% e 2%. Retirou-se uma peça ao acaso. Qual a
probabilidade da peça ser da maquina C sendo que a peça é defeituosa?
Aplicando o teorema de Bayes temos que:
48
)A(P).A/B(P...)A(P).A/B(P)A(P).A/B(P)A(P).A/B(P
)A(P).A/B(P
)B(P
)BA(P
)B/A(P
nn
iii
i ++++=
∩=
332211
Adaptando para o exemplo:
)C(P).C/D(P)B(P).B/D(P)A(P).A/D(P
)C(P).C/D(P)D/C(P ++=
5
3=15
9=0150
0090=450020+2500120+300010
450020=
,
,
,.,,.,,.,
,.,)D/C(P
49
Exercícios
1 – Em uma fazenda, 25% dos animais possuem uma verminose do tipo A, 15% possuem uma
verminose do tipo B e 10% possuem as duas verminoses. Um animal é amostrado aleatoriamente.
a) Qual a probabilidade de possuir a verminose A ou B? R.: 0,30
b) Se ele possui a verminose B, qual a probabilidade de possuir a verminose A? R.: 2/3
c) Se ele possui a verminose A, qual a probabilidade de possuir a verminose B? R.: 2/5
2 – Extraem-se aleatoriamente duas cartas de um baralho comum de 52 cartas. Determine a
probabilidade de serem ambas ases se a primeira carta é reposta (com reposição), e de serem ambas
ases se a primeira carta não é reposta. (Obs. o baralho tem 4 ases). R.: 1) 1/169 ; 2) 1/221
3 – Uma moeda é lançada 3 vezes. Qual a probabilidade de ocorrer?
a) Três caras? R.:1/8
b) Três caras ou três coroas? R.: 1/4
c) Uma cara? R.: 3/8
d) Ocorrer uma cara e duas coroas nesta ordem? R.: 1/8
e) Sair primeiro uma cara seguida de duas coroas ou sair primeiro uma coroa seguida de duas caras?
R.: 2/8
f) Pelo menos uma cara? R.: 7/8
4– Em uma placa de petri, 40%, 50% e 10% do total são bactérias do tipo A, B e C,
respectivamente. De cada tipo, 3%, 5% e 2%, respectivamente, são patogênicas. Pede-se:
a) Qual a probabilidade de retirar, ao acaso, uma bactéria patogênica? R.: 0,039
b) Sabendo que a bactéria é patogênica, qual a probabilidade de que ela seja do tipo B? R.:
0,64 ou 64%
5 – A urna 1 contém três fichas vermelhas e duas fichas azuis. A urna 2 contém duas fichas
vermelhas e oito azuis. Joga-se uma moeda “honesta”. Se a moeda der “cara”, extrai-se uma ficha
da urna 1; se der “coroa”, extrai-se uma ficha da urna 2. Determine a probabilidade de escolha de
uma ficha vermelha. R.: 2/5
6 – Definir e dar exemplos de:
a) Eventos mutuamente exclusivos
b) Eventos independentes
c) Espaço amostral
7 – Uma urna contém 2 bolas pretas e 3 vermelhas. Foram extraídas 3 bolas com reposição. Pede-
se:
a) Represente o espaço amostral deste experimento aleatório.
b) Qual a probabilidade de terem sido duas bolas pretas e uma vermelha? R.: 0,288
c) Qual a probabilidade de terem sido três bolas pretas? R.: zero
50
8 – Suponha-se que a probabilidade de que um vigia noturno num navio com luzes apagadas
descubra um periscópio em certas condições de tempo é de 0,7. Se um outro vigia similar for
incluído, pede-se:
a) Qual é a probabilidade do vigia A e o vigia B encontrar o periscópio?R.: 0,49
b) Qual é a probabilidade do vigia A ou o vigia B encontrar o periscópio? R.: 0,91
9 - Em uma suinocultura com 200 animais, tem-se 150 fêmeas e 50 machos. Tem-se também, 4
animais doentes, sendo 3 doentes machos e 1 fêmea. Comprando um animal ao acaso, qual a
probabilidade do animal:
a) ser macho R.: 1/4
b) ser fêmea R.: 3/4
c) estar doente R.: 1/50
d) estar doente e ser macho R.: 3/200
e) Um macho foi comprado. Qual a probabilidade do animal estar doente? R.: 3/50
f) Uma fêmea foi comprada. Qual a probabilidade do animal estar doente? R.: 1/150
g) Querendo evitar a compra de um animal doente, você compraria uma animal macho ou fêmea?
Justifique a sua resposta.
10 - O histograma de freqüências absolutas abaixo demonstra a produtividade média de feijão (t/ha)
em 160 propriedades do triângulo mineiro:
Utilizando as informações nele contidas responda as seguintes perguntas:
a) Qual a probabilidade de sortear ao acaso uma propriedade com produtividade média abaixo
de 1.0 t/ha? R.: 1/16
b) Qual a probabilidade de sortear ao acaso uma propriedade com produtividade média acima
de 2.5 t/ha? R.: 1/4
c) c) Qual a probabilidade de selecionar ao acaso uma propriedade com produtividade entre de
1.5 e 2.5 t/ha? R.: 9/16
51
Capítulo III
Distribuições
de
Probabilidades
52
3.1. Variáveis aleatórias
Quando uma variável esta associada a uma probabilidade ela é chamada de variável
aleatória. Portanto, os valores assumidos pelas variáveis aleatórias estão relacionados a
experimentos aleatórios.
Por exemplo: Considere o nascimento de 10 crianças onde será observada a variável
qualitativa “sexo”. Trata-se de um experimento aleatório onde a variável “sexo” apresenta 2
categorias distintas (masculino e feminino) associadas a uma probabilidade de ocorrência.
As variáveis aleatórias podem ser discretas ou contínuas.
Variável aleatória discreta
Uma variável aleatória é discreta quando o número de valores possíveis for finito ou infinito
numerável. Em geral, os seus valores são obtidos mediante alguma forma de contagem.
Como exemplo de variável aleatória discreta, pode-se citar o número de acidentes ocorridos
em uma semana, o número de defeitos por peça, o número de filhos do sexo masculino por casal e o
número de caras em 10 lançamentos de uma moeda. Note que, no caso da moeda, se o número de
lançamentos for infinito, o número de caras também será infinito.
Variável aleatória contínua
Uma variável aleatória é contínua quando assumir infinitos valores em determinado
intervalo. São, em geral, variáveis obtidas por alguma medida. São exemplos de variáveis aleatórias
contínuas, o peso de bebês ao nascer, a altura de plantas de soja, feijão e milho, a pressão arterial,
etc.
Note que o peso de dois bebês pode ser o mesmo em uma ficha médica. Porém, esse fato é
devido a limitações da balança, pois não existem dois bebês com pesos exatamente idênticos. Essa
diferença de peso pode chegar a níveis infinitamente pequenos, sendo este fato característico de
uma variável aleatória contínua.
3.2. Distribuições de probabilidade de variáveis aleatórias
Estudar a forma como uma variável aleatória se distribui é importante para podermos obter
uma função que caracteriza a distribuição. Portanto, serão apresentadas a seguir, funções que
caracterizam as distribuições de variáveis aleatóriasdiscretas e contínuas mais comuns.
3.2.1. Principais distribuições de variáveis aleatórias discretas
Distribuição Binomial
A distribuição Binomial também é conhecida como seqüência de Bernoulli, nome este em
homenagem a seu criador, Jacques Bernoulli.
53
É uma forma de distribuição de probabilidade adequada aos experimentos aleatórios que
apresentam apenas dois resultados (sucesso ou fracasso). Como por exemplo, o número de caras em
10 lançamentos de uma moeda. Note que, têm-se apenas dois resultados, ou seja, o fracasso relativo
à coroa e, o sucesso relativo à cara.
Esta distribuição caracteriza-se pelos seguintes eventos:
1) Realiza-se n provas independentes e do mesmo tipo. Por exemplo, o lançamento de uma moeda
10 vezes.
2) Cada prova admite dois resultados (sucesso ou fracasso). Por exemplo, pode-se considerar que no
lançamento de uma moeda cara é sucesso e coroa fracasso.
Assim, tem-se a probabilidade de sucesso em cada prova igual a p e a de fracasso em cada
prova igual a 1-p = q. A função de probabilidade que caracteriza esta distribuição é:
YX q.p.
!Y!X
!n)X(P =
onde:
n é o número de provas ou observações;
X é o número de sucessos e;
Y é o número de fracassos que é igual a n - X.
Esta função nos dá a probabilidade de um número X de sucessos P(X), em um número n de
provas. Assim, vamos considerar o seguinte exemplo:
Qual a probabilidade de, em uma ninhada de 12 cachorros, nascerem 4 machos? Então,
vamos considerar o nascimento de filhote macho como sucesso e filhote fêmea como fracasso. O
número de sucessos X será igual a 4 e o número de fracassos Y igual a 8. A probabilidade de nascer
macho é p= 0,5 e de nascer fêmea é q = 0,5. O número de “provas” n é igual ao tamanho da
ninhada, ou seja, igual a 12. Identificado cada termo da equação temos:
12090=21495=5081234
891012=505084
12== 121284 ,)/.(,.
!....
!...,.,.
!!
!q.p.
!Y!X
!n)X(P YX
Portanto, a probabilidade de nascer 4 machos em uma ninhada de 12 filhotes é P(X) =
0,1209.
Vamos abordar este assunto de outra forma. Considere agora o nascimento de quatro
cachorros (n = 4). Então, qual a probabilidade de nascerem 2 machos? Neste caso, podem ocorrer as
seguintes seqüências:
M M F F M F M F M F F M
F M F M F M M F F F M M
A probabilidade de ocorrer cada uma destas seqüências é:
P(M M F F ) = ½ . ½ . ½ . ½ .=1/16
54
P(M F M F) = ½ . ½ . ½ . ½ .=1/16
P(M F F M) = ½ . ½ . ½ . ½ .=1/16
P(F M F M) = ½ . ½ . ½ . ½ .=1/16
P(F M M F) = ½ . ½ . ½ . ½ .=1/16
P(F F M M) = ½ . ½ . ½ . ½ .=1/16
Voltemos agora ao Capítulo II onde foi abordado o teorema da soma. Note que, a
probabilidade de, em quatro nascimentos nascerem 2 machos é satisfeita por seis eventos. Assim,
pode-se escrever esta probabilidade da seguinte forma:
P(nascerem 2 machos em uma ninhada de quatro filhotes) =
= P(M M F F ou M F M F ou M F F M ou F M F M ou F M M F ou F F M M) =
= 1/16 + 1/16 + 1/16 + 1/16 + 1/16 + 1/16 = 6 . (1/16) = 6/16
Uma maneira prática de obter o número de eventos possíveis é:
6=22
4=
!!
!
!Y!X
!n
Assim, voltemos à função de probabilidade apresentada anteriormente para resolver esta
questão de forma mais prática. Esta função é especialmente útil quando o número de provas ou
observações é muito elevado.
161=506=505022
4== 422 /,.,.,.
!!
!q.p.
!Y!X
!n)X(P YX
Outros exemplos de distribuição binomial são: mastite (positivo/negativo), resultado de um
jogo (vitória/derrota), efeito de um veneno (fatal/não fatal), etc.
Distribuição Multinomial
A distribuição multinomial resulta da generalização da Binomial. No caso da distribuição
multinomial o espaço amostral é repartido em k eventos A1, A2, A3, ..., Ak independentes com
probabilidades p1, p2, p3, ..., pk. Então, em n provas, a probabilidade de que A1 ocorra X1 vezes, A2,
ocorra X2 vezes, A3 ocorra X3 vezes, ... e Ak ocorra Xk vezes é:
Xk
k
XXX
k
kk p.....p.p.p.!X!...X!X!X
!n)AX...AXAXAX(P 33
2
2
1
1
321
332211 =∩∩∩∩
Note que a diferença em relação a binomial é apenas quanto ao número de categorias da
variável. No caso da binomial a variável é dicotômica, ou seja, apresenta apenas duas categorias.
55
Por exemplo: macho/fêmea; cara/coroa; doente/não doente, etc. No caso da multinomial o número
de categorias é superior a duas.
A distribuição multinomial é muito utilizada em análises genéticas onde se tem três ou mais
categorias. Então, vamos considerar o seguinte exemplo:
Suponha que a probabilidade de um casal de Labradores gerar filhos amarelos, pretos e
vermelhos é 9/16, 6/16 e 1/16 respectivamente. Na genética, as diferentes categorias ou níveis de
uma característica são chamados de fenótipos. Então, a variável qualitativa “cor da pelagem de
labrador” apresenta três fenótipos ou categorias. Neste caso, a distribuição multinomial é adequada
e seria possível responder a seguinte pergunta:
Qual a probabilidade de, em uma cria de 10 filhotes, nascerem 1 amarelo, 1 preto e 8
vermelhos?
09−11−
811
10424=1091490=⎟⎠
⎞⎜⎝
⎛
16
1⎟⎠
⎞⎜⎝
⎛
16
6⎟⎠
⎞⎜⎝
⎛
16
9
811
10=8∩1∩1 x,x,....
!!!
!)vermelhospretoamarelo(P
Note que a probabilidade é bastante baixa, pois este resultado contraria todas as expectativas. Então,
consideremos uma ninhada mais provável, por exemplo, o nascimento de 6 filhotes amarelos, 3
pretos e 1 vermelho:
090=10041840=⎟⎠
⎞⎜⎝
⎛
16
1⎟⎠
⎞⎜⎝
⎛
16
6⎟⎠
⎞⎜⎝
⎛
16
9
136
10=1∩3∩6 4−
136
,x,....
!!!
!)vermelhopretosamarelos(P
Note que a probabilidade foi bem mais elevada.
Outros exemplos de distribuição multinomial são os grupos sanguíneos em uma amostra n
da população, três ou mais fenótipos em uma descendência n (como no exemplo acima) e os
diferentes valores obtidos ao lançar o dado n vezes.
Distribuição de Poisson
Vamos considerar agora uma variável que é obtida através de contagens, como por exemplo,
o número de acidentes em determinado local em determinado tempo. Neste caso, pode-se contar o
número de acidentes que aconteceram, mas não é possível contar o número de acidentes que não
ocorreram. Outra característica é que o número de acidentes é bastante baixo. Estas características
ocorrem em variáveis aleatórias discretas que possuem a chamada distribuição de Poisson.
Então, resumidamente, uma variável que possui distribuição Poisson é obtida por contagem
de um fenômeno raro. Por este fato, a distribuição de Poisson é conhecida classicamente por lei dos
fenômenos raros.
São exemplos de distribuição de Poisson:
número de defeitos por cm2
56
número de acidentes por dia
número anual de suicídios
número de fetos nascidos com determinado defeito
A função de probabilidade de uma variável com distribuição Poisson é:
!x
μ.e)X(P
xμ−
=
onde:
x é o número de sucessos (defeitos, acidentes, suicídios, etc);
e é a base dos logaritmos neperianos e ≈ 2,718;
µ é a média da distribuição.
Exemplos:
1 - Considere uma indústria com média de 3 acidentes por mês. Então, qual seria a
probabilidade de:
a) Ocorrer 10 acidentes no próximo mês.
≈10
3==
103−−
!
.e
!x
μ.e)X(P
xμ
8,10 x 10-4 ≈ 0,00081 ≈ 0,08%
Note que a probabilidade de ocorrer um número de acidentes muito acima da média é baixo,
menos de 1%.
b) Ocorrer 2 acidentes no próximo mês.
%,,
!
.e
!x
μ.e)X(P
xμ
422≈2240≈2
3==
23−−
Ocorrer dois acidentes é muito mais provável (22,4%) por ser próximo à média.
c) Ocorrer 10 acidentes nos próximos 6 meses.
Como a média de acidentes em um mês é 3, então, a média de acidentes em 6meses é igual
a 18.
%,,
!
.e
!x
μ.e)X(P
xμ
51≈0150≈10
18==
1018−−
2 – Para uma determinada marca de lâmpada, de cada 4000, 2 se queimam, em média, ao
serem ligadas. Qual a probabilidade de:
a) Oito lâmpadas queimarem ao serem ligadas 4000 lâmpadas?
57
4−
82−−
10598≈8
2== x,
!
.e
!x
μ.e)X(P
xμ
b) Nenhuma queimar ao serem ligadas 4000 lâmpadas?
13530≈0
2==
02−−
,
!
.e
!x
μ.e)X(P
xμ
c) Cinco queimarem ao serem ligadas 6000 lâmpadas?
1010≈5
3==
53−−
,
!
.e
!x
μ.e)X(P
xμ
3 – Estima-se em 1% a proporção de canhotos em uma população.
a) Qual a probabilidade de termos dois canhotos em uma turma de 30 alunos?
Se a proporção é de 1% de canhotos, espera-se que, em uma turma de 30 alunos se tenha
0,01 x 30 = 0,3 canhotos. Então:
0330≈2
30==
230−−
,
!
,.e
!x
μ.e)X(P
,xμ
b)Qual a probabilidade de termos pelo menos um canhoto em uma classe de 30 alunos?
Neste caso, é só fazer 1 – probabilidade de não ter nenhum canhoto.
Probabilidade de não ter nenhum canhoto é:
7410≈0
30==
030−−
,
!
,.e
!x
μ.e)X(P
,xμ
P(pelo menos um canhoto) = 1 – 0,741 = 0,259
Outras distribuições
Outras distribuições menos comuns de variáveis aleatórias discretas são: Binomial negativa,
Beta-binomial, etc.
3.2.2 Principais distribuições de variáveis aleatórias contínuas
Distribuição Normal
É uma das mais importantes distribuições de probabilidades, sendo aplicada em inúmeros
fenômenos e constantemente utilizada para o desenvolvimento teórico da inferência estatística.
Também é conhecida como distribuição de Gauss, Laplace ou Laplace-Gauss.
58
Uma variável aleatória contínua x que tem distribuição normal possui a seguinte função de
probabilidade, chamada neste caso de “função densidade de probabilidade” (f.d.p.), apresentada a
seguir:
0〉∞〈〈∞−∞〈〈∞−2
1= 2
−
2
1−
σex,μparae
πσ
)x(f σ
)μx(
onde:
2σ é a variância de x;
μ é a média de x.
Quando a variável x tem distribuição aproximadamente normal com média µ e variância σ2,
representam-se estas características pela seguinte notação:
x ~ N(µ, σ2)
A representação gráfica de uma variável com distribuição normal é apresentada na Figura 1:
Figura 1. Distribuição de probabilidade para dados hipotéticos de altura em centímetros.
Neste gráfico, o eixo das abscissas contém os valores da variável x e, o eixo das ordenadas
contém valores de probabilidade.
As propriedades da distribuição normal são:
59
1) f(x) possui um ponto de máximo para x = µ;
2) f(x) tem dois pontos de inflexão cujas abscissas valem µ + σ e µ - σ;
3) f(x) é simétrica em relação a x = µ (µ = Mo = Md);
4) f(x) tende a zero quando x tende para ± ∞ .
A propriedade 1 é obtida derivando f(x) e igualando a zero. O valor obtido será um máximo
se a segunda derivada de f(x) for menor que zero. O ponto de máximo obtido com estas derivações
é x = µ.
A propriedade 2 é obtida igualando a segunda derivada de f(x) a zero, ou seja, f’’(x) = 0. O
valor obtido é um ponto de inflexão. No caso são dois pontos, µ + σ e µ - σ.
Os valores em torno da média variam conforme a variância. Na Figura 2 pode-se observar
graficamente quatro situações com diferentes valores de variância com média constante.
Figura 2. Distribuições de probabilidade para dados hipotéticos de altura em centímetros,
com mesma média e diferentes variâncias.
60
Deve-se destacar que a área sob a curva nos dá valores de probabilidade. Como os valores
de probabilidade variam de 0 a 1, a área total sobre a curva representa o valor 1, ou seja, a
probabilidade de ocorrer um valor de x entre - ∞ e + ∞ é igual a 1. Então, qual seria a
probabilidade de ocorrer um valor de x entre - ∞ e µ? Esta resposta é muito fácil, pois a
distribuição é simétrica. Então, metade dos valores de x são encontrados acima e, a outra metade
abaixo da média (µ). Assim, a probabilidade de ocorrer um valor de x entre - ∞ e µ é igual a 0,5.
Vamos abordar agora uma questão um pouco mais difícil. Qual a probabilidade de ocorrer
um valor entre - ∞ e x1? Considere x1 um valor qualquer entre - ∞ e µ. Para obter este valor de
probabilidade acumulada, ou seja, a probabilidade de ocorrer qualquer valor entre - ∞ e x1, deve-se
calcular a área sob a curva entre - ∞ e x1. Assim, integra-se a f(x) entre - ∞ e x1 e obtém-se o valor
de probabilidade acumulada.
A função em questão é chamada de função de distribuição acumulada, apresentada a seguir:
dxe
πσ
)x(f
x
σ
)μx(
∫1 2
∞−
−
2
1−
2
1=
Assim, a integração de f(x) em um determinado intervalo nos dá a probabilidade de ocorrer
um valor de x dentro do intervalo. No entanto, o calculo da probabilidade de uma variável aleatória
contínua em determinado intervalo é complicado por dois motivos:
1) A integração de f(x) é uma operação matematicamente complicada;
2) A elaboração de valores tabelados é inviável, pois a função depende de dois parâmetros
(µ e σ2), o que acarreta o estabelecimento de todas as possíveis combinações de valores
destes parâmetros. (Para cada valor de µ e σ2 há uma distribuição normal diferente,
tornado difícil à tabulação de todas estas distribuições).
Para facilitar a obtenção de valores de probabilidade, podem-se padronizar os valores de f(x),
obtendo a distribuição normal reduzida apresentada a seguir:
Distribuição normal reduzida ou padrão (Z)
Como comentado anteriormente, a obtenção dos valores de probabilidade de uma variável
com distribuição normal é um processo muito difícil e trabalhoso. A distribuição normal
padronizada (Z) obtém os valores de probabilidade de uma variável aleatória contínua com
distribuição normal de maneira bastante facilitada.
A padronização consiste em atribuir um valor Z a equação (x - µ)/σ, ou seja:
61
σ
)μx(Z −=
Assim, a seguinte função densidade de probabilidade acumulada é obtida:
2−
2
2
1=
Z
e
π
)z(f
Note que, obter valores de probabilidade para a variável Z é uma tarefa bem mais simples.
Assim, construiu-se uma tabela onde valores obtidos para Z correspondem a uma probabilidade.
Com valores de x, µ, e σ pode-se obter valores de Z e, a partir dos valores de Z, obter valores de
probabilidade acumulada em tabela própria.
A distribuição normal padrão caracteriza-se por apresentar media igual a zero e variância
igual a 1, ou seja, Z ~ N(0, 1). Na Figura 3 pode-se observar graficamente a distribuição normal
padrão.
Figura 3. Visualização gráfica de uma variável com distribuição normal padronizada.
Exemplos:
1 - Considere uma variável x, normalmente distribuída, com média 120 e desvio padrão 25.
a) Qual a probabilidade de encontrar um valor de x menor que 180, ou seja, P(x < 180).
Note que a probabilidade de encontrar um valor entre - ∞ e µ é igual a 0,5. Então, já
sabemos que a probabilidade de encontrar um valor menor que 180 é maior que 0,5. Para resolver
esta questão, usaremos a seguinte equação:
62
402=25
120−180=−= ,
σ
)μx(Z
Na tabela de Z onde a integração é feita de Z até 0 tem-se:
0,5 + P(0 < Z < 2,40) = 0,50 + 0,4918 = 0,9918
O valor de probabilidade 0,4918 foi obtido em tabela própria. A probabilidade de encontrar
um valor de x menor que 180 é muito elevada (0,99).
b) Qual a probabilidade de encontrar um valor de x maior que 90, ou seja, P(x > 90).
201−=25
120−90=−= ,
σ
)μx(Z
P(x > 90) = P(Z > 1,20) = P(-1,20 < Z < 0) + 0,50 = P(0 < Z < 1,20) + 0,50 = 0,3849 + 0,50
= 0,8849
c) Qual a probabilidadede encontrar um valor de x entre 80 e 150. Neste caso, devemos
calcular dois valores de Z. Assim:
601−=25
120−80=−=1 ,σ
)μx(Z
201=25
120−150=−=2 ,σ
)μx(Z
P(80 < x < 150) = P(-1,60 < Z < 1,20) = P(-1,60 < Z < 0) + P(0 < Z < 1,20) = P(0 < Z <
1,60) + P(0 < Z < 1,20) = 0,4452 + 0,3849 = 0,8301
Vamos considerar agora que a probabilidade de encontrar um valor de x menor que x1 seja
0,8643, ou seja, P(x < x1) = 0,8643. Assim:
50,147)25x10,1(120x
25
120x10,1)x(Z 11 =+=⇒−==σ
μ−=
Portanto, um valor de x menor que 147,50 tem probabilidade 0,8643 de ocorrer.
Outras distribuições de variáveis aleatórias contínuas
Gama, Gama Invertida, Beta, Distribuição t, Weibull, etc.
63
Exercícios
1 – Um casal quer ter quatro filhos.
a) Qual a probabilidade de nascerem 2 meninos e 2 meninas? R.: 3/8
b) Qual a probabilidade de nascerem 3 meninos e 1 menina? R.: 1/4
c) Qual a probabilidade de nascerem 2 meninos e 2 meninas, nesta ordem de nascimento?
R.: 1/16
2 – Determine a probabilidade de que, em 5 lançamentos de um dado, apareça a face 3:
a) Duas vezes. R.: 0,161
b) Ao menos duas vezes. R.: 0,196493621
3 – Sabe-se que 24% dos indivíduos que recebem um medicamento X sofrem certos efeitos
colaterais. Se o medicamento X for ministrado a quatro pacientes, qual a probabilidade de que:
a) Nenhum sofra efeitos colaterais. R.: 0,33
b) Três não sofram efeitos colaterais. R.: 0,42
c) Pelo menos um sofra efeitos colaterais. R.: 0,6653
4 – Uma população apresenta 25% de indivíduos do grupo sanguíneo A, 25% do grupo B, 30% do
grupo O e 20% do grupo AB. Retirando-se uma amostra aleatória de 10 indivíduos, pede-se:
a) Qual a probabilidade de retirar 3, 2, 3 e 2 indivíduos dos grupos A, B, O e AB? R.: 0,1772
b) Qual a probabilidade de retirar 0, 1, 5 e 4 indivíduos dos grupos A, B, O e AB? R.: 0,001225
5 – Uma granja produz 4000 aves por mês. Em média, 4 aves são contaminadas pelo patógeno A
(média mensal). Então, qual seria a probabilidade de:
a) Dez aves serem contaminadas no próximo mês. R.: 0,00530
b) Cinco aves serem contaminadas no próximo mês. R.: 0,15600
c) Dez aves serem contaminadas nos próximos 6 meses. R.: 0,00066
6 – Em uma determinada região são avistados, em média, 2 indivíduos de uma espécie em extinção
por mês. Pede-se:
a) Em um determinado mês foram avistados 15 indivíduos. Qual a probabilidade de avistar 15
indivíduos novamente no próximo mês? R.: 3,4 x 10-9
b) Qual a probabilidade de avistar 8 indivíduos da espécie em um período de 3 meses? R.:
0,103
7 – Seja X o número de crianças não imunizadas numa campanha de vacinação contra uma
determinada doença, onde a probabilidade de não imunização é 0,001. De 5000 crianças vacinadas,
qual a probabilidade de não ficarem imunes:
64
a) Uma criança. R.: 0,0337
b) Pelo menos uma criança. R.: 0,9933
8 – As notas de uma prova são normalmente distribuídas com média 73 e variância 225. Os 15%
melhores alunos recebem o conceito A e os 11,9% piores alunos recebem conceito R. Pede-se:
a) Nota mínima para receber A? R.: 88,6
b) Nota mínima para ser aprovado? R.: 55,3
c) Probabilidade de encontrar uma nota acima de 55,3, ou seja, P(X > 55,3)? R.: 0,8810
d) Porcentagem de indivíduos com nota entre 58 e 88? R.: 0,6826
9 – Sabe-se que o peso médio, em arrobas, de abate de bovinos é normalmente distribuído com
média 18 e variância 2,25. Um lote de 5000 cabeças, com essa característica foi destinado ao
frigorífico que abate só a partir de um peso mínimo W. Sabendo-se que foram abatidas 4200
cabeças, pede-se:
a) O número esperado de bovinos com peso entre 17 e 19 arrobas? R.: 2486 bovinos
b) Qual o valor de W? R.: 16,515
10 – O volume de correspondência recebido por uma firma quinzenalmente é normalmente
distribuído com média de 4000 cartas e desvio padrão de 200 cartas.
a) Qual a porcentagem de quinzenas em que a firma recebe mais de 4200 cartas? R.: 15,87%
a) Qual a porcentagem de quinzenas em que a firma recebe menos de 3400 cartas? R.: 0,13%
11 – Uma população A de pinhão manso apresentou teor médio de óleo de 28% e desvio padrão de
4,8%. Uma população B apresentou teor médio de óleo de 31,6% e desvio padrão de 2,0%.
a) Qual população apresenta maior variabilidade quanto ao teor de óleo? Justifique.
b) Qual a porcentagem de indivíduos da população A com teor de óleo acima de 35%? R.: 7,21%
c) Com a finalidade de selecionar 10 indivíduos da população A com teor de óleo acima de 35%,
quantos indivíduos, no mínimo, devem ser avaliados? R.: 139 indivíduos
d) Que a porcentagem de indivíduos da população B com teor de proteína acima de 35%? R.: 4,46%
e) Com a finalidade de selecionar 10 indivíduos da população B com teor de óleo acima de 35%,
quantos indivíduos, no mínimo, devem ser avaliados? R.: 225 indivíduos
f) Em qual população é mais fácil encontrar indivíduos com teor de óleo acima de 35%?
12 – Uma máquina de empacotar determinado produto oferece variações de peso com desvio padrão
de 20g. Em quanto deve ser regulado o peso médio do pacote para que apenas 10% tenham menos
de 400g?
60425=⇒6025−=−400⇒20
−400=281−=−= ,μ,μμ,
σ
)μx(Z
65
Capítulo IV
Inferência Estatística
66
4.1. Introdução
A inferência estatística é um ramo da estatística que tem o objetivo de inferir a respeito de
uma população a partir de amostras. A inferência compreende:
- estimação de parâmetros, como a média e a variância
- testes de hipóteses
Como a estimação é feita a partir de amostras, primeiramente vamos abordar alguns
aspectos a respeito da amostragem estatística.
4.2. Amostragem
População e Amostra
Do ponto de vista estatístico, o conjunto de todos os elementos sobre os quais desejamos
desenvolver determinado estudo constitui uma população. Quando é considerada apenas uma parte
deles, ou seja, um subconjunto da população, tem-se uma amostra.
Uma População (N) pode ser finita ou infinita:
a) Uma população finita apresenta um número limitado de observações, que é passível de
contagem, por exemplo:
- os alunos de determinado curso;
- os produtos de um supermercado;
- os livros de uma biblioteca.
b) Uma população infinita apresenta um número ilimitado de observações, por exemplo:
- extrações com reposições de bolas de uma urna;
- nascimentos futuros de crianças;
- número de carros produzidos futuramente.
Observações importantes:
Note que as amostras infinitas são processos contínuos, a cada dia são produzidos carros e
nascem crianças. Porém, se a população for o número de carros produzidos ou o número de
nascimentos em 2006, aí a população seria finita.
Uma população pode, mediante processos operacionais, ser considerada infinita, pois a
mesma irá depender do tamanho da amostra. Isso ocorre sempre que uma amostra constitui de no
máximo 5% da população. Assim, por exemplo, se tomarmos uma amostra de 100 habitantes da
cidade de Chapadinha, esta população embora finita, será considerada infinita.
67
Censo e Amostragem
Quando se obtém dados de todos os elementos de uma população, procedeu-se um censo e,
quanto se obtém dados de parte da população, procedeu-se uma amostragem.
Vantagens da amostragem
As principais vantagens da amostragem em relação ao censo são:
a) Custo reduzido
É evidente que em decorrência do menor número de dados coletados a amostragem é mais
econômica em relação ao censo.
b) Maior rapidez
Os dados podem ser coletados e tabulados mais rapidamente na amostragem, possibilitandoa obtenção dos resultados ou informações num espaço de tempo menor.
c) Maior facilidade de execução
Para determinadas pesquisas há necessidade de utilização de equipes bem treinadas e
equipamentos especializados para a obtenção dos dados. Neste caso a realização de um censo pode
ser inviável.
d) Maior precisão
Em alguns casos a amostragem pode ser mais precisa que o censo. Isso ocorre porque o
menor número de observações na amostragem leva a uma menor quantidade de coletores de dados.
A menor quantidade de coletores possibilita trabalhar com uma equipe mais homogênea, de melhor
nível e mais bem treinada.
e) Testes destrutivos
Testes de caráter destrutivo, como testes de munição, testes de impacto com veículos, vida
útil de lâmpadas etc só podem ser realizados com amostras, pois se os testes fossem realizados com
toda a população a mesma não existiria.
Observações importantes:
Há certas situações em que é mais vantajoso examinar todos os elementos de uma população, ou
seja, fazer um censo. Entre estas situações temos:
- A população pode ser tão pequena que o custo e o tempo de um censo sejam um pouco maiores
que o de uma amostra.
- Quando o tamanho da amostra para que as estimativas tenham a precisão exigida deve ser tão
grande que quase atinge o tamanho da população.
- Quando se exige total precisão da estimativa.
68
Plano de Amostragem
O sucesso de um levantamento por amostragem está na dependência direta de seu
planejamento. Um plano de amostragem pode ser planejado da seguinte maneira:
1) Definir os objetivos da pesquisa
Aqui devem ser definidos os objetivos com base no problema e nas hipóteses. As conclusões
finais devem responder, sempre que possível, as perguntas levantas no problema com base em
alguma hipótese previamente formulada.
2) População a ser amostrada (identificar a população alvo)
3) Parâmetros a serem estimados (Por exemplo: média, variância, proporção etc)
4) Dados a serem coletados (idade, sexo, peso, renda, produção em kg/ha, etc)
5) Definição da unidade amostral (Por exemplo: pessoa, família, bairro, cidade, etc)
6) Forma de seleção dos elementos da população que farão parte da amostra.
A forma de seleção de elementos depende, principalmente, de como os elementos amostrais
estão distribuídos na população. Pela sua importância, este aspecto será tratado em maiores detalhes
adiante, quando serão abordados os tipos de amostragens.
7) Definição do tamanho da Amostra (n)
O tamanho da amostra dependerá da precisão das estimativas e da variância na população
(quanto maior a amostra e menor a variância mais precisa serão as estimativas) e da disponibilidade
de dinheiro, tempo, mão-de-obra, etc.
O exemplo abaixo tenta ilustrar todas as fases de um planejamento de amostragem
Suponha que é necessária a realização de uma pesquisa para saber a proporção de pessoas
infectadas por determinada doença no estado do Maranhão. Note que a definição do problema já foi
levantada (Qual a proporção de pessoas infectas pela doença X no estado do Maranhão?). A partir
deste problema pode se ter uma hipótese, com base em informações preliminares. Um exemplo de
hipótese seria: A proporção de pessoas infectadas esta ou não acima de um valor mínimo tolerável.
A população alvo também foi definida (todos os habitantes do estado do Maranhão). O parâmetro a
ser estimado neste caso é uma proporção (π). A unidade amostral será cada habitante amostrado. A
forma da seleção de cada pessoa a ser amostrada já é algo mais complicado e deve ser mais
criterioso. Será abordado no tópico “tipos de amostragem” a seguir. E, por fim, a definição do
tamanho da amostra deve ser o maior possível considerando os custos e a logística da realização da
pesquisa, juntamente com a precisão da estimativa. Quanto maior a amostra mais precisa será a
estimação dos parâmetros.
69
Tipos de Amostragem
A forma de seleção de cada elemento de uma amostra irá depender do tipo de amostragem,
que por sua vez, dependerá de aspectos particulares de cada população. Abordaremos os tipos mais
importantes de amostras probabilísticas. Primeiramente vejamos os conceitos de amostra
probabilística ou não-probabilística.
Amostra probabilística
Quando cada elemento pertencente à população possui probabilidade conhecida e diferente
de zero de pertencer à amostra, diz-se que a amostra é probabilística. Assim, uma pessoa em uma
cidade com 10 mil habitantes possui probabilidade de 1/10000 de ser amostrada. Porém, a seleção
da pessoa deve ser ao acaso. Caso a seleção seja feita por algum critério e não ao acaso, tem-se uma
amostra não-probabilística.
Amostra não probabilística
É uma amostra em que alguns elementos são favorecidos em relação aos demais. Isso ocorre
quando a seleção não é feita ao acaso. Por exemplo: amostram-se pessoas em uma cidade de 10 mil
habitantes apenas nos bairros mais ricos. Note que as pessoas moradoras de bairros mais pobres têm
probabilidade zero ou menor que 1/10000 de pertencer à amostra. Outro exemplo é obter amostras
de sangue de doadores voluntários. Neste caso a amostra também não foi feita ao acaso e pessoas da
população que não podem ou não querem doar sangue tem probabilidade zero de serem amostradas.
Nestes dois exemplos as amostras não são representativas da população e, portanto, não serão
abordadas neste curso.
Tipos de amostragem probabilística
Amostragem Simples ou Ocasional
É o processo mais elementar e freqüentemente utilizado. Neste tipo de amostragem,
qualquer combinação dos n elementos da amostra tem igual probabilidade de vir a ser sorteada.
Em uma população de N elementos o número possível de amostras de tamanho n que podem
ser retiradas, diferindo em pelo menos uma unidade amostral é:
!n)!nN(
!NCnN −=
Por exemplo: Considere uma população constituída dos elementos: A, B, C, D e E. Neste
caso o tamanho da população é N = 5. Quantas amostras diferentes de tamanho n = 3 podem ser
retiradas desta população?
10=33−5
5=35 !)!(
!C
Assim, as 10 amostras possíveis são:
70
ABC ADE
ABD BCD
ABE BCE
ACD BDE
ACE CDE
Note que qualquer combinação dos 3 elementos da amostra tem igual probabilidade de vir a
ser sorteada.
Amostragem Estratificada
É um processo de amostragem usado quando nos depararmos com populações heterogêneas,
na qual se pode distinguir subpopulações mais ou menos homogêneas, denominados estratos.
Assim, após a determinação dos estratos, seleciona-se uma amostra aleatória de cada subpopulação
(estrato).
As diversas subamostras retiradas das subpopulações devem ser proporcionais aos
respectivos números de elementos dos estratos e, guardarem a proporcionalidade em relação a
variabilidade de cada estrato, obtendo-se uma estratificação ótima.
Por exemplo: Considere uma pesquisa sobre o nível de renda em determinada cidade.
Considere que os níveis de renda são variáveis de acordo com regiões da cidade (bairros). Assim,
temos uma população que não é distribuída de forma homogênea quanto a variável renda. Se
pegarmos pessoas ao acaso na população como um todo, pode-se selecionar um maior número de
pessoas de um determinado bairro. Neste caso, o valor estimado da renda média tem maior
probabilidade de ser um valor pouco representativo da renda média da cidade. Assim, para obter
uma estimativa mais precisa, pode-se amostrar de maneira aleatória dentro de cada bairro e depois
juntar os dados coletados estimando a renda média que será, provavelmente, mais precisa quando
comparada com a renda média obtida de amostragem aleatória simples. É importante destacar que o
número de pessoas amostradasdentro de cada estrato deve ser proporcional ao seu tamanho. Assim,
se a cidade tem 10 mil habitantes em 5 bairros com, respectivamente 200, 500, 100, 150 e 50 mil
habitantes e, deseja-se obter uma amostra de 100 habitantes, deve-se amostrar, respectivamente, 20,
50, 10, 15 e 5 habitantes em cada bairro. O conjunto destas 5 amostras simples denomina-se
amostra estratificada.
Uma outra maneira de obter uma amostra estratificada seria utilizar a informação dos
tamanhos populacionais dos estratos e a variância dentro de cada estrato. Assim, considere o mesmo
exemplo anterior, considerando que a variância de cada estrato é, respectivamente, 2, 4, 6, 3 e 7.
Note que, estratos de maior variância são mais heterogêneos e, portanto, pode-se amostrar,
71
relativamente, um maior número de elementos em estratos de maior variância em comparação com
estratos de menor variância.
Vamos fazer o seguinte exemplo: Querendo amostrar a renda média de produtores de
determinada região, é adequado considerar que, em geral, existe uma heterogeneidade de renda
entre produtores com diferentes tamanhos de propriedade. Então, pode-se fazer uma amostragem
mais precisa se os produtores forem separados por estratos relativos ao tamanho da propriedade em
hectares. A Tabela 1 contém os estratos, o número de propriedades por estrato e o desvios padrões
por estrato.
Tabela 1. Desvios padrões da renda e o número de proprietários rurais por estratos relativos ao
tamanho da propriedade em hectares
Estratos
(áreas em ha)
Número de propriedades
Nh
Desvio Padrão
0׀– 2 500 10
2׀– 5 320 11
5׀– 10 100 13
10 ׀– 20 50 20
20 ׀– 40 30 30
Total 1.000 -
Vamos considerar que uma amostra de 50 propriedades é suficiente para a precisão da estimativa da
renda média na região. Então, podem-se considerar dois tipos de amostragem estratificada.
1) Amostrar um número de propriedades proporcional ao tamanho do estrato. Neste caso, pode-se
resolver por regra de três simples:
Para o estrato 1 tem-se: 2550x
000.1
500nx
N
Nn 11 ===
E assim sucessivamente. Os resultados para os demais estratos encontram-se na Tabela 2.
2) Quando se tem conhecimento da variância dentro de cada estrato, a amostragem pode ser mais
precisa, utilizando a partilha ótima de Neyman (1934). Neste tipo de amostragem, o tamanho da
amostra em cada estrato é obtido por:
nx
N
Nn L
1h
hh
hh
h ∑
=
σ
σ=
72
Utilizando esta equação e as informações contidas na Tabela 1, o tamanho amostral para o primeiro
estrato é:
33,2150x
720.11
000.5nx
N
Nn 5
1h
hh
11
1 ==
σ
σ=
∑
=
E assim sucessivamente. Os resultados para os demais estratos encontram-se na Tabela 2.
Tabela 2. Desvios padrões da renda, número de proprietários rurais por estratos e tamanho de
amostra por estrato utilizando duas metodologias de partilha.
Estratos
(áreas em ha)
Número de
propriedades (Nh)
Desvio
Padrão
Tamanho Amostral
(partilha proporcional)
Tamanho Amostral
(partilha de Neyman)
0׀– 2 500 10 25 21
2׀– 5 320 11 16 15
5׀– 10 100 13 5 6
10 ׀– 20 50 20 3 4
20 ׀– 40 30 30 1 4
Total 1.000 50 50
Amostragem Sistemática
Trata-se de uma variação da amostragem aleatória simples ou ocasional, conveniente quando
a população está naturalmente ordenada, como fichas em um fichário, lista telefônica, cadastros etc.
Por exemplo: Considere o sorteio de 50 pessoas em uma cidade para fazer uma entrevista. Seria
muito trabalhoso obter o nome de todas as pessoas e realizar o sorteio. Vamos considerar o caso da
lista telefônica que, neste caso, contém 1000 telefones. Pode-se então, fazer o seguinte. Dividir
1000 por 50. Neste caso se obtém 20. Note que, se pegarmos um nome a cada 20 na lista, vamos
obter uma amostra de cinqüenta pessoas. Agora é só sortear um número de 1 a 20, vamos supor que
saiu o número 3. A seguinte seqüência de nomes foi amostrada: 3, 23, 43, 63, 83, ..., 983.
As vantagens da amostragem sistemática são: i) a sua maior facilidade de aplicação quando os
dados estão ordenados e, ou, listados; ii) também é vantajosa se a população for heterogênea, pois
amostra em toda a extensão da população.
Amostragem por Conglomerados (ou Agrupamentos)
Algumas populações não permitem, ou torna-se extremamente difícil que se identifiquem
seus elementos, mas podemos identificar subgrupos da população. Em tais casos, uma amostra
aleatória simples desses subgrupos (conglomerados) pode ser escolhida. Portanto, quando os
elementos da população são reunidos em grupos que são sorteados para compor a amostra, o
processo é denominado amostragem por conglomerado.
73
Por exemplo: Considere a amostragem de 500 proprietários rurais no estado do Maranhão.
Neste caso, pode-se considerar o sorteio de 50 municípios e 10 proprietários em cada. Ou o sorteio
de 25 municípios e 20 proprietários em cada. A economia neste tipo de sorteio é evidente, pois o
método dispensa o sorteio da listagem de referência ou cadastro de toda a população, pois somente
os conglomerados sorteados são identificados e listados. Um outro aspecto é o custo de locomoção.
Note que se fosse feita uma amostra casual simples de 500 proprietários no Estado do Maranhão, o
número de municípios poderia ser bem maior que 50, dificultando a locomoção das equipes de
pesquisa.
4.3. Estimação de parâmetros
Para melhor entender o significado da estimação de parâmetros, primeiramente vamos
analisar alguns conceitos muito importantes abordados a seguir:
Parâmetro (θ)
Parâmetro é uma função de valores populacionais, sendo, em geral, um valor conhecido
associado à população.
Exemplo: Para uma variável quantitativa que possua distribuição normal, podem-se obter os
parâmetros média (µ) e variância (σ2).
Estimador
Um estimador de um parâmetro (θ) é qualquer função das observações da amostra aleatória
X1, X2, X3, ..., Xn. Ele representa uma dada fórmula de cálculo que fornecerá valores diferentes em
diferentes amostras.
Exemplos:
n
X
X = μˆ é µ média daEstimador 1)
n
i
i∑
1==
1n
n
X
X
SˆéiânciavardaestimadorO)2
2n
1i
in
1i
2
i
222
−
⎟⎠
⎞⎜⎝
⎛
==σσ
∑∑ =
=
Estimativa
Estimativa é o valor numérico assumido pelo estimador.
Exemplo: A estimativa da altura média ( X ) de uma população A é 1,71 m. A estimativa da
variância (S2) da altura média desta mesma população é 4,67 m2. Portanto, a estimação consiste em
utilizar dados amostrais para estimar parâmetros populacionais, como por exemplo, a média, a
variância, etc.
74
A figura abaixo representa a simbologia de alguns parâmetros populacionais e seus
respectivos estimadores amostrais.
Um parâmetro populacional, por exemplo, a média ( µ), pode ter a sua estimativa
representada por X , como exemplificado acima, ou por μˆ .
A estimação pode ser:
a) por ponto
Na estimação por ponto obtém-se um único valor como estimativa de um parâmetro
populacional. Por exemplo: obter a média de altura de um país com base em uma amostra. O valor
obtido é a estimativa pontual do parâmetro populacional. Poderia ser 1,71 m.
b) por intervalo de confiança
Na estimação por intervalo de confiança, procura-se determinar um intervalo que tenha uma
probabilidade de conter o parâmetro populacional. Assim, o mesmo parâmetro considerado no
exemplo anterior (média) poderia ser estimado por intervalo. Poderia ser: A média da população
tem 95% de probabilidade de estar entre 1,69 m e 1,73 m.
Podem-se obter intervalos de confiança para diversos parâmetros populacionais, como por
exemplo:a média, a variância, uma proporção, um coeficiente de variação, etc.
- intervalo de confiança para uma média
O intervalo de confiança para uma média pode ser obtido pela seguinte expressão no caso de
população infinita (n < 0,05N):
α−=⎟⎠
⎞⎜⎝
⎛ +≤μ≤− αα 1n
stX
n
stXP xx
onde:
P é a probabilidade da média populacional ocorrer no intervalo;
α é o nível de significância, (geralmente 1% ou 5%);
sx é o desvio padrão amostral dos dados;
n é o tamanho da amostra;
X é a média amostral e;
75
αt é o valor da distribuição t de Student, obtido com base no tamanho da amostra (n – 1) e o
nível de significância (α) ;
Para população finita o intervalo de confiança pode ser obtido por:
α−=⎟⎟⎠
⎞
⎜⎜⎝
⎛ −+≤μ≤−− αα 1N
nN
n
s
tX
N
nN
n
s
tXP xx
Onde:
N é o tamanho da população
Exemplo: Considere uma amostra de 121 plantas de feijão, cuja média estimada para
produção de grãos por planta foi 11,1645 g/planta e a variância estimada foi 77,3901 g2/planta.
Vamos construir um intervalo de confiança que tenha 95% de chance de conter a média
populacional. Considere que a população é infinita n < 0,05N.
Resolução:
Precisamos obter o desvio padrão (sx) e o “t” tabelado. O desvio padrão é obtido por:
7972,83901,77sx ==
Para obter o valor de “t” tabelado, deve-se considerar que α = 5%, para um intervalo de 95%
de confiança. Assim, entra-se em tabela própria (tabela bilateral) com 05,0t e (n -1), ou seja 120
graus de liberdade. Assim, obtém-se o valor 1,987.
Assim, tem-se:
05,01
121
7972,8987,11645,11
121
7972,8987,11645,11P −=⎟⎠
⎞⎜⎝
⎛ +≤μ≤−
( ) 95,07536,125754,9P =≤μ≤
Portanto, a probabilidade da média μ variar de 9,5754 até 12,7536 é 0,95 ou 95%.
O intervalo de confiança também pode ser apresentado da seguinte maneira:
IC0,95 = [11,1645 ± 1,5891]
Esse intervalo de confiança possibilita inferir com 95% de confiança que a média de
produtividade de grãos por planta na população se encontra entre 9,5754 g/planta e 12,7536
g/planta.
Observações importantes:
Intervalos de menor amplitude significam estimativas mais precisas.
Quanto maior o tamanho da amostra, mais precisa é a estimativa e, portanto, menor é o
intervalo de confiança.
Quanto menor a variância, mais homogênea é a população e, consequentemente, mais
precisa será a amostragem. Portanto, menor será o intervalo de confiança.
76
- intervalo de confiança para uma proporção
O intervalo de confiança para uma proporção pode ser obtido pela seguinte expressão:
( ) α−=+≤π≤− αα 1)p(stpˆ)p(stpˆP
onde:
P é a probabilidade do parâmetro populacional ocorrer no intervalo;
α é o nível de significância, (geralmente 1% ou 5%);
s(p) é o desvio padrão amostral para a proporção p;
n é o tamanho da amostra; e
αt é o valor da distribuição t de Student, obtido com base no tamanho da amostra (n – 1) e o
nível de significância (α) ;
Observação:
No caso de população infinita (n < 0,05N), o desvio padrão amostral para uma proporção p é
obtido por:
1n
pq)p(s −=
No caso de populações finitas o desvio padrão uma proporção p é obtido por:
q.p.
)1n(N
)1N()p(s −
−=
Exemplo: Considere uma amostra de 121 caprinos onde 20 animais estavam infectados com
determinado parasito. Construa um intervalo de confiança que tenha 95% de chance de conter a
proporção populacional.
Considerando que a população é infinita n < 0,05N
Resolução:
Precisamos obter o desvio padrão (sp) e o “t” tabelado. O desvio padrão é obtido por:
0339,0
120
835,0.165,0)p(s ==
( ) α−=+≤π≤− αα 1)p(stpˆ)p(stpˆP
( ) 95,00339,0.987,1165,00339,0.987,1165,0P =+≤π≤−
( ) 95,0232,0098,0P =≤μ≤
IC0,95 = [0,165 ± 0,0674]
Esse intervalo de confiança possibilita inferir com 95% de confiança que a proporção de
caprinos contaminados com o parasito, na população, encontra-se entre 0,098 (10%) e 0,232 (23%).
77
4.4. Testes de Hipóteses
Introdução
O teste estatístico de hipótese é uma regra decisória que nos permite rejeitar ou não uma
hipótese estatística com base nos resultados de uma amostra. Estas hipóteses são, em geral, sobre
parâmetros populacionais e, a realização do teste se baseia na distribuição amostral dos respectivos
estimadores.
A seguir, tem-se uma breve descrição de alguns procedimentos necessários para realização
de um teste de hipóteses.
Hipóteses
Antes da realização de um teste estatístico, deve-se formular a hipótese a ser testada.
Por exemplo: Um pesquisador quer testar se existe diferença significativa entre a média de altura
entre as populações A e B. Portanto, foram coletadas amostras de altura nas duas populações,
obtendo uma estimativa da média para cada população. Neste caso, a hipótese a ser testada é µA =
µB. Esta hipótese é chamada de hipótese de nulidade (Ho), representada por:
Ho : µA = µB
A hipótese alternativa (Ha) é a hipótese que contraria Ho. Neste caso, a hipótese alternativa pode
ser representada por:
Ha1 : µA ≠ µB
ou
Ha2 : µA >µB
ou
Ha3 : µA < µB
Qual dessas usar?
Depende do conhecimento que se tem do problema e das informações que o problema trás.
Nível de significância
O nível de significância é o valor de probabilidade acima do qual os desvios amostrais são
devidos ao acaso. O nível de significância é representado por alfa (α) e, em geral, utiliza-se alfa
igual a 5% ou 1%. Estes valores equivalem à probabilidade de 0,05 e 0,01 respectivamente.
Por exemplo: Considere uma diferença entre as médias das amostras A e B. O que se quer testar é:
essa diferença é real (ou seja, uma população possui média diferente da outra) ou a diferença
ocorreu ao acaso devido a um erro amostral. Portanto, qual a probabilidade da diferença encontrada
entre as médias A e B estar ocorrendo ao acaso? O teste estatístico nos dá esta informação. Se a
78
probabilidade de ocorrer determinada diferença entre as médias A e B for elevada, conclui-se que as
médias são iguais, pois a diferença, provavelmente, esta ocorrendo ao acaso. Porém, o pesquisador
deve fixar um limite (chamado nível de significância) acima do qual, considera-se que os desvios
estejam ocorrendo ao acaso. Esse limite é, em geral, 5%. Assim, se o teste apresenta probabilidade
de uma diferença estar ocorrendo ao acaso maior que 5%, aceita-se Ho. Se a probabilidade dos
desvios estarem ocorrendo ao acaso é menor que 5%, rejeita-se Ho.
Observação: Notem o seguinte. Quando fazemos uma amostragem, selecionamos, ao acaso,
diferentes indivíduos. Assim, cada média tomada da mesma população deve apresentar valores
distintos que podem ser mais ou menos representativos do valor populacional.
Tipos de erros
Notem que o resultado obtido em um teste não nos dá uma certeza!!! Mas sim uma
probabilidade. Assim, dois tipos de erros podem ocorrer:
Erro tipo I ou α: é a probabilidade de rejeitar Ho sendo Ho verdadeira. É o nível de significância,
geralmente fixado em 0,05.
Por exemplo: Em um censo uma população apresentou média de escolaridade de 15 anos. Passados
quatro anos, obteve-se uma amostra desta população para saber se o nível médio de escolaridade foi
alterado. A estimativa obtida foi de 16 anos. A hipótese a ser testada é:
Ho : µ = 15
Ha : µ > 15
Depois de realizado o teste estatístico adequado, verificou-se que a superioridade encontrada
possui 4% de probabilidade de estar ocorrendo ao acaso. Note que a probabilidade da superioridade
estar ocorrendo ao acaso é baixa, portanto, é bastante provável (96 %) que a média de escolaridade
aumentou. Neste caso a hipótese Ho é rejeitada, considerando um nível de significância de 5%.
Porém, mesmoassim existe a probabilidade (4%) da média de escolaridade não ter alterado. A
diferença ocorreu por erro amostral devido ao acaso. Neste caso, seria cometido o erro tipo I.
Erro tipo II ou β: é a probabilidade de aceitar Ho sendo Ho falsa.
Considere o exemplo anterior. Porém, neste caso a hipótese Ho foi aceita, considerando que a
probabilidade dos desvios estarem ocorrendo ao acaso foi maior que 5% (considere 30%). Note que
a probabilidade da diferença ter ocorrido por simples acaso é elevada 0,3 ou 30%. Porém, mesmo
assim tem-se bastante chance da diferença não ter ocorrido ao acaso. Caso a diferença não tenha
ocorrido ao acaso, cometeu-se erro tipo II.
79
Portanto, qualquer que seja o resultado do teste, tem-se a probabilidade do resultado obtido
estar errado!!!!!
Quanto maior o nível de significância, maior a probabilidade de cometer erro tipo I e menor
a probabilidade de cometer erro tipo II. E vice-versa. Assim, a melhor maneira de diminuir a
probabilidade de erro é aumentando o tamanho e a precisão da amostra.
Obs.: Notem que, rejeitar uma hipótese, em geral, é uma decisão mais segura que não rejeitar.
Passos para realização de um teste de hipótese
1) Enunciar as hipóteses Ho e Ha;
2) Obter o valor tabelado do teste nas tabelas próprias, através do nível de significância (α);
3) Por meio de elementos amostrais, calcular o valor da estatística do teste e;
4) Concluir pela rejeição ou não de Ho comparando o valor obtido em 3 (valor tabelado do
teste) com o valor obtido em 4 (valor calculado do teste).
Principais testes estatísticos
Teste para comparar duas variâncias populacionais (teste F)
Este teste é utilizado para testar se duas variâncias obtidas de duas amostras casuais e
independentes são diferentes. Pressupõe-se que as variáveis x (amostra A) e y (amostra B) tenham
distribuição normal.
Neste caso a hipótese de nulidade é:
Ho : σ2A = σ2B
A hipótese alternativa pode ser:
Ha1 : σ2A ≠ σ2B
ou
Ha2 : σ2A > σ2B
ou
Ha3 : σ2A < σ2B
Para testar a hipótese Ho usa-se a estatística definida por:
2
2
=
B
A
S
SF
onde:
2
AS e
2
BS são as variâncias amostrais das variáveis x e y correspondentes a população A e B
respectivamente.
80
Para facilitar o uso da tabela usa-se:
2
2
〈
〉=
S
S
F
onde:
2〉 S é a maior variância e 2〈 S a menor variância, ou seja, F > 1.
O F tabelado (Fα) é obtido em tabela própria utilizando os graus de liberdade (n1, n2), sendo
n1 e n2 correspondente aos graus de liberdade do numerador e denominador respectivamente.
Observação:
n1 = n – 1 onde n é o tamanho amostral da maior variância
n2 = n – 1 onde n é o tamanho amostral da menor variância
Regra decisória:
Se Fcalculado ≥ Ftabelado: rejeita-se Ho, ou seja, é bastante provável que as duas populações apresentam
variâncias diferentes.
Se Fcalculado < Ftabelado: não se rejeita Ho, ou seja, é bastante provável que as duas populações tenham
a mesma variância.
Exemplo: A fim de verificar se duas populações crioulas de milho (A e B) apresentam a mesma
variabilidade quando ao ciclo, foram amostras seis plantas de cada população, tendo obtido os
dados abaixo em dias.
População A: 145; 127; 136; 142; 141; 137
População B : 143; 128; 132; 138; 142; 132
Testar se as duas variâncias são diferentes para α = 5%.
00,40
5
6
)828(-137...127145
1-n
n
X
X
S
2
222
2n
1i
in
1i
2
i
A
2 =
+++
=
⎟⎠
⎞⎜⎝
⎛
−
=
∑∑ =
=
96,36
5
6
)815(132...128143
1-n
n
X
X
S
2
222
2n
1i
in
1i
2
i
B
2 =
−+++
=
⎟⎠
⎞⎜⎝
⎛
−
=
∑∑ =
=
81
1) Primeiro passo: formular as hipóteses (nulidade e alternativa)
No caso, a hipótese de nulidade considera que as duas variâncias são iguais. Como foi
convencionado, a hipótese alternativa deve ser sempre a maior variância amostral (no caso a
variância maior foi obtida da população A) sendo significativamente maior.
Ho : σ2A = σ2B
Ha : σ2A > σ2B
2) Segundo passo: obter o valor tabelado do teste
Neste caso, utiliza-se (n1, n2) para localizar o respectivo valor na tabela de F (F>1) ao nível
de 5% de probabilidade. No exemplo em questão n1 são os graus de liberdade da maior variância
(população A) e n2 são os graus de liberdade da menor variância (população B). Assim, n1 = (6 – 1)
= 5 e n2 = (6 – 1) = 5.
Ftabelado 5% (5,5) = 5,05.
3) Terceiro passo: obter o valor calculado
A estatística apropriada é 081=9636
0040=〈
〉= 2
2
,
,
,
S
S
F = Fcalculado
4) Quarto passo: concluir pela rejeição ou não de Ho.
Como Fcalculado < Ftabelado: não se rejeita Ho, ou seja, é bastante provável que as duas
populações tenham a mesma variabilidade, pois a diferença encontrada é provavelmente devida ao
acaso.
Teste para médias (“t” de Student)
O teste t considera que a distribuição das variáveis em estudo seja normal. É o teste mais
utilizado para testar médias populacionais.
a) Teste de hipótese de uma média populacional
Este teste é utilizado em situações onde se quer testar uma média.
Por exemplo: Em um censo uma população apresentou média de escolaridade de 15 anos. Passados
quatro anos, fez-se uma amostra desta população para saber se o nível médio de escolaridade foi
alterado. A estimativa obtida foi de 16 anos. A hipótese a ser testada é:
Ho : µ = 15
Ha : µ > 15
Ou seja, a média é igual a 15 ou maior que 15?
82
Esta é uma situação em que se pode utilizar o teste t (desde que a amostra apresente
distribuição aproximadamente normal). O teste apropriado (t calculado) será:
n
S
μXt −= , que tem distribuição de Student com (n – 1) graus de liberdade, onde n é o tamanho
amostral.
As hipóteses são:
Ho : µ = k
Ha1 : µ ≠ k (teste bilateral)
ou
Ha2 : µ > k (teste unilateral a direita)
ou
Ha3 : µ < k (teste unilateral a esquerda)
A regra decisória é:
Se ׀tcalculado׀ ≥ ttabelado : rejeita-se Ho
Se ׀tcalculado׀ < ttabelado : não rejeita-se Ho
Observação sobre o uso das tabelas:
tabela bilateral
⎩⎨
⎧
2αcomentrar:unilateralteste
αcomentrar:bilateralteste
tabela unilateral
⎪⎩
⎪⎨
⎧
2
2
αcomentrar:unilateralteste
αcomentrar:bilateralteste
Exemplo: O peso médio de caprinos ao abate na região do Baixo Parnaíba é de 42 kg. Após dois
anos, em que o Sebrae atuou de forma a aumentar o peso médio ao abate, retirou-se uma amostra
aleatória de oito animais para avaliar se a média de caprinos ao abate foi alterada. Segue o peso dos
oito animais: 44,5; 48,0; 46,0; 40,5; 47,0; 43,0; 42,0; 45,0.
50,44
8
0,45...0,485,44
n
X
X
n
1i
i
=+++==
∑
=
50,6
7
8
)0,356(0,45...0,485,44
1-n
n
X
X
S
2
222
2n
1i
in
1i
2
i
2 =
−+++
=
⎟⎠
⎞⎜⎝
⎛
−
=
∑∑ =
=
552=506= ,,S
83
1) Primeiro passo: formular as hipóteses (nulidade e alternativa).
Ho : µ = 42
Ha : µ > 42
2) Segundo passo: obter o valor tabelado do teste.
Neste caso, utiliza-se n – 1 graus de liberdade para localizar o respectivo valor na tabela de t
(unilateral ou bilateral) ao nível de 5% de probabilidade. No exemplo em questão tem-se 7 graus de
liberdade. Na tabela bilateral entrar com 10%, ou seja, 2α.
Ttabelado 5% (7) = 1,90.
3) Terceiro passo: obter o valor calculado.
A estatística apropriada é 143=
8
552
042−544=−= ,
,
,,
n
S
μXt = tcalculado
4) Quarto passo: concluir pela rejeição ou não de Ho.
׀tcalculado׀ ≥ ttabelado : portanto, rejeita-se Ho, ou seja, o peso médio de caprinos ao abate na região do
Baixo Parnaíbaé superior a 42 kg, pois a diferença encontrada provavelmente não é devida ao
acaso.
b) Teste para a igualdade de médias obtidas de duas amostras independentes
Aqui novamente o teste adequado é o teste t. É utilizado para testar se a diferença obtida
entre médias de duas amostras é significativa.
Por exemplo: Pesquisadores querem descobrir qual variedade crioula de milho (variedade
de polinização aberta) apresenta maior teor de proteína médio, a partir de 9 amostras de cada
variedade. As hipóteses possíveis são:
Ho : µA = µB
Ha1 : µA ≠ µB
ou
Ha2 : µA >µB
ou
Ha3 : µA < µB
Neste caso devem-se considerar duas situações possíveis:
1) as variâncias das duas amostras são iguais;
84
2) as variâncias das duas amostras são diferentes.
O procedimento adequado é realizar um teste F para concluir se as duas variâncias são
provavelmente iguais ou não.
Caso 1
No primeiro caso, consideram-se as variâncias iguais, pois não se rejeitou a hipótese Ho :
σ2A = σ2B. Deve-se, portanto, utilizar uma variância comum entre as duas amostras obtida por:
2−+
1−+1−=
22
2
BA
BBAA
c
nn
S)n(S)n(S
O valor calculado do teste t neste caso é:
⎟⎟⎠
⎞
⎜⎜⎝
⎛ 1+1
−=
2
BA
c
BA
nn
S
XXt , que tem distribuição de Student com (nA + nB – 2) graus de liberdade.
Caso 2
No segundo caso, consideram-se as variâncias diferentes, pois se rejeitou a hipótese Ho: σ2A = σ2B.
Neste caso não é necessário calcular variância comum.
O valor calculado do teste t neste caso é:
B
B
A
A
BA
n
S
n
S
XXt 22
+
−= , que tem distribuição de Student com n* graus de liberdade.
1−
⎟⎟⎠
⎞
⎜⎜⎝
⎛
+1−
⎟⎟⎠
⎞
⎜⎜⎝
⎛
⎟⎟⎠
⎞
⎜⎜⎝
⎛ +
= 2222
222
B
B
B
A
A
A
B
B
A
A
n
n
S
n
n
S
n
S
n
S
*n
A regra decisória (para os dois casos) é:
Se ׀tcalculado׀ ≥ ttabelado : rejeita-se Ho
Se ׀tcalculado׀ < ttabelado : não rejeita-se Ho
EXEMPLOS (Teste de t para duas médias)
Exemplo 1
Dois métodos de ensino (A e B) deverão ser comparados. Cada método foi aplicado a uma amostra
casual de 10 alunos. Os resultados, em índice de aproveitamento, foram:
A: 63 61 60 62 81 55 72 73 64 80
B: 65 48 61 62 64 63 70 75 79 78
Ao nível de 5% de probabilidade, os dois métodos podem ser considerados igualmente eficientes?
85
Solução:
32,78
9
10
)671(80...6163
1-n
n
X
X
S
2
222
2n
1i
in
1i
2
i
A
2 =
−+++
=
⎟⎠
⎞⎜⎝
⎛
−
=
∑∑ =
=
39,87
9
10
)665(78...4865
1-n
n
X
X
S
2
222
2n
1i
in
1i
2
i
B
2 =
−+++
=
⎟⎠
⎞⎜⎝
⎛
−
=
∑∑ =
=
50,66
10
665
n
X
X;10,67
10
671
n
X
X
n
1i
i
B
n
1i
i
A ======
∑∑
==
Teste F para testar a igualdade das variâncias
1) Primeiro passo: formular as hipóteses
Ho : σ2A = σ2B
Ha : σ2B > σ2A
2) Segundo passo: obter o valor tabelado
Ftabelado 5% (9,9) = 3,18
3) Terceiro passo: obter o valor calculado
A estatística apropriada é 111=3278
3987== 2
2
,
,
,
S
SF
A
B
4) Quarto passo: concluir pela rejeição ou não de Ho
Fcalculado < Ftabelado. Portanto, não se rejeita Ho, ou seja, as variâncias são estatisticamente iguais, pois
a diferença entre elas é provavelmente devida ao acaso.
Teste t para testar a igualdade das médias
Como as variâncias são estatisticamente iguais, deve-se calcular a variância comum
obtida por:
86
8582=18
39879+32789=2−+
1−+1−=
22
2 ,),(),(
nn
S)n(S)n(S
BA
BBAA
c
1) Primeiro passo: formular as hipóteses
Ho : µA = µB
Ha1 : µA ≠ µB
2) Segundo passo: obter o valor tabelado
ttabelado 5% (nA + nB - 2) = ttabelado 5% (18)=2,10
3) Terceiro passo: obter o valor calculado
A estatística apropriada é 150=
⎟⎠
⎞⎜⎝
⎛
10
1+10
18582
5066−1067=
⎟⎟⎠
⎞
⎜⎜⎝
⎛ 1+1
−=
2
,
,
,,
nn
S
XXt
BA
c
BA
4) Quarto passo: concluir pela rejeição ou não de Ho
׀tcalculado׀ < ttabelado. Portanto, não se rejeita Ho, ou seja, as médias são estatisticamente iguais, pois a
diferença entre elas é provavelmente devida ao acaso.
Exemplo 2
Desejando saber entre duas variedades de milho crioulo, qual apresenta maior teor de proteína no
grão, retirou-se 9 amostras da variedade A e 9 da variedade B, obtendo-se os dados abaixo:
Teores de proteína X S2
Variedade A 12,00 3,50
Variedade B 15,00 15,25
A diferença de proteína encontrada é significativa?
Teste F para testar a igualdade das variâncias
1) Primeiro passo: formular as hipóteses
Ho : σ2A = σ2B
Ha : σ2B > σ2A
2) Segundo passo: obter o valor tabelado do teste.
Ftabelado 5% (8,8) = 3,44
87
3) Terceiro passo: obter o valor calculado.
A estatística apropriada é 364=503
2515== 2
2
,
,
,
S
SF
A
B
4) Quarto passo: concluir pela rejeição ou não de Ho.
Fcalculado ≥ Ftabelado. Portanto, rejeita-se Ho, ou seja, as variâncias são estatisticamente diferentes.
Teste t para testar a igualdade das médias
Como as variâncias são estatisticamente diferentes, não é necessário obter variância
comum.
1) Primeiro passo: formular as hipóteses estatísticas
Ho : µA = µB
Ha1 : µA ≠ µB
2) Segundo passo: obter o valor tabelado do teste.
ttabelado 5% (n*) = 12≈
8
⎟⎠
⎞⎜⎝
⎛
9
2515
+8
⎟⎠
⎞⎜⎝
⎛
9
503
⎟⎠
⎞⎜⎝
⎛
9
2515+9
503
=
1−
⎟⎟⎠
⎞
⎜⎜⎝
⎛
+1−
⎟⎟⎠
⎞
⎜⎜⎝
⎛
⎟⎟⎠
⎞
⎜⎜⎝
⎛ +
= 22
2
2222
222
,,
,,
n
n
S
n
n
S
n
S
n
S
*n
B
B
B
A
A
A
B
B
A
A
ttabelado 5% (12) = 2,18
3) Terceiro passo: obter o valor calculado.
A estatística apropriada é 082=
9
2515+9
503
12−15=
+
−= 22 ,,,
n
S
n
S
XXt
B
B
A
A
BA
4) Quarto passo: concluir pela rejeição ou não de Ho.
׀tcalculado׀ < ttabelado. Portanto, não se rejeita Ho, ou seja, as médias são estatisticamente iguais,
pois a diferença entre elas é provavelmente devida ao acaso.
88
c) Teste para a igualdade de médias obtidas de dados pareados
Quando os resultados de duas amostras constituem dados emparelhados (relacionados dois a
dois) segundo algum critério de associação entre eles, o teste adequado é o teste t para dados
pareados, desde que a variável tenha distribuição normal.
Por exemplo: Cientistas querem testar se uma nova droga é eficiente na redução de peso em
humanos. Quarenta pessoas são selecionadas e pesadas. A droga é aplicada e, dois meses depois as
quarenta pessoas são novamente pesadas. Será que a diferença de peso encontrada é significativa?
Este tipo de questão deve ser “solucionada” com ajuda do teste t para dados pareados.
A notação matemática adequada é:
X1i: representa o peso da pessoa i antes de receber a droga;
X2i: representa o peso da pessoa i após receber a droga e passado determinado tempo.
Assim, obtêm-se os desvios (di = X2i –X1i), que são a diferença de peso (antes e depois) de
cada observação (pessoa).
Considerando as n = 40 pessoas do estudo, pode-se montar a seguinte tabela:
Pessoas X1i X2i di =X2i – X1i
1 X11 X21 d1
2 X12 X22 d2
3 X13 X23 d3
... ... ... ...
40 X140 X240 d40
A partir destes dados, pode-se obter a média estimada dos desvios pelo seguinte estimador:
n
d
d
n
i
i∑
1==
Assim, d é a diferença média na amostra e D é a diferença média na população.
As hipóteses são:
Ho: D = 0
Ha1: D > 0
ou
Ha2: D < 0
ou
Ha3: D ≠ 0
O t calculado é obtido por:n
)d(S
dt = , com (n – 1) graus de liberdade.
onde:
89
S(d) é o desvio padrão da diferença amostral;
n = tamanho da amostra.
A regra decisória é:
Se ׀tcalculado׀ ≥ ttabelado : rejeita-se Ho
Se ׀tcalculado׀ < ttabelado : não rejeita-se Ho
Exemplo
Com o objetivo de aumentar a produtividade de milho de pequenos agricultores no interior
do Paraná, o serviço de extensão rural estabeleceu um programa de assistência técnica a estes
agricultores. A variável produtividade de grãos (t/ha) foi quantificada em ano agrícola antes (A) e
depois (B) da aplicação do referido programa. Os dados obtidos se encontram na tabela abaixo.
Produtividades médias de milho obtidas por oito produtores antes (A) e depois (B) da aplicação de
um programa de assistência técnica (dados hipotéticos)
Produtores
Produtividade
média em t/ha
Antes (A)
Produtividade
média em t/ha
Depois (B)
di
1 5,23 7,82 2,59
2 6,31 8,25 1,94
3 4,46 3,86 -0,60
4 4,86 6,72 1,86
5 5,43 8,52 3,09
6 3,45 5,65 2,20
7 4,85 6,41 1,56
8 3,28 4,46 1,18
9 3,87 3,87 0,00
A implantação do programa de assistência técnica foi eficiente em elevar a produtividade média dos
pequenos agricultores?
1) Primeiro passo: formular as hipóteses estatísticas
Ho: D = 0
Ha: D > 0
2) Segundo passo: obter o valor tabelado do teste
ttabelado 5% (8) = 1,86
90
3) Terceiro passo: obter o valor calculado
A estatística apropriada é 863=
9
191
531== ,
,
,
n
)d(S
dt
4) Quarto passo: concluir pela rejeição ou não de Ho
׀tcalculado׀ ≥ ttabelado. Portanto, rejeita-se Ho, ou seja, a aplicação do programa de assistência técnica
foi eficiente em elevar a produtividade de milho.
Teste Qui-quadrado ( 2χ )
O teste qui-quadrado é utilizado como uma medida da discrepância entre freqüências
esperadas e observadas.
Por exemplo: Suponha que em uma amostra de 80 nascimentos avaliou-se a freqüência de meninos
e meninas. Observou-se 45 meninos e 35 meninas. A pergunta é: será que o nascimento de meninos
na população é superior ao nascimento de meninas por acaso ou por algum outro motivo que não
seja o acaso. A decisão sobre esta questão pode ser orientada pelo teste qui-quadrado, que compara
a freqüência observada de meninos (45 meninos) e meninas (35 meninas) com as freqüências
esperadas de meninos (40 meninos) e meninas (40 meninas).
O teste de qui-quadrado pode ser utilizado principalmente para:
1. Teste de aderência
2. Teste de independência
3. Teste de homogeneidade
Qui-quadrado para aderência
O teste de aderência é utilizado quando a hipótese a ser testada refere-se à forma da
distribuição da população. Assim, pode-se verificar se distribuições teóricas se ajustam a
distribuições empíricas, ou seja, as distribuições amostrais.
Exemplos:
1. Testar se uma variável tem distribuição normal
2. Testar se uma variável tem distribuição poisson
3. Testar se uma variável tem distribuição binomial
4. O nascimento de crianças do sexo feminino e masculino tem proporção 1:1
As hipóteses Ho e Ha são, genericamente:
Ho: a variável analisada apresenta uma distribuição esperada
Ha: a variável analisada não apresenta a distribuição esperada
91
O número de graus de liberdade é obtido por:
a) Quando as freqüências esperadas puderem ser calculadas sem que se façam estimativas dos
parâmetros populacionais a partir das distribuições amostrais tem-se:
G.L. = k – 1; onde k é o número de categorias da variável.
b) Quando para determinação das freqüências esperadas, r parâmetros tiverem suas estimativas
calculadas a partir das distribuições amostrais tem-se:
G.L. = k – 1 - r; onde k é o número de categorias da variável e r o número de parâmetros estimados
(este segundo caso não será abordado neste curso).
O qui-quadrado para aderência é obtido por:
k
kk
E
)EO(...
E
)EO(
E
)EO(
E
)EO(
χ
2
3
2
33
2
2
22
1
2
112 −++−+−+−=
ou seja,
∑
1=
2
2 −=
k
i i
ii
E
)EO(
χ
onde:
iO é a freqüência observada para a i-ésima categoria;
iE é a freqüência esperada para a i-ésima categoria e;
k é o número de categorias da variável qualitativa analisada.
Note que quanto maior o valor de 2χ , maior é a discrepância entre as freqüências esperadas
e observadas.
A conclusão é:
calculadoχ 2 ≥ tabeladoχ 2 : rejeita Ho.
calculadoχ 2 < tabeladoχ 2 : não se rejeita Ho.
Geralmente o teste qui-quadrado é aplicado a variáveis qualitativas, como no exemplo a
seguir:
Em um estudo de hereditariedade da cor da vagem em feijão, foram observadas 98 plantas com a
vagem verde e 24 com a vagem amarela numa descendência de 122 plântulas. Supondo que a
proporção esperada é 3 verdes para 1 amarela, verifique se as observações estão de acordo com esta
hipótese, adotando α = 5%.
92
Solução:
Note que a variável em questão é qualitativa nominal com duas categorias (k=2). É um estudo
comum em análises genéticas, semelhante aos estudos realizados por Mendel com ervilhas.
Pressupondo que os pais são AA (vagem verde) e aa (vagem amarela), espera-se que a proporção de
filhos seja: ¾ de vagens verdes (AA e Aa) e ¼ de vagens amarelas (aa), supondo que a presença de
A determine a cor verde. Para a resolução deste problema podem-se adotar os seguintes passos:
1) Primeiro passo: formular as hipótese Ho e Ha
Ho: a cor da vagem analisada apresenta a distribuição 3:1 (3/4 vagens verdes: 1/4 vagens amarelas)
Ha: a cor da vagem analisada apresenta distribuição diferente de 3:1
2) Segundo passo: obter o qui-quadrado tabelado
Considerando α = 5% e o grau de liberdade obtido por (k – 1), onde k é o número de
categorias da variável qualitativa, tem-se:
843=152 ,)(χ % obtido em tabela própria.
3) Terceiro passo: obter o qui-quadrado calculado
As freqüências esperadas podem ser obtidas por:
Freqüência esperada de vagens verdes = 591=4
3122 ,x
Freqüência esperada de vagens amarelas = 530=4
1122 ,x
Freqüências observadas e esperadas para a cor da vagem em 122 plantas de feijão.
Cor da vagem Freqüência observada Freqüência esperada
Vagem verde 98 91,5
Vagem amarela 24 30,5
Totais 122 120
Com as freqüências esperadas e observadas em cada categoria da variável, pode-se obter o
qui-quadrado calculado por:
851=530
530−24+591
591−98=−=
22
1=
2
2 ∑ ,, ),(, ),(E )EO(χ
k
i i
ii
93
4) Quarto passo: conclusão
calculadoχ 2 < tabeladoχ 2 : portanto, não se rejeita Ho ao nível de 5% de probabilidade. É
bastante provável que a cor da vagem analisada apresenta a distribuição 3:1. Assim, pode-se
concluir que a cor da vagem em feijão é controlada por dois genes, sendo que o gene A é dominante
e a sua presença determina vagens verdes e a sua ausência determina vagens amarelas.
Qui-quadrado para independência
Este teste é utilizado para testar se duas variáveis qualitativas são independentes. Por
exemplo: será que a resposta dada a uma determinada pergunta (a favor ou contra o aborto) depende
do sexo (masculino e feminino). Se a proporção de respostas a favor e contra forem estatisticamente
iguais em ambos os sexos, as variáveis “opinião sobre o aborto” e “sexo” são independentes. Se a
proporção de respostas a favor e contra o aborto forem estatisticamente diferente para homens e
mulheres, considera-se que as variáveis não são independentes. Neste caso, pode-se dizer que a
opinião sobre o aborto (a favor ou contra) depende do sexo do entrevistado.
As hipóteses Ho e Ha são:
Ho: as variáveis são independentesHa: as variáveis são dependentes
O número de graus de liberdade é obtido por:
G.L. = (k – 1)(h – 1), em que k é o número de categorias de uma das variáveis e h é o número de
categorias da outra.
O qui-quadrado calculado, neste caso, é obtido por:
kh
2
khkh
12
2
1212
11
2
1111
k
1i
h
1j ij
2
ijij2
E
)EO(...
E
)EO(
E
)EO(
E
)EO( −++−+−=−=χ ∑∑
= =
A conclusão é:
calculadoχ 2 ≥ tabeladoχ 2 : rejeita Ho.
calculadoχ 2 < tabeladoχ 2 : não se rejeita Ho.
Para exemplificar melhor, considere o problema a seguir:
A tabela de contingência a seguir se refere á opinião de homens e mulheres sobre o aborto.
Verificar, aplicando o teste qui-quadrado, se existe associação entre a opinião e o sexo do
entrevistado, adotando α = 1%.
94
Opinião Sexo favorável desfavorável indiferente Total
homens 33 (24) 12 (19,2) 15 (16,8) 60
mulheres 7 (16) 20 (12,8) 13 (11,2) 40
Total 40 32 28 100
Pode-se realizar o teste qui-quadrado adotando os seguintes passos:
1) Primeiro passo: formular as hipótese Ho e Ha
Ho: as variáveis “opinião sobre o aborto” e “sexo” são independentes
Ha: as variáveis “opinião sobre o aborto” e “sexo” são dependentes
2) Segundo passo: obter o qui-quadrado tabelado
Considerando α = 1% e o grau de liberdade obtido por (k – 1)(h – 1), onde k é o número de
categorias de uma variável qualitativa e h é o número de categorias da outra. Assim, tem-se:
21,9)2(%12 =χ obtido em tabela própria.
3) Terceiro passo: obter o qui-quadrado calculado.
Os dados entre parênteses na tabela acima referem-se as freqüências absolutas esperadas obtidas
por:
totalsoma
)jcolunadasoma)(ilinhadasoma(ijesperadaabsolutaFrequência =
24=100
4060=11 ))((esperadaabsolutaFrequência
219=100
3260=12 ,))((esperadaabsolutaFrequência
.
.
.
211=100
2840=23 ,))((esperadaabsolutaFrequência
Com as freqüências esperadas e observadas, pode-se obter o qui-quadrado calculado por:
67,15
2,11
)2,1113(...
2,19
)2,1912(
24
)2433(
E
)EO( 222k
1i
h
1j ij
2
ijij2 =−++−+−=−=χ ∑∑
= =
95
4) Quarto passo: conclusão.
calculadoχ 2 ≥ tabeladoχ 2 : portanto, rejeita-se Ho ao nível de 1% de probabilidade. É
bastante provável a opinião sobre o aborto esta relacionada ao sexo do entrevistado.
Qui-quadrado para homogeneidade (testa se duas ou mais amostras são homogêneas)
O teste qui-quadrado para a homogeneidade é o mesmo qui-quadrado para independência.
Porém, neste caso não é utilizado duas variáveis, mas uma variável e um conjunto de amostras.
Portanto, é utilizado para testar se a variável em estudo se distribui de forma homogênea nas
populações onde foram retiradas as amostras.
Por exemplo: considerando a variável grupo sanguíneo amostrada em duas populações (A e B). As
freqüências de indivíduos A, B, AB e O serão diferentes nas duas amostras. Porém, a pergunta
adequada é: será que esta diferença esta ocorrendo ao acaso ou não. Se a diferença de freqüências
nas duas amostras provavelmente estiver ocorrendo ao acaso, conclui-se que as duas populações são
homogêneas quanto ao tipo sanguíneo. Porém, se a diferença provavelmente não estiver ocorrendo
ao acaso, conclui-se que as duas populações não são homogêneas quanto ao tipo sanguíneo.
As hipóteses Ho e Ha são:
Ho: as populações são homogêneas
Ha: as populações são não homogêneas
O número de graus de liberdade é obtido por:
G.L. = (k – 1)(h – 1), em que k é o número de categorias da variável e h é o número de amostras.
O qui-quadrado calculado, neste caso, é obtido por:
kh
2
khkh
12
2
1212
11
2
1111
k
1i
h
1j ij
2
ijij2
E
)EO(...
E
)EO(
E
)EO(
E
)EO( −++−+−=−=χ ∑∑
= =
A conclusão é:
calculadoχ 2 ≥ tabeladoχ 2 : rejeita Ho.
calculadoχ 2 < tabeladoχ 2 : não se rejeita Ho.
Para exemplificar melhor, considere o problema a seguir:
96
As freqüências absolutas aos tipos sanguíneos O, A, B e AB em amostras de duas populações (A e
B) forneceram os dados abaixo:
Freqüências absolutas de tipos sanguíneos Amostras
O A B AB
Totais
Amostra A 56 (56,44) 60 (58,57) 18 (19,31) 6 (5,68) 140
Amostra B 120 (119,56) 122 (123,43) 42 (40,69) 11 (11,32) 295
Totais 176 182 60 17 435
Pode-se realizar o teste qui-quadrado adotando os seguintes passos:
1) Primeiro passo: formular as hipótese Ho e Ha
Ho: as populações A e B são homogêneas quanto ao tipo sanguíneo
Ha: as populações A e B não são homogêneas quanto ao tipo sanguíneo
2) Segundo passo: obter o qui-quadrado tabelado
Considerando α = 1% e o grau de liberdade obtido por (k – 1)(h – 1), onde k é o número de
amostras e h é o número de categorias da variável qualitativa. Assim, tem-se:
817=352 ,)(χ % obtido em tabela própria.
3) Terceiro passo: obter o qui-quadrado calculado
Os dados entre parênteses na tabela acima referem-se as freqüências absolutas esperadas obtidas
por:
totalsoma
)jlinhadasoma)(ilinhadasoma(ijesperadaabsolutaFrequência =
4456=435
176140=11 ,))((esperadaabsolutaFrequência
5758=435
182140=12 ,))((esperadaabsolutaFrequência
.
.
.
3211=435
17295=24 ,))((esperadaabsolutaFrequência
Com as freqüências esperadas e observadas, pode-se obter o qui-quadrado calculado por:
27,0
32,11
)32,1111(...
56,119
)56,119120(
44,56
)44,5656(
E
)EO( 222k
1i
h
1j ij
2
ijij2 =−++−+−=−=χ ∑∑
= =
97
4) Quinto passo: conclusão
calculadoχ 2 < tabeladoχ 2 : portanto, não se rejeita Ho ao nível de 5% de probabilidade. É
bastante provável que as duas amostras sejam homogêneas e, portanto, as duas populações tem as
mesmas proporções de indivíduos de tipo sanguíneo A, B, AB e O.
Restrições ao uso do Qui-quadrado
Não é recomendado utilizar p qui-quadrado nos seguintes casos:
a) Se a freqüência absoluta total for menor que 20, ou seja, amostras com menos de 20
observações;
b) Se a freqüência absoluta total estiver entre 20 e 40 observações e a menor freqüência
esperada for menor que 5 observações;
c) Se a freqüência absoluta total for maior que 40 e a freqüência esperada mínima for menor
que 5, deve-se proceder a correção de Yates apresentada a seguir.
k
kk
ajustado
E
),EO(
...
E
),EO(
E
),EO(
E
),EO(
χ
2
3
2
33
2
2
22
1
2
112 50−−++50−−+50−−+50−−=
assim,
∑
1=
2
2 50−−=
k
i i
ii
ajustado
E
),EO(
χ
98
Exercícios
Amostragem
1. Qual a relação entre o tamanho da amostra e a precisão das estimativas obtidas?
2. Considere uma população de 35 árvores de uma determinada espécie, pertencentes a um parque
ecológico, cujos elementos possuem os seguintes comprimentos em cm para o diâmetro da altura do
peito (DAP):
(1) 25, (2) 20, (3) 35, (4) 21, (5) 22, (6) 22, (7) 24, (8) 25, (9) 30, (10) 38, (11) 24, (12) 20, (13) 20,
(14) 25, (15) 20, (16) 19, (17) 25, (18) 23, (19) 20, (20) 24, (21) 28, (22) 24, (23) 24, (24) 22, (25)
28, (26) 26, (27) 23, (28) 25, (29) 22, (30) 27, (31) 25, (32) 23, (33) 28, (34) 27, (35) 22.
a) Com o objetivo de estimar o comprimento médio, como deveria ser extraída uma amostra
simples ao acaso de tamanho n = 10 desta população?
b) Quantas amostras de tamanho n = 10 poderiam ser extraídas desta população?
c) Calcule a média populacional e compare com as médias estimadas em quatro amostras simples
ao acaso de tamanhos diferentes (n = 2, n = 5, n = 10 e n = 20).
d) Calcule a média em amostras sistemáticas de tamanhos diferentes(n=2, n=5, n=10, n=20).
3. Os dados abaixo são referentes a número de empregados de uma empresa agrícola, divididos por
setores:
Setores Número de funcionários
Administrativo 314
Transporte 948
Campo 1.451
Outros 701
Total 3.414
Decidiu-se fazer uma amostra de 60 funcionários para avaliar o nível salarial médio da empresa.
Apresente o tipo de amostragem mais adequada e de forma detalhada.
4. Quais as situações em que a amostra estratificada deve ser preferida à amostragem simples ao
acaso?
5. Qual é a principal diferença entre amostra probabilística e não-probabilística?
6. Quais as vantagens de utilizar uma amostra sistemática?
7. Qual a vantagem e desvantagem da amostra por conglomerados?
99
Estimação de parâmetros
1) Defina e de exemplos de:
a) Parâmetro
b) Estimador
c) Estimativa
2) O que você sugere para obter estimativas mais precisas de determinado parâmetro?
3) Qual a relação da variância com a precisão das estimativas?
4) Estime a média por intervalo (α = 5%) da produtividade de milho de uma região X, onde foi
retirada uma amostra de 50 produtores, com média de 5 t/ha e variância de 2 t2/ha. Apresente a
interpretação dos resultados.
5) Estime a média por intervalo (α = 5%) da produtividade de milho de uma região Y, onde foi
retirada uma amostra de 30 produtores, com média de 5 t/ha e variância de 2 t2/ha. Apresente a
interpretação dos resultados.
6) Estime a média por ponto e intervalo (α = 5%) da produtividade de milho de uma região Z, onde
foi retirada uma amostra de 50 produtores, com média de 5 t/ha e variância de 4 t2/ha. Apresente a
interpretação dos resultados.
7) Compare as questões 4, 5 e 6.
8) Uma empresa de crédito agrícola resolveu fazer uma pesquisa sobre a inadimplência de
empréstimos a produtores rurais no Estado do Mato Grosso. Foram amostrados 200 produtores. Na
amostra, a porcentagem de inadimplentes foi de 15%. Apresente a proporção por ponto e por
intervalo (α = 5%) de produtores rurais inadimplentes.
Testes de hipóteses
1) Pesquisadores da Embrapa querem descobrir se duas populações de uma planta medicinal da
Amazônia apresentam a mesma variabilidade na quantidade de determinado principio ativo. Foram
amostradas 11 plantas da população X e 19 plantas da população Y. As duas amostras apresentaram
a mesma média quanto à quantidade de princípio ativo extraída. Sabendo que a variância da amostra
X foi 40 e da Y 16, pergunta-se. A população X possui maior variabilidade na quantidade de
princípio ativo em relação à população Y?
Resposta: Rejeita-se Ho ao nível de 5% de probabilidade.
Ftabelado 5% (10,18) =2,41; Fcalculado = 2,50
100
2) Um rebanho de certa raça leiteira apresenta lactação média de 200 kg. Uma nova raça foi
introduzida com o objetivo de aumentar a produtividade média. Posteriormente, uma amostra de 25
vacas apresentou uma lactação média de 210 kg e desvio padrão de 26 kg. Pode-se concluir que a
média de produção de leite aumentou com a introdução da nova raça?
Resposta: Rejeita-se Ho ao nível de 5% de probabilidade.
׀ tcalculado ׀ = 1,92; ttabelado 5% (24) = 1,71
3) A fim de diminuir o tempo que um analgésico leva para penetrar na corrente sanguínea, um
bioquímico acrescentou certo ingrediente a fórmula original que acusava tempo médio de 48
minutos. Em 30 observações com a nova fórmula obteve-se um tempo médio de 45 minutos com
variância de 25 minutos2. Admitindo a distribuição do tempo aproximadamente normal, o que se
pode concluir ao nível de 5% de probabilidade, sobre a eficiência do novo ingrediente?
Resposta: Rejeita-se Ho.
׀ tcalculado ׀ = 3,28; ttabelado 5% (29) = 1,70
4) Suponha que duas fontes protéicas X e Y deverão ser comparadas na alimentação de aves,
medindo-se a eficiência pelo tempo exigido para a absorção de determinado nutriente. A fonte X foi
administrada a 18 aves e a Y foi administrada a 13. Verificar se há diferença significativa entre as
duas rações, quanto ao tempo de absorção do nutriente, adotando α = 5%. Os resultados foram:
minSminS
minYminX
yx 15=12=
17=20=
22
Resposta: Fcalculado = 1,25; Ftabelado 5% (12,17) = 2,38; Não se rejeita Ho
׀ tcalculado ׀= 2,27; ttabelado 5% (29) = 2,045; Rejeita-se Ho.
5) Um pesquisador deseja saber se duas rações alimentares X e Y para suínos são equivalentes, ou
se a ração X é superior a ração Y no sentido de causar maior ganho de peso. Para 11 animais foi
dada a ração X e a outros 19 a ração Y. Os resultados foram:
2222 16=40=
63=66=
kgSkgS
kgYkgX
yx
A que conclusão chegar ao nível de 5% de probabilidade?
Resposta: Fcalculado = 2,50; Ftabelado 5% (10,18) = 2,41; Rejeita-se Ho
׀ tcalculado ׀= 1,418; ttabelado 5% (14) = 1,761; Não se rejeita Ho.
101
6) O quadro abaixo apresenta uma seqüência de observações sobre os valores das pressões de sete
indivíduos antes e depois da aplicação de um medicamento que tem por finalidade reduzir a
pressão. Verificar se o medicamento teve efeito significativo ao nível de 1% de probabilidade.
Pressão Indivíduo Antes Depois
1 1,1 0
2 3,9 1,2
3 3,1 2,1
4 5,3 2,1
5 5,3 3,4
6 3,4 2,2
7 5 3,2
Resposta: Ho: D = 0; Ha: D < 0
(tcalculado = -5,795; ttabelado (1%) = -3,143; Rejeita-se Ho)
7) Uma pesquisa feita junto a 320 famílias de 5 filhos cada revelou a distribuição apresentada na
tabela a seguir. Tais resultados são consistentes com a hipótese de igual probabilidade de
nascimento para ambos os sexos? Usar α = 5%.
Número de meninos Número de meninas Número de famílias
5 0 18
4 1 56
3 2 110
2 3 88
1 4 40
0 5 8
Total: 320
R.: HosejeitaRe;07,11;0,12 %)5(tabelado2calculado2 −=χ=χ
8) Uma amostra de 125 proprietários de certa máquina agrícola foi entrevistada. O objetivo foi
descobrir se o nível de satisfação dos proprietários com a máquina esta relacionada com a
concepção do consumo de combustível da mesma. Os dados obtidos na entrevista foram
organizados na tabela a seguir. Verificar, ao nível de 5% de probabilidade, se o nível de satisfação e
o consumo não guardam relação entre si.
Nível de Satisfação Consumo
Péssimo Regular Bom
Alto 29 27 42
Baixo 4 6 17
R.:
Ho: Desempenho e consumo são independentes
Ha: Desempenho e consumo não são independentes
HoserejeitaNão;991,5;791,3 %)5(tabelado2calculado2 −=χ=χ
102
9) Em seus experimentos com ervilha, Mendel observou 315 lisas e amarelas, 108 lisas e verdes,
101 rugosas e amarelas, 32 rugosas e verdes. De acordo com sua teoria de hereditariedade, os
números deveriam apresentar-se na proporção 9:3:3:1. As observações estão de acordo com esta
teoria, ao nível de 1% de probabilidade?
R.: HoserejeitaNão;345,11;470,0 %)1(tabelado2calculado2 −=χ=χ
10) Suponha que certo bairro possua dois colégios A e B, igualmente procurados por crianças de
todos os níveis econômicos. Alguém do bairro afirmou que a direção de um dos colégios faz certa
discriminação quanto a seleção de alunos, no sentido se dar preferência a crianças de nível
econômico mais elevado. A fim de verificar este fato, selecionou-se ao acaso uma amostra de 100
crianças do colégio A e uma amostra de 120 crianças do colégio B. Os dados se encontram
organizados na tabela a seguir. Teste se a hipótese de não haver discriminação entre os colégios ao
nível de 5% de probabilidade.
Nível Econômico Colégio Inferior Médio Superior Total
A 20 40 40 100
B 50 40 30 120
Total 70 80 70 220
R.: HosejeitaRe;991,5;57,12 %)5(tabelado2calculado2 −=χ=χ
103
Tabelas EstatísticasTabela 1. Probabilidades α da distribuição normal padrão N(0, 1), para valores do quantil Zt
padronizado, de acordo com a seguinte afirmativa probabilística: P(0<Z<Zt)=α.
Zt 0 1 2 3 4 5 6 7 8 9
0,0 0,00000 0,00399 0,00798 0,01197 0,01595 0,01994 0,02392 0,02790 0,03188 0,03586
0,1 0,03983 0,04380 0,04776 0,05172 0,05567 0,05962 0,06356 0,06749 0,07142 0,07535
0,2 0,07926 0,08317 0,08706 0,09095 0,09483 0,09871 0,10257 0,10642 0,11026 0,11409
0,3 0,11791 0,12172 0,12552 0,12930 0,13307 0,13683 0,14058 0,14431 0,14803 0,15173
0,4 0,15542 0,15910 0,16276 0,16640 0,17003 0,17364 0,17724 0,18082 0,18439 0,18793
0,5 0,19146 0,19497 0,19847 0,20194 0,20540 0,20884 0,21226 0,21566 0,21904 0,22240
0,6 0,22575 0,22907 0,23237 0,23565 0,23891 0,24215 0,24537 0,24857 0,25175 0,25490
0,7 0,25804 0,26115 0,26424 0,26730 0,27035 0,27337 0,27637 0,27935 0,28230 0,28524
0,8 0,28814 0,29103 0,29389 0,29673 0,29955 0,30234 0,30511 0,30785 0,31057 0,31327
0,9 0,31594 0,31859 0,32121 0,32381 0,32639 0,32894 0,33147 0,33398 0,33646 0,33891
1,0 0,34134 0,34375 0,34614 0,34849 0,35083 0,35314 0,35543 0,35769 0,35993 0,36214
1,1 0,36433 0,36650 0,36864 0,37076 0,37286 0,37493 0,37698 0,37900 0,38100 0,38298
1,2 0,38493 0,38686 0,38877 0,39065 0,39251 0,39435 0,39617 0,39796 0,39973 0,40147
1,3 0,40320 0,40490 0,40658 0,40824 0,40988 0,41149 0,41308 0,41466 0,41621 0,41774
1,4 0,41924 0,42073 0,42220 0,42364 0,42507 0,42647 0,42785 0,42922 0,43056 0,43189
1,5 0,43319 0,43448 0,43574 0,43699 0,43822 0,43943 0,44062 0,44179 0,44295 0,44408
1,6 0,44520 0,44630 0,44738 0,44845 0,44950 0,45053 0,45154 0,45254 0,45352 0,45449
1,7 0,45543 0,45637 0,45728 0,45818 0,45907 0,45994 0,46080 0,46164 0,46246 0,46327
1,8 0,46407 0,46485 0,46562 0,46638 0,46712 0,46784 0,46856 0,46926 0,46995 0,47062
1,9 0,47128 0,47193 0,47257 0,47320 0,47381 0,47441 0,47500 0,47558 0,47615 0,47670
2,0 0,47725 0,47778 0,47831 0,47882 0,47932 0,47982 0,48030 0,48077 0,48124 0,48169
2,1 0,48214 0,48257 0,48300 0,48341 0,48382 0,48422 0,48461 0,48500 0,48537 0,48574
2,2 0,48610 0,48645 0,48679 0,48713 0,48745 0,48778 0,48809 0,48840 0,48870 0,48899
2,3 0,48928 0,48956 0,48983 0,49010 0,49036 0,49061 0,49086 0,49111 0,49134 0,49158
2,4 0,49180 0,49202 0,49224 0,49245 0,49266 0,49286 0,49305 0,49324 0,49343 0,49361
2,5 0,49379 0,49396 0,49413 0,49430 0,49446 0,49461 0,49477 0,49492 0,49506 0,49520
2,6 0,49534 0,49547 0,49560 0,49573 0,49585 0,49598 0,49609 0,49621 0,49632 0,49643
2,7 0,49653 0,49664 0,49674 0,49683 0,49693 0,49702 0,49711 0,49720 0,49728 0,49736
2,8 0,49744 0,49752 0,49760 0,49767 0,49774 0,49781 0,49788 0,49795 0,49801 0,49807
2,9 0,49813 0,49819 0,49825 0,49831 0,49836 0,49841 0,49846 0,49851 0,49856 0,49861
3,0 0,49865 0,49869 0,49874 0,49878 0,49882 0,49886 0,49889 0,49893 0,49896 0,49900
3,1 0,49903 0,49906 0,49910 0,49913 0,49916 0,49918 0,49921 0,49924 0,49926 0,49929
3,2 0,49931 0,49934 0,49936 0,49938 0,49940 0,49942 0,49944 0,49946 0,49948 0,49950
3,3 0,49952 0,49953 0,49955 0,49957 0,49958 0,49960 0,49961 0,49962 0,49964 0,49965
3,4 0,49966 0,49968 0,49969 0,49970 0,49971 0,49972 0,49973 0,49974 0,49975 0,49976
3,5 0,49977 0,49978 0,49978 0,49979 0,49980 0,49981 0,49981 0,49982 0,49983 0,49983
3,6 0,49984 0,49985 0,49985 0,49986 0,49986 0,49987 0,49987 0,49988 0,49988 0,49989
3,7 0,49989 0,49990 0,49990 0,49990 0,49991 0,49991 0,49992 0,49992 0,49992 0,49992
3,8 0,49993 0,49993 0,49993 0,49994 0,49994 0,49994 0,49994 0,49995 0,49995 0,49995
3,9 >0,49995 etc ...
104
Tabela 2. Limites unilaterais de F ao nível de 5% de probabilidade, para o caso de F > 1.
n1
n2
1 2 3 4 5 6 7 8 9 10 12 14 15 16 18 20 24 30 40 60 120 ∞
1 161,4 199,5 215,7 224,6 230,2 234,0 236,8 238,9 240,5 241,9 243,9 245,4 245,9 246,5 247,3 248,0 249,1 250,1 251,1 252,2 253,3 254,3
2 18,51 19,00 19,16 19,25 19,30 19,33 19,35 19,37 19,38 19,40 19,41 19,42 19,43 19,43 19,44 19,45 19,45 19,46 19,47 19,48 19,49 19,50
3 10,13 9,55 9,28 9,12 9,01 8,94 8,89 8,85 8,81 8,79 8,74 8,72 8,70 8,69 8,67 8,66 8,64 8,62 8,59 8,57 8,55 8,53
4 7,71 6,94 6,59 6,39 6,26 6,16 6,09 6,04 6,00 5,96 5,91 5,87 5,86 5,84 5,82 5,80 5,77 5,75 5,72 5,69 5,66 5,63
5 6,61 5,79 5,41 5,19 5,05 4,95 4,88 4,82 4,77 4,74 4,68 4,64 4,62 4,60 4,58 4,56 4,53 4,50 4,46 4,43 4,40 4,36
6 5,99 5,14 4,76 4,53 4,39 4,28 4,21 4,15 4,10 4,06 4,00 3,96 3,94 3,92 3,90 3,87 3,84 3,81 3,77 3,74 3,70 3,67
7 5,59 4,74 4,35 4,12 3,97 3,87 3,79 3,73 3,68 3,64 3,57 3,53 3,51 3,49 3,47 3,44 3,41 3,38 3,34 3,30 3,27 3,23
8 5,32 4,46 4,07 3,84 3,69 3,58 3,50 3,44 3,39 3,35 3,28 3,24 3,22 3,20 3,17 3,15 3,12 3,08 3,04 3,01 2,97 2,93
9 5,12 4,26 3,86 3,63 3,48 3,37 3,29 3,23 3,18 3,14 3,07 3,03 3,01 2,99 2,96 2,94 2,90 2,86 2,83 2,79 2,75 2,71
10 4,96 4,10 3,71 3,48 3,33 3,22 3,14 3,07 3,02 2,98 2,91 2,87 2,85 2,83 2,80 2,77 2,74 2,70 2,66 2,62 2,58 2,54
11 4,84 3,98 3,59 3,36 3,20 3,09 3,01 2,95 2,90 2,85 2,79 2,74 2,72 2,70 2,67 2,65 2,61 2,57 2,53 2,49 2,45 2,40
12 4,75 3,89 3,49 3,26 3,11 3,00 2,91 2,85 2,80 2,75 2,69 2,64 2,62 2,60 2,57 2,54 2,51 2,47 2,43 2,38 2,34 2,30
13 4,67 3,81 3,41 3,18 3,03 2,92 2,83 2,77 2,71 2,67 2,60 2,55 2,53 2,52 2,48 2,46 2,42 2,38 2,34 2,30 2,25 2,21
14 4,60 3,74 3,34 3,11 2,96 2,85 2,76 2,70 2,65 2,60 2,53 2,48 2,46 2,44 2,41 2,39 2,35 2,31 2,27 2,22 2,18 2,13
15 4,54 3,68 3,29 3,06 2,90 2,79 2,71 2,64 2,59 2,54 2,48 2,42 2,40 2,39 2,35 2,33 2,29 2,25 2,20 2,16 2,11 2,07
16 4,49 3,63 3,24 3,01 2,85 2,74 2,66 2,59 2,54 2,49 2,42 2,37 2,35 2,33 2,30 2,28 2,24 2,19 2,15 2,11 2,06 2,01
17 4,45 3,59 3,20 2,96 2,81 2,70 2,61 2,55 2,49 2,45 2,38 2,34 2,31 2,29 2,26 2,23 2,19 2,15 2,10 2,06 2,01 1,96
18 4,41 3,55 3,16 2,93 2,77 2,66 2,58 2,51 2,46 2,41 2,34 2,29 2,27 2,25 2,22 2,19 2,15 2,11 2,06 2,02 1,97 1,92
19 4,38 3,52 3,13 2,90 2,74 2,63 2,54 2,48 2,42 2,38 2,31 2,26 2,23 2,22 2,18 2,16 2,11 2,07 2,03 1,98 1,93 1,88
20 4,35 3,49 3,10 2,87 2,71 2,60 2,51 2,45 2,39 2,35 2,28 2,22 2,20 2,18 2,15 2,12 2,08 2,04 1,99 1,95 1,90 1,84
21 4,32 3,47 3,07 2,84 2,68 2,57 2,49 2,42 2,37 2,32 2,25 2,20 2,18 2,16 2,12 2,10 2,05 2,01 1,96 1,92 1,87 1,81
22 4,30 3,44 3,05 2,82 2,66 2,55 2,46 2,40 2,34 2,30 2,23 2,17 2,15 2,13 2,10 2,07 2,03 1,98 1,94 1,89 1,84 1,78
23 4,28 3,42 3,03 2,80 2,64 2,53 2,44 2,37 2,32 2,27 2,20 2,15 2,13 2,11 2,08 2,05 2,01 1,96 1,91 1,86 1,81 1,76
24 4,26 3,40 3,01 2,78 2,62 2,51 2,42 2,36 2,30 2,25 2,18 2,13 2,11 2,09 2,05 2,03 1,98 1,94 1,89 1,84 1,79 1,73
25 4,24 3,39 2,99 2,76 2,60 2,49 2,40 2,34 2,28 2,24 2,16 2,11 2,09 2,07 2,04 2,01 1,96 1,92 1,87 1,82 1,77 1,71
26 4,23 3,37 2,98 2,74 2,59 2,47 2,39 2,32 2,27 2,22 2,15 2,09 2,07 2,05 2,02 1,99 1,95 1,90 1,85 1,80 1,75 1,69
27 4,21 3,35 2,96 2,73 2,57 2,46 2,37 2,31 2,25 2,20 2,13 2,08 2,06 2,04 2,00 1,97 1,93 1,88 1,84 1,79 1,73 1,67
28 4,20 3,34 2,95 2,71 2,56 2,45 2,36 2,29 2,24 2,19 2,12 2,06 2,04 2,02 1,99 1,96 1,91 1,87 1,82 1,77 1,71 1,65
29 4,18 3,33 2,93 2,70 2,55 2,43 2,35 2,28 2,22 2,18 2,10 2,05 2,03 2,01 1,97 1,94 1,90 1,85 1,81 1,75 1,70 1,64
30 4,17 3,32 2,92 2,69 2,53 2,42 2,33 2,27 2,21 2,16 2,09 2,04 2,01 1,99 1,96 1,93 1,89 1,84 1,79 1,74 1,68 1,62
40 4,08 3,23 2,84 2,61 2,45 2,34 2,25 2,18 2,12 2,08 2,00 1,95 1,92 1,90 1,87 1,84 1,79 1,74 1,69 1,64 1,58 1,51
60 4,00 3,15 2,76 2,53 2,37 2,25 2,17 2,10 2,04 1,99 1,92 1,86 1,84 1,81 1,78 1,75 1,70 1,65 1,59 1,53 1,47 1,39
120 3,92 3,07 2,68 2,45 2,29 2,17 2,09 2,02 1,96 1,91 1,83 1,77 1,75 1,72 1,69 1,66 1,61 1,55 1,50 1,43 1,35 1,25
∞ 3,84 3,00 2,60 2,37 2,21 2,10 2,01 1,94 1,88 1,83 1,75 1,69 1,67 1,63 1,60 1,57 1,52 1,46 1,39 1,32 1,22 1,00
n1 = número de graus de liberdade do numerador e n2 = número de graus de liberdade do denominador
105
Tabela 3. Valores de t (tabela bilateral)
Rohlf, FJ & Sokal, RR. Statistical Tables, 2nd ed., USA, 1981.106
Tabela 4. Valores de t (tabela unilateral)
107
Tabela 5. Quantis superiores da distribuição qui-quadrdo )( 2 αχ com v graus de liberdade e
diferentes valores de probabilidade (α), de acordo com a seguinte afirmativa probabilística: P 2(χ >
α=χ α )2 .
v 0.995 0.975 0.9 0.5 0.1 0.05 0.025 0.01 0.005 0.001
1 0.000 0.001 0.016 0.455 2.706 3.841 5.024 6.635 7.879 10.827
2 0.010 0.051 0.211 1.386 4.605 5.991 7.378 9.210 10.597 13.815
3 0.072 0.216 0.584 2.366 6.251 7.815 9.348 11.345 12.838 16.266
4 0.207 0.484 1.064 3.357 7.779 9.488 11.143 13.277 14.860 18.466
5 0.412 0.831 1.610 4.351 9.236 11.070 12.832 15.086 16.750 20.515
6 0.676 1.237 2.204 5.348 10.645 12.592 14.449 16.812 18.548 22.457
7 0.989 1.690 2.833 6.346 12.017 14.067 16.013 18.475 20.278 24.321
8 1.344 2.180 3.490 7.344 13.362 15.507 17.535 20.090 21.955 26.124
9 1.735 2.700 4.168 8.343 14.684 16.919 19.023 21.666 23.589 27.877
10 2.156 3.247 4.865 9.342 15.987 18.307 20.483 23.209 25.188 29.588
11 2.603 3.816 5.578 10.341 17.275 19.675 21.920 24.725 26.757 31.264
12 3.074 4.404 6.304 11.340 18.549 21.026 23.337 26.217 28.300 32.909
13 3.565 5.009 7.041 12.340 19.812 22.362 24.736 27.688 29.819 34.527
14 4.075 5.629 7.790 13.339 21.064 23.685 26.119 29.141 31.319 36.124
15 4.601 6.262 8.547 14.339 22.307 24.996 27.488 30.578 32.801 37.698
16 5.142 6.908 9.312 15.338 23.542 26.296 28.845 32.000 34.267 39.252
17 5.697 7.564 10.085 16.338 24.769 27.587 30.191 33.409 35.718 40.791
18 6.265 8.231 10.865 17.338 25.989 28.869 31.526 34.805 37.156 42.312
19 6.844 8.907 11.651 18.338 27.204 30.144 32.852 36.191 38.582 43.819
20 7.434 9.591 12.443 19.337 28.412 31.410 34.170 37.566 39.997 45.314
21 8.034 10.283 13.240 20.337 29.615 32.671 35.479 38.932 41.401 46.796
22 8.643 10.982 14.041 21.337 30.813 33.924 36.781 40.289 42.796 48.268
23 9.260 11.689 14.848 22.337 32.007 35.172 38.076 41.638 44.181 49.728
24 9.886 12.401 15.659 23.337 33.196 36.415 39.364 42.980 45.558 51.179
25 10.520 13.120 16.473 24.337 34.382 37.652 40.646 44.314 46.928 52.619
26 11.160 13.844 17.292 25.336 35.563 38.885 41.923 45.642 48.290 54.051
27 11.808 14.573 18.114 26.336 36.741 40.113 43.195 46.963 49.645 55.475
28 12.461 15.308 18.939 27.336 37.916 41.337 44.461 48.278 50.994 56.892
29 13.121 16.047 19.768 28.336 39.087 42.557 45.722 49.588 52.335 58.301
30 13.787 16.791 20.599 29.336 40.256 43.773 46.979 50.892 53.672 59.702
Rohlf, FJ & Sokal, RR. Statistical Tables, 2nd ed., USA, 1981.
1.4. Apresentação gráfica e tabular
Variáveis qualitativas - nominais e ordinais
Variáveis Quantitativas Discretas
Variáveis Quantitativas contínuas
1.5. Medidas de posição
Medidas de posição são aquelas que visam representar a tendência central de uma distribuição, isto é, um valor em torno do qual os dados se distribuem.
Média aritmética
A média aritmética é uma medida de posição que pode ser utilizada para variáveis quantitativas. Dado um conjunto de n observações X1, X2, X3, ..., Xn, define-se a média aritmética por:
(1)
Se os valores X1, X2, X3, ..., Xn ocorrem com as respectivas freqüências f1, f2, f3, ..., fn tem-se a média aritmética ponderada:
(2)
Exemplo
Os dados abaixo se referem ao número de espigas em 22 plantas de milho-pipoca:
0 1 1 1 1 1 2 2 2 2 2 2 3 3 3 3 4 4 4 5 5 6
A média destes valores é obtida pela equação (1):
2,59
Tem-se uma média de 2,59 espigas por planta.
Estes valores podem ser apresentados em uma tabela de freqüência, como no exemplo a seguir:
Número de espigas/planta
Freqüência absoluta (fi)
0
1
1
5
2
6
3
4
4
3
5
2
6
1
Total
22
Neste caso a média pode ser obtida pela equação (2):
Esta média também é chamada de média ponderada, pois cada valor é ponderado por um peso, que neste caso é a freqüência.
Propriedades da média aritmética
a) A soma algébrica dos desvios em relação à média aritmética é nula;
b) Somando-se ou subtraindo-se uma constante a cada um dos valores da série X1, X2, X3, ..., Xn, a média destes valores fica somada ou subtraída da constante; ;
c) Multiplicando-se ou dividindo-se cada um dos valores da série X1, X2, X3, ..., Xn, a média destes valores fica multiplicada ou dividida pela constante;
d) A soma de quadrados dos desvios (SQD) em relação a média é um mínimo;
é um mínimo
Seja
Logo, tem-se um ponto de mínimo para o valor de X0 = média.
Moda
A moda de um conjunto de dados é o valor que ocorre com maior freqüência.
Por exemplo: Considere o seguinte conjunto de observações:
2, 4, 3, 4, 1, 1, 2, 2,
Neste caso a moda é 2 (Mo = 2), que é o valor que ocorre com maior freqüência.
Considere agora a seguinte distribuição de freqüência de tipos sanguíneos:
Tipos Sanguíneos
A
B
AB
O
Freqüência Absoluta
10
13
8
14
Neste caso a moda é o tipo sanguíneo O, que ocorre com maior freqüência.
Nestes dois exemplos têm-se séries unimodais, ou seja, possuem uma única moda. Quando uma série possui mais de uma moda ela é dita multimodal e, quando não possui moda é dita amodal.
Note que no primeiro exemplo a variável é quantitativa discreta e no segundo a variável é qualitativa. Para variáveis quantitativas contínuas pode-se obter a moda quando os dados são agrupados em classes ou, obtendo-se o ponto de máximo da função de freqüência, como no exemplo a seguir.
Considere a seguinte função de freqüência: f(x) = X – X 2
Derivando-se esta função e igualando a zero, se obtém um ponto de máximo ou mínimo.
f’(x) = 1 – 2x
f’(x) = 0
1 – 2x = 0 → x = ½
Este ponto será um máximo se a segunda derivada for negativa e um mínimo se a segunda derivada for positiva.
f”(x) = -2
Como a segunda derivada é negativa, o ponto x = ½ é de máximo.
Mediana
A mediana de um conjunto de dados ordenados em ordem crescente ou decrescente de grandeza é o valor abaixo e acima do qual se tem a metade dos dados. Assim, a mediana divide o conjunto ordenado em duas partes com igual número de dados.
Há dois casos a considerar:
a) n é impar: a mediana será o valor que ocupa a posição de um rol estatístico.
Ex.: 5, 4, 2, 6, 3, 7, 9; n = 7
rol.: 2, 3, 4, 5, 6, 7, 9
, ou seja, P4 = elemento do rol que ocupa a quarta posição = 5
b) n é par: a mediana será a média dos valores que ocupam as posições e de um rol estatístico.
Ex.: 7, 6, 1, 4, 8, 9, 3, 2; n = 8
rol.: 1, 2, 3, 4, 6, 7, 8, 9
, a mediana é a média dos valores que ocupam a posição 4 e 5. Assim, Med = (4+6)/2=5.
A mediana é uma medida de posição, em geral, menos informativa que a média, pois só considera os ranques (postos ou posições) das observações e não o valor, como faz à média. No entanto, em algumas ocasiões à mediana pode ser mais vantajosa pelo fato de não ser afetada pelos extremos. Considere o exemplo a seguir:
1 2 3 4 5 6 7 8 9 10 11
Note que a média e a mediana deste conjunto de dados é igual a 6. Vamos supor agora o seguinte conjunto de dados onde ocorreu um valor extremo:
1 2 3 4 5 6 7 8 9 10 40
Note que a mediana não foi alterada, continua sendo igual a 6. No entanto, a média neste caso é igual a 8,64 devido ao valor extremo igual a 40.
A mediana também tem a vantagem de poder ser aplicada a variáveis qualitativas ordinais.
1.6. Medidas de dispersão
As medidas de dispersão medem a variabilidade dos dados. Entre as várias medidas existentes veremos apenas as mais importantes.
Variância
A variância mede a variabilidade dos dados em torno da média. Dada uma amostra de n valores X1, X2, X3, ..., Xn define-se a variância de x por:
Aplicando propriedades do somatório tem-se:
Se os valores X1, X2, X3, ... Xn ocorrem com as respectivas freqüências f1, f2, f3,..., fn a soma de quadrados dos desvios será:
SQD =
Assim, a variância de um conjunto de dados quantitativos pode ser obtida por:(3)
Se os dados estão organizados em tabelas de freqüência a variância pode ser obtida por:
(4)
Exemplo
Considerando novamente os dados que se referem ao número de espigas em 22 plantas de milho-pipoca:
0 1 1 1 1 1 2 2 2 2 2 2 3 3 3 3 4 4 4 5 5 6
A variância destes valores é obtida pela equação (3):
Estes valores podem ser apresentados em uma tabela de freqüência, como no exemplo a seguir:
Número de espigas/planta
Freqüência absoluta (Fi)
0
1
1
5
2
6
3
4
4
3
5
2
6
1
Total
22
Neste caso a variância pode ser obtida pela equação (4):
Propriedades da variância
a) Variância de uma constante (k) é igual a zero: V(k) = 0.
b) Somando-se ou subtraindo-se uma constante a cada um dos valores da série, a variância não se altera: .
c) Multiplicando-se ou dividindo-se cada um dos valores da série por uma constante, a variância fica multiplicada ou dividida pelo quadrado da constante.
Desvio Padrão
O desvio padrão é simplesmente a raiz quadrada da variância, obtido por:
O desvio padrão para o número de espigas/planta de milho-pipoca é:
Observação
A unidade de medida da variável que se estima a variância fica elevada ao quadrado, assim, por exemplo, uma medida em metros (m) fica m2. No desvio padrão a variável ficaria em m.
Erro Padrão da Média
É uma medida de dispersão que mede a precisão da média aritmética. Quanto menor o desvio padrão e maior a amostra, menor é o erro padrão da média e mais precisa será a média.
A equação que nos dá essa relação é:
O erro padrão da média para o número de espigas/planta de milho-pipoca é:
Coeficiente de Variação
O coeficiente de variação é uma medida de dispersão relativa. Sua vantagem é o fato de ser uma medida adimensional, assim, independe das unidades usadas e é importante para comparar a dispersão de amostras de médias ou unidades de medida diferentes.
O coeficiente de variação é obtido pela razão do desvio padrão pela média:
O coeficiente de variação para o número de espigas/planta de milho-pipoca é:
Observação importante
Para comparar duas amostras com relação a homogeneidade, temos dois casos a considerar:
a) As médias das amostras são iguais . Neste caso a mais homogênea é aquela que possui a menor variância, desvio padrão ou coeficiente de variação. Qualquer destas medidas pode ser utilizada.
b) Se as médias de duas amostras são diferentes, ou ainda, se as duas amostras possuem unidades de medida diferente, deve-se utilizar o coeficiente de variação. Assim, a amostra de menor coeficiente de variação é a mais homogênea.
1.7. Medidas de correlação
As medidas de correlação medem o grau de associação entre duas variáveis.
Por exemplo:
altura da planta x peso de grãos
tempo de treinamento x rendimento do atleta
quantidade de adubo x produtividade
Note que, em todos estes exemplos, as variáveis são quantitativas. Nestes casos pode-se obter um valor que nos dá o grau de associação entre duas variáveis. A medida em questão é chamada de correlação de Pearson e, pode ser obtida pela seguinte equação:
onde
O valor da correlação ( ) entre duas variáveis varia de -1 a 1. Quando o valor é positivo, uma variável cresce e a outra, em média, também cresce. Isto é, as duas variáveis variam no mesmo sentido. Quando o valor é negativo uma variável cresce e a outra, em média, decresce. Neste caso as variáveis variam em sentido contrário. Quando a correlação é nula as variáveis não estão relacionadas.
Exemplo
Os dados a seguir referem-se a altura média AP (m) e a produtividade de grãos PG (g) de 8 famílias de milho-pipoca.
Neste caso podem-se fazer as seguintes perguntas:
Será que a altura de plantas esta correlacionada com a produtividade?
Será que plantas mais altas são mais produtivas?
Neste caso, se a correlação for positiva, ou seja, o valor obtido estiver no intervalo entre 0 e 1, pode-se concluir que, em geral, plantas mais altas são mais produtivas. Quanto mais a correlação se aproxima de 1, maior é a correlação, ou seja, tem-se uma tendência mais acentuada de plantas mais altas serem mais produtivas.
Para obter o valor da correlação vamos utilizar a fórmula a seguir:
Portanto, a altura de planta esta correlacionada com a produtividade. Como o valor é positivo (0,60), pode-se dizer que existe uma tendência de magnitude razoável de plantas mais altas serem mais produtivas.
Se o valor fosse negativo (-0,60) ter-se-ia tendência de plantas mais baixas serem mais produtivas. Se o valor fosse zero ou de próximo de zero, a tendência seria nula ou muito baixa.
A correlação pode ser visualizada em gráficos chamados de diagrama de dispersão. Os gráficos abaixo representam os valores de duas variáveis (X,Y) plotados no eixo cartesiano:
a) correlação positiva (0,99) b) correlação negativa (-0,99) c) ausência de correlação (0,00)
1.8. Regressão linear simples
Como abordado anteriormente, duas variáveis quantitativas podem apresentar diferentes níveis de associação ou, muitas vezes, nem estarem associadas. A simples existência de associação indica que uma variável pode estar influenciando à outra em uma relação de causa e efeito. Por exemplo, considere o gráfico de dispersão abaixo em que as duas variáveis estão muito correlacionadas (0,99).
Esta relação pode indicar uma influencia de causa e efeito da variável X sobre a variável Y. Suponha que X seja a quantidade de determinado fertilizante e Y a produtividade de determinada cultura. Assim, a influencia de causa e efeito do adubo sobre a produtividade poderia ser quantificada. Note que o gráfico indica uma resposta linear e, portanto, pode-se adotar um modelo linear para quantificar a resposta da produção em relação à quantidade de adubo. O modelo matemático em questão, já bastante conhecido, é a equação da reta:
y = a + bx
Note que para cada quantidade de adubo (x), ter-se-ia uma resposta em y. Se a quantidade de adubo fosse igual à zero, ainda assim haveria produção. Neste caso y = a.
No entanto, a equação apresentada trata-se de um modelo matemático (exato). Para representar os dados utilizaremos um modelo estatístico dado por:
y = a + bx + erro
Este modelo é equivalente a:
Este é um modelo estatístico que representa uma relação linear de causa e efeito entre duas variáveis quantitativas. O coeficiente nada mais é do que o coeficiente linear da reta (a). O coeficiente nada mais é do que o coeficiente angular da reta (b), também chamado de regressor. Então, a diferença do modelo estatístico para o matemático é a consideração do erro (ei) no modelo estatístico. Como a produtividade depende de outros fatores (chuva, ataque de pragas, etc) além da quantidade de adubo, a resposta não é perfeitamente linear. Assim, a influencia de variáveis desconhecidas é quantificada no erro.
Para ficar mais claro esta abordagem, vejamos o exemplo a seguir, onde se tem a produtividade de milho em função de diferentes quantidades de adubo (dados hipotéticos):
Note que, parece haver uma relação entre as variáveis, ou seja, quanto maior a quantidade de adubo, maior é a produtividade. Realmente, a correlação de Pearson para estes dados é de 0,986. Analisando o gráfico abaixo, também se pode visualizar que a associação é linear e sugere um tipo de ralação de causa e efeito entre as variáveis.
Portanto, o modelo estatístico que representa estes dados é:
Assim, o objetivo da regressão é obter o melhor modelo (matemático) que se ajuste aos dados, que é aquele que minimiza a soma de quadrados dos erros (ei). Este método é denominado método dos mínimos quadrados. Para obter o modelo ajustado, podem-se adotar os seguintes passos:
a) Isolar o erro (ei) na equação:
b) Elevar ambos os membros da equação ao quadrado:
c) Aplicar somatório:
d) Derivar a equação em relação a βo e β1 e igualar a zero:
e) Aplicar propriedades do somatório:f) Resolver o sistema resultante obtendo e :
Assim, parte-se de um modelo estatístico e obtém-se um modelo matemático, que é a equação ajustada dada por:
Esta equação é equivalente a equação da reta y = a + bx.
Agora podemos aplicar estes conhecimentos nos dados de adubação e produção do milho e obter uma equação que melhor se ajusta aos dados. O primeiro passo é a obtenção dos seguintes valores:
Agora é só utilizar as fórmulas obtidas pelas derivadas parciais para estimar os valores de βo e β1.
O modelo ajustado ( ) fica:
Assim, para cada acréscimo em uma unidade de X, tem-se um acréscimo de 11,71 unidades em Y, ou seja, para cada 1 kg/ha de adubo (NPK), tem-se um acréscimo de 11,71 kg/ha na produção de milho. Se a quantidade de adubo for igual à zero, a produtividade é igual a 5445,05 kg/ha. Colocando todos os valores de X na equação e obtendo os respectivos valores de Y, obtém-se a reta do gráfico abaixo, que é aquela que melhor se ajusta aos dados:
Observações importantes:
Aqui foi apresentado apenas o modelo de uma regressão linear simples. Isso porque a variável resposta Y esta em função de apenas uma variável (X). Quando a variável resposta (Y) esta em função de duas ou mais variáveis, em um modelo linear, tem-se os modelos de regressão linear múltipla. No entanto, nem sempre a natureza de uma interação é linear. Para estes casos existem outros tipos de regressão, como a regressão quadrática, cúbica, exponencial etc.
A equação ajustada só deve ser utilizada para valores de X do intervalo avaliado, ou seja, neste exemplo os valores de X devem ficar entre 0 e 450. Para melhor entendermos esta colocação, vamos raciocinar o seguinte. Suponha que sejam aplicadas quantidades de adubo superior a 450 kg/ha. Pode-se pensar que a produtividade irá aumentar. Porém, não sabemos a natureza da resposta neste caso, pois ela não foi avaliada. Uma quantidade de adubo acima de 450 kg/ha pode acarretar uma resposta nula, não linear ou até mesmo negativa. Portanto, não é adequado prever valores de Y fora do intervalo de valores de X utilizados para a obtenção da equação ajustada.
Duas variáveis podem ter correlação aproximadamente nula e terem uma relação de causa e efeito. Estes casos não foram abordados aqui, como por exemplo, a regressão polinomial quadrática representada abaixo, onde a correlação é -0,04:
Exercícios – Estatística Descritiva
Somatório
9 - Em uma suinocultura com 200 animais, tem-se 150 fêmeas e 50 machos. Tem-se também, 4 animais doentes, sendo 3 doentes machos e 1 fêmea. Comprando um animal ao acaso, qual a probabilidade do animal:
a) ser macho R.: 1/4
b) ser fêmea R.: 3/4
c) estar doente R.: 1/50
d) estar doente e ser macho R.: 3/200
e) Um macho foi comprado. Qual a probabilidade do animal estar doente? R.: 3/50
f) Uma fêmea foi comprada. Qual a probabilidade do animal estar doente? R.: 1/150
g) Querendo evitar a compra de um animal doente, você compraria uma animal macho ou fêmea? Justifique a sua resposta.