Estatística Básica

breadcrumb-separator

Agrárias

em 16/12/2018

Conteúdos escolhidos para você

ESTATISTICA

04_Estatistica

UFRJ

05-apostila-versao-digital-probabilidade-e-estatistica

05-apostila-versao-digital-probabilidade-e-estatistica

UNIFESP

Probabilidade e Estatística

Probabilidade e Estatística

FAVENI

Estatística com Aplicações

Estatística com Aplicações

Uniasselvi

Perguntas dessa disciplina

Leia o texto a seguir: Consideremos o seguinte experimento aleatório: Vamos sortear uma amostra de 20 funcionários de uma empresa que tem 100 funcioná

FAM

Leia o texto a seguir: Consideremos o seguinte experimento aleatórioLeia o texto a seguir: A distribuição binomial de probabilidade é aplicada à exper

FAM

Considerando o que foi estudado a respeito do uso da estatística e das funções das medidas de dispersão para as pesquisas científicas, leia as afir...

FAM

Pergunta 20,2 pts A estatística está presente em todos os dias da nossa vida, mesmo que nem sempre seja visível. Previsões da meteorologia, pesquisas

FAM

AVALIAÇÃO PRESENCIAL – BIOESTATÍSTICA APLICADA À SAÚDE – 2° PERÍODO – TERAPIA OCUPACIONAL 2 A estatística pode ser definida como um ramo da matemática

Material

left-side-bubbles-background

right-side-bubbles-background

Experimente o Premium!

Acesse conteúdos dessa e de diversas outras disciplinas.

Libere conteúdos
sem pagar

Ajude estudantes e ganhe conteúdos liberados!

left-side-bubbles-background

right-side-bubbles-background

Experimente o Premium!

Acesse conteúdos dessa e de diversas outras disciplinas.

Libere conteúdos
sem pagar

Ajude estudantes e ganhe conteúdos liberados!

left-side-bubbles-background

right-side-bubbles-background

Experimente o Premium!

Acesse conteúdos dessa e de diversas outras disciplinas.

Libere conteúdos
sem pagar

Ajude estudantes e ganhe conteúdos liberados!

left-side-bubbles-background

right-side-bubbles-background

Experimente o Premium!

Acesse conteúdos dessa e de diversas outras disciplinas.

Libere conteúdos
sem pagar

Ajude estudantes e ganhe conteúdos liberados!

left-side-bubbles-background

right-side-bubbles-background

Experimente o Premium!

Acesse conteúdos dessa e de diversas outras disciplinas.

Libere conteúdos
sem pagar

Ajude estudantes e ganhe conteúdos liberados!

left-side-bubbles-background

right-side-bubbles-background

Experimente o Premium!

Acesse conteúdos dessa e de diversas outras disciplinas.

Libere conteúdos
sem pagar

Ajude estudantes e ganhe conteúdos liberados!

left-side-bubbles-background

right-side-bubbles-background

Experimente o Premium!

Acesse conteúdos dessa e de diversas outras disciplinas.

Libere conteúdos
sem pagar

Ajude estudantes e ganhe conteúdos liberados!

left-side-bubbles-background

right-side-bubbles-background

Experimente o Premium!

Acesse conteúdos dessa e de diversas outras disciplinas.

Libere conteúdos
sem pagar

Ajude estudantes e ganhe conteúdos liberados!

left-side-bubbles-background

right-side-bubbles-background

Experimente o Premium!

Acesse conteúdos dessa e de diversas outras disciplinas.

Libere conteúdos
sem pagar

Ajude estudantes e ganhe conteúdos liberados!

left-side-bubbles-background

right-side-bubbles-background

Experimente o Premium!

Acesse conteúdos dessa e de diversas outras disciplinas.

Libere conteúdos
sem pagar

Ajude estudantes e ganhe conteúdos liberados!

Conteúdos escolhidos para você

ESTATISTICA

04_Estatistica

UFRJ

05-apostila-versao-digital-probabilidade-e-estatistica

05-apostila-versao-digital-probabilidade-e-estatistica

UNIFESP

Probabilidade e Estatística

Probabilidade e Estatística

FAVENI

Estatística com Aplicações

Estatística com Aplicações

Uniasselvi

Perguntas dessa disciplina

Leia o texto a seguir: Consideremos o seguinte experimento aleatório: Vamos sortear uma amostra de 20 funcionários de uma empresa que tem 100 funcioná

FAM

Leia o texto a seguir: Consideremos o seguinte experimento aleatórioLeia o texto a seguir: A distribuição binomial de probabilidade é aplicada à exper

FAM

Considerando o que foi estudado a respeito do uso da estatística e das funções das medidas de dispersão para as pesquisas científicas, leia as afir...

FAM

Pergunta 20,2 pts A estatística está presente em todos os dias da nossa vida, mesmo que nem sempre seja visível. Previsões da meteorologia, pesquisas

FAM

AVALIAÇÃO PRESENCIAL – BIOESTATÍSTICA APLICADA À SAÚDE – 2° PERÍODO – TERAPIA OCUPACIONAL 2 A estatística pode ser definida como um ramo da matemática

Prévia do material em texto

UNIVERSIDADE FEDERAL DO MARANHÃO 
CENTRO DE CIÊNCIAS AGRÁRIAS E AMBIENTAIS 
 
 
 
 
Estatística Básica 
 
 
Emmanuel Arnhold 
Professor Adjunto (UFMA/CCAA) 
 
 
 
 
 
 
Chapadinha - Maranhão 
2007 
 
 
Apresentação 
Atualmente encontram-se um grande número de livros abordando aspectos introdutórios de 
estatística. No entanto, são raros os materiais didáticos introdutórios aplicados à área de ciências 
agrárias. Visando estimular o aprendizado com uma linguagem mais simples e aplicada, com 
exemplos práticos voltados, principalmente, as áreas de ciências agrárias e biológicas, o presente 
material foi desenvolvido para auxiliar o aprendizado dos alunos de agronomia, biologia e zootecnia 
do campus de Ciências Agrárias e Ambientais (CCAA). Portanto, esta apostila será utilizada como 
apoio didático nas disciplinas de introdução à estatística destes cursos. 
A apostila esta distribuída em quatro capítulos. O Capítulo I trata da Estatística Descritiva, 
iniciando com somatório e, em seqüência, abordando variáveis, tabelas de freqüência, gráficos, 
medidas de posição, dispersão, correlação e regressão linear simples. O Capítulo II aborda 
Probabilidade e seus conceitos e teoremas. O Capítulo III aborda as principais distribuições de 
probabilidade, como as distribuições binomial, multinomial, poisson, normal e normal padronizada. 
O Capítulo IV aborda a Inferência Estatística, iniciando com amostragem e, em seqüência, 
estimação intervalar e testes de hipóteses como os testes F, t e qui-quadrado. Neste material também 
estão inclusos exercícios e tabelas estatísticas. 
 
 
 
O autor 
 
 
 
 
 
 
 
 
 
 
 
Sumário 
 
 
 Página 
Introdução 1 
Capítulo 1 – Estatística Descritiva 2 
Capítulo II - Probabilidade 38 
Capítulo III – Distribuições de Probabilidade 51 
Capítulo IV – Inferência Estatística 65 
Tabelas 103 
 
 
 
 
1 
Introdução
O que é estatística? 
Estatística é parte da matemática em que se investigam os processos de obtenção, 
organização e análise de dados sobre uma população ou sobre uma coleção de seres quaisquer, e os 
métodos de tirar conclusões e fazer predições com base nesses dados. 
A Estatística pode ser aplicada em praticamente todas as áreas do conhecimento humano e, 
em algumas áreas, recebe um nome especial. Este é o caso da Bioestatística, que trata de aplicações 
da Estatística em Ciências Biológicas e da Saúde. 
A palavra "Estatística" tem pelo menos três significados: 
1) coleção de informações numéricas ou dados, 
2) medidas resultantes de um conjunto de dados, como por exemplo médias, 
3) métodos usados na coleta e interpretação de dados. 
A estatística compreende três ramos: a) Estatística descritiva; b) Probabilidade e: c)Inferência 
Estatística. 
a) Estatística Descritiva 
A estatística descritiva compreende a organização, o resumo e, em geral, a simplificação de 
informações através de tabelas, gráficos e de medidas de posição, dispersão e correlação. Por 
exemplo: a apresentação gráfica do número de brasileiros em diferentes classes sociais. 
b) Probabilidade 
A probabilidade é utilizada para analisar situações que envolvem o acaso. Por exemplo: a 
probabilidade de ganhar na loteria. 
c) Inferência Estatística 
 A inferência estatística é utilizada para estimar valores populacionais a partir de amostras. 
Por exemplo: a intenção de votos em determinada eleição com base em uma amostra; a altura média 
dos brasileiros com base em uma amostra. 
 
 
 2 
 
 
 
 
 
 
Capítulo I 
Estatística Descritiva 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 3 
1.1. Introdução 
A estatística descritiva compreende a apresentação, organização e resumo dos dados. Faz-se 
isso com o objetivo de facilitar a interpretação e discussão do fenômeno que se esta analisando. 
Neste capítulo serão abordados os diferentes tipos de variáveis e sua forma de apresentação 
em tabelas e gráficos e, a forma de obtenção de medidas que resume de maneira muito informativa 
o conjunto de dados. 
Primeiramente será apresentada uma ferramenta bastante útil em análises estatísticas, o 
somatório. 
1.2. Somatório 
A notação de “soma” é representada por Σ (sigma maiúscula). Assim, tem-se a seguinte 
notação: 
n
n
i
i X...XXXX ++++= 321
1=
∑ 
onde: 
i = limite inferior; 
n = limite superior do somatório 
 
Algumas representações de soma são: 
n
n
i
i X...XXXX ++++= 321
1=
∑ (soma simples) 
22
3
2
2
2
1
1=
2 ++++=∑ nn
i
i X...XXXX (soma de quadrados) 
2
321
2
1=
++++=⎟⎠
⎞⎜⎝
⎛∑ )X...XXX(X nn
i
i (quadrado da soma) 
nni
n
i
i YX...YXYXYXYX ++++= 332211
1=
∑ (soma de produtos) 
 
)Y...YYY)(X...XXXYX nn
n
i
i
n
i
i ++++++++= 321321
1=1=
∑∑ (produto das somas) 
 
Exemplo 
Considere as variáveis X e Y que representam as notas de duas disciplinas em uma turma de 
6 alunos. 
X = {90, 95, 97, 98, 100, 60} 
Y = {60, 70, 80, 60, 90, 75} 
 
 4 
Calcule: 
a) =∑6
1=i
iX 540=60+100+98+97+95+90=+++++ 654321 XXXXXX 
b) =∑6
1=
2
i
iX
2
6
2
5
2
4
2
3
2
2
2
1 +++++ XXXXXX 
73849=60+100+98+97+95+90= 222222 .)()()()()()( 
c) =⎟⎠
⎞⎜⎝
⎛ 26
1=
∑
i
iX ( ) ( ) 600291=540=+++++ 22654321 .XXXXXX 
d) =+++++= 665544332211
6
1=
∑ YXYXYXYXYXYXYX i
i
i 
= (90.60)+(95.70)+(97.80)+(98.60)+(100.90)+(60.75) = 39.190 
e) =∑∑ 6
1=
6
1= i
i
i
i YX ( )654321 +++++ XXXXXX ( )654321 +++++ YYYYYY 
=(540).(435)=234.900 
 
O número de termos de um somatório é: 
N =Ls – Li + 1 
onde: 
Ls é o limite superior 
Li é o limite inferior 
 Assim, o somatório 54321
5
1=
++++=∑ XXXXXX
i
i terá N = 5-1+1 = 5 termos. 
Em alguns casos podem ocorrer restrições no somatório, como no seguinte exemplo: 
5421
5
3≠1=
+++=∑ XXXXX
i
i
i . Assim, o número de termos é obtido por: N =Ls – Li + 1 – r, onde r é 
o número de restrições. Assim, o número de termos deste somatório é N = 5 – 1 +1 – 1 = 4. 
 
Propriedades do somatório 
As propriedades do somatório facilitam o desenvolvimento das expressões algébricas com a 
notação de somatório. O objetivo é desenvolver expressões até chegar às somas simples ou somas 
de quadrados. 
a) Somatório de uma constante (k) 
O somatório de uma constante é igual ao produto da constante pelo número de termos do 
somatório. 
 
 5 
nkk...kkkk
n
i
=++++=∑
1=
 
Exemplo 
50=105=10+10+10+10+10=10∑5
1=
.
i
 
b) Somatório do produto de uma constante por uma variável 
O somatório do produto de uma constante por uma variável é igual ao produto da constante 
pelo somatório da variável. 
∑∑
1=
321321
1=
=++++=++++=
n
i
inni
n
i
Xk)X...XXX(kkX...kXkXkXXk 
Exemplo 
X = {2 3 4 5 6} 
40=2=6++4+3+22=62++42+32+22=2 ∑∑
1=
5
1=
n
i
ii
i
X)...(.......X. 
c) Somatório de uma soma ou subtração de variáveis 
O somatório de uma soma ou subtração de variáveis é igual à soma ou subtração dos 
somatórios dessas variáveis. 
)Z...ZZZ()Y...YYY()X...XXX()ZYX( nnn
n
i
ii
n
i
i ++++++++++++++=++ 32132132
1=
1
1=
∑∑
∑∑∑
1=1=1=
++=
n
i
i
n
i
i
n
i
i ZYX 
Exemplo 
X = {2 3 4 5}; Y = {1 1 2 4}; Z = {4 3 2 2} 
)()()()ZYX(
i
ii
n
i
i 2+2+3+4+4+2+1+1+5+4+3+2=++ ∑∑ 4
1=1=
 
∑∑∑
1=1=1=
33=11+8+14=++=
n
i
i
n
i
i
n
i
i ZYX 
 
Observações importantes 
 A soma de quadrados é diferente do quadrado da soma : 
2
1=1=
2 ⎟⎠
⎞⎜⎝
⎛≠ ∑∑ n
i
i
n
ii XX 
A soma dos produtos é diferente do produto de duas somas 
( ) ⎟⎠
⎞⎜⎝
⎛⎟⎠
⎞⎜⎝
⎛≠ ∑∑∑
1=1=1=
n
i
i
n
i
i
n
i
ii Y.XY.X 
 
 6 
O somatório de um quociente é diferente do cociente de duas somas 
∑
∑∑
1=
1=
1=
≠ n
i
i
n
i
in
i i
i
Y
X
Y
X 
1.3. Tipos de variáveis 
 A correta definição das variáveis é fundamental na pesquisa e no uso correto e eficiente de 
análises estatísticas. Os diferentes tipos de variáveis levam a tomar diferentes decisões na forma de 
proceder à pesquisa, a apresentação, as análises, as discussões e as conclusões sobre um 
determinado fenômeno. 
 
Constante 
Uma constante é uma observação de medida ou classificação que apresenta valor (ou 
categoria) fixo (invariável). 
Exemplos: Peso de caixas de leite de determinada marca, volume de refrigerantes em lata de uma 
mesma marca, o sexo em uma turma de 30 meninas de um grupo de dança. 
 Note que todas estas observações apresentam valores iguais. Os pesos das caixas de leite não 
variam, assim como o volume de refrigerantes e a classificação quanto ao sexo no grupo de dança. 
Portanto, são constantes. 
 
Variável 
Uma variável é uma observação de medida ou classificação que apresenta valor (ou 
categoria) variável. Portanto, uma variável pode ter ou assumir diferentes valores, diferentes 
aspectos, diferentes categorias. 
Exemplos: Peso de 30 alunos de agronomia, sexo de uma turma de 30 alunos de biologia. 
 Note que em uma turma de trinta alunos de agronomia o peso é diferente em cada aluno. No 
caso da turma de 30 alunos de biologia, a variável apresenta duas categorias (masculino e feminino) 
e, portanto, também é variável. 
Observação importante: É importante destacar que tanto uma constante como uma variável pode 
assumir valores numéricos ou não numéricos (palavras, letras, símbolos etc). 
 
As variáveis podem ser classificadas da seguinte forma: 
Variáveis Qualitativas (ou categóricas): são variáveis onde os diferentes níveis não podem ser 
medidos e, portanto, são classificados em categorias distintas com base em critérios subjetivos. 
Podem ser nominais ou ordinais. 
 
 7 
Variáveis nominais: não existe ordenação dentre as categorias. Exemplos: sexo (masculino 
e feminino), altura (alto e baixo), cor dos olhos (azul, verde, marrom), diagnóstico (doente 
ou sadio; +/-). 
Variáveis ordinais: existe uma ordenação entre as categorias. Exemplos: escolaridade (1o, 
2o, 3o graus), estágio da doença (inicial, intermediário, terminal), mês de observação 
(janeiro, fevereiro,..., dezembro), altura (alto, médio e baixo). 
 
Observação importante: Variáveis qualitativas podem assumir valores numéricos, desde que, não 
exista distância matemática entre os diferentes valores. Por exemplo: Notas do grau de doença foliar 
em plantas de milho variando de 1 a 5. Cada nota (1 a 5) representa uma avaliação subjetiva com 
base em alguns critérios dada a cada planta de milho. Assim, a distância entre a nota 1 e a nota 2 
não pode ser considerada como exata, uma vez que a diferença é subjetiva e não matemática. 
Portanto, tem-se uma variável ordinal onde a nota 5 é superior a 4 que é superior a 3 e assim 
sucessivamente. Outros exemplos são o número do telefone de uma pessoa, o número da casa, o 
número de sua identidade. Às vezes o sexo do indivíduo é registrado na planilha de dados como 1 
se macho e 2 se fêmea. Isto não significa que a variável sexo passou a ser quantitativa!!!!!!!! 
 
Variáveis Quantitativas: são variáveis que podem ser medidas, ou seja, apresentam valores 
numéricos obtidos de maneira objetiva por contagem ou com auxílio de algum instrumento. Podem 
ser contínuas ou discretas. 
Variáveis discretas: características mensuráveis que podem assumir apenas um número 
finito ou infinito contável de valores e, assim, somente fazem sentido valores inteiros. São 
obtidas através de contagens. Exemplos: número de filhos por casal, número de bactérias por 
litro de leite, número de cigarros fumados por dia, número de caras em 10 lançamentos de 
uma moeda. 
Variáveis contínuas, características mensuráveis que assumem infinitos valores em uma 
escala contínua (na reta real), para as quais valores fracionários fazem sentido. Usualmente 
devem ser medidas através de algum instrumento (régua, balança, relógio, proveta, 
velocímetro, etc). Exemplos: peso (balança), altura (régua), tempo (relógio), pressão 
arterial, idade, etc. 
 
Observações importantes: 
1) Como podem existir infinitos valores entre 10 e 20 kg? 
Isso ocorre porque o instrumento é limitado. Se for avaliado em grama ou outras medidas 
mais sensíveis, pode-se diferencias objetos que teriam o mesmo peso quando avaliados em kg. 
 
 8 
Ex. Dois cachorros podem pesar 15 kg. Porém, se a balança for mais precisa pode-se detectar 
diferenças em grama e assim sucessivamente. 
 
2) Uma variável originalmente quantitativa pode ser coletada de forma qualitativa. Depende da 
escala de mensuração. 
a) Exemplo: 
altura em escala de mensuração nominal (alto/baixo) 
altura em escala de mensuração ordinal (alto/médio/baixo) 
altura em escala métrica (1,75m; 1,65m; 1,82m; 1,72m; etc) 
b) Exemplo: 
A variável idade, medida em anos completos é quantitativa; mas, se for informada apenas a 
faixa etária (0 a 5 anos, 6 a 10 anos, etc...), é qualitativa (ordinal). 
c) Outro exemplo é o peso dos lutadores de boxe, uma variável quantitativa (contínua) se for 
utilizado o valor obtido na balança, mas qualitativa (ordinal) se classificado nas categorias do boxe 
(peso-pena, peso-leve, peso-pesado, etc.). 
É importante destacar que: 
O nível de informação é sempre maior quando proveniente de variáveis quantitativas. 
Assim, a variável altura pode apresentar níveis crescentes de informação. A altura categorizada em 
duas classes (altos e baixos) caracteriza uma variável qualitativa nominal. É menos informativa do 
que a altura categorizada em altos médios e baixos (qualitativa ordinal). Que, por sua vez, é menos 
informativa do que a altura em metros (quantitativa contínua). 
 
1.4. Apresentação gráfica e tabular 
Como já sabemos, as variáveis de um estudo podem ser classificadas em quatro tipos: 
qualitativas (nominais e ordinais) e quantitativas (discretas e contínuas). Os dados gerados por esses 
tipos de variáveis são de naturezas diferentes e, portanto, devem receber tratamentos diferentes. 
Portanto, inicialmente vamos estudar as ferramentas - tabelas e gráficos - mais adequadas para cada 
tipo de variáveis. 
Variáveis qualitativas - nominais e ordinais 
Iniciaremos essa apresentação com os dados de natureza qualitativa, que são os mais fáceis 
de tratar do ponto de vista da análise descritiva. 
Para organizar os dados provenientes de uma variável qualitativa, é usual fazer uma tabela 
de freqüências, como a Tabela 1, onde estão apresentadas as freqüências com que ocorre cada um 
dos grupos sanguíneos observados. 
 
 
 9 
Tabela 1. Distribuições de freqüências de um grupo de indivíduos amostrados de uma população A, 
segundo o grupo sanguíneo 
Grupo 
Sanguíneo 
Freqüências 
absolutas 
Freqüências 
relativas 
Freqüências 
percentuais 
A 4 0,20 20% 
B 6 0,30 30% 
AB 5 0,25 25% 
O 5 0,25 25% 
Total (n) 20 1,00 100% 
 
 Note que a variável (grupo sanguíneo) é qualitativa nominal com quatro categorias (A, B, 
AB e O). É interessante computar também, as freqüências absolutas, relativas e percentuais, 
definidas a seguir: 
Freqüência absoluta é o número de vezes que uma categoria da variável aparece em uma 
experiência ou numa observação de caráter estatístico. 
Freqüência relativa é a razão (divisão) da freqüência pelototal de observações (n): 
n
absolutaFrequênciarelativaFrequência = 
Freqüência percentual (%) é a freqüência relativa multiplicada por 100: 
100×=
n
absolutaFrequência%percentualFrequência 
Observação importante: A freqüência relativa ou a percentual são úteis na comparação de dois 
conjuntos de dados distintos. 
Exemplo: Compare os dados apresentados nas Tabelas 1 e 2. 
 
Tabela 2. Distribuições de freqüências de um segundo grupo de indivíduos amostrados de uma 
população B, segundo o grupo sanguíneo 
Grupo 
Sanguíneo 
Freqüências 
absolutas 
Freqüências 
relativas 
Freqüências 
percentuais 
A 10 0,25 25% 
B 10 0,25 25% 
AB 8 0,20 20% 
O 12 0,30 30% 
Total (n) 40 1,00 100% 
 
 Note que o tamanho das amostras é diferente e, a freqüência absoluta de cada tipo sanguíneo 
também. Neste caso, o correto é fazer a comparação com as freqüências relativas ou percentuais. No 
caso do tipo AB, por exemplo, tem-se maior freqüência absoluta na amostra da população B. No 
entanto, a freqüência relativa e percentual são maiores na população A. 
Para as variáveis qualitativas ordinais a representação é semelhante, como exemplificado na 
Tabela 3 para a variável altura. 
 
 10 
Tabela 3. Distribuição de freqüências de alunos segundo categorias de altura 
Categorias de 
altura 
Freqüências 
absolutas 
Freqüências 
relativas 
Freqüências 
percentuais 
alto 10 0,25 25% 
médio 18 0,45 45% 
baixo 12 0,30 30% 
Total (n) 40 1,00 100% 
 
É importante destacar que as tabelas não devem ter linhas verticais. Devem apresentar texto 
na parte superior (cabeçalho) e, devem ser auto-explicativas (na medida do possível). 
A visualização da distribuição de freqüências de uma variável fica mais fácil se fizermos um 
gráfico a partir da tabela de freqüências. Para as variáveis do tipo qualitativas (nominal e ordinal), 
abordaremos dois tipos de gráficos: gráficos de setores e gráficos de barras. 
Os gráficos de setores, mais conhecidos como gráficos de pizza ou torta, são construídos 
dividindo-se um círculo (pizza) em setores (fatias), um para cada categoria, que serão proporcionais 
à freqüência daquela categoria. 
Graficamente os dados contidos nas Tabelas 1 e 3 podem ser visualizados, respectivamente 
nas Figuras 1 e 2. 
 
Figura 1. Gráficos de setores da distribuição de freqüências de um grupo de indivíduos amostrados 
de uma população A, segundo o grupo sanguíneo. 
 
 11 
 
Figura 2. Gráfico de setores da distribuição de freqüência de alunos segundo categorias de altura. 
 
Nas Figuras 3 e 4 pode-se observar os dados das Tabelas 1 e 3 representados em gráficos de barras. 
 
 
Figura 3. Gráfico de barras para as distribuições de freqüências de um grupo de indivíduos 
amostrados de uma população A, segundo o grupo sanguíneo. 
 
 
 12 
 
Figura 4. Gráfico de barras da distribuição de freqüência de alunos segundo categorias de altura. 
 
No gráfico de barras podem-se visualizar dados de amostras distintas. Assim, as Tabelas 1 e 
2 podem ser visualizadas e comparas no mesmo gráfico, como exemplificado na Figura 5. 
 
Figura 5. Gráfico de barras para as distribuições de freqüências de indivíduos amostrados de duas 
populações, segundo o grupo sanguíneo. 
 No caso dos gráficos, o texto deve ser localizado, preferencialmente, na parte inferior da 
figura. 
Variáveis Quantitativas Discretas 
Quando estamos trabalhando com uma variável quantitativa discreta que assume poucos 
valores, podemos dar a ela o mesmo tratamento dado às variáveis qualitativas ordinais, assumindo 
que cada valor é uma classe e que existe uma ordem natural nessas classes. 
 
 13 
Assim, variáveis quantitativas discretas com poucas classes também são normalmente 
representadas em tabelas de freqüência (Tabela 4) e gráficos de setores e barras. 
 
Tabela 4. Distribuição de freqüências do número de filhos por família em uma localidade (25 lares) 
Número 
de 
filhos 
Freqüência 
absoluta 
Freqüência 
percentual % 
 
Freqüência 
percentual 
acumulada 
 
Freqüência 
percentual 
acumulada inversa 
0 1 4,0 4,0 100,0 
1 4 16,0 20,0 96,0 
2 10 40,0 60,0 80,0 
3 6 24,0 84,0 40,0 
4 2 8,0 92,0 16,0 
5 2 8,0 100,0 8,0 
Total 25 100 --- --- 
 
Analisando a Tabela 4, pode-se perceber que as famílias mais freqüentes são as de dois 
filhos (40%), seguida pelas famílias de três filhos. 
Para variáveis quantitativas discretas, além das freqüências absolutas, relativa e percentual, 
também é interessante computar a freqüência acumulada. A freqüência acumulada da à proporção 
dos dados que superam um determinado valor, ou são inferiores a determinado valor. 
No exemplo da Tabela 4 tem-se 60% das famílias com dois filhos ou menos e, 40% das 
famílias com três a cinco filhos. 
As freqüências absolutas dos dados da Tabela 4 estão representadas graficamente na Figura 
6. 
 
 Figura 6. Número de filhos por família em 25 lares. 
 
 
 14 
Quando trabalhamos com uma variável quantitativa discreta que pode assumir um grande 
número de valores distintos como, por exemplo, o número de ovos que um determinado inseto põe 
durante sua vida, a construção da tabela de freqüências e de gráficos considerando cada valor como 
uma categoria fica inviável. A solução é agrupar os valores em classes. Esse procedimento será 
abordado a seguir, juntamente com as variáveis quantitativas contínuas. 
 
Variáveis Quantitativas contínuas 
Analisando os dados da Tabela 5, verifica-se que não é possível efetuar o mesmo tipo de 
tratamento dispensado aos dados qualitativos e aos dados quantitativos discretos com poucos 
valores. 
Tabela 5. Peso ao abate em uma amostra de 25 caprinos 
Animal Peso ao abate em kg
1 9,0 
2 9,5 
3 9,7 
4 10,9 
5 11,5 
6 12,0 
7 14,5 
8 15,0 
9 16,0 
10 17,0 
11 17,5 
12 17,6 
13 18,0 
14 18,3 
15 18,4 
16 18,5 
17 18,9 
18 19,0 
19 20,0 
20 21,0 
21 23,0 
22 24,0 
23 28,0 
24 29,0 
25 34,0 
 
Para uma análise gráfica mais apropriada, estes dados devem ser agrupados em classes de 
valores (Tabela 6). A escolha do número de classes e do tamanho das classes depende da amplitude 
dos valores a serem representados e da quantidade de observações no conjunto de dados. O 
intervalo de classes deve ser preferencialmente igual. 
 
 
 
 15 
 
 
Tabela 6. Distribuição de freqüências de classes do peso ao abate em kg obtido de uma amostra de 
25 caprinos ao abate 
Intervalos 
de 
Classes 
Ponto 
médio da 
classe 
Freqüência 
absoluta 
Freqüência 
percentual 
 
Freqüência 
percentual 
acumulada 
 
Freqüência 
percentual 
acumulada 
inversa 
 5 |— 10 7,5 3 12 12 100 
10 |— 15 12,5 4 16 28 88 
15 |— 20 17,5 11 44 72 72 
20 |— 25 22,5 4 16 88 28 
25 |— 30 27,5 2 8 96 12 
30 |— 35 32,5 1 4 100 4 
Total - 25 100 --- --- 
 
Intervalos de classe muito grandes resumem demais a informação contida nos dados, pois 
forçam a construção de poucas classes. Intervalos de classes muito pequenos levam a formação de 
muitas classes, dificultando a observação gráfica. 
O número de classes pode ser obtido pelo uso de algumas fórmulas ou pela experiência ou o 
bom senso do pesquisador. Uma vez decidido pelo número de classes, pode-se obter o comprimento 
de cada classe dado por: 
k
Ac = onde A é a amplitude total, obtida pela diferença entre o maior e o menor valor observado e, 
k é o número de classes estabelecido. 
No exemplo da Tabela 5 a amplitude é A= 34 - 9 = 25. No entanto, pode-se considerar o 
limite inferior como igual a 5 e o superior igual 35 para facilitar a interpretação. Assim, a amplitude 
considerada é 30. Considerando K = 6, tem-se um intervalo de classe c= 5. 
O símbolo ׀—indica que o limite inferior pertence a classe em questão e o limite superior 
não pertence a esta classe. 
O ponto médio de cada classe é obtido por: 
Ponto médio de classe =
2
LSLI − onde LI e LS são, respectivamente, os limites inferior e superior 
da classe cujo ponto médio pretende-se obter. 
Os limites inferiores e superiores de cada classe dependem do tamanho (amplitude) de classe 
escolhido, que deve ser, na medida do possível, igual para todas as classes. Isso facilita a 
interpretação da distribuição de freqüências da variável em estudo. 
Observação: a alteração ou não dos limites superior e inferior pode ficar a critério do 
pesquisador. 
 
 16 
As variáveis quantitativas contínuas agrupadas em classes são representadas graficamente 
pelo histograma de freqüência e pelo polígono de freqüências (Figura 7). Obs.: As variáveis 
quantitativas discretas com grande número de valores distintos também podem ser representadas 
desta forma quando agrupadas em classes. 
 
Histograma e Polígono de Frequência
0
2
4
6
8
10
12
2.5 7.5 12.5 17.5 22.5 27.5 32.5 37.5
Peso de Caprinos ao Abate em kg
Fr
eq
uê
nc
ia
 A
bs
ol
ut
a
Figura 7. Histograma e polígono de freqüências absolutas do peso de caprinos ao abate em kg. 
 
O histograma é semelhante ao gráfico de barras, com a altura de cada coluna correspondente 
a freqüência da classe que ela representa e a base a amplitude de classe (comprimento de classe = 
c). 
 O polígono de freqüências é constituído de segmentos de retas que unem os pontos médios 
de cada classe de freqüência. 
 
Observação importante: Quando os intervalos de classe são diferentes, deve-se utilizar a 
densidade ao invés das freqüências na construção gráfica. A densidade é obtida por: 
 
ervaloint
absolutafrequênciaabsolutadensidade = 
 
ervaloint
relativafrequência
relativadensidade = 
 
 17 
 
ervaloint
percentuafrequência
(%)empercentagemrelativadensidade = 
 
As freqüências acumuladas dos dados da Tabela 6 estão representadas nos gráficos do tipo 
ogiva (Figuras 8 e 9). 
Ogiva de Frequência Percentual Acumulada
0
20
40
60
80
100
120
2.5 7.5 12.5 17.5 22.5 27.5 32.5
Peso de caprinos ao abate em kg
Fr
eq
uê
nc
ia
 a
cu
m
ul
ad
a 
(%
)
 
Figura 8. Freqüências acumuladas do peso de caprinos ao abate em kg 
Ogiva de Frequência Percentual Acumulada (inversa)
0
20
40
60
80
100
120
2.5 7.5 12.5 17.5 22.5 27.5 32.5
Peso de caprinos ao abate em kg
Fr
eq
uê
nc
ia
 a
cu
m
ud
a 
in
ve
rs
a 
(%
)
 
Figura 9. Freqüências acumuladas (inversa) do peso de caprinos ao abate em kg 
 
A observação gráfica simultânea de duas variáveis quantitativas (x,y) também é interessante, 
pois permite a visualização gráfica da associação (correlação) entre as duas variáveis. Estes gráficos 
são chamados de diagrama de dispersão e serão abordados mais adiante. 
 
 
 18 
1.5. Medidas de posição 
Medidas de posição são aquelas que visam representar a tendência central de uma 
distribuição, isto é, um valor em torno do qual os dados se distribuem. 
Média aritmética 
A média aritmética é uma medida de posição que pode ser utilizada para variáveis 
quantitativas. Dado um conjunto de n observações X1, X2, X3, ..., Xn, define-se a média aritmética 
por: 
n
X
n
X...XXX
X
n
i
i
n
∑
1=321 =++++= (1) 
Se os valores X1, X2, X3, ..., Xn ocorrem com as respectivas freqüências f1, f2, f3, ..., fn tem-
se a média aritmética ponderada: 
∑
∑
1=
1=332211 =++++= n
i
i
n
i
ii
nn
f
Xf
n
Xf...XfXfXf
X (2) 
Exemplo 
 Os dados abaixo se referem ao número de espigas em 22 plantas de milho-pipoca: 
0 1 1 1 1 1 2 2 2 2 2 2 3 3 3 3 4 4 4 5 5 6 
A média destes valores é obtida pela equação (1): 
=22
6++1+1+0==
∑
1= ...
n
X
X
n
i
i
2,59 
Tem-se uma média de 2,59 espigas por planta. 
Estes valores podem ser apresentados em uma tabela de freqüência, como no exemplo a 
seguir: 
Número de espigas/planta Freqüência absoluta (fi) 
0 1 
1 5 
2 6 
3 4 
4 3 
5 2 
6 1 
Total 22 
 
Neste caso a média pode ser obtida pela equação (2): 
 
 19 
592=22
61++26+15+01==++++=
∑
∑
1=
1=332211 ,).(...).().().(
f
Xf
n
Xf...XfXfXf
X n
i
i
n
i
ii
nn 
Esta média também é chamada de média ponderada, pois cada valor é ponderado por um 
peso, que neste caso é a freqüência. 
 
Propriedades da média aritmética 
a) A soma algébrica dos desvios em relação à média aritmética é nula; 
0=−=−=−= ∑∑∑
1=1=1=
XnXnXX)XX(SD
n
i
n
i
i
n
i
i 
b) Somando-se ou subtraindo-se uma constante a cada um dos valores da série X1, X2, X3, 
..., Xn, a média destes valores fica somada ou subtraída da constante; ; 
kX
n
nkX
n
k
n
X
n
)kX(
n
i
n
i
i
n
i
i
±=±=±=
± ∑∑∑
1=1=1= 
c) Multiplicando-se ou dividindo-se cada um dos valores da série X1, X2, X3, ..., Xn, a média 
destes valores fica multiplicada ou dividida pela constante; 
X.k
n
X
k
n
kX
k
XX.
kn
X
kn
k
X
n
i
i
n
i
i
n
i
i
n
i
i
==
=1=1=
∑∑
∑∑
1=1=
1=1=
 
d) A soma de quadrados dos desvios (SQD) em relação a média é um mínimo; 
∑
1=
2−=
n
i
i )XX(SQD é um mínimo 
Seja ∑
1=
2
00 −=
n
i
i )XX()X(f 
∑ ∑∑
1= 1=
0
1=
00 2+2−=1−−2=
n
i
n
i
i
n
i
i XX)()XX()X('f 
nnXXXX'f)X(''f
X
n
X
X
nXXXXXX)X('f
n
i
oi
n
i
n
i
i
n
i
i
o
n
i
i
n
i
n
i
i
n
i
n
i
i
2=2+2−=⎟⎠
⎞⎜⎝
⎛ 2+2−=
==
=⇒=⇒0=2+2−⇒0=
∑∑ ∑
∑
∑∑ ∑∑ ∑
1=1= 1=
00
1=
1=
0
1= 1=
0
1= 1=
00
 
 
 20 
Logo, tem-se um ponto de mínimo para o valor de X0 = média. 
 
Moda 
 A moda de um conjunto de dados é o valor que ocorre com maior freqüência. 
Por exemplo: Considere o seguinte conjunto de observações: 
2, 4, 3, 4, 1, 1, 2, 2, 
Neste caso a moda é 2 (Mo = 2), que é o valor que ocorre com maior freqüência. 
Considere agora a seguinte distribuição de freqüência de tipos sanguíneos: 
 Tipos Sanguíneos 
 A B AB O 
Freqüência Absoluta 10 13 8 14 
 
Neste caso a moda é o tipo sanguíneo O, que ocorre com maior freqüência. 
Nestes dois exemplos têm-se séries unimodais, ou seja, possuem uma única moda. Quando 
uma série possui mais de uma moda ela é dita multimodal e, quando não possui moda é dita 
amodal. 
Note que no primeiro exemplo a variável é quantitativa discreta e no segundo a variável é 
qualitativa. Para variáveis quantitativas contínuas pode-se obter a moda quando os dados são 
agrupados em classes ou, obtendo-se o ponto de máximo da função de freqüência, como no 
exemplo a seguir. 
Considere a seguinte função de freqüência: f(x) = X – X 2 
Derivando-se esta função e igualando a zero, se obtém um ponto de máximo ou mínimo. 
 f’(x) = 1 – 2x 
 f’(x) = 0 
1 – 2x = 0 → x = ½ 
Este ponto será um máximo se a segunda derivada for negativa e um mínimo se a segunda 
derivada for positiva. 
f”(x) = -2 
Como a segunda derivada é negativa, o ponto x = ½ é de máximo. 
 
Mediana 
A mediana de um conjunto de dados ordenados em ordem crescente ou decrescente de 
grandeza é o valor abaixo e acima do qual se tem a metade dos dados. Assim, a mediana divide o 
conjunto ordenado em duas partes com igual número de dados. 
Há dois casos a considerar: 
 
 21 
a) n é impar: a mediana será o valor que ocupa a posição 2
1+Pn de um rol estatístico. 
Ex.: 5, 4, 2, 6, 3, 7, 9; n = 7 
rol.: 2, 3,4, 5, 6, 7, 9 
4=2
1+7=2
1+ PPPn , ou seja, P4 = elemento do rol que ocupa a quarta posição = 5 
b) n é par: a mediana será a média dos valores que ocupam as posições 2
Pn e 2
2+ )n(P de um 
rol estatístico. 
Ex.: 7, 6, 1, 4, 8, 9, 3, 2; n = 8 
rol.: 1, 2, 3, 4, 6, 7, 8, 9 
6+4=5+4=2
2++2 PP
)n(PPn , a mediana é a média dos valores que ocupam a posição 4 
e 5. Assim, Med = (4+6)/2=5. 
A mediana é uma medida de posição, em geral, menos informativa que a média, pois só 
considera os ranques (postos ou posições) das observações e não o valor, como faz à média. No 
entanto, em algumas ocasiões à mediana pode ser mais vantajosa pelo fato de não ser afetada pelos 
extremos. Considere o exemplo a seguir: 
1 2 3 4 5 6 7 8 9 10 11 
Note que a média e a mediana deste conjunto de dados é igual a 6. Vamos supor agora o 
seguinte conjunto de dados onde ocorreu um valor extremo: 
1 2 3 4 5 6 7 8 9 10 40 
Note que a mediana não foi alterada, continua sendo igual a 6. No entanto, a média neste 
caso é igual a 8,64 devido ao valor extremo igual a 40. 
A mediana também tem a vantagem de poder ser aplicada a variáveis qualitativas ordinais. 
 
1.6. Medidas de dispersão 
As medidas de dispersão medem a variabilidade dos dados. Entre as várias medidas 
existentes veremos apenas as mais importantes. 
Variância 
A variância mede a variabilidade dos dados em torno da média. Dada uma amostra de n 
valores X1, X2, X3, ..., Xn define-se a variância de x por: 
1−==== 22 nGL;
GL
SQDSσˆ)X(V 
 
 22 
1−
−
===
∑
1=
2
22
n
)XXi(
Sσˆ)X(V
n
i 
∑ ∑
1= 1=
222 +2−=−=
n
i
n
i
ii )XXXX()XXi(SQD 
 
Aplicando propriedades do somatório tem-se: 
n
X
X
n
Xn
n
XX
X
XnX.
n
X
XXXXXSQD
n
i
in
i
i
n
i
i
n
i
i
n
i
in
i
i
n
i
i
n
i
in
i
i
n
i
n
i
i
n
i
i
2
1=
1=
2
2
2
1=1=1=
1=
2
2
1=
1=
1=
2
1=
2
1=1=
2
⎟⎠
⎞⎜⎝
⎛
−=
⎟⎠
⎞⎜⎝
⎛
+
⎟⎠
⎞⎜⎝
⎛⎟⎠
⎞⎜⎝
⎛2
−
+2−=+2−=
∑∑∑∑∑∑
∑∑∑∑∑∑
 
Se os valores X1, X2, X3, ... Xn ocorrem com as respectivas freqüências f1, f2, f3,..., fn a soma 
de quadrados dos desvios será: 
SQD = 
∑
∑∑
1=
2
1=
1=
2
⎟⎠
⎞⎜⎝
⎛
− n
i
i
n
i
iin
i
ii
f
Xf
Xf 
Assim, a variância de um conjunto de dados quantitativos pode ser obtida por: 
1−
⎟⎠
⎞⎜⎝
⎛
−
=
2
1=
1=
2
2
∑∑
n
n
X
X
S
n
i
in
i
i
 (3) 
Se os dados estão organizados em tabelas de freqüência a variância pode ser obtida por: 
1−⎟⎠
⎞⎜⎝
⎛
⎟⎠
⎞⎜⎝
⎛
−
=
∑
∑
∑∑
1=
1=
2
1=
1=
2
2
n
i
i
n
i
i
n
i
iin
i
ii
f
f
Xf
Xf
S (4) 
Exemplo 
Considerando novamente os dados que se referem ao número de espigas em 22 plantas de milho-
pipoca: 
0 1 1 1 1 1 2 2 2 2 2 2 3 3 3 3 4 4 4 5 5 6 
A variância destes valores é obtida pela equação (3): 
 
 23 
442=1−22
22
57−6++1+1+0
=1−
⎟⎠
⎞⎜⎝
⎛
−
=
2
2222
2
1=
1=
2
2
∑∑
,
)(...
n
n
X
X
S
n
i
in
i
i
 
Estes valores podem ser apresentados em uma tabela de freqüência, como no exemplo a 
seguir: 
Número de espigas/planta Freqüência absoluta (Fi) 
0 1 
1 5 
2 6 
3 4 
4 3 
5 2 
6 1 
Total 22 
 
Neste caso a variância pode ser obtida pela equação (4): 
442=1−22
22
57−61++26+15+01
=
1−⎟⎠
⎞⎜⎝
⎛
⎟⎠
⎞⎜⎝
⎛
−
=
2
2222
1=
1=
2
1=
1=
2
2
∑
∑
∑∑
,
).(...).().().(
f
f
Xf
Xf
S
n
i
i
n
i
i
n
i
iin
i
ii
 
Propriedades da variância 
a) Variância de uma constante (k) é igual a zero: V(k) = 0. 
b) Somando-se ou subtraindo-se uma constante a cada um dos valores da série, a variância 
não se altera: )X(V)kX(V =± . 
c) Multiplicando-se ou dividindo-se cada um dos valores da série por uma constante, a 
variância fica multiplicada ou dividida pelo quadrado da constante. 
2
2 =⎟⎠
⎞⎜⎝
⎛=
k
)X(V
k
XV);X(Vk)kX(V 
Desvio Padrão 
O desvio padrão é simplesmente a raiz quadrada da variância, obtido por: 
)X(VSσˆ == 
O desvio padrão para o número de espigas/planta de milho-pipoca é: 
561=442== ,,Sσˆ 
 
 
 
 24 
Observação 
A unidade de medida da variável que se estima a variância fica elevada ao quadrado, assim, 
por exemplo, uma medida em metros (m) fica m2. No desvio padrão a variável ficaria em m. 
 
Erro Padrão da Média 
É uma medida de dispersão que mede a precisão da média aritmética. Quanto menor o 
desvio padrão e maior a amostra, menor é o erro padrão da média e mais precisa será a média. 
A equação que nos dá essa relação é: 
n
)X(S)X(S =
 
O erro padrão da média para o número de espigas/planta de milho-pipoca é: 
330=22
561== ,,
n
)X(S)X(S
 
Coeficiente de Variação 
O coeficiente de variação é uma medida de dispersão relativa. Sua vantagem é o fato de ser 
uma medida adimensional, assim, independe das unidades usadas e é importante para comparar a 
dispersão de amostras de médias ou unidades de medida diferentes. 
O coeficiente de variação é obtido pela razão do desvio padrão pela média: 
100= x
X
)X(S(%)CV
 
O coeficiente de variação para o número de espigas/planta de milho-pipoca é: 
%,x
,
,(%)CV 3160=100592
561= 
Observação importante 
Para comparar duas amostras com relação a homogeneidade, temos dois casos a considerar: 
a) As médias das amostras são iguais BA XX = . Neste caso a mais homogênea é aquela que 
possui a menor variância, desvio padrão ou coeficiente de variação. Qualquer destas medidas pode 
ser utilizada. 
b) Se as médias de duas amostras são diferentes, ou ainda, se as duas amostras possuem 
unidades de medida diferente, deve-se utilizar o coeficiente de variação. Assim, a amostra de menor 
coeficiente de variação é a mais homogênea. 
 
 
 25 
1.7. Medidas de correlação 
As medidas de correlação medem o grau de associação entre duas variáveis. 
 Por exemplo: 
altura da planta x peso de grãos 
tempo de treinamento x rendimento do atleta 
quantidade de adubo x produtividade 
Note que, em todos estes exemplos, as variáveis são quantitativas. Nestes casos pode-se 
obter um valor que nos dá o grau de associação entre duas variáveis. A medida em questão é 
chamada de correlação de Pearson e, pode ser obtida pela seguinte equação: 
YXn
i
i
n
i
i
n
i
ii
xy SQD.SQD
)Y,X(SPD
)YY(.)XX(
)YY)(XX(
)Y(Vˆ).X(Vˆ
)Y,X(VOˆCr =
−−
−−
== 2
1=
2
1=
1=
∑∑
∑
 onde 
n
YX
YX)Y,X(SQP
n
i
i
n
i
in
i
ii
⎟⎠
⎞⎜⎝
⎛⎟⎠
⎞⎜⎝
⎛
−=
∑∑∑ 1=1=
1=
 
n
X
XSQD
n
i
in
i
iX
2
1=
1=
2
⎟⎠
⎞⎜⎝
⎛
−=
∑∑ 
n
Y
YSQD
2n
1i
in
1i
2
iY
⎟⎠
⎞⎜⎝
⎛
−=
∑∑ =
=
 
O valor da correlação ( xyr ) entre duas variáveis varia de -1 a 1. Quando o valor é positivo, 
uma variável cresce e a outra, em média, também cresce. Isto é, as duas variáveis variam no mesmo 
sentido. Quando o valor é negativo uma variável cresce e a outra, em média, decresce. Neste caso as 
variáveis variam em sentido contrário. Quando a correlação é nula as variáveis não estão 
relacionadas. 
Exemplo 
Os dados a seguir referem-se a altura média AP (m) e a produtividade de grãos PG (g) de 8 
famílias de milho-pipoca. 
 
 
 
 
 
 
 26 
Variáveis Família AP (m) PG (g) 
1 2,08 627 
2 2,22 913 
3 2,21 1391 
4 2,02 903 
5 1,90 655 
6 1,99 786 
7 1,98 625 
8 1,94 975 
 
Neste caso podem-se fazer as seguintes perguntas: 
Será que a altura de plantas esta correlacionada coma produtividade? 
Será que plantas mais altas são mais produtivas? 
Neste caso, se a correlação for positiva, ou seja, o valor obtido estiver no intervalo entre 0 e 
1, pode-se concluir que, em geral, plantas mais altas são mais produtivas. Quanto mais a correlação 
se aproxima de 1, maior é a correlação, ou seja, tem-se uma tendência mais acentuada de plantas 
mais altas serem mais produtivas. 
Para obter o valor da correlação vamos utilizar a fórmula a seguir: 
YX
xy SQD.SQD
)Y,X(SPDr = 
n
YX
YX)Y,X(SPD
n
i
i
n
i
in
i
ii
⎟⎠
⎞⎜⎝
⎛⎟⎠
⎞⎜⎝
⎛
−=
∑∑∑ 1=1=
1=
 
9117414=975941++913212+627082=∑
1=
,.).,(...).,().,(YX
n
i
ii 
∑
1=
3516=941++212+082=
n
i
i ,),...,,(X 
∑
1=
8756=975++913+627=
n
i
i .)...(Y 
( )( ) 13124=8
87563516−9117414= ,.,,.)Y,X(SPD 
n
X
XSQD
n
i
in
i
iX
2
1=
1=
2
⎟⎠
⎞⎜⎝
⎛
−=
∑∑ 
5133=941++212+082=∑
1=
2222 ,),(...),(),(X
n
i
i 
 
 27 
( ) 0950=8
3516−5133=
2
,,,SQDX 
n
Y
YSQD
n
i
in
i
iY
2
1=
1=
2
⎟⎠
⎞⎜⎝
⎛
−=
∑∑ 
0593656=975++913+627=∑
1=
2222 ..)(...)()(Y
n
i
i 
( ) 856456=8
8756−0593656=
2
....SQDY 
 
( )( ) 600=208
13124=8564560950
13124== ,,
..,
,
SQD.SQD
)Y,X(SPDr
YX
xy 
 
Portanto, a altura de planta esta correlacionada com a produtividade. Como o valor é 
positivo (0,60), pode-se dizer que existe uma tendência de magnitude razoável de plantas mais altas 
serem mais produtivas. 
Se o valor fosse negativo (-0,60) ter-se-ia tendência de plantas mais baixas serem mais 
produtivas. Se o valor fosse zero ou de próximo de zero, a tendência seria nula ou muito baixa. 
A correlação pode ser visualizada em gráficos chamados de diagrama de dispersão. Os 
gráficos abaixo representam os valores de duas variáveis (X,Y) plotados no eixo cartesiano: 
 
a) correlação positiva (0,99) b) correlação negativa (-0,99) c) ausência de correlação (0,00) 
 
1.8. Regressão linear simples 
 Como abordado anteriormente, duas variáveis quantitativas podem apresentar diferentes 
níveis de associação ou, muitas vezes, nem estarem associadas. A simples existência de associação 
indica que uma variável pode estar influenciando à outra em uma relação de causa e efeito. Por 
 
 28 
exemplo, considere o gráfico de dispersão abaixo em que as duas variáveis estão muito 
correlacionadas (0,99). 
 
Esta relação pode indicar uma influencia de causa e efeito da variável X sobre a variável Y. 
Suponha que X seja a quantidade de determinado fertilizante e Y a produtividade de determinada 
cultura. Assim, a influencia de causa e efeito do adubo sobre a produtividade poderia ser 
quantificada. Note que o gráfico indica uma resposta linear e, portanto, pode-se adotar um modelo 
linear para quantificar a resposta da produção em relação à quantidade de adubo. O modelo 
matemático em questão, já bastante conhecido, é a equação da reta: 
y = a + bx 
Note que para cada quantidade de adubo (x), ter-se-ia uma resposta em y. Se a quantidade de 
adubo fosse igual à zero, ainda assim haveria produção. Neste caso y = a. 
No entanto, a equação apresentada trata-se de um modelo matemático (exato). Para 
representar os dados utilizaremos um modelo estatístico dado por: 
y = a + bx + erro 
Este modelo é equivalente a: 
iioi eXββY ++= 1 
Este é um modelo estatístico que representa uma relação linear de causa e efeito entre duas 
variáveis quantitativas. O coeficiente oβ nada mais é do que o coeficiente linear da reta (a). O 
coeficiente 1β nada mais é do que o coeficiente angular da reta (b), também chamado de regressor. 
Então, a diferença do modelo estatístico para o matemático é a consideração do erro (ei) no modelo 
estatístico. Como a produtividade depende de outros fatores (chuva, ataque de pragas, etc) além da 
quantidade de adubo, a resposta não é perfeitamente linear. Assim, a influencia de variáveis 
desconhecidas é quantificada no erro. 
 
 
 
 
 
 29 
Para ficar mais claro esta abordagem, vejamos o exemplo a seguir, onde se tem a 
produtividade de milho em função de diferentes quantidades de adubo (dados hipotéticos): 
NPK em kg/ha Produção de milho em kg/ha 
0 5.230 
50 5.980 
100 6.210 
150 7.450 
200 8.123 
250 8.756 
300 9.020 
350 9.800 
400 9.899 
450 10.330 
 
Note que, parece haver uma relação entre as variáveis, ou seja, quanto maior a quantidade de 
adubo, maior é a produtividade. Realmente, a correlação de Pearson para estes dados é de 0,986. 
Analisando o gráfico abaixo, também se pode visualizar que a associação é linear e sugere um tipo 
de ralação de causa e efeito entre as variáveis. 
 
 
 Portanto, o modelo estatístico que representa estes dados é: 
iioi eXββY ++= 1 
 Assim, o objetivo da regressão é obter o melhor modelo (matemático) que se ajuste aos 
dados, que é aquele que minimiza a soma de quadrados dos erros (ei). Este método é denominado 
método dos mínimos quadrados. Para obter o modelo ajustado, podem-se adotar os seguintes 
passos: 
a) Isolar o erro (ei) na equação: ioii XββYe 1−−= 
 b) Elevar ambos os membros da equação ao quadrado: ( )212 −−= ioii XββYe 
 c) Aplicar somatório: ( )∑∑
1=
2
1
1=
2 −−=
n
i
ioi
n
i
i XββYe 
 
 30 
 d) Derivar a equação em relação a βo e β1 e igualar a zero: 
( ) ( )
( ) ( )⎪⎪
⎪
⎩
⎪⎪
⎪
⎨
⎧
0=−−⇒0=−−−2⇒0=∂
∂
0=−−⇒0=1−−−2⇒0=∂
∂
∑∑∑
∑∑∑
1=
1
1=
1
1
1=
2
1=
1
1=
1
0
1=
2
n
i
iioi
n
i
iioi
n
i
i
n
i
ioi
n
i
ioi
n
i
i
)X(XβˆβˆY)X(XβˆβˆY
β
e
XβˆβˆY)(XβˆβˆY
β
e
 
 e) Aplicar propriedades do somatório: 
⎪⎪⎩
⎪⎪⎨
⎧
0=−−⇒0=−−
0=−−⇒0=−−
∑ ∑ ∑∑∑∑
∑ ∑ ∑∑∑
1= 1= 1=
2
1
1=
0
2
1=
1
1=
0
1= 1= 1=
10
1=
1
1=
0
n
i
n
i
n
i
i
n
i
iiii
n
i
n
i
iii
n
i
n
i
n
i
iii
n
i
n
i
i
XβˆXβˆXYXβˆXβˆXY
XβˆβˆnYXβˆβˆY
 
⎪⎪⎩
⎪⎪⎨
⎧
+=
+=
∑ ∑∑
∑ ∑
1= 1=
2
1
1=
0
1= 1=
10
n
i
n
i
i
n
i
iii
n
i
n
i
ii
XβˆXβˆXY
XβˆβˆnY
 
 f) Resolver o sistema resultante obtendo 0βˆ e 1βˆ : 
∑ ∑
∑ ∑ ∑
1=
2
1=2
1=
1= 1=
1
⎟⎠
⎞⎜⎝
⎛
−
−
=
n
i
n
i
i
i
n
i
n
i
n
i
ii
ii
n
X
X
n
YX
YX
βˆ 
XβˆY
n
X
βˆ
n
Y
βˆ
n
i
i
n
i
i
1
1=
1
1=
0 −=−=
∑∑
 
 Assim, parte-se de um modelo estatístico e obtém-se um modelo matemático, que é a 
equação ajustada dada por: 
ii XβˆβˆYˆ 10 += 
Esta equação é equivalente a equação da reta y = a + bx. 
 Agora podemos aplicar estes conhecimentos nos dados de adubação e produção do milho e 
obter uma equação que melhor se ajusta aos dados. O primeiro passo é a obtenção dos seguintes 
valores: 
2502=450++100+50+0=∑
1=
.)...(X
n
i
i 
 
 31 
79880=33010++2106+9805+2305=∑
1=
.).......(Y
n
i
i 
20059520=10330450++6210100+598050+52300=∑
1=
..)*(...)*()*()*(YX
n
i
ii 
500712=450++100+50+0= 2222
1=
2∑ .)(...)()()(Xn
i
i 
5000625=2502=⎟⎠
⎞⎜⎝
⎛ 22
1=
∑ ..).(Xn
i
i 
225=X 
80798= ,.Y 
 Agora é só utilizar as fórmulas obtidas pelas derivadas parciais para estimar os valores de βo 
e β1. 
( )( )
7111=
10
5000625−500712
10
798802502−20059520
=
⎟⎠
⎞⎜⎝
⎛
−
−
=
∑ ∑
∑ ∑ ∑
1=
2
1=2
1=
1= 1=
1 ,...
....
n
X
X
n
YX
YX
βˆ
n
i
n
i
i
i
n
i
n
i
n
i
ii
ii
 
 
055445=2257111−88079=−=−= 11=11=0
∑∑
,*,,XβˆY
n
X
βˆ
n
Y
βˆ
n
i
i
n
i
i
 
 
 Omodelo ajustado ( ii XβˆβˆYˆ 10 += ) fica: 
ii X,,Yˆ 7111+055445= 
Assim, para cada acréscimo em uma unidade de X, tem-se um acréscimo de 11,71 unidades 
em Y, ou seja, para cada 1 kg/ha de adubo (NPK), tem-se um acréscimo de 11,71 kg/ha na produção 
de milho. Se a quantidade de adubo for igual à zero, a produtividade é igual a 5445,05 kg/ha. 
Colocando todos os valores de X na equação e obtendo os respectivos valores de Y, obtém-se a reta 
do gráfico abaixo, que é aquela que melhor se ajusta aos dados: 
 
 32 
 
Observações importantes: 
 Aqui foi apresentado apenas o modelo de uma regressão linear simples. Isso porque a 
variável resposta Y esta em função de apenas uma variável (X). Quando a variável resposta (Y) esta 
em função de duas ou mais variáveis, em um modelo linear, tem-se os modelos de regressão linear 
múltipla. No entanto, nem sempre a natureza de uma interação é linear. Para estes casos existem 
outros tipos de regressão, como a regressão quadrática, cúbica, exponencial etc. 
 A equação ajustada só deve ser utilizada para valores de X do intervalo avaliado, ou seja, 
neste exemplo os valores de X devem ficar entre 0 e 450. Para melhor entendermos esta colocação, 
vamos raciocinar o seguinte. Suponha que sejam aplicadas quantidades de adubo superior a 450 
kg/ha. Pode-se pensar que a produtividade irá aumentar. Porém, não sabemos a natureza da resposta 
neste caso, pois ela não foi avaliada. Uma quantidade de adubo acima de 450 kg/ha pode acarretar 
uma resposta nula, não linear ou até mesmo negativa. Portanto, não é adequado prever valores de Y 
fora do intervalo de valores de X utilizados para a obtenção da equação ajustada. 
 Duas variáveis podem ter correlação aproximadamente nula e terem uma relação de causa e 
efeito. Estes casos não foram abordados aqui, como por exemplo, a regressão polinomial quadrática 
representada abaixo, onde a correlação é -0,04: 
 
 
 33 
Exercícios – Estatística Descritiva 
Somatório 
1) Obter o número de termos para os seguintes somatórios: 
∑ =8 3) i iXa
 ∑ ≠=15 11,93) ii iXb 
Respostas 
a) 6 e; b) 11 
2) Seja uma variável X, assumindo os seguintes valores: 
 
X = {5, 2, 3, 0, 1, 2, 6, 9, 4, 8} n = 10 Calcule: 
∑10
1=i
iX)a
 
2
10
1
)∑
=i
iXb
 
210
1
) ⎟⎠
⎞⎜⎝
⎛∑
=i
iXc
 110
10)
210
12
10
1
−
⎟⎠
⎞⎜⎝
⎛
−
∑∑ =
=
i
i
i
i
X
X
d
 
)4()
10
1
−∑
=i
iXe
 
2
10
1
)4() −∑
=i
iXf
 110
)4(
)
2
10
1
−
−∑
=i
iX
g
 10
)
10
1
∑
=i
iX
h
 
 
Respostas 
a) 40; b) 240; c) 1600; d) 80/9; e) 0; f) 80; g) 80/9 e; h) 4 
 
3) Calcule X1 e X3, dado que: 
∑
=
=
6
1
42
i
iX
 
∑
=
=
6
1
2 364
i
iX
 
∑
≠=
=
6
3,1
1
34
i
i
iX
 
∑
≠=
=
6
3,1
1
2 324
i
i
iX
 
 
Respostas 
X1 = 6 e X3 = 2 ou X1 = 2 e X3 = 6 
 
4) Sabendo-se que ∑
=
−=
5
1
6
i
iX e ∑
=
=
5
1
2 12
i
iX , calcule: 
∑
=
+
5
1
)54()
i
iXa
 
∑
=
−
5
1
)2()
i
ii XXb
 
2
5
1
)3()∑
=
−
i
iXc
 
 
Respostas 
a) 1; b) 24 e; c) 93 
 
 
 
 
 34 
Tipos de variáveis,tabelas de freqüência e gráficos 
1) Um pesquisador solicita a sua equipe que coletem os seguintes dados sobre 14 leitões recém 
nascidos: 
a) Peso de leitões ao nascer e; b) sexo dos leitões. 
Como você classificaria cada uma destas variáveis? 
Qual a sua sugestão de análise gráfica para cada uma destas variáveis? 
 
2) Um professor pede a seus estagiários que coletem os seguintes dados de plantas de feijão: 
a) Altura da planta em cm; b) número de vagens por planta; c) peso de grãos de cada planta 
(g/planta); d) ciclo (tempo, em dias, da germinação até a colheita) e; d) cor da flor. Pede-se: 
Como você classificaria cada uma destas variáveis? 
Qual a sua sugestão de análise gráfica de cada uma destas variáveis? 
 
4) Qual das seguintes amostras (A e B) tem maior porcentagem de mulheres infectadas pelo vírus 
HPV? 
Amostra da população A: 400 mulheres (113 HPV positivo; 287 HPV negativo). 
Amostra da população B: 300 mulheres (97 HPV positivo; 203 HPV negativo). 
R. População B tem maior porcentagem de mulheres infectadas. 
 
4) Um grande produtor de leite do interior de Minas Gerais avaliou a genealogia de 200 fêmeas e 
classificou-as em relação a pureza genética (sem raça definida (SRD); meio-sangue Pardo-Suíço e 
pura Pardo-Suíço). O produtor obteve os seguintes números: 22 SRD, 44 meio-sangue e 134 de raça 
pura. Apresente estes dados em uma tabela de freqüência com as seguintes informações: Freqüência 
absoluta, freqüência relativa e freqüência percentual. 
 
5) Complete a tabela abaixo. 
Número de 
leitões/parto 
Freqüência 
absoluta (Fi) 
Freqüência 
percentual 
Freqüência 
percentual 
acumulada 
Freqüência 
percentual acumulada 
(inversa) 
9 3 
10 4 
11 7 
12 3 
13 2 
14 1 
Total 20 
 
 
 35 
6) Os gráficos abaixo correspondem às notas de alunos(as) de agronomia da UFMA na primeira 
prova de Introdução a Estatística. 
 
 
Com as informações contidas nestes gráficos complete as seguintes tabelas: 
 
Notas Ponto Médio 
Freqüência 
absoluta 
Freqüência 
percentual 
Freqüência 
percentual 
acumulada 
Freqüência 
percentual 
acumulada 
(inversa) 
45 ׀─ 50 
50 ׀─ 55 
55 ׀─ 60 
60 ׀─ 65 
65 ׀─ 70 
70 ׀─ 75 
75 ׀─ 80 
80 ׀─ 85 
85 ׀─ 90 
90 ׀─ 95 
95 ׀─ 100 
Total 
 
Notas Ponto Médio 
Freqüência 
absoluta 
Freqüência 
percentual 
Freqüência 
percentual 
acumulada 
Freqüência 
percentual 
acumulada 
(inversa) 
40 ׀─ 50 
50 ׀─ 60 
60 ׀─ 70 
70 ׀─ 80 
80 ׀─ 90 
 90 ׀─ 100 
Total 
 
 
 36 
Com as informações contidas nestes gráficos e tabelas responda as seguintes perguntas: 
 
a) Qual o número de alunos(as) com nota abaixo de 70? 
b) Qual a porcentagem de alunos(as) com notas abaixo de 70? 
c) Qual o número de alunos(as) com nota acima de 90? 
d) Qual a porcentagem de alunos(as) com nota entre 70 e 80? 
e) Qual a porcentagem de alunos(as) com nota entre 85 e 90? 
f) Qual dos dois gráficos é mais informativo? Justifique sua resposta. 
 
 
Medidas de posição, dispersão e correlação 
1) Os dados abaixo se referem às medidas tomadas em uma amostra de 10 cães: 
Cão 1 2 3 4 5 6 7 8 9 10 
Peso (kg) 23,0 22,7 21,2 21,5 17,0 28,4 19,0 14,5 18,9 19,5 
Comprimento (cm) 104,1 105,1 103,0 105,0 100,1 104,0 100,0 91,0 102,0 99,0 
 
Para as características avaliadas (peso e comprimento) pede-se: 
 
a) Média; 
b) Variância; 
c) Desvio-padrão; 
d) Erro padrão da média; 
e) Coeficiente de variação; 
f) Qual das duas características é mais homogênea; 
g) Mediana; 
h) Coeficiente de correlação entre as duas características; 
i) Compare o valor da média e da mediana de cada característica; 
 
Respostas 
Estatística Peso (kg) Comprimento (cm) 
Média 20,57 kg 101,33 cm 
Variância 14,33 kg2 17,91 cm2 
Desvio-padrão 3,79 kg 4,23 cm 
Erro padrão da média 1,20 kg 1,33 cm 
Coeficiente de variação 18,41 % 4,18 % 
Mediana 20,35 kg 102,50 kg 
Correlação 0,77 
 
2) Um pesquisador dispõe das seguintes informações, a respeito dos valores de uma amostra: 
 - a média de todos os valores é igual a 50,34; 
 - a soma dos quadrados dos valores é igual a 150.000; 
 - a amostra é constituída de 52 valores distintos. 
Pergunta-se: 
Com essas informações é possível obter alguma medidade dispersão dos valores amostrais? Em 
caso afirmativo, efetue os cálculos e obtenha alguma medida. 
Resposta 
S2 = 357,37; S = 18,90; CV(%) = 37,55% 
 
 37 
 
3) Duas turmas A e B com nA =50 e nB = 80 apresentaram médias de 65=AX e 70=BX e 
variâncias Var (A) = 225 e Var (B) = 235. Qual é a turma mais homogênea. 
Resposta: A turma B é mais homogênea. 
 
4) O quadro abaixo contém o número de leitões/parto em uma amostra de 20 partos ocorridos 
durante o ano de 2006 em uma suinocultura. 
Número de leitões/parto Freqüência Absoluta (Fi) 
9 3 
10 4 
11 7 
12 3 
13 2 
14 1 
Total 20 
Pede-se: 
Qual a média de leitões/parto? Resposta: 11 leitões 
Qual o número de leitões/parto mais freqüente (moda)? Resposta: 11 leitões 
Qual é a mediana? Resposta: 11 leitões 
Compare o valor da média, da mediana e da moda. 
Obtenha a variância. Resposta: S2 = 1,90 
 
5) Foram amostrados cinco produtores de milho. A área plantada de cada produtor foi 2, 5, 10, 35 e 
75 hectares. A produtividade média/hectare de cada produtor foi de 3000, 4000, 5000, 6000 e 7000 
kg. Pergunta-se: 
Qual a média de hectares plantados com milho? Resposta: 25,4 hectares. 
Qual a média de produtividade dos produtores amostrados? Respostas: 5000 kg/ha. 
Qual a média de produtividade por hectare plantado? Resposta: 6386 kg/ha. 
 
Regressão linear simples 
1) Qual a diferença entre um modelo matemático e estatístico? 
2) Os dados abaixo se referem aos pesos ao nascer (X) e peso na desmama (Y) de 6 bezerros da raça 
guzerá. 
X Y 
25,3 48,4 
26,9 49,7 
26,5 49,2 
27,4 50,0 
27,9 50,6 
25,8 48,7 
a) Obtenha a equação ajustada para estes dados. Resposta: ii X,,Yˆ 84210+004927= 
b) Plote os pontos da tabela acima em um diagrama de dispersão. 
c) No mesmo gráfico da letra b, plote os pontos de X e Y a partir da equação ajustada. 
 
 
 38 
 
 
 
Capítulo II 
Probabilidade 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 39 
 
2.1. Introdução 
A probabilidade teve sua origem no século XVI. As aplicações iniciais referem-se 
principalmente aos jogos de azar. Mesmo hoje há muitas aplicações que envolvem jogos de azar 
como as loterias e corridas de cavalo, etc. 
Atualmente a teoria das probabilidades é utilizada por governos, empresas, pesquisadores 
etc, nas mais diversas áreas. Independente de qual seja a aplicação, a probabilidade nos dá uma 
quantificação da chance de ocorrência ou não de um evento futuro. Assim, pode-se utilizar a teoria 
das probabilidades para prever a chance de uma pessoa contrair determinada doença, fazer 
previsões do tempo e prever as chances de uma criança nascer com determinado defeito. 
Para melhor entendermos a aplicação da teoria das probabilidades, primeiramente vejamos 
alguns conceitos. 
2.2. Conceitos 
A Probabilidade é o estudo de experimentos aleatórios ou não determinísticos. 
Experimentos determinísticos: 
São aqueles que, repetidos sob as mesmas condições dão resultados, em geral, idênticos. 
Como por exemplo, um experimento onde se avalia o teor de proteína de determinado produto. 
 
 Experimentos aleatórios: 
 São aqueles que repetidos sob as mesmas condições dão resultados, em geral, distintos. 
Como por exemplo, um experimento onde uma moeda é lançada dez vezes e o número de caras é 
observado. Note que cada vez que for repetido o mesmo experimento, em geral, o resultado será 
diferente. 
 
Espaço amostral (S) 
É o conjunto de resultados possíveis de um experimento aleatório. O espaço amostral pode 
ser classificado em: 
 
Finito 
Número limitado de elementos. 
 
Exemplo.: Considere o lançamento de um dado. Assim, podem ocorrer seis resultados: 
S = {1, 2, 3, 4, 5, 6} 
 
Infinito 
Número ilimitado de elementos. Pode ser subdividido em: 
 
a - Enumerável 
 
 40 
É o caso das variáveis aleatórias discretas, como por exemplo, jogar uma moeda infinitas 
vezes e observar o número de caras. Note que é possível enumerar os possíveis resultados em um 
determinado intervalo. 
 
b - Não Enumerável 
É o caso de variáveis aleatórias contínuas. Neste caso existem infinitos resultados em 
qualquer intervalo. 
 
Evento (E) 
Um evento (E) é qualquer subconjunto de um espaço amostral (S). 
Considere como exemplo o seguinte experimento aleatório: Selecionar, ao acaso, três peças de uma 
linha de produção. Classificar cada item conforme ele seja perfeito ou defeituoso: 
P = perfeito; 
D = defeituoso 
O espaço amostral (S) neste caso será: 
 
S = {PPP, PPD, PDP, PDD, DDD, DPD, DDP, DPP} 
 
Assim, um evento (E) pode ser qualquer subconjunto de S. Vamos considerar os eventos A e 
B a seguir: 
A = retirar duas peças defeituosas: A = {PDD, DPD, DDP} 
B = retirar três peças defeituosas B = {DDD}. 
 
 2.3. Probabilidade de um evento 
A probabilidade de um evento A, em que todos os resultados possíveis do espaço amostral 
(S) são igualmente prováveis pode ser obtida por: 
)S(possíveisresultadosdetotalnúmero
)A(eventoaofavoráveisresultadosdenúmero)A(P = 
Considere o exemplo em que um dado é lançado. Qual a probabilidade de ocorrer o número 
5? 
Neste caso o evento A = {5} é um subconjunto do espaço amostral S = {1, 2, 3, 4, 5, 6}. A 
probabilidade é obtida pelo conceito clássico de probabilidade apresentado acima: 
6
1==
)S(possíveisresultadosdetotalnúmero
)A(eventoaofavoráveisresultadosdenúmero)A(P 
Considere agora a probabilidade de lançar o dado e ocorrer um número par. Neste caso o 
evento A = {2, 4, 6}. A probabilidade é novamente obtida pelo conceito clássico de probabilidade: 
50=2
1=6
3== ,
)S(possíveisresultadosdetotalnúmero
)A(eventoaofavoráveisresultadosdenúmero)A(P 
 
2.4. Probabilidade de dois ou mais eventos (teorema do produto) 
Acima foi apresentada a forma de obter a probabilidade de ocorrência de um evento A 
qualquer. Aqui vamos conhecer uma maneira de obter a probabilidade de ocorrência de eventos 
 
 41 
simultâneos ou em seqüência. Sejam A1, A2, A3, ..., An n eventos independentes. Então, a 
probabilidade destes eventos ocorrerem simultaneamente ou em seqüência é: 
)A(P....).A(P).A(P).A(P)Ae...eAeAeA(P nn 321321 = 
Pode-se representar também pela seguinte notação: 
)A(P....).A(P).A(P).A(P)A...AAA(P nn 321321 =∩∩∩∩ 
O símbolo ∩ significa interseção. Para melhor exemplificar, vamos considerar o diagrama 
de Venn abaixo: 
 
Neste diagrama a área do retângulo representa o espaço amostral S e a área dos círculos A1 e 
A2 representam dois subconjuntos que são os eventos A1 e A2 respectivamente. A área sobreposta 
representa um subconjunto onde A1 e A2 ocorrem simultaneamente, ou seja, A1 interseção A2, que é 
representado por 21 ∩ AA . Assim, a probabilidade de ocorrer A1 e A2 simultaneamente pode ser 
obtida por: 
)A(P).A(P)AeA(P)AA(P 212121 ==∩ 
Exemplo 1. Considere que a probabilidade de um casal ter uma criança albina seja igual a 
1/4 e, a probabilidade de nascer menina seja igual a 1/2. Assim, a probabilidade de nascer uma 
menina albina é: 
8
1=2
1
4
1==∩ 2121 .)AeA(P)AA(P 
onde: 
 A1 é o evento “nascer uma criança albina” e; 
 A2 é o evento “nascer uma menina”. 
Exemplo 2. Considere o lançamento de uma moeda três vezes. Qual a probabilidade de 
ocorrer três caras? 
A probabilidade de ocorrer uma cara é 0,5. Então, a probabilidade de ocorrer três caras, pelo 
teorema do produto é: 
8
1=2
1
2
1
2
1==∩∩ 321321 ..)eAAeA(P)AAA(P 
A2 A1 A1∩A2
S 
 
 42 
A probabilidade de ocorrer quatro caras em quatro lançamentos de uma moeda é: 
16
1=2
1
2
1
2
1
2
1=∩∩∩ 4321 ...)AAAA(P 
Estes eventos são independentes, ou seja, a probabilidade da ocorrência de um evento não 
depende da ocorrência de outro. No entanto, em alguns casos, a probabilidadede ocorrência de um 
evento depende da ocorrência de outro. Então, a probabilidade de ocorrência de n eventos 
dependentes A1, A2, A3, ..., An é obtida por: 
 
)Ae...eAeAeA/A(P....).AeA/A(P).A/A(P).A(P)Ae...eAeAeA(P nnn 1−321213121321 = 
ou 
)A...AAA/A(P....).AA/A(P).A/A(P).A(P)A...AAA(P nnn 1−321213121321 ∩∩∩∩∩=∩∩∩∩ 
em que, por exemplo, P(A2/A1) é a probabilidade do evento A2 ocorrer dado que o evento A1 tenha 
ocorrido, onde: 
)A(P
)AA(P
)A(P
)AA(P)A/A(P
1
12
1
21
12
∩=∩= (teorema da probabilidade condicional) 
Exemplo 3. Considere que a probabilidade de um casal ter uma criança com determinada 
doença é 3/4 se for menino e 1/4 se for menina. Então, qual é a probabilidade nascer uma criança 
doente e do sexo masculino? 
Neste caso vamos estipular que o evento A1 é o nascimento de um menino e o evento A2 é a 
ocorrência da doença. Como a ocorrência da doença depende do sexo, os eventos são dependentes e 
o calculo da probabilidade deve ser feito da seguinte forma: 
8
3=4
3
2
1==∩ 12121 .)A/A(P).A(P)AA(P 
Exemplo 4. Em uma determinada região, 30% dos produtores plantaram milho, 20% 
plantaram soja e 10% plantaram soja e milho. Um produtor é amostrado aleatoriamente. 
Vamos considerar que: 
P(A1) = probabilidade de amostrar um produtor que plantou milho = 0,30 
P(A2) = probabilidade de amostrar um produtor que plantou soja = 0,20 
P(A1 e A2) = P(A1 ∩ A2) = probabilidade de amostrar um produtor que plantou milho e soja = 
0,10 
 
a) Se ele planta soja, qual a probabilidade de ter plantado milho? 
 
Pelo teorema da probabilidade condicional temos que: 
2
1=200
100=∩=
2
21
21 ,
,
)A(P
)AA(P
)A/A(P 
 
b) Se ele planta milho, qual a probabilidade de ter plantado soja? 
 
 
 43 
Pelo teorema da probabilidade condicional temos que: 
3
1=300
100=∩=
1
12
12 ,
,
)A(P
)AA(P)A/A(P 
 
Note que a probabilidade P(A1 e A2) foi fornecida. Caso ela não tivesse sido fornecida, poder-
se-ia calcular P(A1 e A2) = P(A1) . P(A2) = 0,3 . 0,2 = 0,06. Este seria o valor esperado que, nem 
sempre coincide com o valor observado. 
 
 
2.5. Eventos disjuntos ou mutuamente exclusivos 
Eventos disjuntos ou mutuamente exclusivos são eventos que não podem ocorrer 
simultaneamente ou em seqüência, ou seja, 0=∩ 21 )AA(P . 
Como exemplo, considere o diagrama de Venn abaixo: 
 
 
 
 
 
 
 
 
 
Note que os eventos A1 e A2 não podem ocorrer simultaneamente (não existe sobreposição 
entre os dois subconjuntos). Neste caso é dito que os dois eventos são mutuamente exclusivos ou 
disjuntos. 
Considere que o evento A1 no diagrama acima seja o subconjunto relativo ao número de 
pessoas com a doença X e, o evento A2 o número de pessoas com a doença Y, em um espaço 
amostral S onde S – A1 – A2 fornece o número de pessoas sadias. Considere que a doença X só 
ocorre em homens e a doença Y só ocorre em mulheres. Então, as duas doenças não podem ocorrer 
simultaneamente em um mesmo indivíduo e, portanto, os dois subconjuntos não se sobrepõem, 
sendo que, a probabilidade 0=∩ 21 )AA(P . 
 
2.6. Probabilidade de um evento satisfeito por vários outros (teorema da soma) 
Vamos considerar que os eventos A1 e A2 são subconjuntos de indivíduos com a doença X e 
Y, respectivamente. Considere que os eventos são não disjuntos, ou seja, existe a probabilidade de 
ocorrência da doença X e Y simultaneamente. Logo, a probabilidade de ocorrência dos eventos A1 
ou A2 pode ser obtida por: 
Evento A1 
Evento A2 
S 
 
 44 
)AeA(P)A(P)A(P)AouA(P 212121 −+= 
Note que usamos “ou” no lugar de “e”. Portanto, a probabilidade a ser obtida é a ocorrência 
de A1 ou de A2. Neste caso pode-se substituir “ou” pelo símbolo ∪ , que significa união, onde a 
probabilidade acima fica: 
)AA(P)A(P)A(P)AA(P 212121 ∩−+=∪ 
Observe novamente, com a ajuda do diagrama de Venn abaixo, que os eventos podem 
ocorrer simultaneamente. Porém, o que se quer é a probabilidade de ocorrer A1 ou A2. Note que a 
área da interseção 21 ∩ AA é incluída duas vezes no calculo da probabilidade 
)A(P)A(P)AA(P 2121 +=∪ e, portanto, é necessário fazer a subtração, obtendo o calculo correto 
dado por: )AA(P)A(P)A(P)AA(P 212121 ∩−+=∪ . 
 
Exemplo 5. Vamos considerar o exemplo em que a probabilidade de nascer menino (A1) é igual a 
1/2 e a probabilidade de nascer albino (A2) é igual a 1/4. Então, qual é a probabilidade de uma 
criança recém nascida ser menino ou albina? 
85=81−41+21=∩−+=∪ 212121 ////)AA(P)A(P)A(P)AA(P 
 
Exemplo 6. Em uma determinada região, 30% dos produtores plantaram milho, 20% plantaram soja 
e 10% plantaram soja e milho. Um produtor é amostrado aleatoriamente. Qual a probabilidade de 
ter plantado somente soja ou somente milho? 
Vamos considerar que: 
P(A1) = probabilidade de amostrar um produtor que plantou milho = 0,30 
P(A2) = probabilidade de amostrar um produtor que plantou soja = 0,20 
P(A1 e A2) = P(A1 ∩ A2) = probabilidade de amostrar um produtor que plantou milho e soja = 
0,10 
 
Então, a probabilidade do produtor amostrado ter plantado somente soja ou somente milho é: 
400=100−200+300=∩−+=∪ 212121 ,,,,)AA(P)A(P)A(P)AA(P 
 
Vamos considerar agora a ocorrência de 3 eventos não disjuntos. No diagrama de Venn este 
eventos ficam: 
A2 A1 A1∩A2
S 
 
 45 
: 
Para obter a probabilidade de ocorrência de A1 “ou” A2 “ou” A3 devem-se somar as três 
probabilidades P(A1) + P(A2) + P(A3). No entanto, neste caso a probabilidade de cada interseção 
dois a dois é somada duas vezes e deve ser subtraída. No entanto, com este procedimento “elimina-
se” a probabilidade da interseção tripla. Portanto, a mesma deve ser somada, obtendo-se o seguinte 
calculo de probabilidade: 
)AAA(P)AA(P)AA(P)AA(P)A(P)A(P)A(P)AAA(P 321323121321321 ∩∩+∩−∩−∩−++=∪∪ 
Para obter a probabilidade de três ou mais eventos o calculo fica bem mais complicado. No 
entanto, se n eventos A1, A2, A3, ..., An são disjuntos, ou seja, não existem interseções, a 
probabilidade seria obtida simplesmente por: 
)A(P...)A(P)A(P)A(P)A...AAA(P nn ++++=∪∪∪∪ 321321 
Exemplo 7. Considere que, em um determinado nascimento, a criança tenha 1/2 de probabilidade 
de apresentar a doença X e tenha 1/4 de probabilidade de apresentar a doença Y. Considere que as 
mesmas não podem ocorrer simultaneamente. Qual seria a probabilidade de ocorrência da doença X 
ou Y? 
43=41+21=+=∪ 2121 ///)A(P)A(P)AA(P 
Exemplo 6. Considere o lançamento de um dado. Qual a probabilidade de sair 1 ou 4 ou 5? 
 Considere que: 
 P(A1) = probabilidade de sair 1 = 1/6 
P(A2) = probabilidade de sair 4 = 1/6 
P(A3) = probabilidade de sair 5 = 1/6 
Como são eventos disjuntos, pelo teorema da soma temos: 
63=61+61+61=++=∪∪ 321321 ////)A(P)A(P)A(P)AAA(P 
 
 
A2 
A1 
S 
A1∩A2A3∩A2
A3∩A1
A1∩A2∩A3
A3 
 
 46 
 
2.7. Teorema da probabilidade total 
Considere agora um evento B em S, representado no digrama de Venn abaixo pelo círculo. E 
considere também n eventos A1, A2, A3, ..., An como partição do espaço amostral S, satisfazendo as 
seguintes condições: i) 0=∩ 21 )AA(P ; ii) SA
n
i
i =∑
1=
 e; iii) P(Ai)>0. 
 
 
 
Então, pelo teorema da probabilidade total, a probabilidade de B pode ser obtida pela soma 
das probabilidades das interseções .BAi ∩ Assim, tem-se a probabilidade de B dada por: 
)BA(...)BA()BA()BA()B(P n ∩++∩+∩+∩= 321 (1) 
 
 Pelo teorema da probabilidade condicional temos que: 
)A(P
)BA(P)A/B(P
1
1
1
∩= 
Assim, isolando )BA(P ∩1 temos que: 
)A(P).A/B(P)BA(P 111 =∩ 
Aplicando em todas as interseções da equação (1), temos que: 
)A(P).A/B(P)BA(P 111 =∩ 
)A(P).A/B(P)BA(P 222 =∩ 
)A(P).A/B(P)BA(P 333 =∩ 
 
 47 
. 
. 
. 
)A(P).A/B(P)BA(P nnn =∩ 
)A(P).A/B(P...)A(P).A/B(P)A(P).A/B(P)A(P).A/B(P)B(Pnn++++= 332211
 ∑
1=
=
n
i
ii )A(P).A/B(P)B(P 
 
2.8. Teorema de Bayes 
O teorema de Bayes envolve o conhecimento dos teoremas da probabilidade condicional e 
total, apresentados anteriormente. Então, vamos considerar novamente n eventos A1, A2, A3, ..., An 
como partição do espaço amostral S, satisfazendo as seguintes condições: i) 0=∩ 21 )AA(P ; ii) 
SA
n
i
i =∑
1=
 e; iii) P(Ai)>0. Pelo teorema da probabilidade condicional temos que: 
=∩ )BA(P i )A(P).A/B(P)B(P).B/A(P iii = 
Então: 
)B(P
)BA(P)B/A(P ii
∩= 
Pelo teorema da probabilidade total temos que: 
)A(P).A/B(P...)A(P).A/B(P)A(P).A/B(P)A(P).A/B(P)B(P nn++++= 332211 
 
Então, obtém-se o teorema de Bayes dado por: 
)A(P).A/B(P...)A(P).A/B(P)A(P).A/B(P)A(P).A/B(P
)A(P).A/B(P
)B(P
)BA(P
)B/A(P
nn
iii
i ++++=
∩=
332211
 
ou 
 
∑
=
=∩= n
1i
ii
iii
i
)A(P).A/B(P
)A(P).A/B(P
)B(P
)BA(P)B/A(P 
 
Para exemplificar, considere uma fábrica onde as máquinas A, B e C produzem, 
respectivamente, 30%, 25% e 45% do total. A porcentagem de defeitos nas peças produzidas pelas 
máquinas A, B e C é, respectivamente, 1%, 1,2% e 2%. Retirou-se uma peça ao acaso. Qual a 
probabilidade da peça ser da maquina C sendo que a peça é defeituosa? 
Aplicando o teorema de Bayes temos que: 
 
 48 
 
)A(P).A/B(P...)A(P).A/B(P)A(P).A/B(P)A(P).A/B(P
)A(P).A/B(P
)B(P
)BA(P
)B/A(P
nn
iii
i ++++=
∩=
332211
 
 
Adaptando para o exemplo: 
)C(P).C/D(P)B(P).B/D(P)A(P).A/D(P
)C(P).C/D(P)D/C(P ++= 
 
5
3=15
9=0150
0090=450020+2500120+300010
450020=
,
,
,.,,.,,.,
,.,)D/C(P 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 49 
Exercícios 
1 – Em uma fazenda, 25% dos animais possuem uma verminose do tipo A, 15% possuem uma 
verminose do tipo B e 10% possuem as duas verminoses. Um animal é amostrado aleatoriamente. 
 
a) Qual a probabilidade de possuir a verminose A ou B? R.: 0,30 
b) Se ele possui a verminose B, qual a probabilidade de possuir a verminose A? R.: 2/3 
c) Se ele possui a verminose A, qual a probabilidade de possuir a verminose B? R.: 2/5 
 
2 – Extraem-se aleatoriamente duas cartas de um baralho comum de 52 cartas. Determine a 
probabilidade de serem ambas ases se a primeira carta é reposta (com reposição), e de serem ambas 
ases se a primeira carta não é reposta. (Obs. o baralho tem 4 ases). R.: 1) 1/169 ; 2) 1/221 
 
 
3 – Uma moeda é lançada 3 vezes. Qual a probabilidade de ocorrer? 
 
a) Três caras? R.:1/8 
b) Três caras ou três coroas? R.: 1/4 
c) Uma cara? R.: 3/8 
d) Ocorrer uma cara e duas coroas nesta ordem? R.: 1/8 
e) Sair primeiro uma cara seguida de duas coroas ou sair primeiro uma coroa seguida de duas caras? 
R.: 2/8 
f) Pelo menos uma cara? R.: 7/8 
 
 
4– Em uma placa de petri, 40%, 50% e 10% do total são bactérias do tipo A, B e C, 
respectivamente. De cada tipo, 3%, 5% e 2%, respectivamente, são patogênicas. Pede-se: 
 
a) Qual a probabilidade de retirar, ao acaso, uma bactéria patogênica? R.: 0,039 
b) Sabendo que a bactéria é patogênica, qual a probabilidade de que ela seja do tipo B? R.: 
0,64 ou 64% 
 
5 – A urna 1 contém três fichas vermelhas e duas fichas azuis. A urna 2 contém duas fichas 
vermelhas e oito azuis. Joga-se uma moeda “honesta”. Se a moeda der “cara”, extrai-se uma ficha 
da urna 1; se der “coroa”, extrai-se uma ficha da urna 2. Determine a probabilidade de escolha de 
uma ficha vermelha. R.: 2/5 
 
 
6 – Definir e dar exemplos de: 
 
a) Eventos mutuamente exclusivos 
b) Eventos independentes 
c) Espaço amostral 
 
7 – Uma urna contém 2 bolas pretas e 3 vermelhas. Foram extraídas 3 bolas com reposição. Pede-
se: 
 
a) Represente o espaço amostral deste experimento aleatório. 
b) Qual a probabilidade de terem sido duas bolas pretas e uma vermelha? R.: 0,288 
c) Qual a probabilidade de terem sido três bolas pretas? R.: zero 
 
 
 50 
8 – Suponha-se que a probabilidade de que um vigia noturno num navio com luzes apagadas 
descubra um periscópio em certas condições de tempo é de 0,7. Se um outro vigia similar for 
incluído, pede-se: 
 
a) Qual é a probabilidade do vigia A e o vigia B encontrar o periscópio?R.: 0,49 
b) Qual é a probabilidade do vigia A ou o vigia B encontrar o periscópio? R.: 0,91 
 
9 - Em uma suinocultura com 200 animais, tem-se 150 fêmeas e 50 machos. Tem-se também, 4 
animais doentes, sendo 3 doentes machos e 1 fêmea. Comprando um animal ao acaso, qual a 
probabilidade do animal: 
a) ser macho R.: 1/4 
b) ser fêmea R.: 3/4 
c) estar doente R.: 1/50 
d) estar doente e ser macho R.: 3/200 
e) Um macho foi comprado. Qual a probabilidade do animal estar doente? R.: 3/50 
f) Uma fêmea foi comprada. Qual a probabilidade do animal estar doente? R.: 1/150 
g) Querendo evitar a compra de um animal doente, você compraria uma animal macho ou fêmea? 
Justifique a sua resposta. 
 
10 - O histograma de freqüências absolutas abaixo demonstra a produtividade média de feijão (t/ha) 
em 160 propriedades do triângulo mineiro: 
 
 
 
Utilizando as informações nele contidas responda as seguintes perguntas: 
 
a) Qual a probabilidade de sortear ao acaso uma propriedade com produtividade média abaixo 
de 1.0 t/ha? R.: 1/16 
b) Qual a probabilidade de sortear ao acaso uma propriedade com produtividade média acima 
de 2.5 t/ha? R.: 1/4 
c) c) Qual a probabilidade de selecionar ao acaso uma propriedade com produtividade entre de 
1.5 e 2.5 t/ha? R.: 9/16 
 
 
 51 
 
 
Capítulo III 
Distribuições 
de 
Probabilidades 
 
 
 
 
 
 
 
 
 
 
 
 
 52 
 
3.1. Variáveis aleatórias 
Quando uma variável esta associada a uma probabilidade ela é chamada de variável 
aleatória. Portanto, os valores assumidos pelas variáveis aleatórias estão relacionados a 
experimentos aleatórios. 
Por exemplo: Considere o nascimento de 10 crianças onde será observada a variável 
qualitativa “sexo”. Trata-se de um experimento aleatório onde a variável “sexo” apresenta 2 
categorias distintas (masculino e feminino) associadas a uma probabilidade de ocorrência. 
As variáveis aleatórias podem ser discretas ou contínuas. 
Variável aleatória discreta 
Uma variável aleatória é discreta quando o número de valores possíveis for finito ou infinito 
numerável. Em geral, os seus valores são obtidos mediante alguma forma de contagem. 
Como exemplo de variável aleatória discreta, pode-se citar o número de acidentes ocorridos 
em uma semana, o número de defeitos por peça, o número de filhos do sexo masculino por casal e o 
número de caras em 10 lançamentos de uma moeda. Note que, no caso da moeda, se o número de 
lançamentos for infinito, o número de caras também será infinito. 
Variável aleatória contínua 
Uma variável aleatória é contínua quando assumir infinitos valores em determinado 
intervalo. São, em geral, variáveis obtidas por alguma medida. São exemplos de variáveis aleatórias 
contínuas, o peso de bebês ao nascer, a altura de plantas de soja, feijão e milho, a pressão arterial, 
etc. 
 Note que o peso de dois bebês pode ser o mesmo em uma ficha médica. Porém, esse fato é 
devido a limitações da balança, pois não existem dois bebês com pesos exatamente idênticos. Essa 
diferença de peso pode chegar a níveis infinitamente pequenos, sendo este fato característico de 
uma variável aleatória contínua. 
 
3.2. Distribuições de probabilidade de variáveis aleatórias 
Estudar a forma como uma variável aleatória se distribui é importante para podermos obter 
uma função que caracteriza a distribuição. Portanto, serão apresentadas a seguir, funções que 
caracterizam as distribuições de variáveis aleatóriasdiscretas e contínuas mais comuns. 
 
3.2.1. Principais distribuições de variáveis aleatórias discretas 
Distribuição Binomial 
A distribuição Binomial também é conhecida como seqüência de Bernoulli, nome este em 
homenagem a seu criador, Jacques Bernoulli. 
 
 53 
É uma forma de distribuição de probabilidade adequada aos experimentos aleatórios que 
apresentam apenas dois resultados (sucesso ou fracasso). Como por exemplo, o número de caras em 
10 lançamentos de uma moeda. Note que, têm-se apenas dois resultados, ou seja, o fracasso relativo 
à coroa e, o sucesso relativo à cara. 
Esta distribuição caracteriza-se pelos seguintes eventos: 
1) Realiza-se n provas independentes e do mesmo tipo. Por exemplo, o lançamento de uma moeda 
10 vezes. 
2) Cada prova admite dois resultados (sucesso ou fracasso). Por exemplo, pode-se considerar que no 
lançamento de uma moeda cara é sucesso e coroa fracasso. 
Assim, tem-se a probabilidade de sucesso em cada prova igual a p e a de fracasso em cada 
prova igual a 1-p = q. A função de probabilidade que caracteriza esta distribuição é: 
YX q.p.
!Y!X
!n)X(P = 
onde: 
n é o número de provas ou observações; 
X é o número de sucessos e; 
Y é o número de fracassos que é igual a n - X. 
Esta função nos dá a probabilidade de um número X de sucessos P(X), em um número n de 
provas. Assim, vamos considerar o seguinte exemplo: 
Qual a probabilidade de, em uma ninhada de 12 cachorros, nascerem 4 machos? Então, 
vamos considerar o nascimento de filhote macho como sucesso e filhote fêmea como fracasso. O 
número de sucessos X será igual a 4 e o número de fracassos Y igual a 8. A probabilidade de nascer 
macho é p= 0,5 e de nascer fêmea é q = 0,5. O número de “provas” n é igual ao tamanho da 
ninhada, ou seja, igual a 12. Identificado cada termo da equação temos: 
12090=21495=5081234
891012=505084
12== 121284 ,)/.(,.
!....
!...,.,.
!!
!q.p.
!Y!X
!n)X(P YX 
Portanto, a probabilidade de nascer 4 machos em uma ninhada de 12 filhotes é P(X) = 
0,1209. 
Vamos abordar este assunto de outra forma. Considere agora o nascimento de quatro 
cachorros (n = 4). Então, qual a probabilidade de nascerem 2 machos? Neste caso, podem ocorrer as 
seguintes seqüências: 
M M F F M F M F M F F M 
F M F M F M M F F F M M 
A probabilidade de ocorrer cada uma destas seqüências é: 
P(M M F F ) = ½ . ½ . ½ . ½ .=1/16 
 
 54 
P(M F M F) = ½ . ½ . ½ . ½ .=1/16 
P(M F F M) = ½ . ½ . ½ . ½ .=1/16 
P(F M F M) = ½ . ½ . ½ . ½ .=1/16 
P(F M M F) = ½ . ½ . ½ . ½ .=1/16 
P(F F M M) = ½ . ½ . ½ . ½ .=1/16 
Voltemos agora ao Capítulo II onde foi abordado o teorema da soma. Note que, a 
probabilidade de, em quatro nascimentos nascerem 2 machos é satisfeita por seis eventos. Assim, 
pode-se escrever esta probabilidade da seguinte forma: 
 
P(nascerem 2 machos em uma ninhada de quatro filhotes) = 
= P(M M F F ou M F M F ou M F F M ou F M F M ou F M M F ou F F M M) = 
= 1/16 + 1/16 + 1/16 + 1/16 + 1/16 + 1/16 = 6 . (1/16) = 6/16 
 
 Uma maneira prática de obter o número de eventos possíveis é: 
6=22
4=
!!
!
!Y!X
!n 
 Assim, voltemos à função de probabilidade apresentada anteriormente para resolver esta 
questão de forma mais prática. Esta função é especialmente útil quando o número de provas ou 
observações é muito elevado. 
161=506=505022
4== 422 /,.,.,.
!!
!q.p.
!Y!X
!n)X(P YX 
 
Outros exemplos de distribuição binomial são: mastite (positivo/negativo), resultado de um 
jogo (vitória/derrota), efeito de um veneno (fatal/não fatal), etc. 
 
Distribuição Multinomial 
A distribuição multinomial resulta da generalização da Binomial. No caso da distribuição 
multinomial o espaço amostral é repartido em k eventos A1, A2, A3, ..., Ak independentes com 
probabilidades p1, p2, p3, ..., pk. Então, em n provas, a probabilidade de que A1 ocorra X1 vezes, A2, 
ocorra X2 vezes, A3 ocorra X3 vezes, ... e Ak ocorra Xk vezes é: 
Xk
k
XXX
k
kk p.....p.p.p.!X!...X!X!X
!n)AX...AXAXAX(P 33
2
2
1
1
321
332211 =∩∩∩∩ 
Note que a diferença em relação a binomial é apenas quanto ao número de categorias da 
variável. No caso da binomial a variável é dicotômica, ou seja, apresenta apenas duas categorias. 
 
 55 
Por exemplo: macho/fêmea; cara/coroa; doente/não doente, etc. No caso da multinomial o número 
de categorias é superior a duas. 
A distribuição multinomial é muito utilizada em análises genéticas onde se tem três ou mais 
categorias. Então, vamos considerar o seguinte exemplo: 
Suponha que a probabilidade de um casal de Labradores gerar filhos amarelos, pretos e 
vermelhos é 9/16, 6/16 e 1/16 respectivamente. Na genética, as diferentes categorias ou níveis de 
uma característica são chamados de fenótipos. Então, a variável qualitativa “cor da pelagem de 
labrador” apresenta três fenótipos ou categorias. Neste caso, a distribuição multinomial é adequada 
e seria possível responder a seguinte pergunta: 
Qual a probabilidade de, em uma cria de 10 filhotes, nascerem 1 amarelo, 1 preto e 8 
vermelhos? 
09−11−
811
10424=1091490=⎟⎠
⎞⎜⎝
⎛
16
1⎟⎠
⎞⎜⎝
⎛
16
6⎟⎠
⎞⎜⎝
⎛
16
9
811
10=8∩1∩1 x,x,....
!!!
!)vermelhospretoamarelo(P 
Note que a probabilidade é bastante baixa, pois este resultado contraria todas as expectativas. Então, 
consideremos uma ninhada mais provável, por exemplo, o nascimento de 6 filhotes amarelos, 3 
pretos e 1 vermelho: 
090=10041840=⎟⎠
⎞⎜⎝
⎛
16
1⎟⎠
⎞⎜⎝
⎛
16
6⎟⎠
⎞⎜⎝
⎛
16
9
136
10=1∩3∩6 4−
136
,x,....
!!!
!)vermelhopretosamarelos(P 
Note que a probabilidade foi bem mais elevada. 
 
Outros exemplos de distribuição multinomial são os grupos sanguíneos em uma amostra n 
da população, três ou mais fenótipos em uma descendência n (como no exemplo acima) e os 
diferentes valores obtidos ao lançar o dado n vezes. 
 
Distribuição de Poisson 
Vamos considerar agora uma variável que é obtida através de contagens, como por exemplo, 
o número de acidentes em determinado local em determinado tempo. Neste caso, pode-se contar o 
número de acidentes que aconteceram, mas não é possível contar o número de acidentes que não 
ocorreram. Outra característica é que o número de acidentes é bastante baixo. Estas características 
ocorrem em variáveis aleatórias discretas que possuem a chamada distribuição de Poisson. 
Então, resumidamente, uma variável que possui distribuição Poisson é obtida por contagem 
de um fenômeno raro. Por este fato, a distribuição de Poisson é conhecida classicamente por lei dos 
fenômenos raros. 
São exemplos de distribuição de Poisson: 
número de defeitos por cm2 
 
 56 
número de acidentes por dia 
número anual de suicídios 
número de fetos nascidos com determinado defeito 
 
A função de probabilidade de uma variável com distribuição Poisson é: 
!x
μ.e)X(P
xμ−
= 
onde: 
x é o número de sucessos (defeitos, acidentes, suicídios, etc); 
e é a base dos logaritmos neperianos e ≈ 2,718; 
µ é a média da distribuição. 
 
Exemplos: 
1 - Considere uma indústria com média de 3 acidentes por mês. Então, qual seria a 
probabilidade de: 
a) Ocorrer 10 acidentes no próximo mês. 
≈10
3==
103−−
!
.e
!x
μ.e)X(P
xμ
8,10 x 10-4 ≈ 0,00081 ≈ 0,08% 
Note que a probabilidade de ocorrer um número de acidentes muito acima da média é baixo, 
menos de 1%. 
 
b) Ocorrer 2 acidentes no próximo mês. 
%,,
!
.e
!x
μ.e)X(P
xμ
422≈2240≈2
3==
23−−
 
Ocorrer dois acidentes é muito mais provável (22,4%) por ser próximo à média. 
 
c) Ocorrer 10 acidentes nos próximos 6 meses. 
Como a média de acidentes em um mês é 3, então, a média de acidentes em 6meses é igual 
a 18. 
%,,
!
.e
!x
μ.e)X(P
xμ
51≈0150≈10
18==
1018−−
 
 
2 – Para uma determinada marca de lâmpada, de cada 4000, 2 se queimam, em média, ao 
serem ligadas. Qual a probabilidade de: 
a) Oito lâmpadas queimarem ao serem ligadas 4000 lâmpadas? 
 
 57 
4−
82−−
10598≈8
2== x,
!
.e
!x
μ.e)X(P
xμ
 
b) Nenhuma queimar ao serem ligadas 4000 lâmpadas? 
13530≈0
2==
02−−
,
!
.e
!x
μ.e)X(P
xμ
 
c) Cinco queimarem ao serem ligadas 6000 lâmpadas? 
1010≈5
3==
53−−
,
!
.e
!x
μ.e)X(P
xμ
 
 
 
3 – Estima-se em 1% a proporção de canhotos em uma população. 
a) Qual a probabilidade de termos dois canhotos em uma turma de 30 alunos? 
Se a proporção é de 1% de canhotos, espera-se que, em uma turma de 30 alunos se tenha 
0,01 x 30 = 0,3 canhotos. Então: 
0330≈2
30==
230−−
,
!
,.e
!x
μ.e)X(P
,xμ
 
 
b)Qual a probabilidade de termos pelo menos um canhoto em uma classe de 30 alunos? 
Neste caso, é só fazer 1 – probabilidade de não ter nenhum canhoto. 
Probabilidade de não ter nenhum canhoto é: 
7410≈0
30==
030−−
,
!
,.e
!x
μ.e)X(P
,xμ
 
P(pelo menos um canhoto) = 1 – 0,741 = 0,259 
 
Outras distribuições 
Outras distribuições menos comuns de variáveis aleatórias discretas são: Binomial negativa, 
Beta-binomial, etc. 
 
3.2.2 Principais distribuições de variáveis aleatórias contínuas 
Distribuição Normal 
É uma das mais importantes distribuições de probabilidades, sendo aplicada em inúmeros 
fenômenos e constantemente utilizada para o desenvolvimento teórico da inferência estatística. 
Também é conhecida como distribuição de Gauss, Laplace ou Laplace-Gauss. 
 
 58 
Uma variável aleatória contínua x que tem distribuição normal possui a seguinte função de 
probabilidade, chamada neste caso de “função densidade de probabilidade” (f.d.p.), apresentada a 
seguir: 
0〉∞〈〈∞−∞〈〈∞−2
1= 2
−
2
1−
σex,μparae
πσ
)x(f σ
)μx(
 
 
onde: 
2σ é a variância de x; 
μ é a média de x. 
Quando a variável x tem distribuição aproximadamente normal com média µ e variância σ2, 
representam-se estas características pela seguinte notação: 
x ~ N(µ, σ2) 
 
 
A representação gráfica de uma variável com distribuição normal é apresentada na Figura 1: 
 
 
Figura 1. Distribuição de probabilidade para dados hipotéticos de altura em centímetros. 
 
 
Neste gráfico, o eixo das abscissas contém os valores da variável x e, o eixo das ordenadas 
contém valores de probabilidade. 
 
As propriedades da distribuição normal são: 
 
 59 
1) f(x) possui um ponto de máximo para x = µ; 
2) f(x) tem dois pontos de inflexão cujas abscissas valem µ + σ e µ - σ; 
3) f(x) é simétrica em relação a x = µ (µ = Mo = Md); 
4) f(x) tende a zero quando x tende para ± ∞ . 
 
A propriedade 1 é obtida derivando f(x) e igualando a zero. O valor obtido será um máximo 
se a segunda derivada de f(x) for menor que zero. O ponto de máximo obtido com estas derivações 
é x = µ. 
A propriedade 2 é obtida igualando a segunda derivada de f(x) a zero, ou seja, f’’(x) = 0. O 
valor obtido é um ponto de inflexão. No caso são dois pontos, µ + σ e µ - σ. 
Os valores em torno da média variam conforme a variância. Na Figura 2 pode-se observar 
graficamente quatro situações com diferentes valores de variância com média constante. 
 
Figura 2. Distribuições de probabilidade para dados hipotéticos de altura em centímetros, 
com mesma média e diferentes variâncias. 
 
 60 
 
Deve-se destacar que a área sob a curva nos dá valores de probabilidade. Como os valores 
de probabilidade variam de 0 a 1, a área total sobre a curva representa o valor 1, ou seja, a 
probabilidade de ocorrer um valor de x entre - ∞ e + ∞ é igual a 1. Então, qual seria a 
probabilidade de ocorrer um valor de x entre - ∞ e µ? Esta resposta é muito fácil, pois a 
distribuição é simétrica. Então, metade dos valores de x são encontrados acima e, a outra metade 
abaixo da média (µ). Assim, a probabilidade de ocorrer um valor de x entre - ∞ e µ é igual a 0,5. 
Vamos abordar agora uma questão um pouco mais difícil. Qual a probabilidade de ocorrer 
um valor entre - ∞ e x1? Considere x1 um valor qualquer entre - ∞ e µ. Para obter este valor de 
probabilidade acumulada, ou seja, a probabilidade de ocorrer qualquer valor entre - ∞ e x1, deve-se 
calcular a área sob a curva entre - ∞ e x1. Assim, integra-se a f(x) entre - ∞ e x1 e obtém-se o valor 
de probabilidade acumulada. 
 
A função em questão é chamada de função de distribuição acumulada, apresentada a seguir: 
 
dxe
πσ
)x(f
x
σ
)μx(
∫1 2
∞−
−
2
1−
2
1= 
 
Assim, a integração de f(x) em um determinado intervalo nos dá a probabilidade de ocorrer 
um valor de x dentro do intervalo. No entanto, o calculo da probabilidade de uma variável aleatória 
contínua em determinado intervalo é complicado por dois motivos: 
1) A integração de f(x) é uma operação matematicamente complicada; 
2) A elaboração de valores tabelados é inviável, pois a função depende de dois parâmetros 
(µ e σ2), o que acarreta o estabelecimento de todas as possíveis combinações de valores 
destes parâmetros. (Para cada valor de µ e σ2 há uma distribuição normal diferente, 
tornado difícil à tabulação de todas estas distribuições). 
Para facilitar a obtenção de valores de probabilidade, podem-se padronizar os valores de f(x), 
obtendo a distribuição normal reduzida apresentada a seguir: 
 
Distribuição normal reduzida ou padrão (Z) 
Como comentado anteriormente, a obtenção dos valores de probabilidade de uma variável 
com distribuição normal é um processo muito difícil e trabalhoso. A distribuição normal 
padronizada (Z) obtém os valores de probabilidade de uma variável aleatória contínua com 
distribuição normal de maneira bastante facilitada. 
A padronização consiste em atribuir um valor Z a equação (x - µ)/σ, ou seja: 
 
 61 
σ
)μx(Z −= 
Assim, a seguinte função densidade de probabilidade acumulada é obtida: 
2−
2
2
1=
Z
e
π
)z(f 
Note que, obter valores de probabilidade para a variável Z é uma tarefa bem mais simples. 
Assim, construiu-se uma tabela onde valores obtidos para Z correspondem a uma probabilidade. 
Com valores de x, µ, e σ pode-se obter valores de Z e, a partir dos valores de Z, obter valores de 
probabilidade acumulada em tabela própria. 
A distribuição normal padrão caracteriza-se por apresentar media igual a zero e variância 
igual a 1, ou seja, Z ~ N(0, 1). Na Figura 3 pode-se observar graficamente a distribuição normal 
padrão. 
 
 
 
Figura 3. Visualização gráfica de uma variável com distribuição normal padronizada. 
 
Exemplos: 
1 - Considere uma variável x, normalmente distribuída, com média 120 e desvio padrão 25. 
 
a) Qual a probabilidade de encontrar um valor de x menor que 180, ou seja, P(x < 180). 
Note que a probabilidade de encontrar um valor entre - ∞ e µ é igual a 0,5. Então, já 
sabemos que a probabilidade de encontrar um valor menor que 180 é maior que 0,5. Para resolver 
esta questão, usaremos a seguinte equação: 
 
 62 
402=25
120−180=−= ,
σ
)μx(Z 
 
Na tabela de Z onde a integração é feita de Z até 0 tem-se: 
0,5 + P(0 < Z < 2,40) = 0,50 + 0,4918 = 0,9918 
O valor de probabilidade 0,4918 foi obtido em tabela própria. A probabilidade de encontrar 
um valor de x menor que 180 é muito elevada (0,99). 
 
b) Qual a probabilidade de encontrar um valor de x maior que 90, ou seja, P(x > 90). 
201−=25
120−90=−= ,
σ
)μx(Z 
P(x > 90) = P(Z > 1,20) = P(-1,20 < Z < 0) + 0,50 = P(0 < Z < 1,20) + 0,50 = 0,3849 + 0,50 
= 0,8849 
c) Qual a probabilidadede encontrar um valor de x entre 80 e 150. Neste caso, devemos 
calcular dois valores de Z. Assim: 
601−=25
120−80=−=1 ,σ
)μx(Z 
201=25
120−150=−=2 ,σ
)μx(Z 
P(80 < x < 150) = P(-1,60 < Z < 1,20) = P(-1,60 < Z < 0) + P(0 < Z < 1,20) = P(0 < Z < 
1,60) + P(0 < Z < 1,20) = 0,4452 + 0,3849 = 0,8301 
 
Vamos considerar agora que a probabilidade de encontrar um valor de x menor que x1 seja 
0,8643, ou seja, P(x < x1) = 0,8643. Assim: 
50,147)25x10,1(120x
25
120x10,1)x(Z 11 =+=⇒−==σ
μ−= 
Portanto, um valor de x menor que 147,50 tem probabilidade 0,8643 de ocorrer. 
 
 
Outras distribuições de variáveis aleatórias contínuas 
Gama, Gama Invertida, Beta, Distribuição t, Weibull, etc. 
 
 
 
 
 
 
 63 
 
Exercícios 
1 – Um casal quer ter quatro filhos. 
 
a) Qual a probabilidade de nascerem 2 meninos e 2 meninas? R.: 3/8 
b) Qual a probabilidade de nascerem 3 meninos e 1 menina? R.: 1/4 
c) Qual a probabilidade de nascerem 2 meninos e 2 meninas, nesta ordem de nascimento? 
R.: 1/16 
 
2 – Determine a probabilidade de que, em 5 lançamentos de um dado, apareça a face 3: 
 
a) Duas vezes. R.: 0,161 
b) Ao menos duas vezes. R.: 0,196493621 
 
3 – Sabe-se que 24% dos indivíduos que recebem um medicamento X sofrem certos efeitos 
colaterais. Se o medicamento X for ministrado a quatro pacientes, qual a probabilidade de que: 
 
a) Nenhum sofra efeitos colaterais. R.: 0,33 
b) Três não sofram efeitos colaterais. R.: 0,42 
c) Pelo menos um sofra efeitos colaterais. R.: 0,6653 
 
4 – Uma população apresenta 25% de indivíduos do grupo sanguíneo A, 25% do grupo B, 30% do 
grupo O e 20% do grupo AB. Retirando-se uma amostra aleatória de 10 indivíduos, pede-se: 
 
a) Qual a probabilidade de retirar 3, 2, 3 e 2 indivíduos dos grupos A, B, O e AB? R.: 0,1772 
b) Qual a probabilidade de retirar 0, 1, 5 e 4 indivíduos dos grupos A, B, O e AB? R.: 0,001225 
 
5 – Uma granja produz 4000 aves por mês. Em média, 4 aves são contaminadas pelo patógeno A 
(média mensal). Então, qual seria a probabilidade de: 
a) Dez aves serem contaminadas no próximo mês. R.: 0,00530 
b) Cinco aves serem contaminadas no próximo mês. R.: 0,15600 
c) Dez aves serem contaminadas nos próximos 6 meses. R.: 0,00066 
 
6 – Em uma determinada região são avistados, em média, 2 indivíduos de uma espécie em extinção 
por mês. Pede-se: 
a) Em um determinado mês foram avistados 15 indivíduos. Qual a probabilidade de avistar 15 
indivíduos novamente no próximo mês? R.: 3,4 x 10-9 
b) Qual a probabilidade de avistar 8 indivíduos da espécie em um período de 3 meses? R.: 
0,103 
 
7 – Seja X o número de crianças não imunizadas numa campanha de vacinação contra uma 
determinada doença, onde a probabilidade de não imunização é 0,001. De 5000 crianças vacinadas, 
qual a probabilidade de não ficarem imunes: 
 
 64 
a) Uma criança. R.: 0,0337 
b) Pelo menos uma criança. R.: 0,9933 
 
8 – As notas de uma prova são normalmente distribuídas com média 73 e variância 225. Os 15% 
melhores alunos recebem o conceito A e os 11,9% piores alunos recebem conceito R. Pede-se: 
 
a) Nota mínima para receber A? R.: 88,6 
b) Nota mínima para ser aprovado? R.: 55,3 
c) Probabilidade de encontrar uma nota acima de 55,3, ou seja, P(X > 55,3)? R.: 0,8810 
d) Porcentagem de indivíduos com nota entre 58 e 88? R.: 0,6826 
 
9 – Sabe-se que o peso médio, em arrobas, de abate de bovinos é normalmente distribuído com 
média 18 e variância 2,25. Um lote de 5000 cabeças, com essa característica foi destinado ao 
frigorífico que abate só a partir de um peso mínimo W. Sabendo-se que foram abatidas 4200 
cabeças, pede-se: 
 
a) O número esperado de bovinos com peso entre 17 e 19 arrobas? R.: 2486 bovinos 
b) Qual o valor de W? R.: 16,515 
 
10 – O volume de correspondência recebido por uma firma quinzenalmente é normalmente 
distribuído com média de 4000 cartas e desvio padrão de 200 cartas. 
 
a) Qual a porcentagem de quinzenas em que a firma recebe mais de 4200 cartas? R.: 15,87% 
a) Qual a porcentagem de quinzenas em que a firma recebe menos de 3400 cartas? R.: 0,13% 
 
 
11 – Uma população A de pinhão manso apresentou teor médio de óleo de 28% e desvio padrão de 
4,8%. Uma população B apresentou teor médio de óleo de 31,6% e desvio padrão de 2,0%. 
 
a) Qual população apresenta maior variabilidade quanto ao teor de óleo? Justifique. 
b) Qual a porcentagem de indivíduos da população A com teor de óleo acima de 35%? R.: 7,21% 
c) Com a finalidade de selecionar 10 indivíduos da população A com teor de óleo acima de 35%, 
quantos indivíduos, no mínimo, devem ser avaliados? R.: 139 indivíduos 
d) Que a porcentagem de indivíduos da população B com teor de proteína acima de 35%? R.: 4,46% 
e) Com a finalidade de selecionar 10 indivíduos da população B com teor de óleo acima de 35%, 
quantos indivíduos, no mínimo, devem ser avaliados? R.: 225 indivíduos 
f) Em qual população é mais fácil encontrar indivíduos com teor de óleo acima de 35%? 
 
12 – Uma máquina de empacotar determinado produto oferece variações de peso com desvio padrão 
de 20g. Em quanto deve ser regulado o peso médio do pacote para que apenas 10% tenham menos 
de 400g? 
 
60425=⇒6025−=−400⇒20
−400=281−=−= ,μ,μμ,
σ
)μx(Z 
 
 
 65 
 
 
 
Capítulo IV 
Inferência Estatística 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 66 
4.1. Introdução 
 A inferência estatística é um ramo da estatística que tem o objetivo de inferir a respeito de 
uma população a partir de amostras. A inferência compreende: 
- estimação de parâmetros, como a média e a variância 
- testes de hipóteses 
Como a estimação é feita a partir de amostras, primeiramente vamos abordar alguns 
aspectos a respeito da amostragem estatística. 
 
4.2. Amostragem 
População e Amostra 
 Do ponto de vista estatístico, o conjunto de todos os elementos sobre os quais desejamos 
desenvolver determinado estudo constitui uma população. Quando é considerada apenas uma parte 
deles, ou seja, um subconjunto da população, tem-se uma amostra. 
 
Uma População (N) pode ser finita ou infinita: 
a) Uma população finita apresenta um número limitado de observações, que é passível de 
contagem, por exemplo: 
 - os alunos de determinado curso; 
 - os produtos de um supermercado; 
 - os livros de uma biblioteca. 
 
b) Uma população infinita apresenta um número ilimitado de observações, por exemplo: 
 - extrações com reposições de bolas de uma urna; 
 - nascimentos futuros de crianças; 
 - número de carros produzidos futuramente. 
 
Observações importantes: 
Note que as amostras infinitas são processos contínuos, a cada dia são produzidos carros e 
nascem crianças. Porém, se a população for o número de carros produzidos ou o número de 
nascimentos em 2006, aí a população seria finita. 
Uma população pode, mediante processos operacionais, ser considerada infinita, pois a 
mesma irá depender do tamanho da amostra. Isso ocorre sempre que uma amostra constitui de no 
máximo 5% da população. Assim, por exemplo, se tomarmos uma amostra de 100 habitantes da 
cidade de Chapadinha, esta população embora finita, será considerada infinita. 
 
 
 67 
Censo e Amostragem 
Quando se obtém dados de todos os elementos de uma população, procedeu-se um censo e, 
quanto se obtém dados de parte da população, procedeu-se uma amostragem. 
 
Vantagens da amostragem 
 As principais vantagens da amostragem em relação ao censo são: 
a) Custo reduzido 
 É evidente que em decorrência do menor número de dados coletados a amostragem é mais 
econômica em relação ao censo. 
b) Maior rapidez 
 Os dados podem ser coletados e tabulados mais rapidamente na amostragem, possibilitandoa obtenção dos resultados ou informações num espaço de tempo menor. 
c) Maior facilidade de execução 
 Para determinadas pesquisas há necessidade de utilização de equipes bem treinadas e 
equipamentos especializados para a obtenção dos dados. Neste caso a realização de um censo pode 
ser inviável. 
d) Maior precisão 
 Em alguns casos a amostragem pode ser mais precisa que o censo. Isso ocorre porque o 
menor número de observações na amostragem leva a uma menor quantidade de coletores de dados. 
A menor quantidade de coletores possibilita trabalhar com uma equipe mais homogênea, de melhor 
nível e mais bem treinada. 
e) Testes destrutivos 
Testes de caráter destrutivo, como testes de munição, testes de impacto com veículos, vida 
útil de lâmpadas etc só podem ser realizados com amostras, pois se os testes fossem realizados com 
toda a população a mesma não existiria. 
 
Observações importantes: 
Há certas situações em que é mais vantajoso examinar todos os elementos de uma população, ou 
seja, fazer um censo. Entre estas situações temos: 
 
- A população pode ser tão pequena que o custo e o tempo de um censo sejam um pouco maiores 
que o de uma amostra. 
- Quando o tamanho da amostra para que as estimativas tenham a precisão exigida deve ser tão 
grande que quase atinge o tamanho da população. 
- Quando se exige total precisão da estimativa. 
 
 68 
 Plano de Amostragem 
 O sucesso de um levantamento por amostragem está na dependência direta de seu 
planejamento. Um plano de amostragem pode ser planejado da seguinte maneira: 
 
1) Definir os objetivos da pesquisa 
Aqui devem ser definidos os objetivos com base no problema e nas hipóteses. As conclusões 
finais devem responder, sempre que possível, as perguntas levantas no problema com base em 
alguma hipótese previamente formulada. 
2) População a ser amostrada (identificar a população alvo) 
3) Parâmetros a serem estimados (Por exemplo: média, variância, proporção etc) 
4) Dados a serem coletados (idade, sexo, peso, renda, produção em kg/ha, etc) 
5) Definição da unidade amostral (Por exemplo: pessoa, família, bairro, cidade, etc) 
6) Forma de seleção dos elementos da população que farão parte da amostra. 
 A forma de seleção de elementos depende, principalmente, de como os elementos amostrais 
estão distribuídos na população. Pela sua importância, este aspecto será tratado em maiores detalhes 
adiante, quando serão abordados os tipos de amostragens. 
7) Definição do tamanho da Amostra (n) 
 O tamanho da amostra dependerá da precisão das estimativas e da variância na população 
(quanto maior a amostra e menor a variância mais precisa serão as estimativas) e da disponibilidade 
de dinheiro, tempo, mão-de-obra, etc. 
O exemplo abaixo tenta ilustrar todas as fases de um planejamento de amostragem 
 Suponha que é necessária a realização de uma pesquisa para saber a proporção de pessoas 
infectadas por determinada doença no estado do Maranhão. Note que a definição do problema já foi 
levantada (Qual a proporção de pessoas infectas pela doença X no estado do Maranhão?). A partir 
deste problema pode se ter uma hipótese, com base em informações preliminares. Um exemplo de 
hipótese seria: A proporção de pessoas infectadas esta ou não acima de um valor mínimo tolerável. 
A população alvo também foi definida (todos os habitantes do estado do Maranhão). O parâmetro a 
ser estimado neste caso é uma proporção (π). A unidade amostral será cada habitante amostrado. A 
forma da seleção de cada pessoa a ser amostrada já é algo mais complicado e deve ser mais 
criterioso. Será abordado no tópico “tipos de amostragem” a seguir. E, por fim, a definição do 
tamanho da amostra deve ser o maior possível considerando os custos e a logística da realização da 
pesquisa, juntamente com a precisão da estimativa. Quanto maior a amostra mais precisa será a 
estimação dos parâmetros. 
 
 
 
 69 
Tipos de Amostragem 
 A forma de seleção de cada elemento de uma amostra irá depender do tipo de amostragem, 
que por sua vez, dependerá de aspectos particulares de cada população. Abordaremos os tipos mais 
importantes de amostras probabilísticas. Primeiramente vejamos os conceitos de amostra 
probabilística ou não-probabilística. 
Amostra probabilística 
Quando cada elemento pertencente à população possui probabilidade conhecida e diferente 
de zero de pertencer à amostra, diz-se que a amostra é probabilística. Assim, uma pessoa em uma 
cidade com 10 mil habitantes possui probabilidade de 1/10000 de ser amostrada. Porém, a seleção 
da pessoa deve ser ao acaso. Caso a seleção seja feita por algum critério e não ao acaso, tem-se uma 
amostra não-probabilística. 
Amostra não probabilística 
É uma amostra em que alguns elementos são favorecidos em relação aos demais. Isso ocorre 
quando a seleção não é feita ao acaso. Por exemplo: amostram-se pessoas em uma cidade de 10 mil 
habitantes apenas nos bairros mais ricos. Note que as pessoas moradoras de bairros mais pobres têm 
probabilidade zero ou menor que 1/10000 de pertencer à amostra. Outro exemplo é obter amostras 
de sangue de doadores voluntários. Neste caso a amostra também não foi feita ao acaso e pessoas da 
população que não podem ou não querem doar sangue tem probabilidade zero de serem amostradas. 
Nestes dois exemplos as amostras não são representativas da população e, portanto, não serão 
abordadas neste curso. 
 
Tipos de amostragem probabilística 
Amostragem Simples ou Ocasional 
É o processo mais elementar e freqüentemente utilizado. Neste tipo de amostragem, 
qualquer combinação dos n elementos da amostra tem igual probabilidade de vir a ser sorteada. 
Em uma população de N elementos o número possível de amostras de tamanho n que podem 
ser retiradas, diferindo em pelo menos uma unidade amostral é: 
!n)!nN(
!NCnN −= 
 Por exemplo: Considere uma população constituída dos elementos: A, B, C, D e E. Neste 
caso o tamanho da população é N = 5. Quantas amostras diferentes de tamanho n = 3 podem ser 
retiradas desta população? 
10=33−5
5=35 !)!(
!C 
 Assim, as 10 amostras possíveis são: 
 
 70 
ABC ADE 
ABD BCD 
ABE BCE 
ACD BDE 
ACE CDE 
Note que qualquer combinação dos 3 elementos da amostra tem igual probabilidade de vir a 
ser sorteada. 
 
Amostragem Estratificada 
É um processo de amostragem usado quando nos depararmos com populações heterogêneas, 
na qual se pode distinguir subpopulações mais ou menos homogêneas, denominados estratos. 
Assim, após a determinação dos estratos, seleciona-se uma amostra aleatória de cada subpopulação 
(estrato). 
As diversas subamostras retiradas das subpopulações devem ser proporcionais aos 
respectivos números de elementos dos estratos e, guardarem a proporcionalidade em relação a 
variabilidade de cada estrato, obtendo-se uma estratificação ótima. 
 Por exemplo: Considere uma pesquisa sobre o nível de renda em determinada cidade. 
Considere que os níveis de renda são variáveis de acordo com regiões da cidade (bairros). Assim, 
temos uma população que não é distribuída de forma homogênea quanto a variável renda. Se 
pegarmos pessoas ao acaso na população como um todo, pode-se selecionar um maior número de 
pessoas de um determinado bairro. Neste caso, o valor estimado da renda média tem maior 
probabilidade de ser um valor pouco representativo da renda média da cidade. Assim, para obter 
uma estimativa mais precisa, pode-se amostrar de maneira aleatória dentro de cada bairro e depois 
juntar os dados coletados estimando a renda média que será, provavelmente, mais precisa quando 
comparada com a renda média obtida de amostragem aleatória simples. É importante destacar que o 
número de pessoas amostradasdentro de cada estrato deve ser proporcional ao seu tamanho. Assim, 
se a cidade tem 10 mil habitantes em 5 bairros com, respectivamente 200, 500, 100, 150 e 50 mil 
habitantes e, deseja-se obter uma amostra de 100 habitantes, deve-se amostrar, respectivamente, 20, 
50, 10, 15 e 5 habitantes em cada bairro. O conjunto destas 5 amostras simples denomina-se 
amostra estratificada. 
 Uma outra maneira de obter uma amostra estratificada seria utilizar a informação dos 
tamanhos populacionais dos estratos e a variância dentro de cada estrato. Assim, considere o mesmo 
exemplo anterior, considerando que a variância de cada estrato é, respectivamente, 2, 4, 6, 3 e 7. 
Note que, estratos de maior variância são mais heterogêneos e, portanto, pode-se amostrar, 
 
 71 
relativamente, um maior número de elementos em estratos de maior variância em comparação com 
estratos de menor variância. 
 Vamos fazer o seguinte exemplo: Querendo amostrar a renda média de produtores de 
determinada região, é adequado considerar que, em geral, existe uma heterogeneidade de renda 
entre produtores com diferentes tamanhos de propriedade. Então, pode-se fazer uma amostragem 
mais precisa se os produtores forem separados por estratos relativos ao tamanho da propriedade em 
hectares. A Tabela 1 contém os estratos, o número de propriedades por estrato e o desvios padrões 
por estrato. 
Tabela 1. Desvios padrões da renda e o número de proprietários rurais por estratos relativos ao 
tamanho da propriedade em hectares 
Estratos 
(áreas em ha) 
Número de propriedades 
Nh 
Desvio Padrão 
 0׀– 2 500 10 
 2׀– 5 320 11 
 5׀– 10 100 13 
10 ׀– 20 50 20 
20 ׀– 40 30 30 
Total 1.000 - 
 
Vamos considerar que uma amostra de 50 propriedades é suficiente para a precisão da estimativa da 
renda média na região. Então, podem-se considerar dois tipos de amostragem estratificada. 
 
1) Amostrar um número de propriedades proporcional ao tamanho do estrato. Neste caso, pode-se 
resolver por regra de três simples: 
Para o estrato 1 tem-se: 2550x
000.1
500nx
N
Nn 11 === 
E assim sucessivamente. Os resultados para os demais estratos encontram-se na Tabela 2. 
 
2) Quando se tem conhecimento da variância dentro de cada estrato, a amostragem pode ser mais 
precisa, utilizando a partilha ótima de Neyman (1934). Neste tipo de amostragem, o tamanho da 
amostra em cada estrato é obtido por: 
nx
N
Nn L
1h
hh
hh
h ∑
=
σ
σ= 
 
 72 
Utilizando esta equação e as informações contidas na Tabela 1, o tamanho amostral para o primeiro 
estrato é: 
33,2150x
720.11
000.5nx
N
Nn 5
1h
hh
11
1 ==
σ
σ=
∑
=
 
E assim sucessivamente. Os resultados para os demais estratos encontram-se na Tabela 2. 
Tabela 2. Desvios padrões da renda, número de proprietários rurais por estratos e tamanho de 
amostra por estrato utilizando duas metodologias de partilha. 
Estratos 
(áreas em ha) 
Número de 
propriedades (Nh) 
Desvio 
Padrão 
Tamanho Amostral 
(partilha proporcional) 
Tamanho Amostral 
(partilha de Neyman) 
 0׀– 2 500 10 25 21 
 2׀– 5 320 11 16 15 
 5׀– 10 100 13 5 6 
10 ׀– 20 50 20 3 4 
20 ׀– 40 30 30 1 4 
Total 1.000 50 50 
 
Amostragem Sistemática 
 Trata-se de uma variação da amostragem aleatória simples ou ocasional, conveniente quando 
a população está naturalmente ordenada, como fichas em um fichário, lista telefônica, cadastros etc. 
Por exemplo: Considere o sorteio de 50 pessoas em uma cidade para fazer uma entrevista. Seria 
muito trabalhoso obter o nome de todas as pessoas e realizar o sorteio. Vamos considerar o caso da 
lista telefônica que, neste caso, contém 1000 telefones. Pode-se então, fazer o seguinte. Dividir 
1000 por 50. Neste caso se obtém 20. Note que, se pegarmos um nome a cada 20 na lista, vamos 
obter uma amostra de cinqüenta pessoas. Agora é só sortear um número de 1 a 20, vamos supor que 
saiu o número 3. A seguinte seqüência de nomes foi amostrada: 3, 23, 43, 63, 83, ..., 983. 
As vantagens da amostragem sistemática são: i) a sua maior facilidade de aplicação quando os 
dados estão ordenados e, ou, listados; ii) também é vantajosa se a população for heterogênea, pois 
amostra em toda a extensão da população. 
 
Amostragem por Conglomerados (ou Agrupamentos) 
Algumas populações não permitem, ou torna-se extremamente difícil que se identifiquem 
seus elementos, mas podemos identificar subgrupos da população. Em tais casos, uma amostra 
aleatória simples desses subgrupos (conglomerados) pode ser escolhida. Portanto, quando os 
elementos da população são reunidos em grupos que são sorteados para compor a amostra, o 
processo é denominado amostragem por conglomerado. 
 
 73 
Por exemplo: Considere a amostragem de 500 proprietários rurais no estado do Maranhão. 
Neste caso, pode-se considerar o sorteio de 50 municípios e 10 proprietários em cada. Ou o sorteio 
de 25 municípios e 20 proprietários em cada. A economia neste tipo de sorteio é evidente, pois o 
método dispensa o sorteio da listagem de referência ou cadastro de toda a população, pois somente 
os conglomerados sorteados são identificados e listados. Um outro aspecto é o custo de locomoção. 
Note que se fosse feita uma amostra casual simples de 500 proprietários no Estado do Maranhão, o 
número de municípios poderia ser bem maior que 50, dificultando a locomoção das equipes de 
pesquisa. 
 
4.3. Estimação de parâmetros 
Para melhor entender o significado da estimação de parâmetros, primeiramente vamos 
analisar alguns conceitos muito importantes abordados a seguir: 
Parâmetro (θ) 
 Parâmetro é uma função de valores populacionais, sendo, em geral, um valor conhecido 
associado à população. 
Exemplo: Para uma variável quantitativa que possua distribuição normal, podem-se obter os 
parâmetros média (µ) e variância (σ2). 
 
Estimador 
 Um estimador de um parâmetro (θ) é qualquer função das observações da amostra aleatória 
X1, X2, X3, ..., Xn. Ele representa uma dada fórmula de cálculo que fornecerá valores diferentes em 
diferentes amostras. 
Exemplos: 
n
X
X = μˆ é µ média daEstimador 1)
n
i
i∑
1== 
1n
n
X
X
SˆéiânciavardaestimadorO)2
2n
1i
in
1i
2
i
222
−
⎟⎠
⎞⎜⎝
⎛
==σσ
∑∑ =
= 
Estimativa 
 Estimativa é o valor numérico assumido pelo estimador. 
Exemplo: A estimativa da altura média ( X ) de uma população A é 1,71 m. A estimativa da 
variância (S2) da altura média desta mesma população é 4,67 m2. Portanto, a estimação consiste em 
utilizar dados amostrais para estimar parâmetros populacionais, como por exemplo, a média, a 
variância, etc. 
 
 74 
 A figura abaixo representa a simbologia de alguns parâmetros populacionais e seus 
respectivos estimadores amostrais. 
 
 Um parâmetro populacional, por exemplo, a média ( µ), pode ter a sua estimativa 
representada por X , como exemplificado acima, ou por μˆ . 
 A estimação pode ser: 
 a) por ponto 
Na estimação por ponto obtém-se um único valor como estimativa de um parâmetro 
populacional. Por exemplo: obter a média de altura de um país com base em uma amostra. O valor 
obtido é a estimativa pontual do parâmetro populacional. Poderia ser 1,71 m. 
 b) por intervalo de confiança 
 Na estimação por intervalo de confiança, procura-se determinar um intervalo que tenha uma 
probabilidade de conter o parâmetro populacional. Assim, o mesmo parâmetro considerado no 
exemplo anterior (média) poderia ser estimado por intervalo. Poderia ser: A média da população 
tem 95% de probabilidade de estar entre 1,69 m e 1,73 m. 
Podem-se obter intervalos de confiança para diversos parâmetros populacionais, como por 
exemplo:a média, a variância, uma proporção, um coeficiente de variação, etc. 
- intervalo de confiança para uma média 
O intervalo de confiança para uma média pode ser obtido pela seguinte expressão no caso de 
população infinita (n < 0,05N): 
α−=⎟⎠
⎞⎜⎝
⎛ +≤μ≤− αα 1n
stX
n
stXP xx 
onde: 
 P é a probabilidade da média populacional ocorrer no intervalo; 
 α é o nível de significância, (geralmente 1% ou 5%); 
 sx é o desvio padrão amostral dos dados; 
 n é o tamanho da amostra; 
X é a média amostral e; 
 
 75 
αt é o valor da distribuição t de Student, obtido com base no tamanho da amostra (n – 1) e o 
nível de significância (α) ; 
Para população finita o intervalo de confiança pode ser obtido por: 
α−=⎟⎟⎠
⎞
⎜⎜⎝
⎛ −+≤μ≤−− αα 1N
nN
n
s
tX
N
nN
n
s
tXP xx 
Onde: 
N é o tamanho da população 
 
Exemplo: Considere uma amostra de 121 plantas de feijão, cuja média estimada para 
produção de grãos por planta foi 11,1645 g/planta e a variância estimada foi 77,3901 g2/planta. 
Vamos construir um intervalo de confiança que tenha 95% de chance de conter a média 
populacional. Considere que a população é infinita n < 0,05N. 
Resolução: 
Precisamos obter o desvio padrão (sx) e o “t” tabelado. O desvio padrão é obtido por: 
7972,83901,77sx == 
Para obter o valor de “t” tabelado, deve-se considerar que α = 5%, para um intervalo de 95% 
de confiança. Assim, entra-se em tabela própria (tabela bilateral) com 05,0t e (n -1), ou seja 120 
graus de liberdade. Assim, obtém-se o valor 1,987. 
 Assim, tem-se: 
05,01
121
7972,8987,11645,11
121
7972,8987,11645,11P −=⎟⎠
⎞⎜⎝
⎛ +≤μ≤− 
( ) 95,07536,125754,9P =≤μ≤ 
Portanto, a probabilidade da média μ variar de 9,5754 até 12,7536 é 0,95 ou 95%. 
O intervalo de confiança também pode ser apresentado da seguinte maneira: 
IC0,95 = [11,1645 ± 1,5891] 
Esse intervalo de confiança possibilita inferir com 95% de confiança que a média de 
produtividade de grãos por planta na população se encontra entre 9,5754 g/planta e 12,7536 
g/planta. 
Observações importantes: 
Intervalos de menor amplitude significam estimativas mais precisas. 
Quanto maior o tamanho da amostra, mais precisa é a estimativa e, portanto, menor é o 
intervalo de confiança. 
Quanto menor a variância, mais homogênea é a população e, consequentemente, mais 
precisa será a amostragem. Portanto, menor será o intervalo de confiança. 
 
 76 
- intervalo de confiança para uma proporção 
O intervalo de confiança para uma proporção pode ser obtido pela seguinte expressão: 
( ) α−=+≤π≤− αα 1)p(stpˆ)p(stpˆP 
onde: 
P é a probabilidade do parâmetro populacional ocorrer no intervalo; 
α é o nível de significância, (geralmente 1% ou 5%); 
s(p) é o desvio padrão amostral para a proporção p; 
n é o tamanho da amostra; e 
αt é o valor da distribuição t de Student, obtido com base no tamanho da amostra (n – 1) e o 
nível de significância (α) ; 
Observação: 
No caso de população infinita (n < 0,05N), o desvio padrão amostral para uma proporção p é 
obtido por: 
1n
pq)p(s −= 
No caso de populações finitas o desvio padrão uma proporção p é obtido por: 
q.p.
)1n(N
)1N()p(s −
−= 
Exemplo: Considere uma amostra de 121 caprinos onde 20 animais estavam infectados com 
determinado parasito. Construa um intervalo de confiança que tenha 95% de chance de conter a 
proporção populacional. 
Considerando que a população é infinita n < 0,05N 
Resolução: 
Precisamos obter o desvio padrão (sp) e o “t” tabelado. O desvio padrão é obtido por: 
0339,0
120
835,0.165,0)p(s == 
( ) α−=+≤π≤− αα 1)p(stpˆ)p(stpˆP 
( ) 95,00339,0.987,1165,00339,0.987,1165,0P =+≤π≤− 
( ) 95,0232,0098,0P =≤μ≤ 
IC0,95 = [0,165 ± 0,0674] 
Esse intervalo de confiança possibilita inferir com 95% de confiança que a proporção de 
caprinos contaminados com o parasito, na população, encontra-se entre 0,098 (10%) e 0,232 (23%). 
 
 
 
 77 
4.4. Testes de Hipóteses 
Introdução 
O teste estatístico de hipótese é uma regra decisória que nos permite rejeitar ou não uma 
hipótese estatística com base nos resultados de uma amostra. Estas hipóteses são, em geral, sobre 
parâmetros populacionais e, a realização do teste se baseia na distribuição amostral dos respectivos 
estimadores. 
A seguir, tem-se uma breve descrição de alguns procedimentos necessários para realização 
de um teste de hipóteses. 
 
Hipóteses 
 Antes da realização de um teste estatístico, deve-se formular a hipótese a ser testada. 
Por exemplo: Um pesquisador quer testar se existe diferença significativa entre a média de altura 
entre as populações A e B. Portanto, foram coletadas amostras de altura nas duas populações, 
obtendo uma estimativa da média para cada população. Neste caso, a hipótese a ser testada é µA = 
µB. Esta hipótese é chamada de hipótese de nulidade (Ho), representada por: 
Ho : µA = µB 
A hipótese alternativa (Ha) é a hipótese que contraria Ho. Neste caso, a hipótese alternativa pode 
ser representada por: 
Ha1 : µA ≠ µB 
ou 
Ha2 : µA >µB 
ou 
Ha3 : µA < µB 
Qual dessas usar? 
 Depende do conhecimento que se tem do problema e das informações que o problema trás. 
 
Nível de significância 
O nível de significância é o valor de probabilidade acima do qual os desvios amostrais são 
devidos ao acaso. O nível de significância é representado por alfa (α) e, em geral, utiliza-se alfa 
igual a 5% ou 1%. Estes valores equivalem à probabilidade de 0,05 e 0,01 respectivamente. 
 
Por exemplo: Considere uma diferença entre as médias das amostras A e B. O que se quer testar é: 
essa diferença é real (ou seja, uma população possui média diferente da outra) ou a diferença 
ocorreu ao acaso devido a um erro amostral. Portanto, qual a probabilidade da diferença encontrada 
entre as médias A e B estar ocorrendo ao acaso? O teste estatístico nos dá esta informação. Se a 
 
 78 
probabilidade de ocorrer determinada diferença entre as médias A e B for elevada, conclui-se que as 
médias são iguais, pois a diferença, provavelmente, esta ocorrendo ao acaso. Porém, o pesquisador 
deve fixar um limite (chamado nível de significância) acima do qual, considera-se que os desvios 
estejam ocorrendo ao acaso. Esse limite é, em geral, 5%. Assim, se o teste apresenta probabilidade 
de uma diferença estar ocorrendo ao acaso maior que 5%, aceita-se Ho. Se a probabilidade dos 
desvios estarem ocorrendo ao acaso é menor que 5%, rejeita-se Ho. 
 
Observação: Notem o seguinte. Quando fazemos uma amostragem, selecionamos, ao acaso, 
diferentes indivíduos. Assim, cada média tomada da mesma população deve apresentar valores 
distintos que podem ser mais ou menos representativos do valor populacional. 
 
Tipos de erros 
 Notem que o resultado obtido em um teste não nos dá uma certeza!!! Mas sim uma 
probabilidade. Assim, dois tipos de erros podem ocorrer: 
Erro tipo I ou α: é a probabilidade de rejeitar Ho sendo Ho verdadeira. É o nível de significância, 
geralmente fixado em 0,05. 
 
Por exemplo: Em um censo uma população apresentou média de escolaridade de 15 anos. Passados 
quatro anos, obteve-se uma amostra desta população para saber se o nível médio de escolaridade foi 
alterado. A estimativa obtida foi de 16 anos. A hipótese a ser testada é: 
Ho : µ = 15 
Ha : µ > 15 
Depois de realizado o teste estatístico adequado, verificou-se que a superioridade encontrada 
possui 4% de probabilidade de estar ocorrendo ao acaso. Note que a probabilidade da superioridade 
estar ocorrendo ao acaso é baixa, portanto, é bastante provável (96 %) que a média de escolaridade 
aumentou. Neste caso a hipótese Ho é rejeitada, considerando um nível de significância de 5%. 
Porém, mesmoassim existe a probabilidade (4%) da média de escolaridade não ter alterado. A 
diferença ocorreu por erro amostral devido ao acaso. Neste caso, seria cometido o erro tipo I. 
 
Erro tipo II ou β: é a probabilidade de aceitar Ho sendo Ho falsa. 
Considere o exemplo anterior. Porém, neste caso a hipótese Ho foi aceita, considerando que a 
probabilidade dos desvios estarem ocorrendo ao acaso foi maior que 5% (considere 30%). Note que 
a probabilidade da diferença ter ocorrido por simples acaso é elevada 0,3 ou 30%. Porém, mesmo 
assim tem-se bastante chance da diferença não ter ocorrido ao acaso. Caso a diferença não tenha 
ocorrido ao acaso, cometeu-se erro tipo II. 
 
 79 
Portanto, qualquer que seja o resultado do teste, tem-se a probabilidade do resultado obtido 
estar errado!!!!! 
 Quanto maior o nível de significância, maior a probabilidade de cometer erro tipo I e menor 
a probabilidade de cometer erro tipo II. E vice-versa. Assim, a melhor maneira de diminuir a 
probabilidade de erro é aumentando o tamanho e a precisão da amostra. 
Obs.: Notem que, rejeitar uma hipótese, em geral, é uma decisão mais segura que não rejeitar. 
 
Passos para realização de um teste de hipótese 
1) Enunciar as hipóteses Ho e Ha; 
2) Obter o valor tabelado do teste nas tabelas próprias, através do nível de significância (α); 
3) Por meio de elementos amostrais, calcular o valor da estatística do teste e; 
4) Concluir pela rejeição ou não de Ho comparando o valor obtido em 3 (valor tabelado do 
teste) com o valor obtido em 4 (valor calculado do teste). 
 
Principais testes estatísticos 
Teste para comparar duas variâncias populacionais (teste F) 
Este teste é utilizado para testar se duas variâncias obtidas de duas amostras casuais e 
independentes são diferentes. Pressupõe-se que as variáveis x (amostra A) e y (amostra B) tenham 
distribuição normal. 
Neste caso a hipótese de nulidade é: 
Ho : σ2A = σ2B 
A hipótese alternativa pode ser: 
Ha1 : σ2A ≠ σ2B 
ou 
Ha2 : σ2A > σ2B 
ou 
Ha3 : σ2A < σ2B 
Para testar a hipótese Ho usa-se a estatística definida por: 
2
2
=
B
A
S
SF 
onde: 
2
AS e 
2
BS são as variâncias amostrais das variáveis x e y correspondentes a população A e B 
respectivamente. 
 
 
 
 80 
Para facilitar o uso da tabela usa-se: 
2
2
〈
〉=
S
S
F 
onde: 
2〉 S é a maior variância e 2〈 S a menor variância, ou seja, F > 1. 
O F tabelado (Fα) é obtido em tabela própria utilizando os graus de liberdade (n1, n2), sendo 
n1 e n2 correspondente aos graus de liberdade do numerador e denominador respectivamente. 
Observação: 
n1 = n – 1 onde n é o tamanho amostral da maior variância 
n2 = n – 1 onde n é o tamanho amostral da menor variância 
Regra decisória: 
Se Fcalculado ≥ Ftabelado: rejeita-se Ho, ou seja, é bastante provável que as duas populações apresentam 
variâncias diferentes. 
Se Fcalculado < Ftabelado: não se rejeita Ho, ou seja, é bastante provável que as duas populações tenham 
a mesma variância. 
 
Exemplo: A fim de verificar se duas populações crioulas de milho (A e B) apresentam a mesma 
variabilidade quando ao ciclo, foram amostras seis plantas de cada população, tendo obtido os 
dados abaixo em dias. 
População A: 145; 127; 136; 142; 141; 137 
População B : 143; 128; 132; 138; 142; 132 
 
Testar se as duas variâncias são diferentes para α = 5%. 
00,40
5
6
)828(-137...127145
1-n
n
X
X
S
2
222
2n
1i
in
1i
2
i
A
2 =
+++
=
⎟⎠
⎞⎜⎝
⎛
−
=
∑∑ =
= 
96,36
5
6
)815(132...128143
1-n
n
X
X
S
2
222
2n
1i
in
1i
2
i
B
2 =
−+++
=
⎟⎠
⎞⎜⎝
⎛
−
=
∑∑ =
= 
 
 
 
 
 
 81 
1) Primeiro passo: formular as hipóteses (nulidade e alternativa) 
No caso, a hipótese de nulidade considera que as duas variâncias são iguais. Como foi 
convencionado, a hipótese alternativa deve ser sempre a maior variância amostral (no caso a 
variância maior foi obtida da população A) sendo significativamente maior. 
Ho : σ2A = σ2B 
Ha : σ2A > σ2B 
 
2) Segundo passo: obter o valor tabelado do teste 
Neste caso, utiliza-se (n1, n2) para localizar o respectivo valor na tabela de F (F>1) ao nível 
de 5% de probabilidade. No exemplo em questão n1 são os graus de liberdade da maior variância 
(população A) e n2 são os graus de liberdade da menor variância (população B). Assim, n1 = (6 – 1) 
= 5 e n2 = (6 – 1) = 5. 
Ftabelado 5% (5,5) = 5,05. 
 
3) Terceiro passo: obter o valor calculado 
A estatística apropriada é 081=9636
0040=〈
〉= 2
2
,
,
,
S
S
F = Fcalculado 
 
4) Quarto passo: concluir pela rejeição ou não de Ho. 
Como Fcalculado < Ftabelado: não se rejeita Ho, ou seja, é bastante provável que as duas 
populações tenham a mesma variabilidade, pois a diferença encontrada é provavelmente devida ao 
acaso. 
 
Teste para médias (“t” de Student) 
 O teste t considera que a distribuição das variáveis em estudo seja normal. É o teste mais 
utilizado para testar médias populacionais. 
 
a) Teste de hipótese de uma média populacional 
Este teste é utilizado em situações onde se quer testar uma média. 
Por exemplo: Em um censo uma população apresentou média de escolaridade de 15 anos. Passados 
quatro anos, fez-se uma amostra desta população para saber se o nível médio de escolaridade foi 
alterado. A estimativa obtida foi de 16 anos. A hipótese a ser testada é: 
Ho : µ = 15 
Ha : µ > 15 
Ou seja, a média é igual a 15 ou maior que 15? 
 
 82 
 Esta é uma situação em que se pode utilizar o teste t (desde que a amostra apresente 
distribuição aproximadamente normal). O teste apropriado (t calculado) será: 
n
S
μXt −= , que tem distribuição de Student com (n – 1) graus de liberdade, onde n é o tamanho 
amostral. 
As hipóteses são: 
Ho : µ = k 
Ha1 : µ ≠ k (teste bilateral) 
ou 
Ha2 : µ > k (teste unilateral a direita) 
ou 
Ha3 : µ < k (teste unilateral a esquerda) 
A regra decisória é: 
Se ׀tcalculado׀ ≥ ttabelado : rejeita-se Ho 
Se ׀tcalculado׀ < ttabelado : não rejeita-se Ho 
 
Observação sobre o uso das tabelas: 
tabela bilateral 
⎩⎨
⎧
2αcomentrar:unilateralteste
αcomentrar:bilateralteste
 
tabela unilateral 
⎪⎩
⎪⎨
⎧
2
2
αcomentrar:unilateralteste
αcomentrar:bilateralteste
 
 
Exemplo: O peso médio de caprinos ao abate na região do Baixo Parnaíba é de 42 kg. Após dois 
anos, em que o Sebrae atuou de forma a aumentar o peso médio ao abate, retirou-se uma amostra 
aleatória de oito animais para avaliar se a média de caprinos ao abate foi alterada. Segue o peso dos 
oito animais: 44,5; 48,0; 46,0; 40,5; 47,0; 43,0; 42,0; 45,0. 
50,44
8
0,45...0,485,44
n
X
X
n
1i
i
=+++==
∑
= 
50,6
7
8
)0,356(0,45...0,485,44
1-n
n
X
X
S
2
222
2n
1i
in
1i
2
i
2 =
−+++
=
⎟⎠
⎞⎜⎝
⎛
−
=
∑∑ =
= 
552=506= ,,S 
 
 83 
 
1) Primeiro passo: formular as hipóteses (nulidade e alternativa). 
Ho : µ = 42 
Ha : µ > 42 
 
 2) Segundo passo: obter o valor tabelado do teste. 
Neste caso, utiliza-se n – 1 graus de liberdade para localizar o respectivo valor na tabela de t 
(unilateral ou bilateral) ao nível de 5% de probabilidade. No exemplo em questão tem-se 7 graus de 
liberdade. Na tabela bilateral entrar com 10%, ou seja, 2α. 
Ttabelado 5% (7) = 1,90. 
 
3) Terceiro passo: obter o valor calculado. 
A estatística apropriada é 143=
8
552
042−544=−= ,
,
,,
n
S
μXt = tcalculado 
 4) Quarto passo: concluir pela rejeição ou não de Ho. 
׀tcalculado׀ ≥ ttabelado : portanto, rejeita-se Ho, ou seja, o peso médio de caprinos ao abate na região do 
Baixo Parnaíbaé superior a 42 kg, pois a diferença encontrada provavelmente não é devida ao 
acaso. 
 
b) Teste para a igualdade de médias obtidas de duas amostras independentes 
Aqui novamente o teste adequado é o teste t. É utilizado para testar se a diferença obtida 
entre médias de duas amostras é significativa. 
 Por exemplo: Pesquisadores querem descobrir qual variedade crioula de milho (variedade 
de polinização aberta) apresenta maior teor de proteína médio, a partir de 9 amostras de cada 
variedade. As hipóteses possíveis são: 
Ho : µA = µB 
Ha1 : µA ≠ µB 
ou 
Ha2 : µA >µB 
ou 
Ha3 : µA < µB 
 
Neste caso devem-se considerar duas situações possíveis: 
1) as variâncias das duas amostras são iguais; 
 
 84 
2) as variâncias das duas amostras são diferentes. 
 O procedimento adequado é realizar um teste F para concluir se as duas variâncias são 
provavelmente iguais ou não. 
Caso 1 
No primeiro caso, consideram-se as variâncias iguais, pois não se rejeitou a hipótese Ho : 
σ2A = σ2B. Deve-se, portanto, utilizar uma variância comum entre as duas amostras obtida por: 
2−+
1−+1−=
22
2
BA
BBAA
c
nn
S)n(S)n(S 
 O valor calculado do teste t neste caso é: 
⎟⎟⎠
⎞
⎜⎜⎝
⎛ 1+1
−=
2
BA
c
BA
nn
S
XXt , que tem distribuição de Student com (nA + nB – 2) graus de liberdade. 
Caso 2 
No segundo caso, consideram-se as variâncias diferentes, pois se rejeitou a hipótese Ho: σ2A = σ2B. 
Neste caso não é necessário calcular variância comum. 
 O valor calculado do teste t neste caso é: 
B
B
A
A
BA
n
S
n
S
XXt 22
+
−= , que tem distribuição de Student com n* graus de liberdade. 
1−
⎟⎟⎠
⎞
⎜⎜⎝
⎛
+1−
⎟⎟⎠
⎞
⎜⎜⎝
⎛
⎟⎟⎠
⎞
⎜⎜⎝
⎛ +
= 2222
222
B
B
B
A
A
A
B
B
A
A
n
n
S
n
n
S
n
S
n
S
*n 
A regra decisória (para os dois casos) é: 
Se ׀tcalculado׀ ≥ ttabelado : rejeita-se Ho 
Se ׀tcalculado׀ < ttabelado : não rejeita-se Ho 
 
EXEMPLOS (Teste de t para duas médias) 
Exemplo 1 
Dois métodos de ensino (A e B) deverão ser comparados. Cada método foi aplicado a uma amostra 
casual de 10 alunos. Os resultados, em índice de aproveitamento, foram: 
A: 63 61 60 62 81 55 72 73 64 80 
B: 65 48 61 62 64 63 70 75 79 78 
Ao nível de 5% de probabilidade, os dois métodos podem ser considerados igualmente eficientes? 
 
 85 
Solução: 
 
32,78
9
10
)671(80...6163
1-n
n
X
X
S
2
222
2n
1i
in
1i
2
i
A
2 =
−+++
=
⎟⎠
⎞⎜⎝
⎛
−
=
∑∑ =
= 
39,87
9
10
)665(78...4865
1-n
n
X
X
S
2
222
2n
1i
in
1i
2
i
B
2 =
−+++
=
⎟⎠
⎞⎜⎝
⎛
−
=
∑∑ =
= 
 
50,66
10
665
n
X
X;10,67
10
671
n
X
X
n
1i
i
B
n
1i
i
A ======
∑∑
== 
 
Teste F para testar a igualdade das variâncias 
 1) Primeiro passo: formular as hipóteses 
Ho : σ2A = σ2B 
Ha : σ2B > σ2A 
2) Segundo passo: obter o valor tabelado 
Ftabelado 5% (9,9) = 3,18 
 
3) Terceiro passo: obter o valor calculado 
A estatística apropriada é 111=3278
3987== 2
2
,
,
,
S
SF
A
B 
 
4) Quarto passo: concluir pela rejeição ou não de Ho 
 
 
Fcalculado < Ftabelado. Portanto, não se rejeita Ho, ou seja, as variâncias são estatisticamente iguais, pois 
a diferença entre elas é provavelmente devida ao acaso. 
 
Teste t para testar a igualdade das médias 
 Como as variâncias são estatisticamente iguais, deve-se calcular a variância comum 
obtida por: 
 
 86 
8582=18
39879+32789=2−+
1−+1−=
22
2 ,),(),(
nn
S)n(S)n(S
BA
BBAA
c 
 
1) Primeiro passo: formular as hipóteses 
Ho : µA = µB 
Ha1 : µA ≠ µB 
2) Segundo passo: obter o valor tabelado 
ttabelado 5% (nA + nB - 2) = ttabelado 5% (18)=2,10 
 
3) Terceiro passo: obter o valor calculado 
A estatística apropriada é 150=
⎟⎠
⎞⎜⎝
⎛
10
1+10
18582
5066−1067=
⎟⎟⎠
⎞
⎜⎜⎝
⎛ 1+1
−=
2
,
,
,,
nn
S
XXt
BA
c
BA 
 
4) Quarto passo: concluir pela rejeição ou não de Ho 
׀tcalculado׀ < ttabelado. Portanto, não se rejeita Ho, ou seja, as médias são estatisticamente iguais, pois a 
diferença entre elas é provavelmente devida ao acaso. 
 
Exemplo 2 
Desejando saber entre duas variedades de milho crioulo, qual apresenta maior teor de proteína no 
grão, retirou-se 9 amostras da variedade A e 9 da variedade B, obtendo-se os dados abaixo: 
Teores de proteína X S2 
Variedade A 12,00 3,50 
Variedade B 15,00 15,25 
 
A diferença de proteína encontrada é significativa? 
 
Teste F para testar a igualdade das variâncias 
1) Primeiro passo: formular as hipóteses 
Ho : σ2A = σ2B 
Ha : σ2B > σ2A 
 
2) Segundo passo: obter o valor tabelado do teste. 
Ftabelado 5% (8,8) = 3,44 
 
 
 87 
3) Terceiro passo: obter o valor calculado. 
A estatística apropriada é 364=503
2515== 2
2
,
,
,
S
SF
A
B 
 
4) Quarto passo: concluir pela rejeição ou não de Ho. 
Fcalculado ≥ Ftabelado. Portanto, rejeita-se Ho, ou seja, as variâncias são estatisticamente diferentes. 
 
Teste t para testar a igualdade das médias 
 Como as variâncias são estatisticamente diferentes, não é necessário obter variância 
comum. 
1) Primeiro passo: formular as hipóteses estatísticas 
Ho : µA = µB 
Ha1 : µA ≠ µB 
 
 
2) Segundo passo: obter o valor tabelado do teste. 
ttabelado 5% (n*) = 12≈
8
⎟⎠
⎞⎜⎝
⎛
9
2515
+8
⎟⎠
⎞⎜⎝
⎛
9
503
⎟⎠
⎞⎜⎝
⎛
9
2515+9
503
=
1−
⎟⎟⎠
⎞
⎜⎜⎝
⎛
+1−
⎟⎟⎠
⎞
⎜⎜⎝
⎛
⎟⎟⎠
⎞
⎜⎜⎝
⎛ +
= 22
2
2222
222
,,
,,
n
n
S
n
n
S
n
S
n
S
*n
B
B
B
A
A
A
B
B
A
A
 
ttabelado 5% (12) = 2,18 
 
3) Terceiro passo: obter o valor calculado. 
A estatística apropriada é 082=
9
2515+9
503
12−15=
+
−= 22 ,,,
n
S
n
S
XXt
B
B
A
A
BA 
 
4) Quarto passo: concluir pela rejeição ou não de Ho. 
׀tcalculado׀ < ttabelado. Portanto, não se rejeita Ho, ou seja, as médias são estatisticamente iguais, 
pois a diferença entre elas é provavelmente devida ao acaso. 
 
 
 
 
 
 88 
c) Teste para a igualdade de médias obtidas de dados pareados 
Quando os resultados de duas amostras constituem dados emparelhados (relacionados dois a 
dois) segundo algum critério de associação entre eles, o teste adequado é o teste t para dados 
pareados, desde que a variável tenha distribuição normal. 
Por exemplo: Cientistas querem testar se uma nova droga é eficiente na redução de peso em 
humanos. Quarenta pessoas são selecionadas e pesadas. A droga é aplicada e, dois meses depois as 
quarenta pessoas são novamente pesadas. Será que a diferença de peso encontrada é significativa? 
Este tipo de questão deve ser “solucionada” com ajuda do teste t para dados pareados. 
A notação matemática adequada é: 
X1i: representa o peso da pessoa i antes de receber a droga; 
X2i: representa o peso da pessoa i após receber a droga e passado determinado tempo. 
Assim, obtêm-se os desvios (di = X2i –X1i), que são a diferença de peso (antes e depois) de 
cada observação (pessoa). 
Considerando as n = 40 pessoas do estudo, pode-se montar a seguinte tabela: 
Pessoas X1i X2i di =X2i – X1i 
1 X11 X21 d1 
2 X12 X22 d2 
3 X13 X23 d3 
... ... ... ... 
40 X140 X240 d40 
A partir destes dados, pode-se obter a média estimada dos desvios pelo seguinte estimador: 
n
d
d
n
i
i∑
1== 
Assim, d é a diferença média na amostra e D é a diferença média na população. 
As hipóteses são: 
Ho: D = 0 
Ha1: D > 0 
ou 
Ha2: D < 0 
ou 
Ha3: D ≠ 0 
O t calculado é obtido por:n
)d(S
dt = , com (n – 1) graus de liberdade. 
onde: 
 
 89 
S(d) é o desvio padrão da diferença amostral; 
n = tamanho da amostra. 
 
 
A regra decisória é: 
Se ׀tcalculado׀ ≥ ttabelado : rejeita-se Ho 
Se ׀tcalculado׀ < ttabelado : não rejeita-se Ho 
 
Exemplo 
 Com o objetivo de aumentar a produtividade de milho de pequenos agricultores no interior 
do Paraná, o serviço de extensão rural estabeleceu um programa de assistência técnica a estes 
agricultores. A variável produtividade de grãos (t/ha) foi quantificada em ano agrícola antes (A) e 
depois (B) da aplicação do referido programa. Os dados obtidos se encontram na tabela abaixo. 
Produtividades médias de milho obtidas por oito produtores antes (A) e depois (B) da aplicação de 
um programa de assistência técnica (dados hipotéticos) 
Produtores 
Produtividade 
média em t/ha 
Antes (A) 
Produtividade 
média em t/ha 
Depois (B) 
di 
1 5,23 7,82 2,59 
2 6,31 8,25 1,94 
3 4,46 3,86 -0,60 
4 4,86 6,72 1,86 
5 5,43 8,52 3,09 
6 3,45 5,65 2,20 
7 4,85 6,41 1,56 
8 3,28 4,46 1,18 
9 3,87 3,87 0,00 
 
A implantação do programa de assistência técnica foi eficiente em elevar a produtividade média dos 
pequenos agricultores? 
 
1) Primeiro passo: formular as hipóteses estatísticas 
Ho: D = 0 
Ha: D > 0 
 
2) Segundo passo: obter o valor tabelado do teste 
ttabelado 5% (8) = 1,86 
 
 
 
 90 
3) Terceiro passo: obter o valor calculado 
A estatística apropriada é 863=
9
191
531== ,
,
,
n
)d(S
dt 
4) Quarto passo: concluir pela rejeição ou não de Ho 
׀tcalculado׀ ≥ ttabelado. Portanto, rejeita-se Ho, ou seja, a aplicação do programa de assistência técnica 
foi eficiente em elevar a produtividade de milho. 
 
Teste Qui-quadrado ( 2χ ) 
 O teste qui-quadrado é utilizado como uma medida da discrepância entre freqüências 
esperadas e observadas. 
Por exemplo: Suponha que em uma amostra de 80 nascimentos avaliou-se a freqüência de meninos 
e meninas. Observou-se 45 meninos e 35 meninas. A pergunta é: será que o nascimento de meninos 
na população é superior ao nascimento de meninas por acaso ou por algum outro motivo que não 
seja o acaso. A decisão sobre esta questão pode ser orientada pelo teste qui-quadrado, que compara 
a freqüência observada de meninos (45 meninos) e meninas (35 meninas) com as freqüências 
esperadas de meninos (40 meninos) e meninas (40 meninas). 
 O teste de qui-quadrado pode ser utilizado principalmente para: 
1. Teste de aderência 
2. Teste de independência 
3. Teste de homogeneidade 
 
Qui-quadrado para aderência 
O teste de aderência é utilizado quando a hipótese a ser testada refere-se à forma da 
distribuição da população. Assim, pode-se verificar se distribuições teóricas se ajustam a 
distribuições empíricas, ou seja, as distribuições amostrais. 
Exemplos: 
1. Testar se uma variável tem distribuição normal 
2. Testar se uma variável tem distribuição poisson 
3. Testar se uma variável tem distribuição binomial 
4. O nascimento de crianças do sexo feminino e masculino tem proporção 1:1 
 
As hipóteses Ho e Ha são, genericamente: 
Ho: a variável analisada apresenta uma distribuição esperada 
Ha: a variável analisada não apresenta a distribuição esperada 
 
 91 
O número de graus de liberdade é obtido por: 
a) Quando as freqüências esperadas puderem ser calculadas sem que se façam estimativas dos 
parâmetros populacionais a partir das distribuições amostrais tem-se: 
G.L. = k – 1; onde k é o número de categorias da variável. 
b) Quando para determinação das freqüências esperadas, r parâmetros tiverem suas estimativas 
calculadas a partir das distribuições amostrais tem-se: 
G.L. = k – 1 - r; onde k é o número de categorias da variável e r o número de parâmetros estimados 
(este segundo caso não será abordado neste curso). 
 
O qui-quadrado para aderência é obtido por: 
k
kk
E
)EO(...
E
)EO(
E
)EO(
E
)EO(
χ
2
3
2
33
2
2
22
1
2
112 −++−+−+−= 
ou seja, 
∑
1=
2
2 −=
k
i i
ii
E
)EO(
χ 
onde: 
iO é a freqüência observada para a i-ésima categoria; 
iE é a freqüência esperada para a i-ésima categoria e; 
 k é o número de categorias da variável qualitativa analisada. 
 Note que quanto maior o valor de 2χ , maior é a discrepância entre as freqüências esperadas 
e observadas. 
 
A conclusão é: 
calculadoχ 2 ≥ tabeladoχ 2 : rejeita Ho. 
calculadoχ 2 < tabeladoχ 2 : não se rejeita Ho. 
 
Geralmente o teste qui-quadrado é aplicado a variáveis qualitativas, como no exemplo a 
seguir: 
 
Em um estudo de hereditariedade da cor da vagem em feijão, foram observadas 98 plantas com a 
vagem verde e 24 com a vagem amarela numa descendência de 122 plântulas. Supondo que a 
proporção esperada é 3 verdes para 1 amarela, verifique se as observações estão de acordo com esta 
hipótese, adotando α = 5%. 
 
 
 92 
Solução: 
Note que a variável em questão é qualitativa nominal com duas categorias (k=2). É um estudo 
comum em análises genéticas, semelhante aos estudos realizados por Mendel com ervilhas. 
Pressupondo que os pais são AA (vagem verde) e aa (vagem amarela), espera-se que a proporção de 
filhos seja: ¾ de vagens verdes (AA e Aa) e ¼ de vagens amarelas (aa), supondo que a presença de 
A determine a cor verde. Para a resolução deste problema podem-se adotar os seguintes passos: 
 
1) Primeiro passo: formular as hipótese Ho e Ha 
Ho: a cor da vagem analisada apresenta a distribuição 3:1 (3/4 vagens verdes: 1/4 vagens amarelas) 
Ha: a cor da vagem analisada apresenta distribuição diferente de 3:1 
 
2) Segundo passo: obter o qui-quadrado tabelado 
 Considerando α = 5% e o grau de liberdade obtido por (k – 1), onde k é o número de 
categorias da variável qualitativa, tem-se: 
 
843=152 ,)(χ % obtido em tabela própria. 
 
3) Terceiro passo: obter o qui-quadrado calculado 
As freqüências esperadas podem ser obtidas por: 
Freqüência esperada de vagens verdes = 591=4
3122 ,x 
Freqüência esperada de vagens amarelas = 530=4
1122 ,x 
Freqüências observadas e esperadas para a cor da vagem em 122 plantas de feijão. 
Cor da vagem Freqüência observada Freqüência esperada 
Vagem verde 98 91,5 
Vagem amarela 24 30,5 
Totais 122 120 
 
 Com as freqüências esperadas e observadas em cada categoria da variável, pode-se obter o 
qui-quadrado calculado por: 
851=530
530−24+591
591−98=−=
22
1=
2
2 ∑ ,, ),(, ),(E )EO(χ
k
i i
ii 
 
 
 
 
 93 
4) Quarto passo: conclusão 
 calculadoχ 2 < tabeladoχ 2 : portanto, não se rejeita Ho ao nível de 5% de probabilidade. É 
bastante provável que a cor da vagem analisada apresenta a distribuição 3:1. Assim, pode-se 
concluir que a cor da vagem em feijão é controlada por dois genes, sendo que o gene A é dominante 
e a sua presença determina vagens verdes e a sua ausência determina vagens amarelas. 
 
Qui-quadrado para independência 
Este teste é utilizado para testar se duas variáveis qualitativas são independentes. Por 
exemplo: será que a resposta dada a uma determinada pergunta (a favor ou contra o aborto) depende 
do sexo (masculino e feminino). Se a proporção de respostas a favor e contra forem estatisticamente 
iguais em ambos os sexos, as variáveis “opinião sobre o aborto” e “sexo” são independentes. Se a 
proporção de respostas a favor e contra o aborto forem estatisticamente diferente para homens e 
mulheres, considera-se que as variáveis não são independentes. Neste caso, pode-se dizer que a 
opinião sobre o aborto (a favor ou contra) depende do sexo do entrevistado. 
 
As hipóteses Ho e Ha são: 
Ho: as variáveis são independentesHa: as variáveis são dependentes 
 
O número de graus de liberdade é obtido por: 
G.L. = (k – 1)(h – 1), em que k é o número de categorias de uma das variáveis e h é o número de 
categorias da outra. 
 
O qui-quadrado calculado, neste caso, é obtido por: 
kh
2
khkh
12
2
1212
11
2
1111
k
1i
h
1j ij
2
ijij2
E
)EO(...
E
)EO(
E
)EO(
E
)EO( −++−+−=−=χ ∑∑
= =
 
 
A conclusão é: 
calculadoχ 2 ≥ tabeladoχ 2 : rejeita Ho. 
calculadoχ 2 < tabeladoχ 2 : não se rejeita Ho. 
Para exemplificar melhor, considere o problema a seguir: 
A tabela de contingência a seguir se refere á opinião de homens e mulheres sobre o aborto. 
Verificar, aplicando o teste qui-quadrado, se existe associação entre a opinião e o sexo do 
entrevistado, adotando α = 1%. 
 
 94 
Opinião Sexo favorável desfavorável indiferente Total 
homens 33 (24) 12 (19,2) 15 (16,8) 60 
mulheres 7 (16) 20 (12,8) 13 (11,2) 40 
Total 40 32 28 100 
 
 Pode-se realizar o teste qui-quadrado adotando os seguintes passos: 
 
1) Primeiro passo: formular as hipótese Ho e Ha 
Ho: as variáveis “opinião sobre o aborto” e “sexo” são independentes 
Ha: as variáveis “opinião sobre o aborto” e “sexo” são dependentes 
 
2) Segundo passo: obter o qui-quadrado tabelado 
Considerando α = 1% e o grau de liberdade obtido por (k – 1)(h – 1), onde k é o número de 
categorias de uma variável qualitativa e h é o número de categorias da outra. Assim, tem-se: 
21,9)2(%12 =χ obtido em tabela própria. 
 
3) Terceiro passo: obter o qui-quadrado calculado. 
Os dados entre parênteses na tabela acima referem-se as freqüências absolutas esperadas obtidas 
por: 
totalsoma
)jcolunadasoma)(ilinhadasoma(ijesperadaabsolutaFrequência = 
24=100
4060=11 ))((esperadaabsolutaFrequência 
219=100
3260=12 ,))((esperadaabsolutaFrequência 
. 
. 
. 
211=100
2840=23 ,))((esperadaabsolutaFrequência 
 
 
Com as freqüências esperadas e observadas, pode-se obter o qui-quadrado calculado por: 
67,15
2,11
)2,1113(...
2,19
)2,1912(
24
)2433(
E
)EO( 222k
1i
h
1j ij
2
ijij2 =−++−+−=−=χ ∑∑
= =
 
 
 
 95 
4) Quarto passo: conclusão. 
 calculadoχ 2 ≥ tabeladoχ 2 : portanto, rejeita-se Ho ao nível de 1% de probabilidade. É 
bastante provável a opinião sobre o aborto esta relacionada ao sexo do entrevistado. 
 
Qui-quadrado para homogeneidade (testa se duas ou mais amostras são homogêneas) 
 O teste qui-quadrado para a homogeneidade é o mesmo qui-quadrado para independência. 
Porém, neste caso não é utilizado duas variáveis, mas uma variável e um conjunto de amostras. 
Portanto, é utilizado para testar se a variável em estudo se distribui de forma homogênea nas 
populações onde foram retiradas as amostras. 
 
Por exemplo: considerando a variável grupo sanguíneo amostrada em duas populações (A e B). As 
freqüências de indivíduos A, B, AB e O serão diferentes nas duas amostras. Porém, a pergunta 
adequada é: será que esta diferença esta ocorrendo ao acaso ou não. Se a diferença de freqüências 
nas duas amostras provavelmente estiver ocorrendo ao acaso, conclui-se que as duas populações são 
homogêneas quanto ao tipo sanguíneo. Porém, se a diferença provavelmente não estiver ocorrendo 
ao acaso, conclui-se que as duas populações não são homogêneas quanto ao tipo sanguíneo. 
 As hipóteses Ho e Ha são: 
Ho: as populações são homogêneas 
Ha: as populações são não homogêneas 
 
O número de graus de liberdade é obtido por: 
G.L. = (k – 1)(h – 1), em que k é o número de categorias da variável e h é o número de amostras. 
 
O qui-quadrado calculado, neste caso, é obtido por: 
kh
2
khkh
12
2
1212
11
2
1111
k
1i
h
1j ij
2
ijij2
E
)EO(...
E
)EO(
E
)EO(
E
)EO( −++−+−=−=χ ∑∑
= =
 
 
 
A conclusão é: 
calculadoχ 2 ≥ tabeladoχ 2 : rejeita Ho. 
calculadoχ 2 < tabeladoχ 2 : não se rejeita Ho. 
 
Para exemplificar melhor, considere o problema a seguir: 
 
 
 96 
As freqüências absolutas aos tipos sanguíneos O, A, B e AB em amostras de duas populações (A e 
B) forneceram os dados abaixo: 
Freqüências absolutas de tipos sanguíneos Amostras 
O A B AB 
Totais 
Amostra A 56 (56,44) 60 (58,57) 18 (19,31) 6 (5,68) 140 
Amostra B 120 (119,56) 122 (123,43) 42 (40,69) 11 (11,32) 295 
Totais 176 182 60 17 435 
 
Pode-se realizar o teste qui-quadrado adotando os seguintes passos: 
 
1) Primeiro passo: formular as hipótese Ho e Ha 
Ho: as populações A e B são homogêneas quanto ao tipo sanguíneo 
Ha: as populações A e B não são homogêneas quanto ao tipo sanguíneo 
 
2) Segundo passo: obter o qui-quadrado tabelado 
Considerando α = 1% e o grau de liberdade obtido por (k – 1)(h – 1), onde k é o número de 
amostras e h é o número de categorias da variável qualitativa. Assim, tem-se: 
817=352 ,)(χ % obtido em tabela própria. 
 
3) Terceiro passo: obter o qui-quadrado calculado 
Os dados entre parênteses na tabela acima referem-se as freqüências absolutas esperadas obtidas 
por: 
totalsoma
)jlinhadasoma)(ilinhadasoma(ijesperadaabsolutaFrequência = 
4456=435
176140=11 ,))((esperadaabsolutaFrequência 
5758=435
182140=12 ,))((esperadaabsolutaFrequência 
. 
. 
. 
3211=435
17295=24 ,))((esperadaabsolutaFrequência 
 Com as freqüências esperadas e observadas, pode-se obter o qui-quadrado calculado por: 
27,0
32,11
)32,1111(...
56,119
)56,119120(
44,56
)44,5656(
E
)EO( 222k
1i
h
1j ij
2
ijij2 =−++−+−=−=χ ∑∑
= =
 
 
 
 97 
4) Quinto passo: conclusão 
 calculadoχ 2 < tabeladoχ 2 : portanto, não se rejeita Ho ao nível de 5% de probabilidade. É 
bastante provável que as duas amostras sejam homogêneas e, portanto, as duas populações tem as 
mesmas proporções de indivíduos de tipo sanguíneo A, B, AB e O. 
 
Restrições ao uso do Qui-quadrado 
Não é recomendado utilizar p qui-quadrado nos seguintes casos: 
a) Se a freqüência absoluta total for menor que 20, ou seja, amostras com menos de 20 
observações; 
b) Se a freqüência absoluta total estiver entre 20 e 40 observações e a menor freqüência 
esperada for menor que 5 observações; 
c) Se a freqüência absoluta total for maior que 40 e a freqüência esperada mínima for menor 
que 5, deve-se proceder a correção de Yates apresentada a seguir. 
k
kk
ajustado
E
),EO(
...
E
),EO(
E
),EO(
E
),EO(
χ
2
3
2
33
2
2
22
1
2
112 50−−++50−−+50−−+50−−= 
assim, 
∑
1=
2
2 50−−=
k
i i
ii
ajustado
E
),EO(
χ 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 98 
Exercícios 
Amostragem 
1. Qual a relação entre o tamanho da amostra e a precisão das estimativas obtidas? 
 
2. Considere uma população de 35 árvores de uma determinada espécie, pertencentes a um parque 
ecológico, cujos elementos possuem os seguintes comprimentos em cm para o diâmetro da altura do 
peito (DAP): 
(1) 25, (2) 20, (3) 35, (4) 21, (5) 22, (6) 22, (7) 24, (8) 25, (9) 30, (10) 38, (11) 24, (12) 20, (13) 20, 
(14) 25, (15) 20, (16) 19, (17) 25, (18) 23, (19) 20, (20) 24, (21) 28, (22) 24, (23) 24, (24) 22, (25) 
28, (26) 26, (27) 23, (28) 25, (29) 22, (30) 27, (31) 25, (32) 23, (33) 28, (34) 27, (35) 22. 
 
a) Com o objetivo de estimar o comprimento médio, como deveria ser extraída uma amostra 
simples ao acaso de tamanho n = 10 desta população? 
b) Quantas amostras de tamanho n = 10 poderiam ser extraídas desta população? 
c) Calcule a média populacional e compare com as médias estimadas em quatro amostras simples 
ao acaso de tamanhos diferentes (n = 2, n = 5, n = 10 e n = 20). 
d) Calcule a média em amostras sistemáticas de tamanhos diferentes(n=2, n=5, n=10, n=20). 
 
3. Os dados abaixo são referentes a número de empregados de uma empresa agrícola, divididos por 
setores: 
Setores Número de funcionários 
Administrativo 314 
Transporte 948 
Campo 1.451 
Outros 701 
Total 3.414 
Decidiu-se fazer uma amostra de 60 funcionários para avaliar o nível salarial médio da empresa. 
Apresente o tipo de amostragem mais adequada e de forma detalhada. 
 
4. Quais as situações em que a amostra estratificada deve ser preferida à amostragem simples ao 
acaso? 
5. Qual é a principal diferença entre amostra probabilística e não-probabilística? 
6. Quais as vantagens de utilizar uma amostra sistemática? 
7. Qual a vantagem e desvantagem da amostra por conglomerados? 
 
 
 
 
 99 
Estimação de parâmetros 
1) Defina e de exemplos de: 
a) Parâmetro 
b) Estimador 
c) Estimativa 
2) O que você sugere para obter estimativas mais precisas de determinado parâmetro? 
3) Qual a relação da variância com a precisão das estimativas? 
4) Estime a média por intervalo (α = 5%) da produtividade de milho de uma região X, onde foi 
retirada uma amostra de 50 produtores, com média de 5 t/ha e variância de 2 t2/ha. Apresente a 
interpretação dos resultados. 
 
5) Estime a média por intervalo (α = 5%) da produtividade de milho de uma região Y, onde foi 
retirada uma amostra de 30 produtores, com média de 5 t/ha e variância de 2 t2/ha. Apresente a 
interpretação dos resultados. 
 
6) Estime a média por ponto e intervalo (α = 5%) da produtividade de milho de uma região Z, onde 
foi retirada uma amostra de 50 produtores, com média de 5 t/ha e variância de 4 t2/ha. Apresente a 
interpretação dos resultados. 
 
7) Compare as questões 4, 5 e 6. 
 
8) Uma empresa de crédito agrícola resolveu fazer uma pesquisa sobre a inadimplência de 
empréstimos a produtores rurais no Estado do Mato Grosso. Foram amostrados 200 produtores. Na 
amostra, a porcentagem de inadimplentes foi de 15%. Apresente a proporção por ponto e por 
intervalo (α = 5%) de produtores rurais inadimplentes. 
 
Testes de hipóteses 
1) Pesquisadores da Embrapa querem descobrir se duas populações de uma planta medicinal da 
Amazônia apresentam a mesma variabilidade na quantidade de determinado principio ativo. Foram 
amostradas 11 plantas da população X e 19 plantas da população Y. As duas amostras apresentaram 
a mesma média quanto à quantidade de princípio ativo extraída. Sabendo que a variância da amostra 
X foi 40 e da Y 16, pergunta-se. A população X possui maior variabilidade na quantidade de 
princípio ativo em relação à população Y? 
Resposta: Rejeita-se Ho ao nível de 5% de probabilidade. 
Ftabelado 5% (10,18) =2,41; Fcalculado = 2,50 
 
 100 
2) Um rebanho de certa raça leiteira apresenta lactação média de 200 kg. Uma nova raça foi 
introduzida com o objetivo de aumentar a produtividade média. Posteriormente, uma amostra de 25 
vacas apresentou uma lactação média de 210 kg e desvio padrão de 26 kg. Pode-se concluir que a 
média de produção de leite aumentou com a introdução da nova raça? 
Resposta: Rejeita-se Ho ao nível de 5% de probabilidade. 
׀ tcalculado ׀ = 1,92; ttabelado 5% (24) = 1,71 
 
3) A fim de diminuir o tempo que um analgésico leva para penetrar na corrente sanguínea, um 
bioquímico acrescentou certo ingrediente a fórmula original que acusava tempo médio de 48 
minutos. Em 30 observações com a nova fórmula obteve-se um tempo médio de 45 minutos com 
variância de 25 minutos2. Admitindo a distribuição do tempo aproximadamente normal, o que se 
pode concluir ao nível de 5% de probabilidade, sobre a eficiência do novo ingrediente? 
Resposta: Rejeita-se Ho. 
׀ tcalculado ׀ = 3,28; ttabelado 5% (29) = 1,70 
 
4) Suponha que duas fontes protéicas X e Y deverão ser comparadas na alimentação de aves, 
medindo-se a eficiência pelo tempo exigido para a absorção de determinado nutriente. A fonte X foi 
administrada a 18 aves e a Y foi administrada a 13. Verificar se há diferença significativa entre as 
duas rações, quanto ao tempo de absorção do nutriente, adotando α = 5%. Os resultados foram: 
minSminS
minYminX
yx 15=12=
17=20=
22 
Resposta: Fcalculado = 1,25; Ftabelado 5% (12,17) = 2,38; Não se rejeita Ho 
 ׀ tcalculado ׀= 2,27; ttabelado 5% (29) = 2,045; Rejeita-se Ho. 
 
5) Um pesquisador deseja saber se duas rações alimentares X e Y para suínos são equivalentes, ou 
se a ração X é superior a ração Y no sentido de causar maior ganho de peso. Para 11 animais foi 
dada a ração X e a outros 19 a ração Y. Os resultados foram: 
2222 16=40=
63=66=
kgSkgS
kgYkgX
yx
 
A que conclusão chegar ao nível de 5% de probabilidade? 
Resposta: Fcalculado = 2,50; Ftabelado 5% (10,18) = 2,41; Rejeita-se Ho 
 ׀ tcalculado ׀= 1,418; ttabelado 5% (14) = 1,761; Não se rejeita Ho. 
 
 
 101 
6) O quadro abaixo apresenta uma seqüência de observações sobre os valores das pressões de sete 
indivíduos antes e depois da aplicação de um medicamento que tem por finalidade reduzir a 
pressão. Verificar se o medicamento teve efeito significativo ao nível de 1% de probabilidade. 
Pressão Indivíduo Antes Depois 
1 1,1 0 
2 3,9 1,2 
3 3,1 2,1 
4 5,3 2,1 
5 5,3 3,4 
6 3,4 2,2 
7 5 3,2 
Resposta: Ho: D = 0; Ha: D < 0 
(tcalculado = -5,795; ttabelado (1%) = -3,143; Rejeita-se Ho) 
 
7) Uma pesquisa feita junto a 320 famílias de 5 filhos cada revelou a distribuição apresentada na 
tabela a seguir. Tais resultados são consistentes com a hipótese de igual probabilidade de 
nascimento para ambos os sexos? Usar α = 5%. 
Número de meninos Número de meninas Número de famílias 
5 0 18 
4 1 56 
3 2 110 
2 3 88 
1 4 40 
0 5 8 
Total: 320 
R.: HosejeitaRe;07,11;0,12 %)5(tabelado2calculado2 −=χ=χ 
 
8) Uma amostra de 125 proprietários de certa máquina agrícola foi entrevistada. O objetivo foi 
descobrir se o nível de satisfação dos proprietários com a máquina esta relacionada com a 
concepção do consumo de combustível da mesma. Os dados obtidos na entrevista foram 
organizados na tabela a seguir. Verificar, ao nível de 5% de probabilidade, se o nível de satisfação e 
o consumo não guardam relação entre si. 
Nível de Satisfação Consumo 
Péssimo Regular Bom 
Alto 29 27 42 
Baixo 4 6 17 
R.: 
Ho: Desempenho e consumo são independentes 
Ha: Desempenho e consumo não são independentes 
HoserejeitaNão;991,5;791,3 %)5(tabelado2calculado2 −=χ=χ 
 
 
 102 
9) Em seus experimentos com ervilha, Mendel observou 315 lisas e amarelas, 108 lisas e verdes, 
101 rugosas e amarelas, 32 rugosas e verdes. De acordo com sua teoria de hereditariedade, os 
números deveriam apresentar-se na proporção 9:3:3:1. As observações estão de acordo com esta 
teoria, ao nível de 1% de probabilidade? 
R.: HoserejeitaNão;345,11;470,0 %)1(tabelado2calculado2 −=χ=χ 
 
10) Suponha que certo bairro possua dois colégios A e B, igualmente procurados por crianças de 
todos os níveis econômicos. Alguém do bairro afirmou que a direção de um dos colégios faz certa 
discriminação quanto a seleção de alunos, no sentido se dar preferência a crianças de nível 
econômico mais elevado. A fim de verificar este fato, selecionou-se ao acaso uma amostra de 100 
crianças do colégio A e uma amostra de 120 crianças do colégio B. Os dados se encontram 
organizados na tabela a seguir. Teste se a hipótese de não haver discriminação entre os colégios ao 
nível de 5% de probabilidade. 
Nível Econômico Colégio Inferior Médio Superior Total 
A 20 40 40 100 
B 50 40 30 120 
Total 70 80 70 220 
R.: HosejeitaRe;991,5;57,12 %)5(tabelado2calculado2 −=χ=χ 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 103 
Tabelas EstatísticasTabela 1. Probabilidades α da distribuição normal padrão N(0, 1), para valores do quantil Zt 
padronizado, de acordo com a seguinte afirmativa probabilística: P(0<Z<Zt)=α. 
Zt 0 1 2 3 4 5 6 7 8 9 
0,0 0,00000 0,00399 0,00798 0,01197 0,01595 0,01994 0,02392 0,02790 0,03188 0,03586 
0,1 0,03983 0,04380 0,04776 0,05172 0,05567 0,05962 0,06356 0,06749 0,07142 0,07535 
0,2 0,07926 0,08317 0,08706 0,09095 0,09483 0,09871 0,10257 0,10642 0,11026 0,11409 
0,3 0,11791 0,12172 0,12552 0,12930 0,13307 0,13683 0,14058 0,14431 0,14803 0,15173 
0,4 0,15542 0,15910 0,16276 0,16640 0,17003 0,17364 0,17724 0,18082 0,18439 0,18793 
0,5 0,19146 0,19497 0,19847 0,20194 0,20540 0,20884 0,21226 0,21566 0,21904 0,22240 
0,6 0,22575 0,22907 0,23237 0,23565 0,23891 0,24215 0,24537 0,24857 0,25175 0,25490 
0,7 0,25804 0,26115 0,26424 0,26730 0,27035 0,27337 0,27637 0,27935 0,28230 0,28524 
0,8 0,28814 0,29103 0,29389 0,29673 0,29955 0,30234 0,30511 0,30785 0,31057 0,31327 
0,9 0,31594 0,31859 0,32121 0,32381 0,32639 0,32894 0,33147 0,33398 0,33646 0,33891 
1,0 0,34134 0,34375 0,34614 0,34849 0,35083 0,35314 0,35543 0,35769 0,35993 0,36214 
1,1 0,36433 0,36650 0,36864 0,37076 0,37286 0,37493 0,37698 0,37900 0,38100 0,38298 
1,2 0,38493 0,38686 0,38877 0,39065 0,39251 0,39435 0,39617 0,39796 0,39973 0,40147 
1,3 0,40320 0,40490 0,40658 0,40824 0,40988 0,41149 0,41308 0,41466 0,41621 0,41774 
1,4 0,41924 0,42073 0,42220 0,42364 0,42507 0,42647 0,42785 0,42922 0,43056 0,43189 
1,5 0,43319 0,43448 0,43574 0,43699 0,43822 0,43943 0,44062 0,44179 0,44295 0,44408 
1,6 0,44520 0,44630 0,44738 0,44845 0,44950 0,45053 0,45154 0,45254 0,45352 0,45449 
1,7 0,45543 0,45637 0,45728 0,45818 0,45907 0,45994 0,46080 0,46164 0,46246 0,46327 
1,8 0,46407 0,46485 0,46562 0,46638 0,46712 0,46784 0,46856 0,46926 0,46995 0,47062 
1,9 0,47128 0,47193 0,47257 0,47320 0,47381 0,47441 0,47500 0,47558 0,47615 0,47670 
2,0 0,47725 0,47778 0,47831 0,47882 0,47932 0,47982 0,48030 0,48077 0,48124 0,48169 
2,1 0,48214 0,48257 0,48300 0,48341 0,48382 0,48422 0,48461 0,48500 0,48537 0,48574 
2,2 0,48610 0,48645 0,48679 0,48713 0,48745 0,48778 0,48809 0,48840 0,48870 0,48899 
2,3 0,48928 0,48956 0,48983 0,49010 0,49036 0,49061 0,49086 0,49111 0,49134 0,49158 
2,4 0,49180 0,49202 0,49224 0,49245 0,49266 0,49286 0,49305 0,49324 0,49343 0,49361 
2,5 0,49379 0,49396 0,49413 0,49430 0,49446 0,49461 0,49477 0,49492 0,49506 0,49520 
2,6 0,49534 0,49547 0,49560 0,49573 0,49585 0,49598 0,49609 0,49621 0,49632 0,49643 
2,7 0,49653 0,49664 0,49674 0,49683 0,49693 0,49702 0,49711 0,49720 0,49728 0,49736 
2,8 0,49744 0,49752 0,49760 0,49767 0,49774 0,49781 0,49788 0,49795 0,49801 0,49807 
2,9 0,49813 0,49819 0,49825 0,49831 0,49836 0,49841 0,49846 0,49851 0,49856 0,49861 
3,0 0,49865 0,49869 0,49874 0,49878 0,49882 0,49886 0,49889 0,49893 0,49896 0,49900 
3,1 0,49903 0,49906 0,49910 0,49913 0,49916 0,49918 0,49921 0,49924 0,49926 0,49929 
3,2 0,49931 0,49934 0,49936 0,49938 0,49940 0,49942 0,49944 0,49946 0,49948 0,49950 
3,3 0,49952 0,49953 0,49955 0,49957 0,49958 0,49960 0,49961 0,49962 0,49964 0,49965 
3,4 0,49966 0,49968 0,49969 0,49970 0,49971 0,49972 0,49973 0,49974 0,49975 0,49976 
3,5 0,49977 0,49978 0,49978 0,49979 0,49980 0,49981 0,49981 0,49982 0,49983 0,49983 
3,6 0,49984 0,49985 0,49985 0,49986 0,49986 0,49987 0,49987 0,49988 0,49988 0,49989 
3,7 0,49989 0,49990 0,49990 0,49990 0,49991 0,49991 0,49992 0,49992 0,49992 0,49992 
3,8 0,49993 0,49993 0,49993 0,49994 0,49994 0,49994 0,49994 0,49995 0,49995 0,49995 
3,9 >0,49995 etc ... 
 
 
 
 
 
 
 
 104 
Tabela 2. Limites unilaterais de F ao nível de 5% de probabilidade, para o caso de F > 1. 
 n1 
n2 
1 2 3 4 5 6 7 8 9 10 12 14 15 16 18 20 24 30 40 60 120 ∞ 
1 161,4 199,5 215,7 224,6 230,2 234,0 236,8 238,9 240,5 241,9 243,9 245,4 245,9 246,5 247,3 248,0 249,1 250,1 251,1 252,2 253,3 254,3
2 18,51 19,00 19,16 19,25 19,30 19,33 19,35 19,37 19,38 19,40 19,41 19,42 19,43 19,43 19,44 19,45 19,45 19,46 19,47 19,48 19,49 19,50
3 10,13 9,55 9,28 9,12 9,01 8,94 8,89 8,85 8,81 8,79 8,74 8,72 8,70 8,69 8,67 8,66 8,64 8,62 8,59 8,57 8,55 8,53 
4 7,71 6,94 6,59 6,39 6,26 6,16 6,09 6,04 6,00 5,96 5,91 5,87 5,86 5,84 5,82 5,80 5,77 5,75 5,72 5,69 5,66 5,63 
5 6,61 5,79 5,41 5,19 5,05 4,95 4,88 4,82 4,77 4,74 4,68 4,64 4,62 4,60 4,58 4,56 4,53 4,50 4,46 4,43 4,40 4,36 
6 5,99 5,14 4,76 4,53 4,39 4,28 4,21 4,15 4,10 4,06 4,00 3,96 3,94 3,92 3,90 3,87 3,84 3,81 3,77 3,74 3,70 3,67 
7 5,59 4,74 4,35 4,12 3,97 3,87 3,79 3,73 3,68 3,64 3,57 3,53 3,51 3,49 3,47 3,44 3,41 3,38 3,34 3,30 3,27 3,23 
8 5,32 4,46 4,07 3,84 3,69 3,58 3,50 3,44 3,39 3,35 3,28 3,24 3,22 3,20 3,17 3,15 3,12 3,08 3,04 3,01 2,97 2,93 
9 5,12 4,26 3,86 3,63 3,48 3,37 3,29 3,23 3,18 3,14 3,07 3,03 3,01 2,99 2,96 2,94 2,90 2,86 2,83 2,79 2,75 2,71 
10 4,96 4,10 3,71 3,48 3,33 3,22 3,14 3,07 3,02 2,98 2,91 2,87 2,85 2,83 2,80 2,77 2,74 2,70 2,66 2,62 2,58 2,54 
11 4,84 3,98 3,59 3,36 3,20 3,09 3,01 2,95 2,90 2,85 2,79 2,74 2,72 2,70 2,67 2,65 2,61 2,57 2,53 2,49 2,45 2,40 
12 4,75 3,89 3,49 3,26 3,11 3,00 2,91 2,85 2,80 2,75 2,69 2,64 2,62 2,60 2,57 2,54 2,51 2,47 2,43 2,38 2,34 2,30 
13 4,67 3,81 3,41 3,18 3,03 2,92 2,83 2,77 2,71 2,67 2,60 2,55 2,53 2,52 2,48 2,46 2,42 2,38 2,34 2,30 2,25 2,21 
14 4,60 3,74 3,34 3,11 2,96 2,85 2,76 2,70 2,65 2,60 2,53 2,48 2,46 2,44 2,41 2,39 2,35 2,31 2,27 2,22 2,18 2,13 
15 4,54 3,68 3,29 3,06 2,90 2,79 2,71 2,64 2,59 2,54 2,48 2,42 2,40 2,39 2,35 2,33 2,29 2,25 2,20 2,16 2,11 2,07 
16 4,49 3,63 3,24 3,01 2,85 2,74 2,66 2,59 2,54 2,49 2,42 2,37 2,35 2,33 2,30 2,28 2,24 2,19 2,15 2,11 2,06 2,01 
17 4,45 3,59 3,20 2,96 2,81 2,70 2,61 2,55 2,49 2,45 2,38 2,34 2,31 2,29 2,26 2,23 2,19 2,15 2,10 2,06 2,01 1,96 
18 4,41 3,55 3,16 2,93 2,77 2,66 2,58 2,51 2,46 2,41 2,34 2,29 2,27 2,25 2,22 2,19 2,15 2,11 2,06 2,02 1,97 1,92 
19 4,38 3,52 3,13 2,90 2,74 2,63 2,54 2,48 2,42 2,38 2,31 2,26 2,23 2,22 2,18 2,16 2,11 2,07 2,03 1,98 1,93 1,88 
20 4,35 3,49 3,10 2,87 2,71 2,60 2,51 2,45 2,39 2,35 2,28 2,22 2,20 2,18 2,15 2,12 2,08 2,04 1,99 1,95 1,90 1,84 
21 4,32 3,47 3,07 2,84 2,68 2,57 2,49 2,42 2,37 2,32 2,25 2,20 2,18 2,16 2,12 2,10 2,05 2,01 1,96 1,92 1,87 1,81 
22 4,30 3,44 3,05 2,82 2,66 2,55 2,46 2,40 2,34 2,30 2,23 2,17 2,15 2,13 2,10 2,07 2,03 1,98 1,94 1,89 1,84 1,78 
23 4,28 3,42 3,03 2,80 2,64 2,53 2,44 2,37 2,32 2,27 2,20 2,15 2,13 2,11 2,08 2,05 2,01 1,96 1,91 1,86 1,81 1,76 
24 4,26 3,40 3,01 2,78 2,62 2,51 2,42 2,36 2,30 2,25 2,18 2,13 2,11 2,09 2,05 2,03 1,98 1,94 1,89 1,84 1,79 1,73 
25 4,24 3,39 2,99 2,76 2,60 2,49 2,40 2,34 2,28 2,24 2,16 2,11 2,09 2,07 2,04 2,01 1,96 1,92 1,87 1,82 1,77 1,71 
26 4,23 3,37 2,98 2,74 2,59 2,47 2,39 2,32 2,27 2,22 2,15 2,09 2,07 2,05 2,02 1,99 1,95 1,90 1,85 1,80 1,75 1,69 
27 4,21 3,35 2,96 2,73 2,57 2,46 2,37 2,31 2,25 2,20 2,13 2,08 2,06 2,04 2,00 1,97 1,93 1,88 1,84 1,79 1,73 1,67 
28 4,20 3,34 2,95 2,71 2,56 2,45 2,36 2,29 2,24 2,19 2,12 2,06 2,04 2,02 1,99 1,96 1,91 1,87 1,82 1,77 1,71 1,65 
29 4,18 3,33 2,93 2,70 2,55 2,43 2,35 2,28 2,22 2,18 2,10 2,05 2,03 2,01 1,97 1,94 1,90 1,85 1,81 1,75 1,70 1,64 
30 4,17 3,32 2,92 2,69 2,53 2,42 2,33 2,27 2,21 2,16 2,09 2,04 2,01 1,99 1,96 1,93 1,89 1,84 1,79 1,74 1,68 1,62 
40 4,08 3,23 2,84 2,61 2,45 2,34 2,25 2,18 2,12 2,08 2,00 1,95 1,92 1,90 1,87 1,84 1,79 1,74 1,69 1,64 1,58 1,51 
60 4,00 3,15 2,76 2,53 2,37 2,25 2,17 2,10 2,04 1,99 1,92 1,86 1,84 1,81 1,78 1,75 1,70 1,65 1,59 1,53 1,47 1,39 
120 3,92 3,07 2,68 2,45 2,29 2,17 2,09 2,02 1,96 1,91 1,83 1,77 1,75 1,72 1,69 1,66 1,61 1,55 1,50 1,43 1,35 1,25 
∞ 3,84 3,00 2,60 2,37 2,21 2,10 2,01 1,94 1,88 1,83 1,75 1,69 1,67 1,63 1,60 1,57 1,52 1,46 1,39 1,32 1,22 1,00 
n1 = número de graus de liberdade do numerador e n2 = número de graus de liberdade do denominador 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 105 
Tabela 3. Valores de t (tabela bilateral) 
 
Rohlf, FJ & Sokal, RR. Statistical Tables, 2nd ed., USA, 1981.106 
 
Tabela 4. Valores de t (tabela unilateral) 
 
 
 
 
 
 107 
Tabela 5. Quantis superiores da distribuição qui-quadrdo )( 2 αχ com v graus de liberdade e 
diferentes valores de probabilidade (α), de acordo com a seguinte afirmativa probabilística: P 2(χ > 
α=χ α )2 . 
 
 
v 0.995 0.975 0.9 0.5 0.1 0.05 0.025 0.01 0.005 0.001
 1 0.000 0.001 0.016 0.455 2.706 3.841 5.024 6.635 7.879 10.827
2 0.010 0.051 0.211 1.386 4.605 5.991 7.378 9.210 10.597 13.815
3 0.072 0.216 0.584 2.366 6.251 7.815 9.348 11.345 12.838 16.266
4 0.207 0.484 1.064 3.357 7.779 9.488 11.143 13.277 14.860 18.466
5 0.412 0.831 1.610 4.351 9.236 11.070 12.832 15.086 16.750 20.515
6 0.676 1.237 2.204 5.348 10.645 12.592 14.449 16.812 18.548 22.457
7 0.989 1.690 2.833 6.346 12.017 14.067 16.013 18.475 20.278 24.321
8 1.344 2.180 3.490 7.344 13.362 15.507 17.535 20.090 21.955 26.124
9 1.735 2.700 4.168 8.343 14.684 16.919 19.023 21.666 23.589 27.877
10 2.156 3.247 4.865 9.342 15.987 18.307 20.483 23.209 25.188 29.588
11 2.603 3.816 5.578 10.341 17.275 19.675 21.920 24.725 26.757 31.264
12 3.074 4.404 6.304 11.340 18.549 21.026 23.337 26.217 28.300 32.909
13 3.565 5.009 7.041 12.340 19.812 22.362 24.736 27.688 29.819 34.527
14 4.075 5.629 7.790 13.339 21.064 23.685 26.119 29.141 31.319 36.124
15 4.601 6.262 8.547 14.339 22.307 24.996 27.488 30.578 32.801 37.698
16 5.142 6.908 9.312 15.338 23.542 26.296 28.845 32.000 34.267 39.252
17 5.697 7.564 10.085 16.338 24.769 27.587 30.191 33.409 35.718 40.791
18 6.265 8.231 10.865 17.338 25.989 28.869 31.526 34.805 37.156 42.312
19 6.844 8.907 11.651 18.338 27.204 30.144 32.852 36.191 38.582 43.819
20 7.434 9.591 12.443 19.337 28.412 31.410 34.170 37.566 39.997 45.314
21 8.034 10.283 13.240 20.337 29.615 32.671 35.479 38.932 41.401 46.796
22 8.643 10.982 14.041 21.337 30.813 33.924 36.781 40.289 42.796 48.268
23 9.260 11.689 14.848 22.337 32.007 35.172 38.076 41.638 44.181 49.728
24 9.886 12.401 15.659 23.337 33.196 36.415 39.364 42.980 45.558 51.179
25 10.520 13.120 16.473 24.337 34.382 37.652 40.646 44.314 46.928 52.619
26 11.160 13.844 17.292 25.336 35.563 38.885 41.923 45.642 48.290 54.051
27 11.808 14.573 18.114 26.336 36.741 40.113 43.195 46.963 49.645 55.475
28 12.461 15.308 18.939 27.336 37.916 41.337 44.461 48.278 50.994 56.892
29 13.121 16.047 19.768 28.336 39.087 42.557 45.722 49.588 52.335 58.301
30 13.787 16.791 20.599 29.336 40.256 43.773 46.979 50.892 53.672 59.702
Rohlf, FJ & Sokal, RR. Statistical Tables, 2nd ed., USA, 1981. 
 
 
 
 
 
	1.4. Apresentação gráfica e tabular
	Variáveis qualitativas - nominais e ordinais 
	Variáveis Quantitativas Discretas
	Variáveis Quantitativas contínuas
	1.5. Medidas de posição
	Medidas de posição são aquelas que visam representar a tendência central de uma distribuição, isto é, um valor em torno do qual os dados se distribuem.
	Média aritmética
	A média aritmética é uma medida de posição que pode ser utilizada para variáveis quantitativas. Dado um conjunto de n observações X1, X2, X3, ..., Xn, define-se a média aritmética por:
	 (1)
	Se os valores X1, X2, X3, ..., Xn ocorrem com as respectivas freqüências f1, f2, f3, ..., fn tem-se a média aritmética ponderada:
	 (2)
	Exemplo
	 Os dados abaixo se referem ao número de espigas em 22 plantas de milho-pipoca:
	0 1 1 1 1 1 2 2 2 2 2 2 3 3 3 3 4 4 4 5 5 6
	A média destes valores é obtida pela equação (1):
	 2,59
	Tem-se uma média de 2,59 espigas por planta.
	Estes valores podem ser apresentados em uma tabela de freqüência, como no exemplo a seguir:
	Número de espigas/planta
	Freqüência absoluta (fi)
	0
	1
	1
	5
	2
	6
	3
	4
	4
	3
	5
	2
	6
	1
	Total
	22
	 
	Neste caso a média pode ser obtida pela equação (2):
	 
	Esta média também é chamada de média ponderada, pois cada valor é ponderado por um peso, que neste caso é a freqüência.
	Propriedades da média aritmética
	a) A soma algébrica dos desvios em relação à média aritmética é nula;
	 
	b) Somando-se ou subtraindo-se uma constante a cada um dos valores da série X1, X2, X3, ..., Xn, a média destes valores fica somada ou subtraída da constante; ;
	 
	c) Multiplicando-se ou dividindo-se cada um dos valores da série X1, X2, X3, ..., Xn, a média destes valores fica multiplicada ou dividida pela constante;
	 
	d) A soma de quadrados dos desvios (SQD) em relação a média é um mínimo;
	 é um mínimo
	Seja 
	 
	 
	Logo, tem-se um ponto de mínimo para o valor de X0 = média.
	Moda
	 A moda de um conjunto de dados é o valor que ocorre com maior freqüência.
	Por exemplo: Considere o seguinte conjunto de observações:
	2, 4, 3, 4, 1, 1, 2, 2, 
	Neste caso a moda é 2 (Mo = 2), que é o valor que ocorre com maior freqüência.
	Considere agora a seguinte distribuição de freqüência de tipos sanguíneos:
	Tipos Sanguíneos
	A
	B
	AB
	O
	Freqüência Absoluta
	10
	13
	8
	14
	Neste caso a moda é o tipo sanguíneo O, que ocorre com maior freqüência.
	Nestes dois exemplos têm-se séries unimodais, ou seja, possuem uma única moda. Quando uma série possui mais de uma moda ela é dita multimodal e, quando não possui moda é dita amodal.
	Note que no primeiro exemplo a variável é quantitativa discreta e no segundo a variável é qualitativa. Para variáveis quantitativas contínuas pode-se obter a moda quando os dados são agrupados em classes ou, obtendo-se o ponto de máximo da função de freqüência, como no exemplo a seguir.
	Considere a seguinte função de freqüência: f(x) = X – X 2
	Derivando-se esta função e igualando a zero, se obtém um ponto de máximo ou mínimo.
	 f’(x) = 1 – 2x 
	 f’(x) = 0
	1 – 2x = 0 → x = ½
	Este ponto será um máximo se a segunda derivada for negativa e um mínimo se a segunda derivada for positiva.
	f”(x) = -2
	Como a segunda derivada é negativa, o ponto x = ½ é de máximo.
	Mediana
	A mediana de um conjunto de dados ordenados em ordem crescente ou decrescente de grandeza é o valor abaixo e acima do qual se tem a metade dos dados. Assim, a mediana divide o conjunto ordenado em duas partes com igual número de dados.
	Há dois casos a considerar:
	a) n é impar: a mediana será o valor que ocupa a posição de um rol estatístico.
	Ex.: 5, 4, 2, 6, 3, 7, 9; n = 7
	rol.: 2, 3, 4, 5, 6, 7, 9 
	 , ou seja, P4 = elemento do rol que ocupa a quarta posição = 5 
	b) n é par: a mediana será a média dos valores que ocupam as posições e de um rol estatístico.
	Ex.: 7, 6, 1, 4, 8, 9, 3, 2; n = 8
	rol.: 1, 2, 3, 4, 6, 7, 8, 9 
	 , a mediana é a média dos valores que ocupam a posição 4 e 5. Assim, Med = (4+6)/2=5.
	A mediana é uma medida de posição, em geral, menos informativa que a média, pois só considera os ranques (postos ou posições) das observações e não o valor, como faz à média. No entanto, em algumas ocasiões à mediana pode ser mais vantajosa pelo fato de não ser afetada pelos extremos. Considere o exemplo a seguir:
	1 2 3 4 5 6 7 8 9 10 11
	Note que a média e a mediana deste conjunto de dados é igual a 6. Vamos supor agora o seguinte conjunto de dados onde ocorreu um valor extremo:
	1 2 3 4 5 6 7 8 9 10 40
	Note que a mediana não foi alterada, continua sendo igual a 6. No entanto, a média neste caso é igual a 8,64 devido ao valor extremo igual a 40.
	A mediana também tem a vantagem de poder ser aplicada a variáveis qualitativas ordinais.
	1.6. Medidas de dispersão
	As medidas de dispersão medem a variabilidade dos dados. Entre as várias medidas existentes veremos apenas as mais importantes.
	Variância
	A variância mede a variabilidade dos dados em torno da média. Dada uma amostra de n valores X1, X2, X3, ..., Xn define-se a variância de x por:
	 
	 
	 
	Aplicando propriedades do somatório tem-se:
	 
	Se os valores X1, X2, X3, ... Xn ocorrem com as respectivas freqüências f1, f2, f3,..., fn a soma de quadrados dos desvios será:
	SQD = 
	Assim, a variância de um conjunto de dados quantitativos pode ser obtida por:(3)
	Se os dados estão organizados em tabelas de freqüência a variância pode ser obtida por:
	 (4)
	Exemplo
	Considerando novamente os dados que se referem ao número de espigas em 22 plantas de milho-pipoca:
	0 1 1 1 1 1 2 2 2 2 2 2 3 3 3 3 4 4 4 5 5 6
	A variância destes valores é obtida pela equação (3):
	 
	Estes valores podem ser apresentados em uma tabela de freqüência, como no exemplo a seguir:
	Número de espigas/planta
	Freqüência absoluta (Fi)
	0
	1
	1
	5
	2
	6
	3
	4
	4
	3
	5
	2
	6
	1
	Total
	22
	 
	Neste caso a variância pode ser obtida pela equação (4):
	 
	Propriedades da variância
	a) Variância de uma constante (k) é igual a zero: V(k) = 0.
	b) Somando-se ou subtraindo-se uma constante a cada um dos valores da série, a variância não se altera: .
	c) Multiplicando-se ou dividindo-se cada um dos valores da série por uma constante, a variância fica multiplicada ou dividida pelo quadrado da constante.
	 
	Desvio Padrão
	O desvio padrão é simplesmente a raiz quadrada da variância, obtido por:
	 
	O desvio padrão para o número de espigas/planta de milho-pipoca é:
	 
	Observação
	A unidade de medida da variável que se estima a variância fica elevada ao quadrado, assim, por exemplo, uma medida em metros (m) fica m2. No desvio padrão a variável ficaria em m.
	Erro Padrão da Média
	É uma medida de dispersão que mede a precisão da média aritmética. Quanto menor o desvio padrão e maior a amostra, menor é o erro padrão da média e mais precisa será a média.
	A equação que nos dá essa relação é:
	 
	O erro padrão da média para o número de espigas/planta de milho-pipoca é:
	 
	Coeficiente de Variação
	O coeficiente de variação é uma medida de dispersão relativa. Sua vantagem é o fato de ser uma medida adimensional, assim, independe das unidades usadas e é importante para comparar a dispersão de amostras de médias ou unidades de medida diferentes.
	O coeficiente de variação é obtido pela razão do desvio padrão pela média:
	 
	O coeficiente de variação para o número de espigas/planta de milho-pipoca é:
	 
	Observação importante
	Para comparar duas amostras com relação a homogeneidade, temos dois casos a considerar:
	a) As médias das amostras são iguais . Neste caso a mais homogênea é aquela que possui a menor variância, desvio padrão ou coeficiente de variação. Qualquer destas medidas pode ser utilizada.
	b) Se as médias de duas amostras são diferentes, ou ainda, se as duas amostras possuem unidades de medida diferente, deve-se utilizar o coeficiente de variação. Assim, a amostra de menor coeficiente de variação é a mais homogênea. 
	1.7. Medidas de correlação
	As medidas de correlação medem o grau de associação entre duas variáveis.
	 Por exemplo: 
	altura da planta x peso de grãos
	tempo de treinamento x rendimento do atleta
	quantidade de adubo x produtividade
	Note que, em todos estes exemplos, as variáveis são quantitativas. Nestes casos pode-se obter um valor que nos dá o grau de associação entre duas variáveis. A medida em questão é chamada de correlação de Pearson e, pode ser obtida pela seguinte equação:
	 onde
	 
	 
	 
	O valor da correlação ( ) entre duas variáveis varia de -1 a 1. Quando o valor é positivo, uma variável cresce e a outra, em média, também cresce. Isto é, as duas variáveis variam no mesmo sentido. Quando o valor é negativo uma variável cresce e a outra, em média, decresce. Neste caso as variáveis variam em sentido contrário. Quando a correlação é nula as variáveis não estão relacionadas. 
	Exemplo
	Os dados a seguir referem-se a altura média AP (m) e a produtividade de grãos PG (g) de 8 famílias de milho-pipoca.
	Neste caso podem-se fazer as seguintes perguntas: 
	Será que a altura de plantas esta correlacionada com a produtividade? 
	Será que plantas mais altas são mais produtivas? 
	Neste caso, se a correlação for positiva, ou seja, o valor obtido estiver no intervalo entre 0 e 1, pode-se concluir que, em geral, plantas mais altas são mais produtivas. Quanto mais a correlação se aproxima de 1, maior é a correlação, ou seja, tem-se uma tendência mais acentuada de plantas mais altas serem mais produtivas. 
	Para obter o valor da correlação vamos utilizar a fórmula a seguir:
	 
	 
	 
	 
	 
	 
	 
	 
	 
	 
	 
	 
	 
	Portanto, a altura de planta esta correlacionada com a produtividade. Como o valor é positivo (0,60), pode-se dizer que existe uma tendência de magnitude razoável de plantas mais altas serem mais produtivas.
	Se o valor fosse negativo (-0,60) ter-se-ia tendência de plantas mais baixas serem mais produtivas. Se o valor fosse zero ou de próximo de zero, a tendência seria nula ou muito baixa.
	A correlação pode ser visualizada em gráficos chamados de diagrama de dispersão. Os gráficos abaixo representam os valores de duas variáveis (X,Y) plotados no eixo cartesiano: 
	 
	a) correlação positiva (0,99) b) correlação negativa (-0,99) c) ausência de correlação (0,00)
	1.8. Regressão linear simples
	 Como abordado anteriormente, duas variáveis quantitativas podem apresentar diferentes níveis de associação ou, muitas vezes, nem estarem associadas. A simples existência de associação indica que uma variável pode estar influenciando à outra em uma relação de causa e efeito. Por exemplo, considere o gráfico de dispersão abaixo em que as duas variáveis estão muito correlacionadas (0,99).
	 
	Esta relação pode indicar uma influencia de causa e efeito da variável X sobre a variável Y. Suponha que X seja a quantidade de determinado fertilizante e Y a produtividade de determinada cultura. Assim, a influencia de causa e efeito do adubo sobre a produtividade poderia ser quantificada. Note que o gráfico indica uma resposta linear e, portanto, pode-se adotar um modelo linear para quantificar a resposta da produção em relação à quantidade de adubo. O modelo matemático em questão, já bastante conhecido, é a equação da reta:
	y = a + bx
	Note que para cada quantidade de adubo (x), ter-se-ia uma resposta em y. Se a quantidade de adubo fosse igual à zero, ainda assim haveria produção. Neste caso y = a.
	No entanto, a equação apresentada trata-se de um modelo matemático (exato). Para representar os dados utilizaremos um modelo estatístico dado por:
	y = a + bx + erro
	Este modelo é equivalente a:
	 
	Este é um modelo estatístico que representa uma relação linear de causa e efeito entre duas variáveis quantitativas. O coeficiente nada mais é do que o coeficiente linear da reta (a). O coeficiente nada mais é do que o coeficiente angular da reta (b), também chamado de regressor. Então, a diferença do modelo estatístico para o matemático é a consideração do erro (ei) no modelo estatístico. Como a produtividade depende de outros fatores (chuva, ataque de pragas, etc) além da quantidade de adubo, a resposta não é perfeitamente linear. Assim, a influencia de variáveis desconhecidas é quantificada no erro.
	Para ficar mais claro esta abordagem, vejamos o exemplo a seguir, onde se tem a produtividade de milho em função de diferentes quantidades de adubo (dados hipotéticos):
	Note que, parece haver uma relação entre as variáveis, ou seja, quanto maior a quantidade de adubo, maior é a produtividade. Realmente, a correlação de Pearson para estes dados é de 0,986. Analisando o gráfico abaixo, também se pode visualizar que a associação é linear e sugere um tipo de ralação de causa e efeito entre as variáveis.
	 
	 Portanto, o modelo estatístico que representa estes dados é:
	 
	 Assim, o objetivo da regressão é obter o melhor modelo (matemático) que se ajuste aos dados, que é aquele que minimiza a soma de quadrados dos erros (ei). Este método é denominado método dos mínimos quadrados. Para obter o modelo ajustado, podem-se adotar os seguintes passos:
	a) Isolar o erro (ei) na equação: 
	 b) Elevar ambos os membros da equação ao quadrado: 
	 c) Aplicar somatório: 
	 d) Derivar a equação em relação a βo e β1 e igualar a zero:
	 
	 e) Aplicar propriedades do somatório:f) Resolver o sistema resultante obtendo e :
	 
	 
	 Assim, parte-se de um modelo estatístico e obtém-se um modelo matemático, que é a equação ajustada dada por:
	 
	Esta equação é equivalente a equação da reta y = a + bx.
	 Agora podemos aplicar estes conhecimentos nos dados de adubação e produção do milho e obter uma equação que melhor se ajusta aos dados. O primeiro passo é a obtenção dos seguintes valores:
	 
	 
	 
	 
	 
	 
	 
	 Agora é só utilizar as fórmulas obtidas pelas derivadas parciais para estimar os valores de βo e β1.
	 
	 
	 
	 O modelo ajustado ( ) fica:
	 
	Assim, para cada acréscimo em uma unidade de X, tem-se um acréscimo de 11,71 unidades em Y, ou seja, para cada 1 kg/ha de adubo (NPK), tem-se um acréscimo de 11,71 kg/ha na produção de milho. Se a quantidade de adubo for igual à zero, a produtividade é igual a 5445,05 kg/ha. Colocando todos os valores de X na equação e obtendo os respectivos valores de Y, obtém-se a reta do gráfico abaixo, que é aquela que melhor se ajusta aos dados:
	 
	Observações importantes:
	 Aqui foi apresentado apenas o modelo de uma regressão linear simples. Isso porque a variável resposta Y esta em função de apenas uma variável (X). Quando a variável resposta (Y) esta em função de duas ou mais variáveis, em um modelo linear, tem-se os modelos de regressão linear múltipla. No entanto, nem sempre a natureza de uma interação é linear. Para estes casos existem outros tipos de regressão, como a regressão quadrática, cúbica, exponencial etc. 
	 A equação ajustada só deve ser utilizada para valores de X do intervalo avaliado, ou seja, neste exemplo os valores de X devem ficar entre 0 e 450. Para melhor entendermos esta colocação, vamos raciocinar o seguinte. Suponha que sejam aplicadas quantidades de adubo superior a 450 kg/ha. Pode-se pensar que a produtividade irá aumentar. Porém, não sabemos a natureza da resposta neste caso, pois ela não foi avaliada. Uma quantidade de adubo acima de 450 kg/ha pode acarretar uma resposta nula, não linear ou até mesmo negativa. Portanto, não é adequado prever valores de Y fora do intervalo de valores de X utilizados para a obtenção da equação ajustada.
	 Duas variáveis podem ter correlação aproximadamente nula e terem uma relação de causa e efeito. Estes casos não foram abordados aqui, como por exemplo, a regressão polinomial quadrática representada abaixo, onde a correlação é -0,04:
	 
	Exercícios – Estatística Descritiva
	Somatório
	9 - Em uma suinocultura com 200 animais, tem-se 150 fêmeas e 50 machos. Tem-se também, 4 animais doentes, sendo 3 doentes machos e 1 fêmea. Comprando um animal ao acaso, qual a probabilidade do animal:
	a) ser macho R.: 1/4
	b) ser fêmea R.: 3/4
	c) estar doente R.: 1/50
	d) estar doente e ser macho R.: 3/200
	e) Um macho foi comprado. Qual a probabilidade do animal estar doente? R.: 3/50
	f) Uma fêmea foi comprada. Qual a probabilidade do animal estar doente? R.: 1/150
	g) Querendo evitar a compra de um animal doente, você compraria uma animal macho ou fêmea? Justifique a sua resposta.