Prévia do material em texto
1
Sandro Cruz
P R O F E S S O R :
INTELIGÊNCIA ESTATÍSTICA
PARA ENGENHARIA
Campus Recife
Aula 03
2
DISTRIBUIÇÃO DE FREQUÊNCIAS
3
DISTRIBUIÇÃO DE FREQUÊNCIAS
4
DISTRIBUIÇÃO DE FREQUÊNCIAS
A freqüência acumulada indica quantos elementos,
ou que porcentagem deles, estão abaixo de um certo
valor.
Assim, observando a tabela pode-se afirmar que, por
exemplo, 27,78% dos indivíduos ganham até 8
salários e 97, 22% ganham até 20 salários.
O gráfico pode fornecer informações adicionais
como: qual salário s que, tal que 50% dos
funcionários ganham menos do que s.
5
DISTRIBUIÇÃO DE FREQUÊNCIAS
S
50
6
MEDIDAS DE TENDÊNCIA / RESUMO
Um grande conjunto de dados pode ser representando
por UM ou ALGUNS valores, chamados medidas de
posição central:
MODA;
MEDIANA;
MÉDIA.
7
MEDIDAS DE TENDÊNCIA / RESUMO
MODA
É o valor que detém o maior número de observações,
ou seja, o valor ou valores mais freqüentes.
A moda não é necessariamente única, ao contrário da
média ou da mediana.
É especialmente útil quando os valores ou
observações numéricos e não são numéricos, uma
vez que a média e a mediana podem não ser bem
definidas.
8
MEDIDAS DE TENDÊNCIA / RESUMO
MODA
EXEMPLOS
1 - Considere a amostra:
{maçã, maçã, banana, laranja, laranja, laranja, pêssego}.
Pergunta-se: - Qual a Moda da amostra?
R. A moda de é laranja
9
MEDIDAS DE TENDÊNCIA / RESUMO
MODA
EXEMPLOS
2 - Considere a amostragem apresentada na Página 11,
para o número de filhos:
{1, 2, 0, 1, 2, 3, 0, 1, 2, 1, 0, 2, 2, 0, 5, 2, 1, 3, 2, 3}.
Pergunta-se: - Qual a Moda da amostra?
R. 1º ordenar a amostra
{0, 0, 0, 0, 1, 1, 1, 1, 1, 2, 2, 2, 2, 2, 2, 2, 3, 3, 3, 5}.
F=4 F=5 F=7 F=3 F=1
10
MEDIDAS DE TENDÊNCIA / RESUMO
MODA
EXEMPLOS
3 - Considere a amostra:
{1, 3, 5, 5, 6, 6}.
Pergunta-se: - Qual a Moda da amostra?
R. 5 e 6 => a amostra é BIMODAL
4 – Considere a amostra:
{1, 3, 2, 5, 8, 7, 9}.
Pergunta-se: - Qual a Moda da amostra?
R. A amostra NÃO APRESENTA MODA
11
MEDIDAS DE TENDÊNCIA / RESUMO
MEDIANA
É uma medida de tendência central, um número que
caracteriza as observações de uma determinada
variável de tal forma que este número (a mediana) de
um grupo de dados ORDENADOS separa a metade
inferior da amostra, população ou distribuição de
probabilidade, da metade superior.
Mais concretamente, 1/2 da população terá valores
inferiores ou iguais à mediana e 1/2 da população
terá valores superiores ou iguais à mediana.
12
MEDIDAS DE TENDÊNCIA / RESUMO
MEDIANA
Ordem Elementos
1o 3
2o 4
3o 7
4o 8
5o 8
13
MEDIDAS DE TENDÊNCIA / RESUMO
MEDIANA
No caso de dados não classificados, quer para
variáveis contínuas quer discretas, são calculadas
conforme a seguir.
Para populações (n) ímpares:
a mediana será o elemento central (n+1)/2.
Para populações (n) pares:
a mediana será o resultado da média simples dos
elementos n/2 e (n/2)+1.
14
MEDIDAS DE TENDÊNCIA / RESUMO
MEDIANA
Ordem Elementos ÍMPAR
1o 3
2o 4
3o 7
4o 8
5o 8
n. elementos = 5
Mediana = (n+1)/2 = (5+1)/2 = 6/2 = 3o
15
MEDIDAS DE TENDÊNCIA / RESUMO
MEDIANA
Ordem Elementos PAR
1o 3
2o 4
3o 7
4o 8
5o 8
6o 9
n. elementos = 6
Mediana => (n) / 2 = 3o ; ((n) / 2) +1 = 4o
(7 + 8) / 2 = 7,5
16
MEDIDAS DE TENDÊNCIA / RESUMO
MEDIANA
EXEMPLO
1 - Considere a amostra:
{1, 3, 5, 7, 9 }.
Pergunta-se: - Qual a Mediana da amostra?
R. 5
17
MEDIDAS DE TENDÊNCIA / RESUMO
MEDIANA
EXEMPLO
2 - Considere a amostra:
{1, 2, 4, 10, 13 }.
Pergunta-se: - Qual a Mediana da amostra?
R. 4
18
MEDIDAS DE TENDÊNCIA / RESUMO
MEDIANA
EXEMPLO
3 - Considere a amostra:
{1, 2, 4, 7, 9, 10}.
Pergunta-se: - Qual a Mediana da amostra?
R. 5,5
19
MEDIDAS DE TENDÊNCIA / RESUMO
MEDIANA
Quando se trata de um conjunto de dados classificados, o cálculo da
mediana é feito através do histograma, ou através da função
cumulativa de freqüências relativas. A mediana é o ponto do eixo
das abscissas correspondente a 50% da freqüência relativa
acumulada.
No caso de variáveis contínuas, a mediana é calculada através de
interpolação linear entre os pontos centrais das duas classes entre as
quais se encontra o ponto correspondente a 50% da freqüência
relativa acumulada.
No caso de variáveis discretas, e quando as freqüências estão
calculadas por unidade, a mediana é o ponto do eixo das abscissas
para o qual a freqüência relativa acumulada é inferior ou igual a
50% e superior ou igual a 50% para o ponto imediatamente a seguir.
20
MEDIDAS DE TENDÊNCIA / RESUMO
MÉDIA
É o valor médio de uma distribuição,
determinado segundo uma regra
estabelecida a priori e que se utiliza
para representar todos os valores da
distribuição.
A Média é uma das medidas de
maior utilização, contudo ela pode,
às vezes, traduzir com grande
distorção a amostragem.
100º
0º
50º
21
MEDIDAS DE TENDÊNCIA / RESUMO
MÉDIA
Nome Equação ou descrição Aplicação
Média aritmética
Geral
Média ponderada
Geral
Média geométrica
Economia
Média harmônica
Elétrica (resistências)
Média quadrática
(ou RMS)
Geral
22
MEDIDAS DE DISPERSÃO
DESVIO
Em alguns momentos somente MÉDIA não
colabora para análises mais profunda, de uma série
de dados.
Exemplo: Considere os seguintes conjuntos de resultados
de tensões de ruptura dos Corpos de Prova de concreto,
medidos em Mpa.
A = {16, 18, 20, 22, 24}; Média = 20 Mpa.
B = {13, 17, 21, 25, 29}; Média = 21 Mpa.
C = {11, 15, 19, 23, 27}; Média = 19 Mpa.
QUAL O MELHOR CONCRETO ?
23
DESVIO
Uma boa opção é identificar o desvio (distância)
dos valores até a MÉDIA.
A = {16, 18, 20, 22, 24}; Média = 20 Mpa.
|16-20|=4 |18-20|=2 |20-20|=0 |22-20|=2 |24-20|=4
B = {13, 17, 21, 25, 29}; Média = 21 Mpa.
|13-21|=8 |17-21|=4 |21-21|=0 |25-21|=4 |29-21|=8
1242024|| =++++=− xxi
2484048|| =++++=− xxi
MEDIDAS DE DISPERSÃO
24
DESVIO
Uma boa opção é identificar o desvio (distância)
dos valores até a MÉDIA.
C = {11, 15, 19, 23, 27}; Média = 19 Mpa.
|11-19|=4 |15-19|=2 |19-19|=0 |23-19|=2 |27-19|=4
A = 12 B = 24 C=12
Comparando as amostras A, B e C, não conseguimos
expressar uma comparação consistente.
1242024|| =++++=− xxi
MEDIDAS DE DISPERSÃO
25
DESVIO MÉDIO
É a média aritmética dos valores absolutos dos
desvios.
n
xxi
xdm
||
)( −
=
Através da análise do Desvio Médio é possível
avaliar a homogeneidade (Dispersão) de
amostragens de diferentes valores.
MEDIDAS DE DISPERSÃO
26
VARIÂNCIA
É a média do quadrado da distância de cada ponto
até a média. É assim a “média do quadrado dos
desvios”
n
xxi
x
2)(
)var( −
=
[un2]
Através da análise da Variância é possível avaliar
a homogeneidade (Dispersão) de amostragens de
diferentes valores.
MEDIDAS DE DISPERSÃO
27
DESVIO PADRÃO
Sendo a Variância uma medida cuja unidade final é
quadrática [un2], causando problemas de
interpretação, assim tomasse a raiz da Variância
chamada DESVIO PADRÃO.
O desvio padrão retrata a distribuição dos valores
da variável com relação a média. Quanto maio o
valor, maior a dispersão com relação a média.
)var()( XxdP =
MEDIDAS DE DISPERSÃO
28
O DESVIO PADRÃO é a medida de dispersão mais
utilizada em casos de distribuições simétricas.
As distribuições simétricas se aproximam da curva
conhecida como CURVA NORMAL ou CURVA DE
GAUSS. Zona de normalidade
MEDIDAS DE DISPERSÃO
29
Exemplo:
- 68% dos valores encontram-se a uma distância da
média inferior a um desvio padrão.
- 95% dos valores encontram-se a uma distância da
média inferior a duas vezes o desvio padrão.
- 99,7% dos valores encontram-se a uma distância da
média inferior a três vezes o desvio padrão.
MEDIDAS DE DISPERSÃO
30
COEFICIENTE DE VARIAÇÃO
É uma medida de dispersão que se presta para a
comparação de distribuições diferentes.
O desvio-padrão, uma medida de dispersão, é relativo à
média e como duas distribuições podem ter médias
diferentes, o desvio dessas duas distribuições não é
comparável. A solução é usar o coeficiente de variação,
que é igual ao desvio-padrão divididopela média.
100
)(
)( ×=
x
xdp
xCV [%]
MEDIDAS DE DISPERSÃO
31
EXERCÍCIO 1
Considere os seguintes conjuntos de resultados de
tensões de ruptura dos Corpos de Prova de concreto,
medidos em Mpa.
A = {16, 18, 20, 22, 24}
B = {13, 17, 21, 25, 29}
C = {11, 15, 19, 23, 27}
Pede-se:
a) Média;
b) Desvio Médio;
c) Variância;
d) Desvio Padrão;
e) Coeficiente de Variação das amostras.
32
EXERCÍCIO 2
Considere as vazões diárias (10 dias) de um posto fluviométrico
localizado no Rio Ipojuca, no município de Caruaru.
Pede-se:
a) Média (para toda amostra) e a Média dos 10 dias (para cada mês);
b) Desvio Médio (para toda amostra) e dos 10 dias (para cada mês);
c) Variância e Desvio Padrão (para toda amostra)
e) Quadro de Distribuição de Freqüências.
Data Vazao01 Vazao02 Vazao03 Vazao04 Vazao05 Vazao06 Vazao07 Vazao08 Vazao09 Vazao10
1/1/2007 0,00000 0,00000 0,05600 0,08300 0,11300 0,11300 0,05600 0,05600 0,11300 0,61200
1/2/2007 0,00000 0,00000 0,00000 0,00000 0,00000 0,00000 0,00000 0,00000 0,00000 0,00000
1/3/2007 0,82217 0,74908 0,74908 0,74908 0,67886 0,61156 0,54724 0,48594 0,48594 1,14246
1/4/2007 0,48600 0,48600 0,48600 0,42800 0,42800 0,37300 0,37300 0,37300 0,37300 0,37300
1/5/2007 0,61156 0,61156 0,37265 0,54724 0,61156 0,61156 0,54724 0,48594 0,48594 0,48594
1/7/2007 0,89809 1,05827 1,05827 1,05827 1,14246 1,22934 1,22934 1,14246 1,14246 1,22934
1/8/2007 0,74908 0,89809 0,97681 1,22934 1,31886 2,01751 2,23951 1,91017 1,91017 1,80530
1/9/2007 1,05827 1,05827 1,05827 1,14246 1,60307 2,47115 2,01751 2,01751 1,80530 1,60307
1/10/2007 0,74908 0,74908 0,67886 0,67886 0,61156 0,61156 0,61156 0,61156 0,67886 0,74908
1/11/2007 0,37265 0,37265 0,37265 0,37265 0,37265 0,37265 0,37265 0,37265 0,37265 0,27224
1/12/2007 0,37265 0,37265 0,37265 0,37265 0,37265 0,37265 0,37265 0,37265 0,37265 0,37265
1/1/2008 0,27224 0,27224 0,27224 0,22707 0,18538 0,18538 0,18538 0,18538 0,18538 0,18538
Vazões Diárias
33
FIM