Prévia do material em texto
·E�TAT(sr!r /\
-� 11-\I ' "" I vi-\
BAS I CA
Geraldo Lucio Somat6rio. 0 operador somat6rio facilita sobremaneira a
indica�ao e a formula�ao de medidas, bem como algumas opera�5es alge
bricas desenvolvidas pela Estatistica. E por essa razao que o assunto sera
apresentado neste livro como uma especie de apendice ao Capitulo 1.
Para designar somat6rio, utiliza-se a letra grega sigma mahisculo: l:. ,
0 simbolo deve ser lido como "somat6rio de" ou "soma de". Assim, por
exemplo, seja o seguinte conjunto de mimeros:X= {3,6, 9, 12, 15}. A soma
1970/1975.
Solu¢o:
1.1.1. Divide-se a popul�lio de cada regilio pela do Estado em cada
ano, multip licando-se o quociente por 100. Os resultados estao na
Tabela 1. 28.
TABELA 1.28
Populw;io (%)
Regiiies N'! .i 1970 1975
I Grande Scio Paulo 45,5 50,9
II Litoral 4,7 4,8
Ill Vale do Pararba 4,5 4,3
IV Sorocaba 6,2 5,7
v Campinas 11,8 11,4
VI Ribeiriio Preto 8,0 7, 1
VII Bauru 3, 1 2,5
VIII S. J. do Rio Prato 5,3 4,4
IX Ar�tuba 3,0 2,7
x Presidente Prudente 4,0 3,2
XI Mar Ilia 3,9 3,1
EST ADO 100,0 100,0 47
N'!
I
II
Ill
IV
v
VI
VII
VIII
IX
x
XI
48
1.1.2. Para determinar as taxas de crescimento em 5 anos, dividimos
a popula�ao de 1975 de uma certa regiao pela popula�ao em 1970 da
mesma regiiio. Exemplo: Para a Grande Sao Paulo teremos: �O
1
4:
3
1
;
4
=
,
= 1,287, ou seja, cresceu 28, 7% em cinco anos. Para o Estado teremos:
20 577 ,0
17 885,8
= 1,150, ou seja, cresceu 15% em cinco anos. As demais
estao na Tabela 1.29.
TABELA 1.29
Regioes
Taxa de crescimento
1970-75 (%)
Grande Slio Paulo 28,7
Litoral 16,6
Vale do Parafba 10,8
Sorocaba 4,8
Campinas 10,5
Ribeiriio Preto 2,2
Bauru - 7,1
S. J. do Rio Preto -3,9
Arac,atuba 1 ,9
Presidente Prudente -8,0
Mar Ilia -7.4
ESTA DO 15,0%
I. 2. Calcular os seguintes somatorios:
4
1.2.1. L (xi + 2) para x = 2, 3 , 4, 5.
i=l
4
1.2.2. L (xi + 2)2 para x = 1, 2, 3 , 4.
i=l
Soluffio:
4 4 4 4
1.2.1. L Xj + L 2 = L Xj + (4 x 2) = L Xj + 8 =
i=l i=l i=l
= 2 + 3 + 4 + 5 + 8 = 22
4 4 4
i=l
1.2.2. L (xi + 4xi + 4) = L xl + 4 L X; + 16 =
i=l i=l i=l
= l + 4 + 9 + 16 + 4(1 + 2 + 3 + 4) + 16 =
= 34 + 40 + 16 = 90
Distribuifiio de Frequencias
No primeiro capitulo, ao se enunciarem as formas de apresentayiio de
dados numericos, foi mencionada a apresentayiio tabular das series estatis
ticas. Uma das vantagens das tabelas estatisticas e a de condensar, de forma
consistente, as informay5es necessanas ao estudo desejado. Isto porque,
freqiientemente, o estudo de um determinado fenomeno requer a coleta de
uma grande massa de dados numericos, dificil de ser tratada se esses dados
nao forem organizados e condensados em uma tabela. No caso especifico das
seriayOes, acontece normalmente que, ao coletar os dados referentes ao fenO
meno objeto de estudo, o analista se defronta com valores que se repetem
algumas vezes, sugerindo sua apresentayiio atraves de tabelas onde somente
apareyam valores distintos uns dos outros. Essa providencia favorece eviden
temente uma arnilise e interpretayiio mais rapida da natureza e comporta
mento do fenomeno observado. Neste capitulo sera desenvolvido um tipo
de tabela que condensa uma coleyiio de dados conforme as freqiiencias ou
repetiyoes de seus valores.
2.1. DADOS BRUTOS
Feita a coleta, os dados originais ainda niio se encontram prontos para
anatise, por nao estaren1 numericamente organiZados. Por essa raziio, costu
ma-se chama-los de dados brutos. Tomando-se, por exemplo, as alturas dos
alunos em uma sala de aula e anotando-se os resultados em uma lista da qual
constem os nomes dos alunos em ordem alfabetica, ninguem garantira que
os valores correspondentes as alturas observarao uma determinada ordem
numerica, crescente OU decrescente. Mais provavel e que estejam desorgani
zados, uma vez que a ordem das alturas nao corresponde necessariamente a
ordem alfabetica. A lista de alturas e, portanto, uma lista de dados brutos,
que sao aqueles valores a que se chegou pela simples coleta, sem qualquer
preocupayiiO quanto a sua ordenayiiO. 49
50
Na Tabela 2 .1, estao relacionados os valores correspondentes ao consu
mo individual de energia eletrica, medido em quilowatts-hora, em um grupo
de 50 usuarios.
TABELA 2.1
Consumo Mensal de Energia Elitrica, por 50 Usuarios Particulares - KWH
58 62 80 57 8 126 136 96 144 19
90 86 38 94 82 75 148 114 131 28
66 95 121 158 64 105 118 73 83 81
50 92 60 52 89 58 10 90 94 74
9 75 72 157 125 76 88 78 84 36
Como pode ser observado, as cifras estao dispostas de forma desorde
nada. Em razao disso, pouca informayao se consegue obter inspecionando os
dados anotados. Mesmo uma informayao tao simples como a de saber os
consumos maximo e minimo requer um certo exame dos dados da tabela,
2.2. ROL
0 rol e uma lista em que os valores estao dispostos em uma determi
nada ordem, crescente ou decrescente. Dispondo os dados de acordo com o
consumo, obtem-se uma ordenayao da Tabela 2.1.
TABELA 2.2
Con1umo Mensal de Energia Ellrtrica por 50 Usuarios Particul•es - KWH
3
8
10
19
28
36
38
50
52
57
58 75 89 118
58 76 90 121
60 78 90 125
62 80 92 126
64 81 94 131
66 82 94 136
72 83 95 144
73 84 96 148
74 86 105 157
75 88 114 158
Essa classificayao dos dados proporciona algumas vantagens concretas
com relayao a sua forma original. Em primeiro lugar, ela torna possivel visua
lizar, de forma bem ampla, as variayoes de consumo, uma vez que os val ores
extremos sao percebidos de imediato. Em Segundo lugar, e possivel observar
-se uma tendencia de concentrayao dos valores na faixa de 50-90 kwh. Apesar
de o rol propiciar ao analista mais informayoes e com menos esforyo de
concentrayao do que os dados brutos, ainda assim persiste o problema de
a analise ter que se basear nas 50 observayoes individuais. 0 problema se
agravara quando 0 numero de dados for muito grande.
2.3. TABELA DE FREOUENCIAS
As tabelas de freqiiencias sao representayoes nas quais os valores se
apresentam em correspondencia com suas repetiyoes, evitando-se assim que
eles apare�m mais de uma vez na tabela, como ocorre com o rol.
Uma empresa fabricante de instrumentos de precisao esta interessada
em saber o numero de aparelhos defeituosos rejeitados pela seyao encarregada
do controle de qualidade. As estatisticas, fornecidas por essa seyao, referem-se
ao periodo de 1971a1974.
� J
0
1971 6
1972 10
1973 3
1974 7
TABELA 2.3 - EMPRESA X
Numero Mensal de Aparelhos Defeituosos
F M A M J J A s
2 5 6 0 8 7 .6 3
9 7 6 3 4 6 4 5
6 7 9 3 1 4 6 5
2 5 8 6 4 2 5 1
0 N
4 5
4 0
3 5
6 5
Os dados brutos, apresentados na Tabela 2.3, nao informam muita coisa
sobre o fenomeno "numero de aparelhos defeituosos", sendo dificil extrair
deles muitas conclusoes, sem esforyo de concentrayao. Observa-se, entretanto,
que os valores que constam da tabela aparecem repetidos, como o 0 (zero),
por exemplo, que aparece duas vezes. Esse fato ira sugerir, naturalmente, que
se condensem todos os resultados em uma tabela, estabelecendo a correspon
dencia entre o valor individual e o respectivo numero de vezes que ele foi
observado.
0 nuniero de observayoes ou repetiyoes de um valor ou de uma modali
dade, em um levantamento qualquer, e chamado freqiiencia desse valor OU
dessa modalidade. Uma tabela de freqiiencias e uma tabela onde se procura
fazer corresponder os valores observados da variavel em estudo e as respectivas
freqiiencias. A tabela de freqiiencias proporciona uma apresentayao estetica
mente mais vantajosa dos dados, facilitando ainda a verificayao do comporta
rriento do fenomeno. E possivel, por outro lado, com a utilizayao de uma
tabela de freqiiencias, a obtenyao de estatisticas (medidas) com menos
calculo, e, conseqiientemente, em menos tempo do que se esse trabalho fosse
realizado a partir dos dados brutos.
As tabelas de freqiiencias podem representar tanto valores individuais
como valores agrupados em classes.
2.3.1. Distribui�ao de Frequencias de Dados Tabulados
Niio-Agrupados em Classes
Utilizando OS dados da Tabela 2.3, e possivel construir uma tabela de
D
8
1
4
2
freqiiencias de valores nao-agrupados em classe, ou seja, uma tabela onde os 51
52
valores da variavel aparecem individualmente. Este tipo de apresentayliO e
utilizado para representar uma variavel discreta ou descontinua. 0 exemplo
e dado pela Tabela 2.4.
TABELA 2.4 - EMPRESA X
NumeroMensal de Aparelhos Defeituosos
Numero de
Contagem ou Numero de
j Aparelhos com
Defeito fxjJ
Tabula�o Meses ffj)
1 I 0 r I 2 I I
2 I 1 n I 3
3 I 2 0 I 4
I
ISi
I
4 I 3 I 5
5 I 4 ISi r I 7
6 I
5 ISi n I
8 I I
7 I 6 ISi 0 I 9
8 I 7 0 I 4
9
I
8 n
I
I I 3
10 I 9 r I 2
11 I 10 I I
1
I I
11
I fj = 48
j=I
Na primeira coluna, encabeyad� pelo fndice j, aparecem os numeros
correspondentes a ordem dos valores da variavel. 0 indice j sera utilizado,
neste livro, sempre que se estiver trabalhando com tabelas de frequencias
(dados tabulados). Para operar - com os dados brutos, usar-se-a o indice i.
Na segunda coluna, encabeyada por Xj, sao anotados os valores da
variavel.
A terceira coluna e uma coluna auxiliar, utilizada para que se possa
processar a contagem dos valores repetidos, sem grande esforyo.
A ultima coluna, encabeyada por fj, apresenta as freqiiencias, que sao
os resultados numericos provenientes da contagem. A soma das freqiiencias
e sempre igual ao numero total de valores observados:
�
�
k e 0 extremo superior do intervalo de valores do indice j.
fj e 0 numero de observayoes de um valor
Ne o numero total de valores observados
(1)
Normalmente, depois de construida, a tabela apresentara apenas as
colunas encabeyadas por Xj e f;.
2.3.2. Distribui\:io de FrequAncias de Dados Agrupados em Classes
Muitas vezes, mesmo com o risco de se sacrificar algum detalhe mani- .
festado na ordenayao de valores individuais, ha vantagem em resumir os dados
originais em uma distribuiyao de freqiiencias, onde os valores observados nao
mais aparecerao individualmente, mas agrupados em classes.
Quando a variavel objeto do estudo for continua, sera sempre conve
niente agrupar os valores observados em classes. Se, por outto lado, a variavel
for discreta e o numero de valores representativos dessa variavel for muito
grande, recomenda-se o agrupamento dos dados em classes. Neste ultimo
caso, o procedimento visa a evitar certos inconvenientes, como:
a. grande extensao da tabela, dificultando, tanto quantci os dados brutps, a
leitura e a interpreta�o dos resultados apurados.
b. Aparecimento de diversos valores da variavel com freqiiencia nula.
c. lmpossibilidade ou dificuldade de visualizar;ao do comportamento do
fenomeno como um todo, bem como de sua variar;ao.
Um teste de estatistica, contendo 100 perguntas do ti po certo-errado,
foi aplicado em uma tunna de 500 estudantes. A Tabela 2.5 apresenta os
resultados do teste.
TABELA 2.5
Resultados do Teste de Estatlstica
Classes Freqiiiincias
Notas fj
01--10 5
10.f--20 15
201--30 20
301--40 45
401--50 100
501--60 130
601--70 100
701--80 60
801--90 15
901--100 10
10
I fj = 500
j=l
53
54
Para a constru9ao dessa tabela, nao ha necessidade de se ordenarem os
valores originais. Pode-se partir diretamente da lista de dados brutos. E facil
ver, por outro lado, que, na distribui9ao de freqilencias de valores agrupados
em classes, nao figuram mais os valores exatos de cada item em particular.
Nao e possivel, da mesma forma, obter diretamente da tabela o valor exato
dos itens mais alto e mais baixo. Apesar disso, a tabela informa, de imediato,
a tendencia de a serie se concentrar em torno de um valor central, alem de
proporcionar uma visao panoramica do comportamento da variavel, o que
seria impossivel de se fazer a partir da lista dos dados brutos.
0 simbolo f--- indica inclusao na classe do valor situado a sua
esquerda e exclusao do valor situado a sua direita. Assim, na Tabela 2.5 a
primeira classe (Ol---10) congrega valores de 0 (zero), inclusive, ate 10,
exclusive.
Ha outros simbolos para representar o intervalo de classe:
0 --l 10: A classe cornpreende valores de 0, exclusive, ate 10, inclusive.
0 -- 10: A classe cornpreende valores de 0, exclusive, ate 10, exclusive.
0 f---i 10: A classe cornpreende valores de 0, inclusive, ate 10, inclusive.
2.4. ELEMENTOS DE UMA DISTRIBUICAO DE FREQUENCIAS
Para construir uma tabela de freqilencias, e necessario conhecer alguns
termos pr6prios e de uso corrente, bem como o procedimento tecnico mais
adequado. Esses termos serao listados a seguir.
2.4.1. Frequencia Simples Absoluta
A freqilencia simples absoluta de uma classe ou de um valor individual
e o numero de o'bserva9oes correspondentes a essa classe ou a esse valor. A
freqilencia simples absoluta, OU simplesmente freqilencia, e sirnbolizada por
fj. Na Tabela 5:
!1 =
5
!2 = 15
f3 = 20
!10 10
2.4.2. Amplitude Total: Ar
A amplitude total OU intervalo total e a diferen9a entre 0 maior e 0
menor valor observado da variavel em estudo. Se, por exemplo, no teste que
deu origem a Tabela 2.5, a maior nota tivesse sido 97 e a menor 1, a ampli
tude total do conjunto de valores observados seria:
Ar = 97 - 1 = 96
A amplitude total do exemplo da Tabela 2.1, por outro lado, sera:
At = 158 - 8 = 150
2.4.3. Classe
Classe de freqiiencia, OU, simplesmente, classe, e cada um dos grupos
de valores em que se subdivide a amplitude total do conjunto de valores
observados da variavel.
Uma determinada classe pode ser identificada por seus extremos ou
pcla ordem em que ela se encontra na tabela (valor do indice j). Na Tabela 2.5:
Classe 0 I--- 10
Classe 80 I-- 90
ou primeira classe (j = 1)
ou nona classe (j = 9)
0 numero de classes, em uma distribuic;:ao de freqiiencias, e represen
tado por k. E importante que a distribuic;:ao conte com um numero adequado
de classes. Se esse numero for escasso, os dados originais ficarao tao compri
midos que pouca inforrnac;:ao se podera extrair da tabela. Se, por outro lado,
forem utilizadas muitas classes, havera algumas com freqiiencia nula ou muito
pequena, e 0 resultado sera uma distribuic;:ao irregular e prejudiciat a inter
pretac;:ao do fenomeno como um todo.
Para determinar o numero de classes ha diversos metodos. A regra de
Sturges, um dos metodos, estabelece que o numero de classes e igual a:
I k= 1+3,3 log10N I
k = numero de classes
N = numero total de observa�0es
Exemplo:
a) Se 0 numero de observac;:oes for 500:
N = 500
k = 1 + 3,3 log 500
log 500 = 2,69897
k = 1 + (3,3 x 2,69897) = 1 + 8,906601
k = 9,906601 ou, arredondando,
k = 10
b) Se N = 50
k = 1 + 3,3 log 50
k = 1 + (3,3 x 1,69897) = 1 + 5,606601 = 6,606601
k .. 7
(2)
Esses dois exemplos revelam um dos inconvenientes resultantes da apli
cac;:ao da formula de Sturges, que e o de propor um numero demasiado de
classes para um numero pequeno de observac;:oes e relativarnente poucas
classes, quando o total de observac;:oes for grande. 55
56
Truman L. Kelley, em The Grouping Data for Graphic Portrayal, sugere
os seguintes numeros de classes, com base no numero total de observayoes,
para efeito de representayao grafica:
5 10 25 50 100 200 500 1.000
2 4 6 8 10 12 15 15
Mesmo conhecendo esses e outros criterios de determina�ao do numero
de classes, o analista devera ter em mente que a escolha dependera antes da
natureza dos dados e da unidade de medida em que eles forem expressos do
que de regras muitas vezes arbitrarias e pouco flexiveis.
2.4.4. Limites de Classes
a) Limite Superior e Limite Inferior
Os limites de classe sao seus valores extremos. A segunda classe do
exemplo da Tabela 2.5 tern como limites os valores 10 e 20. 0 valor 10 e
denominado limite inferior ou limite minimo de classe, enquanto o valor 20
e den�minado limite superior.
Os valores 0 e 100, por representarem, respectivamente, o limite
inferior da primeira classe e 0 superior da ultima, sao tambem denominados
limite inferior e limite superior da distribui�o.
Para a construyao de uma tabela de freqilencias e muito importante a
escolha dos limites das classes, de forma que seus pontos medios (item 2.4.6)
coincidam, tanto quanto possivel, com a concentra�ao dos valores reais. Alem
disso, e recomendavel que os limites de classe sejam representados porn(1meros inteiros. Por outro lado, ao estabelecer os limites de classe, deve-se
ter cuidado para evitar interpreta�oes ambiguas. Por exemplo, os limites:
30
40
50
Cruzeiros
40
50
60
Eles nao sao claros, em virtude de nao se saber em que classe devem
ser incluidos os valores 40 e 50. Se os valores originais estiverem arredon
dados para inteiros, sera correto escrever:
Cruzeiros
30 a 39
40 a 49
50 a 59
Entretanto, se os valores originais aparecerem com precisao ate centavos,
esses lirnites nao serao claros. Utilizando essa ultima representa9ao, nao se
teria certeza quanto a em que classe se deveriam incluir valores tais como
39,4, 39,8, 49,7 etc. 0 problema estaria solucionado se os limites fossem
escritos da seguinte rnaneira:
30,00
40,00
50,00
Cruzeiros
a
a
a
39,99
49,99
59,99
Entretanto, esse terceiro tipo de distribui�o nao e muito aceito, em
virtude de problernas de ordem estetica.
Para evitar os inconvenientes apresentados pelas tres formas auteriores
de apresenta9ao de dados em tabelas de freqiiencias, alguns autores sugerem
a seguinte representa�o:
Cruzeiros
30 1----------- 40
40 50
50 60
ficando subentendido que na primeira classe devem estar inclufdos os valores
rnaiores ou iguais a 30 ate valores que sejam menores que 40, e assim
sucessivamente.
Se o leitor tiver que trabalhar com uma tabela que ja esteja montada
e onde OS }imites de classe estejam expressos de forma diferente a sugerida
por esse livro, sera conveniente conhecer a no�o de limites reais de classe.
b) Limites Reais de C/asse
Considere a Tabela 2.6, em que se exemplifica urna distribui9ao de
freqiiencias.
TABELA 2.6
Classes fj
2,50 a 2,59 1
2,60 a 2,69 2
2,70 a 2,79 7
2,80 a 2,89 4
2,90 a 2,99 2
16 57
58
A primeira classe, cujos limites sao 2,50 e 2,59, congregaria, na reali
dade, valores compreendidos no intervalo de 2,495 a 2,595. Esses limites sao
denominados limites reais de classe. Na pratica, os limites reais sao obtidos
pela media aritmetica entre o limite superior de urna classe e o limite inferior
de classe seguinte. 0 limite superior real da primeira classe sera, entao:
2,59 + 2,60
= 2 595
2
,
c) Limites niio Definidos
Urna classe com limite indefinido OU aberto e aquela que inclui todos
os valores da variavel menores que um certo limite superior especificado, ou
maiores que um limite inferior especificado.
TABELA 2.7
Acionistas da G.L.T. S.A. - Componentes Eletronicos
Numero de Bfoes
1 a 99
100 a 499
500 a 999
1 000 a 9 999
10 000 OU ma is
TOTAL
Acionistes
fj (1.000)
20
70
50
45
5
190
A utilizac;:ao desse expediente prejudica a representac;:ao e analise dos
dados. Nao se sabe, na realidade, se a media de ac;:oes possuidas pelos 5 000
acionistas com 10.000 ou mais a90es e um numero muito pr6ximo ou muito
afastado desse limite inferior. Nao e possivel, por conseguinte, utilizar a
tabela po.ra calcul�s em que se requeira grande exatidao, como, por exemplo,
para estirnar a media de ac;:oes por acionista.
2.4.5. Amplitude do lntervalo de Classe
A amplitude do intervalo de classe ou simplesmente intervalo de classe
e o comprimento da classe, sendo geralmente definida como a diferenc;:a entre
seus limites superior e inferior. Essa definic;:ao nlio e evidentemente geral, urna
vez que, se for utilizada para calcular o intervalo de classe, qualquer uma
das formas de representac;:ao das classes anteriormente propostas podera
conduzir a intervalos diferentes.
Para determinar, entao, a amplitude do intervalo de classe, deve-se
tomar a diferenc;:a entre dois limites inferiores ou entre dois limites superiores
sucessivos de classe. Esse procedimento e verdadeiro sempre que as classes
tiverem a mesrna amplitude.
No exemplo da Tabela 2.6, tem-se:
a) Amplitude do intervalo de classe obtida pela diferenl(a entre dois limites
superiores sucessivos:
2,69 - 2,59 = 0,10
A amplitude do intervalo da segunda classe e igual a 0,10.
b) Amplitude do intervalo de classe obtida pela diferen�a entre dois limitcs
inferiores sucessivos:
2,70 - 2,60 = 0,10
que e a amplitude do intervalo da segunda classe.
Se a amplitude da segunda classe fosse determinada, para esses limites,'
de acordo com a primeira defini9ao, resultaria em um valor diferente do'
obtido pelo ultimo criterio:
2,69 - 2,60 = 0,09 * 0,10
Se as classes forem representadas como sugerido na Tabela 2.6, a ampli
tude de classe, estabelecida conforme a primeira defirri9ao, somente coincidira
com a calculada de acordo com a segunda quando sua determina9ao for
efetuada a partir dos limites reais de classe. Assim, a amplitude do intervalo
da segunda classe ficara:
2,695 - 2,595 = 0,10
E recomendavel construir tabelas onde os intervalos de classe sejam
iguais. Evitam-se, assim, equivocos na interpreta9ao da varia9ao do fenomeno.
Entretanto, a adoyao desse procedimento pode, em certas ocasioes, resultar
em uma distribuiyao de freqiiencias muito deformada, o que nao acontece
se as amplitudes forem desiguais. Quando, por um motivo qualquer, tecnico
ou estetico, os intervalos tiverem amplitudes desiguais, a nova amplitude
devera ser um multiplo da primitiva, preferencialmente 0 dobro, 0 quintuplo
e o decuplo.
2.4.6. Ponto Medio de Classe - xi -
0 ponto medio OU valor medio de classe e 0 valor que a representa,
para efeito de calculo de certas medidas. Na distribuiyao de freqiiencias com
valores agrupados em classes, considera-se que os resultados incluidos em
cada classe distribuem-se uniformemente por seu intervalo. Por essa razlio, a
escolha do ponto medio para representar todos OS valores de uma classe e 0
procedimento mais coerente, uma vez que esse ponto, por suas caracteristicas,
deve ser eqiiidistante dos limites de classe.
Para obter o ponto medio de uma classe, basta acrescentar ao seu limite
inferior a metade da amplitude do intervalo de classe. Esse procedimento
podc ser adotado, qualquer que seja a representa9ao tabular escolhida. Assim,
por exemplo, o ponto medio da primeira classe da distribni9ao da Tabela 2.7
sera determinado como segue:
Primeira classe: 2,50 a 2,59
Amplitude do intervalo: 0,10
Metade da amplitude: 0,05 59
0 ponto medio da primeira classe seni, entao:
X1 = 2,50 + 0,05 = 2,55
Para obter os pontos medios das classes seguintes, basta acrescentar ao
ponto medio da classe precedente a amplitude do intervalo de classe (se for
constante), como indicamos na Tabela 2.8.
Quando as classes forem representadas conforme aparece na Tabela 2.5,
ou seja, quando o limite superior de uma classe for igual ao inferior da
seguinte, 0 ponto medio podera ser calculado atraves da media aritmetica dos
limites do intervalo. Assim sendo, o ponto medio da primeira classe sera:
Primeira classe: 0 f---10
Xl -
- 0 + 10 -- 5 Ponto medio:
2
TABELA 2.8
'i
Ponto mt!!dio Classe Xj
2,50 a 2,59 1 2,55
2,60 a 2,69 2 2,55 + 0,10 = 2,65
2,70 a 2,79 7 2,65 + 0,10 = 2,75
2,80 a 2,89 4 2,75 + 0,10 = 2,85
2,90 a 2,99 2 2,85 + 0,10 = 2,95
16
2.5. TIPOS DE FREOUENCIAS
Uma tabela de freqiiencias pode representar e caracterizar um dos
seguintes tipos de freqiiencias:
- Freqiiencia Simples
-- Freqiiencia Acumulada
a) Freqii.encia Simples Absoluta
60 Simbolo: f;
{ Absoluta
Relativa
"Abaixo de"
(crescente)
"Acima de"
( decrescente)
{ Absoluta
Relativa
{ Absoluta
Relativa
2.5.1. Freqiiencias Simples
A freqilencia simples absoluta e o numero de repeti9oes de um valor
individual ou de uma classe de valores da variavel. Trata-se do caso visto ate
o presefite. A soma das freqilencias simples absolutas em uma tabela e
chamada freqilencia total e corresponde ao numero total de observa9oes.
�
�
(3)
Considerem-se os exemplos dados pelas Tabelas 2.9 e 2.10.
TABELA 2.9 - EMPRESA X
Relatorio de lnsp�io. NCimero de Defeitos por P�a
Numero de Defeitos
Xj
0
1
2
3
4
Numero de Per:as
fj
5
10
18
12
5
Na Tabela2.9, a freqilencia simples absoluta do valor zero e 5, indicando
que esse numero aparece cinco vezes no levantamento efetuado. Ha, portanto,
cinco pe�s com nenhum defeito.
TABELA 2.10
Notas Obtidas por 500 Alunos em um Teste de Estatlstica
Notas Nes correspondentes a esse valor
ou a essa classe. Para obter a freqtiencia absoluta acumulada (acima de), basta
somar a freqtiencia simples absoluta da classe ou do valor individual as
freqi.iencias simples absolutas das classes ou dos valores individuais posteriores. 65
66
TABELA 2.18
Notas Obtidas por 500 Alunos em um Teste de Estatfstica
Notas fj
Fj
"Acima de"
01-- 10 5 500
101-- 20 15 495
201-- 30 20 480
301-- 40 45 460
401-- 50 100 415
501-- 60 130 315
601-- 70 100 185
701-- 80 60 85
801-- 90 15 25
901--100 10 10
500
Considere-se o exemplo da Tabela 2.16. 0 valor F5 = 415 indica que
houve quatrocentos e quinze alunos com notas iguais ou superiores a 40.
b) Frequencia Relativa Acumulada
A freqiiencia relativa acumulada "acima de" classe ou do valor indi
vidual j, exemplificada na Tabela 2.17, e igual a soma da freqiiencia simples
relativa dessa classe ou desse valor com as freqiiencias simples relativas das
classes ou dos valores posteriores. Da mesma forma como no caso anterior,
pode-se obter as freqiiencias relativas acumuladas "acima de" a partir:
TABELA 2.17
Notas Obtidas por 500 Alunos em um Teste de Estatlstica
I Descordo Deacordo I
Notas 'i I frj (%) Fj com o item (a) com o item (b)
I Acimade
I Frj (%) Frj
I Acimade Acimade
Of-- 10 5 : 1 500 100 500/500 = 1 ,00 OU 100%
101-- 20 15 I 3 495 99 495/500 = 0,99 OU 99%
201-- 30 20 I 4 480 96 480/500 = 0,96 OU 96%
301-- 40 45 I 9 460 92 460/500 = 0,92 OU 92%
401-- 50 100 I 20 415 83 415/500 = 0,83 OU 83%
501-- 60 130
I
26 315 63 315/500 = 0,63 OU 63% I
601-- 70 100 I 20 185 37 185/500 = 0,37 OU 37%
701-- 80 60 I 12 85 17 85/500=0,17 OU 17%
801-- 90 15 I 3 25 5 25/500 = 0,05 OU 5%
901--100 10 I 2
I
10 2 10/500 = 0,02 OU 2%
500 I 100
a) da defini�ao de freqilencias acumuladas;
b) da defini�o de freqilencias relativas.
2.6. ROTEIRO PARA A ELABORACAO DE UMA TABELA DEFREOUENCIAS COM DADOS AGRUPADOS EM CLASSES
Para a constru�o de uma tabela de frequencias, e conveniente adotar-se
um roteiro que, embora baseado em criterios relativamente arbitrarios, facilita
e torna mais operacional o trabalho de quern ira montar a tabela. 0 roteiro
proposto consta dos seguintes passos:
a) Lista de dados brutos que pode ou nio ser transformada em rol.
b) Encontrar a amplitude total do conjunto de valores observados.
At=
Maior valor
do conjunto
Menor valor
do conjunto
c) Escolher o numero de classes (k). Alguns autores prop(iem que se escolha
arbitrariamente entre um minimo de cinco e um maximo de vinte classes, ressaltando,
todavia, que, quanto maior o numero de observa¢es, maior devera ser o numero de
classes e vice-versa. No item 2.4.3 desse cap{tulo Coram apresentados dois criterios mais
objetivos para a determina�iio do numero de classes: a formula de Sturges e a tabela
de Kelley, os quais, eventualmente, poderiio ser utilizados pelo leitor.
d) Determinar a amplitude do intervalo de classe. A amplitude do intervalo
de classe sera igual ao quociente entre a amplitude total da serie e 0 numero de classes
escolhido.
At
Amplitude do Intervalo de Classe = k (7)
Muitas vezes, ao efetuar a divisiio acima, pode-se chegar a um resultado nio
muito conveniente, sob o aspecto de montagem das classes. Neste caso, convem arre
dondar o nlimero correspondente a amplitude do intervalo de classe a que se chegou
para um numero mais adequado, que facilite os c8lculos (arredondamento arbi
trario ).
e) Determinar os limites das classes, escolhendo-se, preferencialmente,
numeros inteiros.
O Construir a tabela de freqilencias, conformc sugerido anteriormente.
EXERCiCIOS RESOLVIDOS
2.1. A tabela abaixo representa os salarios pagos a l 00 operarios da empresa
GLT & Cia.
2. l. l . Determinar: F requencias absolu tas acumuladas ( "abaixo de'');
frequencias simples relativas e frequencias relativas acumuladas ("abai
xo e acima de'').
2.1.2. Quantos operarios ganham ate dois salarios mfnimos? 67
68
N'! de salarios Numa caracteristica comum
objeto de estudo.
2.10. 2. Os fenomenos de Massa sao:
a. aqueles em que as caracteristicas observadas niio valem para os indiv{duos;
b. aqueles que niio podem ser definidos por uma simples observa«;lio;
c. aqueles que irlio compor os fenomenos coletivos.
2.10.3. A variavel e discreta quando:
a. dados dois valores reais, podemos encontrar pelo menos um valor entre
eles;
b. a menor diferen11a niio nula entre dois valores dados for finita;
c. dados dois valores reais, a diferen1----
Exportai;:ao efetiva
(acumulada)
/
/
/
J F M A M J J A S O N D
60 000
50 001
40 000
30 000
20 000
10 000
0
trativos, economicos ou de qualquer outra natureza combinam as tres formas
de apresentayao de dados. lsto porque, na pratica, poucas pessoas tern habi
lidade com mimeros, e as que tern dificuldade consultarao, via de regra,
apenas o grafico. Por outro !ado, a maior parte das pessoas nunca examinara
as tabelas estatfsticas, preferindo analisar os graficos e eventualmente
procurar no texto a informayao adicional necessaria.
3.2.3. Uso lndevido dos Graficos
Muitas vezes, o uso indevido dos graficos pode trazer uma ideia falsa
dos dados que estao sendo analisados, chegando mesmo a confundir o leitor.
Vejamos, atraves de um exemplo, como esse fato pode ocorrer. Os tres
graficos apresentados a seguir representam o mesmo fenomeno atravesdo
mesmo grupo de dados. A primeira impressao e a de que OS tres graficos
representam dados nitidamente diferentes.
No Grafico 3.2, as flutua96es das vendas parecem ser moderadas; ja no
Grafico 3.4, tem-se a impressao de que a flutuayao das vendas nao manifesta
praticamente tendencia alguma, exceto leve flutuayao. Trata-se, na realidade,
de um problema de construyao de escalas. Enquanto o Grafico 3.2 se apre
senta com uma escala mais ou menos convencional, os demais revelam pro
pory6es consideravelmente diferentes para as escalas em que foram divididos
os dois eixos.
Examinando superficialmente os tres graficos e nao prestando muita
atenyao as escalas e a outros detalhes tecnicos, o leitor certamente recebera
impressoes diferentes sobre a flutuayao das vendas. 77
GRAFICO 3.2 - VENDAS DO ARTIGO Y G RA FICO 3.3 VEN DAS DO ART I GO Y
4
..
e
·;;; 3
N
2
"
..
"O 2
..
..
>O
.J:.
:E
0
J F M A M J J A S O
1975
..
e
·a;
N
2
"
..
"O
..
..
>O
.J:.
:E
3,0
2,9
2,8
2,7
2,6
2,5
2,4
J M M J S
/ 1975
GRAFICO 3.4 - VENDAS DO ARTIGO Y
..
e
·a;
N
2
"
Cl)
"O
..
"'
>O
.J::.
:E
4
3
2
0
J F M A M J J A s 0
1975
3.2.4. Principais Tipos de Graficos
3.2.4.1. Graficos em Barras (horizontais)
Os graficos em barras tern por finalidade comparar grandezas, por meio
de retiingulos de igual largura e alturas proporcionais as respectivas grandezas.
Cada barra (ou coluna) representa a intensidade de uma modalidade do
78 atributo. 0 Grafico 3.5, em barras, representa as vendas efetuadas pela
empresa V ASIGLASS S.A., fabricante de vasilhas de vidro, conforme os
diferentes tipos desses recipientes, expressando-se as vendas de cada tipo
como percentagem das vendas totais.
As magnitudes das barras sao representadas pelos respectivos compri
mentos e seu trayado e feito tendo-se como referenda uma escala horizontal.
Em geral, as divisoes da escala se prolongam em trayos verticais por todo o
grafico, facilitando assim a leitura do comprimento de cada barra. A identi
ficayao da barra e inscrita a esquerda do grafico.
GRAFICO 3.5 - VASIGLASS S.A.
VENDAS DE VASILHAS, POR TIPO, EXPRESSAS COMO PERCENTAGEM
DAS VENDAS TOTAIS, 1972
TIPOS DE VASILHAS 0 5 10 15 20 25 30 35 40%
Para al imentos (boca I arga)
Farm6cia e cosm8ticos
Utilidade geral
Garrafas de cerveja
Lie ores
Alimentos (boca estreita)
Garrafas de refrigerantes
Vasilhas caseiras
0 5 10 15 20 25 30 35 40%
Ha quatro orientayoes gerais a sercm observadas na construyao de um
grafico em barras horizontais:
a) As barras so diferem em comprimento, e nio em largura, a qual e
arbitraria.
b) As barras devem vir separadas umas das outras pelo mesmo espac;o, o qua!
deve ser suficicnte para que as inscric;oes que identificam as diferentes
barras nao tragam confusiio ao leitor. Como regra pratica pode-se tomar
o espac;o entrc as barras com·o aproxirnadamente a metadc ou dois terc;os
de suas larguras.
c) As barras dcvem ser desenhadas observando sua ordem de grandeza,
para facilitar a leitura e analise comparativa dos valores. Normalmente, a
ordem e decrcscente, a barra superior representando o maior valor. Cate
gorias gerais que costumam vir com inscric;oes do tipo "outros", "demais"
etc. aparecerao representadas na barra inferior, mesmo que seu compri
mento exceda o de alguma outra, uma vez que ela representa o agrupa
rnento de classes relativamente pouco importantes.
d) Um grafico, construldo para mostrar grandezas absolutas, devera ter uma
linha zero claramente definida e uma escala de quantidades ininterrupta, 79
caso contnirio a leitura e a interpretar;iio do gr:ifico poderiio ficar
distorcidas.
Existem outros tipos mais elaborados de graficos em barras. Entre eles
destacam-se tres: o grafico de barras compostas, o graficocostuma-se colocar no topo ou no interior de cada coluna
o valor correspondente a sua altura. Esse procedimento permite eliminar a
escala.
A Tabela 3.1 apresenta a produyao media mensal de carvao betumi
noso efetuada por um certo pafs, no periodo de 1965 a 1972.
Atraves do Grillco 3.9 podemos ver como a Tabela 3.1 ficara reprer
·sentada.
Os graficos em colunas podem aparecer de diversas maneiras, dentre as
quais se destacam tres: graficos em colunas superpostas, graficos de porcen
tagens complementares e graficos em colunas remontadas.
Grtificos em Co/unas Superpostas
0 grafico em colunas superpostas corresponde ao grafico de barras
compostas. Tanto um quanta o outro servem para representar compara
tivamente dois ou mais atributos. 0 Grafico 3.10 apresenta a produ�o de
televisores portateis e de televisores com mais de 20 polegadas da Empresa Y.
GR,\FICO 3.10 - PRODUCAO DE TELEVISORES - EMPRESA Y 1970-1973
3500
3000
2 500
2 000
1 500
1 000
500
0
1970 1971 1972 1973
Grdficos de Porcentagens Complementares
3 500
3000
2 500
2 000
1 500
1 000
500
0
� Maisde20
� Polegadas
llllllD Portateis
0 mesmo fato representado pelo grafico de colunas superpostas pode
ser visto tambem em termos de participa�o percentual de cada tipo de
televisor no total produzido.
Cada coluna do grafico corresponde a 100%, e suas partes componentes
sao obtidas por meio de uma regra de tres simples. Para exemplificar: a
produ�o total de televisores em 1970, cujo valor e igual a altura da primeira
coluna do Grafico 3.10, corresponde a 100%; entao, a produyao de televisores
portateis correspondera, em 1970, a x por cento. Esquematicamente,
2 500 ----- 100%
2000 ----- x
= 2000 x 100
= 800!. x 2 500 10 83
GRAFICO 3.11 - EMPRESA Y - PRODUCAO DE TELEVISORES 1970-1973
84
% %
100 100
80
60
40
20
0
1970 1971 1972
80
60
40
20
0
1973
Mais de 20
Polegadas
lllllllllllll Portateis
Obtem-se a porcentagem do complemento por diferen9a: porcentagem
de televisor es com mais de 20 polegadas: 100 - 80 = 20%. E assim se
procede sucessivamente, ate completar o grafico. /
Grdfico em Colu�s Remontadas
0 grafico em colunas remontadas presta-se aos mesmos prop6sitos que
o grafico em barras agrupadas. Ela permite que as compara9oes entre as
grandezas dos atributos sejam feitas mais facilmente. No Grafico 3.12 estao
representadas as vendas da empresa Y, discriminadas de acordo com o fa to de
as vendas serem destinadas ao mercado externo ou ao interno.
GRAFICO 3.12 - VENDAS DA EMPRESA Y
VENDAS INTERNAS X VENDAS PARA 0 EXTERIOR - 1968-1972
Vendas
(1.000 cruzeiros)
700
600
500
400
300
200
100
0
1969 1970 1971
Vendas
(1.000 cruzeiros)
700
600
500
400
300
200
100
0
1972
lllllllll
Vendas
lnternas
Vendas ao
Exterior
3.2.4.3. Graficos Pict6ricos (Pictogramas)
Os graficos pict6ricos ou pictogramas sao construi'dos a partir de fi
guras ou conjunto de figuras representativas da intensidade ouos
valores de cada segmento como percentagens do total, trayando-se o grafico 87
88
GRAFICO 3.16 - PRODUCAO BRASILEIRA OE CAMINH0ES PESADOS
PERiODO 1962-1966
30 000
20 000
10 000
0
1962 1963 1964 1965 �966
GRAFICO 3.17 - PRODUCAO ACUMULADA DE CAMINHCES PESADOS
BRASIL - 1962-1966
140
120
100
80
60
40
20
0
1962 1963 1964 1965 1966
correspondente a partir dai. A largura das faixas de cada segmento fornecera
a respectiva participac;ao percentual na producrao de caminhoes.
Para esclarecer melhor o calculo das porcentagens (participas;ao percen-
tual de cada segmento ), e apresentado a seguir 0 calculo da participas;ao
GRAFICO 3.18 - PRODUCAO BRASILEIRA DE CAMINHOES PESADOS
PARTICIPACAO PERCENTUAL DE CADA SEGMENTO - 1962-1966
%
80
60
40
20
0
1962 1963 1964 1965 1966
percentual do segmento Diesel na producrao de caminhoes pesados no
ano de 1963:
Produ\(ao do ano (segmento Diesel). . . . . . . . . . . . . . . . . . . 8 096
Produ\(ao do ano (segmento Gasolina) . . . . . . . .... . . . . . . 15 928
Produ¢o total do ano (gasolina mais Diesel) .. . . . . . . . . . 24 024
A participacrao percentual do segmento Diesel e determinada por meio
de urna regra de tres simples, lembrando que a producrao total do ano
representara 100%. 0 clilculo ficara:
24 024 ----- 100%
8096 ----- x
8 096 x 100
x =
24 024
= 33'73
Portanto, a participas;ao percentual do segmento Diesel na producrao
do ano de 1963 foi da ordem de 33,7%. A participac;ao percentual do
segmento gasolina podera ser obtida por diferen\:a: 100,0%- 33,7% = 66,3%.
Da mesrna forma procede-se para os outros anos., ate completar a tabela. 89
90
3.2.4.6. Graficos em Setores
Os gnificos em setores ou setogramas sao usados para representar
valores absolutos ou porcentagens complementares. Desta forma, a repre
senta?o de porcentagens complementares pode ser feita atraves de diferentes
tipos de giaficos:
a) Graficos em Setores
b) Grwcos em Barras Compostas
c) Grwcos em Colunas (porcentagens complementares)
d) Grwcos em Faixas Complementares
0 grafico em setores tambem e conhecido coma gr:ifico circular ou
cartograma em setores. Para construi-lo, parte-se do fato de que o nfunero
total cie graus de um area de circunferencia e 360. Assim, o riumero total
de valores analisados (100%, se quisermos representar as porcentagens com
plementares) correspondera a 360°. Cada uma das parcelas componentes do
total dos valores podera, entao, ser expressa em graus, e a correspondencia
se fara atraves de uma regra de tres simples. Exemplificando:
TABELA 3.3
PRODUCAO AGRICOLA DO ESTADO A - ALGUNS PRODUTOS
1972
��������������������� /
Produtos Ousntidade (t)
Caf6 ............ .
A�ucar ........... .
Milho . . . . . . • . . . . . •
Feijao ........... .
Total ........ .
Fonte: X (dados fictfcios)
400 000
200 000
100 000
20 000
720 000
Constr6i-se preliminarmente uma nova tabela (como a de numero 3.4),
da qual constem os elementos necessarios a constru�iio dos graficos, ou seja,
OS angulos representatiVOS dos valores (OU porcentagens) individuais de cada
produto.
0 calculo dos angulos oorrespondentes as quantidades exportadas e
desenvolvido a partir da informa�lio relativa a exporta?o total, 720 000
toneladas, a qual devera representar 360°:
Cdlculo do Setor Co"espondente ao Cafe
720 000 ---- 360°
400 000 ----
0
x
TABELA 3.4
Produtos Quantidade ft) Angulos correspondentes (Graus) %
Caf� . . . . - ... . . . . 400 000 200 55,5
Ac,:ucar . . . . . . . . . . 200 000 100 27,8
Milho . . . . . . . . . . . 100 000 50 13,9
Feijao ........... 20 000 10 2,8
Total . . . . . . . . . . . 720 000 360° 100,0
= 400 000 x 360
= 2000 x
720 000
Calculo do Setor Correspondente ao Af!Lcar
720 000 ----- 360°
200 000 ----
�o
200 000 x 360
= 1000 x =
720 000
Calculo do Setor Correspondente ao Mi/ho
720 000 ---- 360°
100 000 ----
0 x
100 000 x 360 = 500 x =
720 000
C124
8 4.2.3. Media harmonica, 132
4.2.4. Media quadratics, 138
4.3. Moda, 143
4.3.1. Determinac;:iio da moda de valores niio-tabulados, 143
4.3.2. Determinac;:iio da moda para valores tabulados, 144
4.4. Medians, 152
4.4.1. Determinac;:iio da mediana de valores niio-tabulados, 152
4. 4. 2. Determinac;:iio da mediana de valores tabulados niio-agr.up�os
em classes, 154
4. 4. 3. Determinac;:iio da mediana de valores tabulados agrupados 'em
classes, 157
4.5. Considerac;:oes adicionais sobre a media aritmetica, a moda
e a mediana, 164
4.5.1. Relac;:iio empfrica entre a media, a moda e a mediana, 164
4.5.2. Caracterfsticas da media, da medians e da moda, 166
4.6. Ouartis - decis - percentis (ou centis), 169
4.6.1. Ouartis, 169
4.6.2. Decis, 170
4.6.3. Percentis ou centls, 171
5 - MEDIDAS DE DISPERSAO, 181
5.1. lntrodur;iio, 181
5.2. Medidas de dispersiio absoluta, 182
5.2.1. Amplitude total ou intervalo total, 182
5.2.2. Desvio quartil ou amplitude semi-interquartilica, 184
5.2.3. Desvio medio, 183
5.2.4. Desvio-padriio, 191
5.2.5. Variiincia, 210
5.3. Medidas de dispersiio relativa, 219
5.3.1. Desvio quartil reduzido, 219
5.3.2. Coeflciente de variar;io, 220
6 - MEDIDAS DE ASSIMETRIA E CURTOSE, 227
6. 1 . lntrodur;iio, 227
6. 2. Momentos, 227
6.2.1. Momento natural (absoluto) de ordem r, 227
6. 2. 2. Momento de ordem r em relac;:iio a uma origem qualquer x , 230
6.2.3. Momento centrado na media de ordem r, 232
6.2.4. Relar;iio geral entre os momentos centrados na media e os
momentos naturals, 235
6.2.5. Relac;:iio entre momentos centrados na media e momentos
centrados em uma origem arbitraria, x , 237
6.2.6. Processo breve para o calculo dos momentos, 241
6. 2. 7. Controle de Charlier e correc;:iio de Sheppard para os
momentos, 246
6. 3. Medidas de assimetria ou de enviesamento, 249
6.3.1. Metodo de comparac;:iio entre medidas de tendencia central, 251
6.3.2. Coeficiente de Pearson, 253 9
6.3.3. Coeficiente quartil de assimetria, 256
6.3.4. Coeficiente de assimetria entre os percentis 10 e 90, 257
6. 3. 5. Coeficiente momenta de assimetria, 259
6.4. Medidas de curtose, 260
6.4.1. Coeficiente percentilico de curtose, 261
6. 4. 2. Coeficiente momenta de curtose, 263
7 - NOMEROS..fNDICES, 311
7. 1. lntroducao, 311
7.2. Conceito de relative, :312
7.2.1. Relative (relacao) de preco (p, t), 312
7.2.2. Relative (relacao) de quantidade (q , t), 313
7.2.3. Relative (relai;:oes) de valor (v , t), 316
7. 3. Criterios (testes) de avaliacao de adequai;:ao da f6rmula de um
indice, 317
7.3.1. ldentidade, 317
7.3.2. Reversao (inversao) do tempo, 318
7.3.3. Circular, 319
7 .3.4. Decomposicao das causas (inversao dos fatores), 320
7. 4. Elos de relative e relative em cadeia, 321
7. 5. Empregos de medias simples e ind ice agregativo simples, .323
7. 5. 1 . Media aritmetica simples de relatives, 323
7. 5. 2. Media harmonica simples de relatives, 324
7. 5. 3. Media geometrica simples de relatives, 325
7. 5. 4. fndice agregativo simples (ind ice de Bradstreet), 331
7. 5. 5. Restrii;:oes ao emprego de indices simples, 333
7. 6. Emprego de indices agregativos ponderados, 342
7. 6. 1 . fndice de laspeyres OU metodo da epoca-basica, 342
7.6.2. fndice de Paasche OU metodo da epoca atual, 344
7. 6. 3. fndice de Fischer (ind ice ideal), 345
7.6.4. fndice de Marshall-Edgeworth, 346
7.6.5. fndice de Drobish, 347
7. 6. 6. fndice de Divisa, 348
7. 6. 7. F6rmulas modificadas, 348
7. 7. Construi;:ao de series de numeros-indices - mudani;:a de base, 355
7. 7. 1 . Base fixa, 356
7. 7. 2. Base m6vel encadeada, 356
7. 7. 3. Vantagens e desvantagens dos metodos, 358
7.7.4. Mudani;:a de base na pratica - metodo abreviado, 358
7. 7. 5. Conjugai;:ao de duas ou mais series de numeros-indices
em uma s6, 359
7. 8. Conceito de deflater e de poder aquisitivo, 360
7.8.1. Deflater, 360
7. 8. 2. Poder aquisitivo, 363
7. 9. Taxa real ou taxa deflacionada, 365
7 .10. Alguns indices especiais, 366
10 7.10.1. fndice de Preco por Atacado - IPA, 366
,.
7.10.2. Iodice Geral de Precos - I GP, 373
7.10.3. Deflator lmplicito de Preco e Iodice de Quantum, 375
7.10.4. Iodice Relacao de Trocas, 379
7.10.5. Iodice da Capacidade de lmportar, 379
7.10.6. Iodice de Precos aoConsumidor - ICV - (Iodice do Custo
de Vida), 382
7 .10. 7. Iodice de Correcao Monetaria - Obrigacoes Reajustaveis do
Tesauro Nacional, 385
7. 11 . Exercfcios propostos, 388
8 - CORRELACAO E REGRESSAO, 412
8.1. Relacao entre variaveis, 412
8.2. Correlacao linear simples, 412
8.2.1. Medida de correlacao, 412
8.2.2. Correlacao linear positiva, 413
8.2.3. Correlacao linear perfeita positiva, 413
8.2.4. Correlacao negative, 414
8.2.5. Correlacao perfeita negativa, 414
8.2.6. Correlacao nula, 415
8.2.7. Correlacao espuria, 416
8.2.8. Calculo pratico do coeficiente de correlacao linear, 416
8.2.9. Exercicios propostos, 418
8.2.10. Correlacao ordinal, 419
8. 2. 11 . Exercicios complementares, 423
8. 3. Analise de regressao, 424
8.3.1. Regressao linear simples, 424
8.3.2. 0 poder explicativo do modelo, 430
8.3.3. Regressao linear por transformacao, 434
8.3.4. Exercicios complementares, 445
8.3.5. Regressao polinomial - ajuste por parabola, 449
8.3.6. Exercicios propostos, 454
Referinclas Blbllogr6ficas, 459
11
Introdufiio Geral a
Compreensiio da Estatistica
1.1. CONSIDERACOES GERAIS
A utilizayao da Estatistica e cada vez mais acentuada em qualquer ati·
vidade profissional da vida moderna. Nos seus mais diversificados ramos de
atuayao, as pessoas estao freqiientemente expostas a Estatistica, utilizando-a
com maior ou menor intensidade. lsto se deve as multiplas aplicayoes que o
metodo estatistico proporciona aqueles que dele necessitam.
Apesar disso, existem muitas concepyOeS erroneas acerca da natureza
desta disciplina. A ideia que um leigo possa fazer da Estatistica difere em
muito da de um profissional. E comum, por exemplo, as pessoas formai:em
conceitos distorcidos a respeito de um estatistico profissional. Para alguns,
trata-se de um individuo que tern a capacidade de manipular numeros para
demonstrar seus pontos de vista. Alguns estudantes, por outro lado, tendem
a admiti-lo como alguem que, auxiliado por sua calculadora, tern a faculdade
de converter qualquer assunto em um estudo "cientifico". Toda essa aura
criada em torno da disciplina tern provocado, em estudantes e profissionais,
uma dupla atitude: de apreensao, quanta a dificuldade de absoryao de seu
conteudo, e de expectativa, quanto a sua potencialidade como instrumento
auxiliar de resoluyao de problemas. Por essa razao, e extremamente dificil
apresentar uma definiyao de Estatistica, alem do que muitos de seus
conceitos fundamentais nao apresentam uma definiyao explicita, ou, se a
apresentam, esta nao se revela suficientemente clara para dar uma ideia defi
nitiva de seu significado.
E possivel distinguir duas concepyaes para a palavra ESTAT(STICA:
a) No plural (estat{sticas), indica qualquer cole�o consistente de dados
numericos, reunidos com a finalidade de fornecer informa,.oes acerca de
uma atividade qualquer. Assim, por exemplo, as estat{sticas demogiaficas
referem-se aos dados numerioos sobre nascimentos, falecimentos, matri-
m0nios, desquites etc .. As estatlsticas economicas consistem em dados 13
14
numericos relacionados com emprego, produ�iio, pre�s, vendas e com
outras atividades ligadas aos varios setores da vida economica.
b) No singular, indica a atividade humana especializada ou um corpo rinci
palmente a um conjuntopor exemplo, o custo de produ¢o de um artigo como a
soma dos seguintes custos parciais: materia-prima, mao-de-obra e diversos, o
94 grafico triangular e muito util.
100
GRAFICO 3.23
Ao tomar o ponto A no interior do triangulo, por exemplo, e necessario
que sua leitura seja feita nas tres escalas: as escalas que fornecerao a partici
pai;:lio percentual nos custos de produi;:ao, da materia-prima, da mlio-de-obra
e de diversos. A partir do ponto em questao, trayam-se paralelas aos eixos
das escalas ate o lado oposto aos vertices (linhas continuas ). Para determinar
a participaylio percentual de cada atributo, bastara efetuar a leitura do
comprimento dessas paralelas, na escala correspondente.
3.2.4.10. Graficos Representativos de Distribui9oes de Frequencias
Os graficos usados para a representayao de distribuiy6es de freqiiencias
simples e acumuladas slio graficos tipicamente de analise. A representaylio
das freqiiencias simples e feita atraves do histograma OU do polfgono de.
freqiiencias, enquanto as freqiiencias acumuladas slio representadas pelo poli
gono de freqiiencias acumuladas ou ogiva de Galton.
a) Histogramas
0 histograma e um grafico formado por um conjunto de retangulos
justapostos, de forma que a area de cada retangulo seja proporcional a
freqiiencia da classe que ele representa. Assim sendo, a soma dos valores
correspondentes as areas dos retangulos sera sempre igual a freqiiencia total.
0 histograma e construido tomando-se como referencia dois eixos
coordenados. No eixo horizontal, ou eixo das abscissas, slio anotados os. 95
valores individuais da variavel em estudo, ou os limites das classes. Por
conseguintc, a dimensao horizontal de cada retiingulo representara a classe.
No eixo vertical, ou eixo das ordenadas, sera construida a escala onde serao
lidos os valores relativos ao numero de observa�es ou freqiiencias da classe.
A area de cada retiingulo do histograma corresponde a freqiiencia da classe
que o retiingulo representa. Para determinar a altura do retangulo, basta
tomar a formula de calculo da area de um retiingulo:
I S=bX h I
onde: b = base do retiingulo = amplitude do intervalo de classe
h = altura do retiingulo
s = area do retiingulo = freqiiencia da classe
(1)
Para tra9de
ate 80.000 d6lares. Se o interesse recair na porcentagem de empresas com
ate 80.000 d6lares exportado, a leitura se fara na escala das freqiiencia�
relativas acumuladas. 0 resultado sera 48,5%.
GRAFICO 3.29 - REPRESENTACAO DAS FREQU�NCIAS ACUMULADAS "ACIMA DE"
70
60
50
40
30
20
17 ---
10
100
90
80
70
60
50
40
lQ- 26%
20
10 Volume
0 .L._.,_....L_--L_---1. _ __,1 __ L__J..__-=:::;;;;.i.._.J.+. 0 Exportado
50 60 70 80 90 100 110 120 (US$ 1000)
Para saber, por exemplo, o numero (ou a porcentagem) de empresas
com volume de exportayao superior a 90.000 d6lares, basta fazer, no
grafico, a correspondencia entre essa quantia e a freqiiencia acumulada,
absoluta ou relativa. Os valores correspondentes serao:
Fj = 17: ha dezessete empresas com um volume de exportayao igual ou
superior a 90.000 d6lares.
Fri
= 0,26 ou 26%: vinte e seis por .cento das empresas analisadas (dentre
as 65) apresentaram um volume de exportayao igual ou superior a
90.000 d6lares.
e) Grafico em Hastes (Bastiio)
Muitas vezes, o interesse recai na representayao grafica de dados nao
agrupados em classes, o que acontece quando os valores da variavel em
estudo aparecem individualmente. A representayao grafica, neste caso, difere
um pouco daquilo que foi visto ate o presente. 101
Na inspeylio de um lote com 1 000 peyas de precisao, produzidas por
uma empresa fabricante de instrumentos 6ticos, encontraram-se os resul
tados reproduzidos na Tabela 3.9.
Numero de defeitos
0
1
2
3
4
5
TABELA 3.9
NtJmero de PBfBS - fj -
(Freqiiencia do numero de defeitos)
40
120
340
290
160
30
Total 1 000
A representaylio grillca do fenomeno acima podera ser feita atraves
do grafico em hastes ou grafico em bastoes (Grafico 3.30). Poderia, altero
nativamente, ser feita a representaylio atraves de um histograma com bases
unitarias. Neste ultimo caso, as freqiiencias serao numericamente iguais as
alturas dos retangulos do histograma. A f6rmula S = b X h sera aplicada,
agora, da seguinte maneira:
Freqiiencia (S) = Base (J) X Altura (h)
S=JXh=h
s = h I
GRAFICO 3.30
Numero de Pe�as fj
360
-
300
240
180
120 --
60
0 .T
.
0 1 2
102.
--
--
T
3 4 5
frj Porcentagem das
Pe�s
36
30
24
18
12
6
Nl'.lmero de
Defeitos
GRAFICO 3.31
Numero de P�as
fj
360
300
240
180
120
60
0 2 3 4 5
frj (%) Porcentagem
das Pei;:as
. 36
30
24
18
12
6
Numero de
Defeitos
Para estabelecer as bases dos retangulos, a partir dos valores da variavel
(numero de defeitos, no caso), procede-se da seguinte maileira:
1
Seja x; um valor qualquer da variavel. Fazendo-se ix; � 21' teremos
o limite inferior da base do retangulo. Para obter o limite superior basta
somar � a x;: ix; +�I· Procede-se da mesma maneira para todos os valores,
cujas freqiiencias se deseja representar atraves de retangulos.
Observa(:io: Nern sempre as bases dos retangulos serao unitarias.
f) Graficos em Escada
A representa�ao das freqiiencias acumuladas para valores individuais e
feita mediante o uso de um grafico em escada, conforme a figura do Grafico
3.32. A representa�ao das freqiiencias acumuladas com o recurso do poligono
de freqiiencias acumuladas, embora encontrada, nao e rigorosa, raziio por que
nao sera exemplificada.
Os dados que deram origem ao Grafico 3.32 siio os constantes da
Tabela 3.10. 103
GRAFICO 3.32
Numero de Pec;:as
Fj
1 000
900
800
700
600
500
400
300
200
100
I
I
I
___J
I
I
I
I
I
I
I
,------,
I I
I I
I I
I I
I I
I I
I I
I I
r--1 I
I I I
I I I
�
I I
- I I I
.
0 2 3 4
TABELA 3.10
Frj (%)
100
90
80
70
60
50
40
30
20
10
I
5
Freqiiincias acumuladas
Numero de defeitos
Fj Frj (%)
0 40 4
1 180 18
2 520 52
3 810 81
4 970 97
5 1 000 100
g) Exemplos de Curvas de Frequencias
Numero de
Defeitos
As curvas de frequencias (poligono de frequencias polido ), em geral,
apresentam um formato, de certo modo, caracteristico, assemelhando-se ao
contorno de um sino, evidenciando uma forte concentra«;ao dos valores em
104 torno do centro da distribui«;ao.
Mesmo que a semelhan9a com um sino seja muito grande, e bem pro
vavel que, na pratica, a curva apresente uma certa deforma9ao (distor9ao)
para a esquerda ou para a direita. Quanto a esse aspecto, e possivel distinguir
tres configura96es (Veja o Capitulo 6) para as curvas em forma de sino:
GRAFICO 3.33
1. C.ur:va sem Oeform�lo
(Simdtrica>
2. Curva com Deform�
ii Direita
x 0
3. Curva com Oeforma(f:io
8 Esquerda
Outros formatos de curvas de freqiiencias podem scr cncontrados.
Sao apresentados a seguir alguns exemplos:
0
GRAFICO 3.34
1. Curva em Form• de U
(Antimodall
h) A Curva de Lorenz·
x 0
2. Curva em Form1 de J
(Amodal)
x 0
3. Curva em Forma de J
lnvertido (Amodall
A curva de Lorenz e um tipo de grafico usado para representar con
ccntra9lio ou desigualdade de renda de receita, de riquezas etc. Na Tabela
3.11 estao registradas as informa96es relativas ao numero de depositantes de
um banco pequeno, agrupados segundo o volume de dep6sitos e o total
depositado em cada classe: 105
TABELA 3.11
NOMERO DE DEPOSITANTES E VOLUME DE DEPOSITOS DO BANCO X
(VALORES ACUMULADOSI
Numero de Volume de
Va/ores percentuais
Dep6sitos
Menos de
Menos de
Menos de
Menos de
Menos de
Menos de
500
1 000
1 500
2 000
2 500
5 000
Menos de 10 000
Acima de 10 000
Depositantes
(acumulado)
770
980
1 090
1 160
1 200
1 310
1 380
1 410
Dep6sitos na classe
Depositantes Dep6sitos
(acumulado)
% %
102.100 54,6 3.4
255.100 69,5 8,6
388.400 77,3 13,1
505.100 82,3 17,0
609.000 85,1 20,5
1.002.800 92,9 33,7
1.465.000 97,9 49,2
2.976.200 100,0 100,0
Como pode ser observado na tabela acima, 1 310 depositantes foram
responsaveis por um volume de dep6sitos inferiores a 5.000 cruzeiros, com
um volume total de dinheiro depositado da ordem de 1.002.800. Em termos
percentuais, pode-se afirmar que 92,9% dos depositantes foram responsaveis
por apenas 33,7% do volume total depositado. 0 Grafico 3.35 representa
todas as rela�oes percentuais entre o numero de depositantes e o volume
total depositado.
A linha diagonal do gnifico representa completa igualdade. Quanto
mais a curva de Lorenz se afasta da diagonal, maior sera a desigualdade.
Assim, por exemplo, pode-se ler que 54,6 por cento dos depositantes sao
responsaveis por apenas 3,4 por cento dos dep6sitos.
GRAFICO 3.36 - CONCENTRACAO DE DEPOSITOS A VISTA
BANCO X - CURVA DE LORENZ
Porcentagem de
Dep6s;tos
100 �-----------
90
80
70
60
60
40
30
20
10
0 IL-.....-....==;::=;::::::;=---�-_j
10 20 30 40 60 60 70 80 90 100
106�--�------- ----P- o r_c�_• age.:..._m_d_e_De�� -•-io _n�t".:...__....1
Medidas de Posifiio
4.1. INTRODUde
tendencia central ou promedias; as quais sao assim denominadas, em virtude
da tendencia de os dados observados se agruparem em torno desses valores
centrais. A moda, a media aritmetica e a mediana sao as tres medidas de
tendencia central ou promedios mais utilizados para resumir o conjunto de va
lores representativos do fenomeno que se deseja estudar. Outros promedios
menos usados sao a media geometrica, harmonica, quadratica, cilbica e
biquadratica.
4.2.M�DIA
A medida de tendencia central mais comumente usada para descrever
resumidamente uma distribuii;ao de freqiiencias e a media, ou mais propria-
mente, a media aritmetica. Ha varios tipos de medias, os quais serao exami- 107
108
nados a seguir: media aritmetica, media geometrica, media harmonica, media
quadratica, media cubica, media biquadratica. 0 leitor ccrtamente devera
estar mais familiarizado com a media aritmetica, devido a freqiiencia com
que dela se utiliza.
4.2.1. Media Aritmetica
Simbolo: x (le-se "x trayo" ou "x barra").
A media aritmetica de um conjunto de numeros pode ser de dois
tipos: simples ou ponderada.
a) Media Aritmetica Simples
A media aritmetica simples de um conjunto de numeros e igual ao
quociente entre a som� dos valores do conjunto e o numero total de valores.
Suponha que em um escrit6rio · de consultoria a empresar ha cinco
contfnuos que recebem os seguintes salarios mensais: Cr$ 800,00, Cr$ 780,00,
CrS 820,00, Cr$ 810,00 e Cr$ 790,00. A media aritmetica dos salarios
ou o salario medio mensal dos contfnuos desse escrit6rio sera de 800 cruzei
ros, de acordo com a definiyao.
on de
x =
800 + 780 + 820 + 810 + 790
=
4.000
= 800
5 5
Genericamente, podemos escrever:
x; = valor genenco da observaylio
n = numero de observay0es
(1)
A media aritmetica simples sera calculada sempre que os valores nao
estiverem tabulados, ou seja, quando aparecerem representados individual
mente, como e o caso, por exemplo, dos dados brutos. No exemplo acima,
a variavel x representa os salarios dos contfnuos. Conseqiientemente;
Xi = 800
Xz = 780
X3 = 820
X4 = 810
X5 = 790
i = {l , 2, 3, 4, 5}
n = 5
5
Ix;
i=l
5
b) Media Aritmetica Ponderada
A media aritmetica e considerada ponderada quando os valores do
conjunto tiverem pesos diferentes. Tratando-se de media simples, todos OS
valores apresentam igual peso. Obtem-se uma media aritmetica ponderada
atraves do quociente entre o produto dos valores da variavel pelos respectivos
pesos e a soma dos pesos.
Assim, por exemplo, um professor pode realizar quatro provas por
ano em sua materia, atribuindo a cada uma delas os seguintes pesos: 1, 2, 3, 4 .
. Se um aluno tiver recebido as notas 8, 7; 9 e 9, nessa ordem, sua nota
final sera a media aritmetica ponderada 8,5, obtida da seguinte maneira:
M"d. F. l
_ (8 X 1) + (7 X 2) + (9 X 3) + (9 X 4) _
cla ma - 1 +2+3+4 . -
8 + 14 + 27 + 36
= --------
10
85
10= 8,5
O mesmo resultado seria obtido se fossem adotados pesos relativos,
como indicamos na Tabela 4.1.
TABELA 4.1
Provas Pesos relativos Notas Produtos
1�
1
0,1 8 0,8 - =
10
2�
2
0,2 7 1.4 - =
10
3�
3
0,3 9 2,7 =
10
4�
4
0.4 9 3,6 -=
10
Soma dos pesos relatives: 1,0 Media ponderada = 8,G
Soma dos produtos
Quando se usam pesos relativos, o denominador sera sempre igual a
unidade, e a media aritmetica ponderada seni igual a soma dos produtos
dos valores da varravel pelos respectivos pesos relativos. Assim sendo, a
media aritmetica ponderada sera igual a soma dos valores constantes da
ultima coluna da Tabela 4.1.
No exemplo apresentado, os pesos dos valores da variavel sao fixados
previamente, para efeito de calculo. Tratando-se, todavia, de distribuiyoes de
freqiiencias, os pesos dos valores da variavel nao sao atribuidos arbitraria
mente, mas correspondem ao numero de vezes que cada valor ocorrer.
Assim, por exemplo, admitamos que as notas atribuidas a vinte alunos
em um teste de estatistica sejam as seguintes, dispostas em o.rdem crescente: 109
110
4, 5, 5, 5, 5;
5, 6, 6, 6, 6;
6, 6, 7, 7, 7;
7, 7, 8, 8, 8.
A nota media obtida mediante a utiliza�ao da formula (I) seni:
n 20
L X; L Xj
i=l i=l x =--- = ---
n 20
=
4+5+5+5+5+5+6+6+6+6+6+6+7+7+7+7+7+8+8+8
=
20
=
=
124
= 6 2 20 '
Portanto, a media aritmetica simples das notas e �.2. Como os valores
da variavel aparecem repetidos, e possfvel adotar 0 numero de observa�oes
ou freqilencia de cada um deles como peso ou fator de pondera�ao. Assim,
por exemplo, a nota sete aparece cinco vezes. E indifercnte, portant,
para efeito de calculo da media SOmar 0 numero sete cinco vezes OU
multiplicar esse valor por cinco.
7 + 7 + 7 + 7 + 7 = 5 x 7 = 35
E possivel proceder da mesma fonna para os demais valores de
variavel, como se observa no desenvolvimento seguinte:
OU
4+5+5+5+5+5+6+6+6+6+6+6+7+7+7+7+7+8+8+8 x = --------------------�
20
- - (4 x 1) + (5 x 5) + (6 x 6) + (7 x 5) + (8 x 3)
x-
1 + 5 + 6 + 5 +3
0 numerador da primeira expressao representa a opera�ao necessaria
para 0 calculo da media aritmetica simples, de acordo com a formula (1 ).
0 denominador e 0 numero total de observa�OeS.
Ja o numerador da segunda expressao apresenta o procedimento para
0 calculo da media ponderada, onde cada valor da variavel e multiplicado
pela respectiva freqiiencia. 0 numero quatro apareceu uma vez, o cinco e o
sete apareceram cinco vezes, o seis apareceu seis vezes e o oito tres vezes.
Ao inves de considerar cada nota do aluno individualmente, como e feito
para 0 calculo da media aritmetica simples, toma-se 0 valor tantas vezes
quantas ele tiver ocorrido. 0 denominador da segunda expressao e calculado
pela soma das freqilencias de cada valor da variavel, o que equivale a
freqiiencia total, ou numero total de valores observados. Retomando os
calculos:
(4 x 1) + (5 x 5) + (6 x 6) + (7 x 5) + (8 x 3)
X =
1 + 5 + 6 + 5 +3
=
=
4 + 25 + 36 + 35 + 24
=
124 =
6 2 20 20 '
Esse resultado e o mesmo que o obtido pelo emprego da formula (1 ),
porque 0 principio dos metodos e 0 mesmo, diferindo apenas a forma
de calculo.
Genericamente, se os valores xi. x2, . .. , Xk ocorreremfi. [2 • . . . , fk
vezes, respectivamente, a media aritmetica do conjunto sera calculada por: i'
k
I x;fi
/ = 1
x = _,:__ __ _
k
I Ii
j=l
Xj = valores da varravel, OU pontos mediOS. de classe
k
L Ji = n = mimero total de observa�oes
j=l
(2)
k = numero de classes ou de valores individuais diferentes da variavel
Na Tabela 4.2, condensamos os resultados do exemplo.
TABELA 4.2
Xj 'i
4 1
5 5
6 6
7 5
8 3
5
I fj = 20 = n
j=l
Xjfj
4 x 1 = 4
5X5=25
6X6=36
7 x 5 = 35
8X3=24
5
L Xjfj = 124
j=l
k = 5
n = 20
Normalmente, para o clilculo da media aritmetica ponderada recorre-se
a uma tabela desse tipo, o que possibilita maior rapidez de opera�ao e
organiza�o dos valores.
Quando os valores estao agrupados em classes, a tabela requer mais
uma coluna, necessaria para dispor os pontos medios de classes, como
indicamos na Tabela 4.3 . 111
112
TABELA 4.3
Classes 'i Xj Xjfj
101--20 5 15 75
201--30 10 25 250
301--40 15 35 525
401--50 10 45 450
501--60 5 55 275
5 5
I'j=45=n I Xjfj = 1 575
j=l
x = _,_i_=_i __
n
j = l
5
I Xjfj
= j=l \= 1575
45 45
c) Propriedades da Media Aritmetica
I) Primeira Propriedade
35
A soma algebrica dos desvios de um conjunto de numeros tomados
em rela�ao a media aritmetica e zero. Simbolicamente:
on de,
n
I d; = 1: (x; - x) = o
i=l
k
I difj = 1:(xi - x)fj = o
j.=1
�l = x; - x e i = { 1, 2, ... , n}
dj =
Xj - X e j = {l, 2, . . . , k}
A comprova�ao dessa propriedade e simples:
Para Dados Brutos
n n n
I d;
= I (x; - x)
= I
i =l i=l i =l
x; -
(3)
para dados brutos
para dados tabulados
Como x e uma constante, para um dado conjunto de valores,
n
Ix= nx
i=l
Mas,
n n
L x; L x;
n
i=l
e, assim, nx = n
i=l
L x =---= x;
n n
i=l
En tao,
n n n n n
L d; = L x; - L x = L x; - L x; = 0
i=l i=l i=l i=l i=l
Para Dados Tabuhdos
k k k k
L di =
L (Xj - x)fj = L Xjfj L xfi
j=l j=l j=l j=l
Mas, k
k k L Xjfj
k
I xfi
= x I Ii = nx = n
j=l
= L Xjfj
n j=l j=l j=l
Portanto,
k k k k k
I dj = I Xjfj -
L xfi L Xjfj - L Xjfj = 0
j=l j=l j=l j=l j=l
Exemplo 1:
Consideremos os salarios recebidos pelos cinco continuos.
x = {780, 790, 800, 810, 820}
A media dos salarios e x = 800, e a soma dos desvios sera zero,
como na Tabela 4.4.
Exemplo 2:
x;
780
790
800
810
820
TABELA 4.4
5 5
d; = Xj -X
780 - 800 = -20
790 -800 = -10
800-800= 0
810 - 800 = 10
820 -800 = 20
I d; := I (x; - soo1 = o >
i=l i=l
n
L d; = o
i=l
Com os dados da Tabela 4.5, comprovar a primeira propriedade
da media. 113
Xj
4
5
6
7
8
Notas
Xj
4
5
6
7
8
TABELA 4.5
Numero de alunos
fj
1
5
6
5
3
n = 20
A media aritmetica das notas e x = 6,2, conforme visto anterior
mente. A Tabela 4.6 pennite operar mais rapidamente
TABELA 4.6
fj Xjfj dj = Xj - 6,2 djfj = (Xj - 6,2) fj,
1 4 4:..... 6,2 = -2,2 (-2,21 x 1 = -2,2
5 25 5 -6,2=-1,2 (-1,21 x 5 = -6,0
6 36 5·_ 6,2 = -0,2 (-0,21 x 6 = -1,2
5 35 7 -6,2 = 0,8 (0,81 x 5 = 4,0
3 24 8 -6,2 = 1,8 (1,81 x 3 = 5,4
5 s
n = 20 L Xjfj = 124 I djfj = o
j=I j=I
II) Segunda Propriedade
A soma dos quadrados dos desvios tomados em rela�o a media
aritmetica e um mfnimo.
Para dados brutos
n n
L (x; - x)2 0 e (x0 - x)2 > 0 => n(x0 - .X)2 > 0.
Assim sendo, a diferen�a
(S2 - Si)= n(x0 -- x)2
C sempre positiva, para Xo i= X, OU seja,
S2 -- S1 > 0
Daf tiramos
S1 --
I ± f;=45 = n/ I ± x; f;=l 5751 ± lx;-35J2
f;=6 000
.r• I _ _ J-'J . J t
s
L:x;f;
j=l x = -=----
n
Como se observa,
1 575 = 35
45
Ix; - 36J2f;
115 - 30125 = 1 125 115 -36125 = 2 205
125 - 301210 = 250 1 12� - 3612 10· = 1 210
135 -· 301215 = 375 i 135 - 361215 = 15
145 - 3012 10 = 2 250 1 145 -- 3612 10 = 810
155 - 30125 = 3125 I 155 - 36125 = 1 805
5 s
L Ix; -3012f; = 7 125 L Ix;-36J2f; = 6 045
j··i j�1
s 5 s
L (x; - 35)2!;aritmetica e
possivel desenvolver um processo breve de calculo da media, menos direto
que o anterior, mas que proporciona o mesmo resultado. Neste caso, faz-se
uso de uma variavel transformada, denominada variavel reduzida, cuja
expressao e a seguinte:
Dados Brutos:
I
, _ X; - Xo
d· - ---1 c
Dados Tabulados:
I
, _ Xj - Xo
. di - -'-
-c--
onde x0 e c sao constantes arbitrarias.
(11)
(12)
Das formulas (11) e (12) deduzimos facilmente as express5es da
media aritmetica simples e ponderada, com a utiliza�o da variavel redu
zida d'.
Para o caso da media aritmetica simples, fazemos
, x; - x0
d; = --
c
x; = x0 + cdj
Conforme a defini�ao da media aritmetica simples, podemos escrever
x =
n
Ix;
i=l
n
i=l
= ------
n
A ultima expressao pode ser desenvolvida como segue:
n II n
I (xo + cdj) I Xo + I
i=l i= 1 i=l
x= = n n
n n
I Xo cz: dj
i=l
n
Portanto,
X = Xo
+ i=l
n
n
I di
i=l +c ---n
X:Xo = -- + c K
cdj
=
n
I dj
i=l
n
(13)
Da mesma forma chegaremos a expressao da media aritmetica pon-
derada:
Assim,
-". _ Xj - Xo
Uj - c
Xj = x0 + cdj
k k
L Xjfi
j=l
n
L (xo + c� = 1
Xg Xg Xg
10 X 60 X 360
=
216 000
=
l
60 60 60 216 000
Observafiio: Conforme pode ser observado, enquanto que a soma dos
desvios em rela�ao a media aritmetica x e igual a zero, 0 produto dos
quocientes dos itens pela media geometrica e um. Utilizando OS dados do
exemplo acima,
3
:L x;
i=i IO+ 60 + 360 430
= x =--- =
n 3 3 = 143,333 ...
± d; = (10 - 4;0) + (60 -
4;0) +
1=i
(360 - 4;0) = 0
II) Segunda Propriedade
Series que apresentam o mesmo m1mero de elementos com a mesma
128 soma total tern a mesma media aritmetica, enquanto series que apresentam
o mesmo numero de elementos com o mesmo produto tern a mesma media
geometrica.
Exemplo 13:
Comprovar a segunda propriedade da media geometrica tomando
X = {8, 12, 5} e Y = {2, 50}.
Calculando as medias geometricas,
Xg = y8 X 12,5 = y'100 =· 10
Yg = v 2 x 50 = v'10Q = 10
Assim, Xg = Jg.
III) Terceira Propriedade
A media geometrica e menor OU igual a media aritmetica.
I xg
�x I (20)
A desigualdade Xg 0
Desenvolvendo o primeiro membro
x� + x� - 2xix2 ;;;. 0
Somando e subtraindo a quantidade 2xix2 ao primeiro membro da
desigualdade, teremos
x� +x� + 2xiX2 - 2XiX2 - 2X1X2;;;. 0
OU
(Xi + X2)2 - 4XiX2 > 0
Dai tiramos
OU
(Xi + X2)2
4 ;;;. X1X2
( X1 + X2 )2
2 ;;;. X1X2
Extraindo a raiz quadrada
Xi + X2
2 ;;;. vx;x:;,
e
129
130
o que equivale a x ;;;i: Xg uma vez que
X1 + X2 __: - � -
2
= X e V X 1 X2 = Xg
A generalizayao para n valores pode ser conseguida da mesma forma.
IV) Quarta Propriedade
Quanto maior a diferenya entre os valores ongma1s maior sera a
diferenya entre as medias aritmetica e geometrica.
Exemplo 14:
Consideremos os seguintes conjuntos de numeros:
x = {2, 2}
y = {14, 16}
w = {8, 12}
z = {2, 50}
As medias aritmetica e geometrica de cada um dos conjuntos sao
as indicadas na Tabela 4.20.
TABELA 4.20
Conj unto
Media aritmltica MtJdia geomltrica
x xg
x = {2, 2} 2 2
y = {14, 16} 15 14,97
w = {8, 12} 10 9,80
z = {2, 50} 26 10
Examinando a Tabela 4.20, percebe-se claramente que as diferenyas
entre as duas medias acentuam-se a medida que os valores originais da
variavel se diferenciarn.
d) Aplicafoes da Media Geometrica
Serao apresentadas, a tftulo de ilustrayao, tres aplicayoes da media
geometrica:
- Media de Relafoes
Consideremos os dados da Tabela 4.21.
TABELA 4.21
Empress
Capital
Dfvida
Re/Bflo Relar;io
lfquido capital/dfvida dfvida/capital
A 2.500 1.000 2,5 0,4
B 1.000 2.000 0,5 2,0
3.500 3.000
Calculando a media aritmetica das duas relai;:aes, teremos:
Relai;:ao capital/divida: :X1
= 2,5 + 0,5 = 1,5 2
Relai;:ao divida/capital: :X2
= 0,4 + 2,0 = 1,2 2
Como essas relai;:oos sao o inverso uma da outra, poderia parecer um
contra-senso que o produto de suas medias nao seja igual a um, o que rear.
mente acontece:
.--I (-1.-5
-
x -1.-2)_>_1.....,I
Entretanto, esse aparente absurdo decorre do fato de nao havermos
atribuido as relai;:oos seus pesos corretos antes de calcular a media. Teriamos
o seguinte resultado, se os pesos houvessem sido considerados:
(2,5 x 1 000) + (0,5 x 2 000) = 1 1667 1000+2 000 '
0 numerador dessa expressao corresponde ao capital liquido total
(3.500), enquanto que 0 denominador e igual a divida total (3.000). 0 re
sultado l ,i 667 deve ser interpretado como a relai;:ao media entre capital
e divida, entre as duas empresas consideradas.
Analogamente, determinamos a media das relai;:0es da divida versus
capital Ii qui do:
(0,4 x 2 500) + (2,0 x 1 000)
= 0,8571 2 500 + 1 000
ou, com o emprego dos totais
. 3 000
3 500 = 0,8571
Multiplicando as duas medias, obtemos:
1 1.1667 x o,8571 = 1 I
Conforme se pode verificar, nesses calculos os pesos atribufdos as
relay6es nao sao iguais. Caso se deseje que isso ocorra, pode-se recorrer a
media geometrica. Assim,
Relai;:ao capital/dfvida: Xg1
=
y 2,5 X 0,5 =
v'T,25 = 1,1180
Relayao dfvida/capital: Xg2 = y 0,4 X 2,0 = � = 0,8944
0 produto dessas medias sera igual a um: 1,1180 x 0,8944 = 1.
A escolha dentre as medidas dependeni, nesse e em outros casos, do
fim que se persiga. Se, para uma determinada empresa, se deseja estabelecer
uma relai;:ao do tipo capital/dfvida que seja independente da dfvida ou do
capital das diferentes empresas envolvidas, e recomendavel o uso da media 131
geometrica. Se o que se deseja saber e a relayao capital liquido/divida de
um certo numero de empresas, ap6s a consolidayao, a cifra correta sera
obtida atraves da media aritmetica, ou achando a relayao pelos totais.
II - Media em Distribuiroes Assimetricas
Uma distribuiyao de freqiiencias pode encontrar-se deformada a direita
(assimetrica). Contudo, se usarmos os logaritmos dos valores da variavel,
com um intervalo de classe constante para os logaritmos, a curva se trans
formara em simetrica. Neste caso, a media geometrica revela-se mais apro
priada que a aritmetica.
III - Media de Taxas de Variariio
A media geometrica e usada em certas ocas1oes, para determinar
taxas medias. Assim, por exemplo, suponhamos que um individuo tenha
investido um capital de Cr$ 500,00 em 1973. Ap6s um ano de aplicayao,
essa importancia ascendeu a Cr$ 650,00. Reaplicando essa ultima quantia,
ao final de mais um ano seu montante situava-se em torno de Cr$ 910,00.
A taxa media de aumento de capital sera obtida mediante o Cl:\lculo de urria
media geometrica.
Calculemos, inicialmente, as taxas de aumento de capital, periodo a
periodo:
Perfodo Taxa
1973-1974 650 1,3 - = 500
1974-1975 910 1,4 - = 650
Taxa media: .,/ 1,3 X 1,4 = 1,3491
A taxa media de aumento do capital investido no perfodo de dois
anos foi de 34,91 %.
4.2.3. Media Harmonica
Simbolo: Xh·
Definiriio: A media harmonica de um conjunto de valores x; e o
inverso da media aritmetica dos inversos.
De acordo com ess:l definiyao, pode-se afirmar que o valor Xk e a
media harmonica de um conjunto de valores, se a operayao que iguala os
dois conjuntos for a adiyao dos inversos. Para um conjunto den valores da
variavel, podemos escrever
1
+
1
+-
1
-+ ... +-l-= +-l-+ ... +-
1
-
132 Xh Xh Xh Xh Xi X2 Xn
n - =
Xh
=
xh
n ( 1 )
I x. i=l I
n
I x;
i=l
n
OU
Daf se conclui que o inverso da media harmonica e a media aritmetica
dos inversos dos valores da variavel.
a) Media HarmfJnica Simples - (Dados Brutos)
Dado o conjunto de n valores x 1, x2, • • • , Xn, a media harmonica do
conjunto sera
OU
.----------------.
1
+ _1 1 + ... +-
Xi X2 Xn
Xh =--
n 1
I x. i= 1 I
n
n
n
n 1
? Xj I =.1
Exemplo 15:
(21)
Calcular a media harmonica simples dos seguintes corijuntos de nu
meros:
x = { 10, 60, 360}
y = {2, 2, 2, 2}
n
xh =----: n 1
3 ------- =
1 1 1
Yh
Ix. i=l I
w+60+36o
n 4 --- = -------
n 1 .!.+.!.+..!.+..!_
� Yi
2 2 2 2
b) Media Harmonica Ponderada
3 x 360
43
= 25,12
4 x 2
-4- = 2
A media harmonica ponderada de um conjunto de numeros, dispostos
em uma tabela de freqiiencias, e dada pela seguinte expressao: 133
134
k
It; n
Xh =
;=1
=
k 1 k k I;
I
1
I L X·f; -!; x;
j=1 I ;=1 x; ;=1
(22)
k
It;
;=1
Exemplo 16:
Uma pessoa adquiriu quatro camisas ao preyo unitario de trinta
cruzeiros e duas camisas a cinqiienta cruzeiros cada uma. Para calcular o
preyO medio pago por camisa, hli duas formas de procedimento:
I) Cdlculo pela Media Harm0nica
Os dados do problema poderiarn ser expressos da seguinte forma:
A pessoa gastou 120 cruzeiros em camisas de 30 cruzeiros e 100 cruzeiros
em camisas de 50 cruzeiros a unidade. Neste caso, os valores da variavel sao
os preyos porcamisa, e seus pesos as quantidades gastas em camisas. Portanto,
1 220 xh = (...!...) (...!...\ =
4 + 2 = 36,67
120
_30_
+ 100 _so)_
120 + 100
II) Cdlculo pela Media Aritmetica
Os valores da variavel sao os preyos por camisa, mas agora os pesos
sao o numero de camisas compradas. Por conseguinte,
-
=
(4 x 30) + (2 x 50) =
220
= 36 67 x 4+2 6 '
Os princfpios dos dois metodos sao simples. Estamos calculando
media de taxas, ou seja, cruzeiros por camisa. 0 numerador de ambas as
expressoes representa a quantia total gasta com camisas (220 cruzeiros),
enquanto 0 denominador e igual ao numero de camisas adquiridas. Quando
sao empregados os pesos do denominador, aplica-se a media aritmetica
(pesos 4 e 2); quando se empregam os pesos do numerador, usa-se a media
harmonica (120 e 100).
Outro exemplo onde se pode empregar indiferentemente qualquer
uma das medias e o da obtenyao da velocidade media de um veiculo
(quilometros por hora). Sendo os pesos os quilometros percorridos, utiliza-se
a media harmonica·, e se OS pesos forem horas invertidas O calculo e feito
atraves da media aritmetica.
Exemplo 17:
Calcular a media harmonica dos dados constantes da Tabela 4.22.
Classes fj
11--- 3 2
31--- 5 4
51--- 7 8
71---- 9 4
91---11 2
k
I 'i=20=n
j=l
Devemos ter
- n
Xh =
k I I x:ii j=t I
Xh = _1Q_ = · 4 96
4,03 '
TABELA 4.22
Xj
2
4
6
8
10
c) Propriedade da Media Harmonica
1
-Xj
1
2
1 -
4
1
6
1
8
1
10
fj
-Xj
2 . 1= 1,00
4
4= 1,00
�= 133 6 •
4
5= 0,50
2 10 = 0,20
5 f;
I _L =403
x· '
j=l I
A media harmonica e menor OU igual a media geometrica para
valores da varilivel diferentes de zero.
(23)
Por extensao de raciocinio e de acordo com a terceira propriedade
da media geometrica, podemos escrever
I Xh,;;;; Xg,;;;; x I (24)
Genericamente, podemos enunciar: A media harmonica de um con-
junto de numerOS positiVOS e menor OU igua} a media geometrica, e esta,
por sua vez, e menor OU igual a media aritmetica.
Verifiquemos a desigualdade Xh Xg > xh
6 > 5,21 > 4,38
18.2) Y = po, 10, IO}
Yg
n
I Yi
= i=l
.
=
10 + 10 + 10. = 30
= 10
n 3 3
� = '!../ 10 x 10 x 10 = � = 10
137
n
Yh = n 1
I -
i=l Xj
3
1 1 1
10+10+10
3 10 =-3-=
10
Como todos OS valores da serie sao iguais, y = Yg = Yh.
18.3) z = {10,1, 10,1, 10,2, 10,4, 10,5}
z = 10,1 + 10,1 + 10,2 + 10,4 + 10,5 = 51,3 = 10 2600 5 5 '
zg = ;_; 10,1 X 10,1 X 10,2 X 10,4 X 10,5 =
= ;,; 113 622,8184 = 10,2587
5 5 Zh = -------------= --�-
_l_ + _l_ + _l_ + _l_ + _l_
0,4874508
10,1 10,1 10,2 10,4 10,5
= 10,2574
Conforme a relaylfo (25)
x + Xh
Xg = 2
para valores pouco diferentes da variavel. Assim, fayamos
z + Zh 10,2600 + 10,2574 = = 10,2587 = zg 2 2
=
4.2.4. Media Ouadratica
Simbolo: Xq·
Definifao: A media quadratica de um conjunto de n valores x; e
a raiz quadrada da media aritmetica dos quadrados. Podemos dizer, entao,
que Xq e a media quadratica de um conjunto de valores Xj se a opera�o
que igualar os dois conjuntos for a adi�o dos quadrados.
(xq )2 + (xq )2 + . . . + (Xq )2 = x� + x� + ... + x!
n n
I (xq)2 =I x:
i=l i=l
n
n(xq)2 = L xt
i=1
a) Media Quadrdtica Simples
OU
n
I x:
(xq)2 = i=1
n (26)
Para o conjunto de n valores x1, x2, • • • , Xn, a media quadratica
simples sera calculada atraves da seguinte expressao, obtida a partir da
138 (26), mediante a extrayao >de raiz quadrada.
Exemplo 19:
Calcular a media quadratica dos conjuntos
x = {2, 2, 2}
Solu�iio:
19.1)
19.2)
y = (2, 3, 4, 5}
+ 22 + 22
3 = /IF= 2
-
=
�
=
j 12 + 32 + 42 + 52
Yq � � ' 4 =
/54--: = ..; 4 = y'13,5 = 3,67
b) Media Quadrdtica Ponderada
(27)
Quando os valores da variavel estiverem dispostos em uma tabela
de freqiiencias, a media quadratica sera determinada pela seguinte expressao:
k k
I x/fj I xf Jj
Xq =
j=l
= [=1
(28)
k n
I fj
j=l
Exemplo 20:
Calcular a media quadratica dos valores constantes da Tabela 4.23
Xq =
k
I xj fj
j
=l = /2298 = · I 54 7143 = 7 40 n ../� v ' ' 139
140
TABELA 4.23
Classes fj
2 2 Xj Xj Xj fj Xjfj
21--- 4 5 3 9 45 15
41--- 6 10 5 25 250 50
61--- 8 12 7 49 588 84
81--- 10 10 9 81 810 90
101--- 12 5 11 121 605 55
5 k
n = 42 I xffj= 2 298 L Xjfj=294
j=l j=1
A media aritmetica desse conjunto e igual a 7' OU seja,
k
I x11;
x = j= 1 =
294
= 7
n 42
c) Propriedades da Media Quadrtitica
I) Primeira Propriedade
A media quadratica de uma constante e igual a Constante.
Xq
=
Para x 1 = x2 = . . . = ·x0, teremos
n
"\' x2
L... 0
i= 1
n
I Xq
= x0 I
fl = =
n
para x; = Xo.
«
= Xo
0 exemplo 19 confirma numericamente essa propriedade.
II) Segunda Propriedade
OU
(29)
Multiplicando ou dividindo todos os valores de um conjunto de
numeros por um valor constante e arbitrario, a media quadratica flea
multiplicada ou dividida por essa constante.
Fa�amos c a constante e Yi = ex;. Entao,
fl;[=
n
I (cx;)2
i=l
Yq = = n
n
JI:_
I
2 X;
c2 i= 1 = = c 1
n n
I Yq = CXq
III) Terceira Propriedade
para Yi = ex;.
n
I c
2x�
I
i=l
n
CXq
Sempre que OS valores de x forem positivos e valida a relac;ao.
I Xq ;;;;. x ;;;;. Xg ;;;;. Xh I
=
(30)
(31)
A igualdade se verifica quando os valores da variiivel forem iguais
(constantes). Assim e que, para X1 = X2 = . .. = Xo.
� � Xq = j 4-- = Xo
conforme a expressao (29).
Da mesma forma, Xq = x = Xg = Xh para x1 = x2 = ... = x0•
Ocorrera a desigualdade para valores de variavel nem todos iguais.
Para comprovar a desigualdade, mostraremos que Xq > x. Para isso, parti
remos da seguinte relac;ao:
n
L (x; - x)2 > o,
i=l
uma vez que se trata de soma de quadrados de valores diferentes.
Desenvolvendo o primeiro membro da desigualdade,
n n
I (x; - x)2 =I (xl + x2 - 2x;x) =
i=I i=l
" n n = I x� + I x2 - 2x I Xj =
I
i=1 i=l i=t
n
I X;
n i=l
= I x� + nx2 - 2Xn =
I n
i=I 141
142
n n
= I 2 + nx2 - 2nx2 = I x� - nx2 >O Xj l
j=I i=I
Assim, se
n
I x: - nx2 > O,
i=I
segue-se que
Mas
n
n
I 2
I 2 > nx2 Xj
Xj OU
i=I i=I > x2
n
n
I xt
I Xq > x I i=i
n
x: . Entlio, x: > x2 e, finalmente, . .
0 exemplo 20 comprova essa propriedade.
0 bserv(lfi5es:
I) A media quadratica e largamente utilizada em Estatistica, principal
mente quando se pretende calcular a media de desvios (x - x), em vez de
amedia dos valores originais. Neste caso, a media quadratica e denominada
desvio-padrlio, que e uma importante medida de dispersao, objeto do pr6ximo
capftulo.
II) Outras medias menos usadas em Estatistica slio a media cubica e
a media biquadratica, as quais sao calculadas respectivamente atraves das
seguintes expressoes:
a) Media CUbica
Xe= 3 n
para a Media Cubica Simples
k
I xJt;
;=1
n para a Media Cubica Ponderada Xe= 3
b) Media Biquadrdtica
jf":7
Xbq = J � para a Media Biquadrtitica Simples
(32)
(33)
(34)
k
'L xilj
1�1 _;_ ___ para a Media Biquadrdtica Ponderada (35)
n
/\
Simbolo: M0 ou X
4.3. MODA
A moda e outra medida de tendencia central, havendo outras deno
mina�oes para designa-la: norma, valor dominante, valor tipico. Generica
mente, pode-se definir a moda como o valor mais freqiiente, quando
comparada sua freqiiencia com. a dos valores contiguos de um conjunto
ordenado. Quando afirmamos que o salario modal de uma empresa e igual
a dois mil cruzeiros, queremos dizer que esse e o salano percebido pelo
maior n6mero de pessoas dessa empresa. 0 termo moda foi utilizado prirneira
mente por Karl Pearson em 1895, talvez como uma associa�ao a sua
concep¢o na linguagem comum.
4.3.1. Determina�o da Moda de Valores Nio-Tabulados
Considerando um conjunto ordenado de valores, a moda sera o valor
predominante, o valor mais freqiiente desse conjunto. Evidentemente, um
conjunto de valores pode nao apresentar moda, sendo, entao, denominado
conjunto amodal, caso em que todos os valores da varravel em estudo
ocorreram com a mesma intensidade (freqiiencia). Por outro lado, po
demos ter conjuntos plurimodais, quando houver mais de um valor predo
minante.
Exemplo 21:
Calcular a moda dos seguintes conjuntos de valores:
x = {4, 5, 5, 6, 6, 6, 7, 7, 8, 8}
y = {4, 4, 5, 5, 6, 6}
z = {l, 2, 2, 2, 3, 3;4, 5, 5, 5, 6, 6}
w = { l, 2, 3, 4, 5}
A moda de cada um dos conjuntos sera:
Moda de X: M0 = 6. 0 valor 6 e o mais freqilente (3 ocorrencias).
Moda de Y: Esse conjunto e amodal, pois seus tres valores apareceram duas
vezes cada um. Nao ha, portanto, predominancia de nenhum
valor do conjunto sobre os outros.
Moda de Z: M0 = 2 e M0 = 5. Trata-se de um conjunto bimodal, uma
vez
1
que tanto o 2 valor 3 como o S apresentaram o maior numero
de observa,.oes.
Moda de W: Esse e outro conjunto amodal. 143
4.3.2. Determina�o da Moda para Valores Tabulados
Os valores da variavel dispostos em uma tabela de freqiiencias podem
apresentar-se individualmente ou agrupados em classes. No primeiro caso, a
determina�ao da moda e imediata, bastando, para isso, consultar a tabela,
localizando o valor que apresenta a maior freqiiencia. Esse valor seni a
moda do conjunto. Assim, por exemplo, a moda do conjunto apresentado
na Tabela 4.24 e M0 = 3. Esse resultado indica que a rejei�ao de 3 pe�as
defeituosas por mes foi o resultado mais observado.
TABELA 4.24 - EMPRESA X
Numero de P�as de Precisiio Defeituosas Devolvidas Mensalmente pelo
Controle de Qualidade
Numero de pe�as com defeito
Xj
0
1
2
3
4
5
6
Numero de meses
'i
7
2
4
6
8
4
2
1
I 'i = 21
j=l
Tratando-se de uma tabela de freqiiencias com valores tabulados e
agrupados em classes, o procedimento n:io e imediato, sendo disponfveis
alguns metodos de calculo distintos. Qualquer que seja 0 metodo adotado,
0 primeiro passo para determinar a moda e localizar a classe que apresenta
a maior freqiiencia, comumente chamada de classe modal.
a) Moda Bruta
0 metodo mais rudimentar de calculo da moda em tabelas de fre
qiiencias com valores agrupados em classes consiste em tomar o ponto
medio da classe modal. Esse valor recebe o nome de moda bruta. Exami
nando os dados da Tabela 4.25, por exemplo, podemos dizer que a terceira
cla�se e a classe modal e a moda bruta seni seu ponto medio: M0 = 35.
Os dois metodos que apresentaremos a seguir sao mais elaborados e
baseiam-se nao apenas na freqiiencia da classe modal, mas tambem nas
freqiiencias das classes adjacentes.
b) Metodo de King
O metodo de King, para o calculo da moda elaborada, baseia-se na
influencia das freqiiencias das classes adjacentes sobre a classe modal.
Considerando essas freqiiencias, esta-se admitindo implicitamente que a
144 moda se desloca dentro do intervalo de classe para um determinado ponto
TABELA 4.25
Classes
101--20
201--30
301--40
401--50
501--60
3
5
7
6
Classe Modal: 301--40
Moda Bruta: 35
n = 22
(valor), de tal sorte que as distancias desse ponto aos lirnites de classe
sejam inversamente proporcionais as freqiiencias das respectivas classes
adjacentes. Assim e que, quanto maior for a freqiiencia da classe adjacente,
menor seni a distancia do ponto a essa classe.
Para comprovar o que dissemos, fa�amos:
l; = limite inferior da classe modal;
ls = limite superior da classe modal;
di = distancia do ponto (moda) ao limite inferior;
d2 = distancia do ponto (moda) ao limite superior;
!ant = freqiiencia simples da classe adjacente anterior a classe modal;
f post = frequencia simples da classe posterior a classe modal.
Como di e d2 sao inversamente proporcionais as freqiiencias das
classes adjacentes, podemos escrever:
d2 fant
di
=
!post
A propriedade das propor�aes permite-nos escrever:
d2 +di f ant +/post
= ---�-
di !post
0 numerador do primeiro membro da expressao equivale a amplitude
do intervalo de classe: d2 +di = c. Assirn,
_ fant +/post
- /post
e =
C • /post
fant + fpost
Para determinar a moda, basta acrescentar a distancia di ao lirnite
inferior da classe modal.
M0 = I + di = I + c
!post
fant +[post
(36)
145
146
Como pode ser notado, o metodo de King nlio leva em consifant + /post
9 90 M0 = 30 + 10 3 + 9 = 30 +
U
Graficamente
A -- -
50 60 x
c) Metodo de Czuber
I M0 = 37,5
GRAFICO 4.2
0 metodo de Czuber, para o calculo da moda elaborada, leva em
considera�ao nao apenas as freqiiencias das classes adjacentes, mas tambem
a freqiiencia da classe modal. 0 ponto que corresponde a moda divide o
intervalo da classe modal em duas partes, as quais sao proporcionais as
diferen�as entre a freqiiencia da classe modal e as das respectivas classes
adjacentes.
Fa�mos, entao,
t.i = Imo - lant = (frequencia da classe
anterior);
62 =Imo - f post= (freqiiencia da classe
posterior);
= limite inferior da classe modal;
ls = limite superior da classe modal;
modal) - (freqiiencia
modal) - (freqiiencia
di = distancia da moda ao. limite inferior da classe modal;
d2 = distancia da moda ao limite superior da classe modal.
Segundo o princfpio do metodo de Czuber,
d2 /J.2
di t:,.1
da classe
da classe
Recorrendo novamente a propriedade das propor�oes,
d2 + di b.2 + b.i
=
Lembrando que d2 + di = c, amplitude do intervalo de classe, e
colocando di em evidencia,
[:, i
di = c
b.2 + !:;,.l
Como d1 e a distancia entre o limite inferior da classe modal e a
moda, essa seni determinada por
OU
!:;,.l
M0 = I + d 1 = I + c --
t::,.2 + ll1
fmo - !ant
M0 = I + c ---------
2/mo - Uant +/post)
Exemplo 24:
(37)
Determinar a moda, pelo metodo de Czuber, usando os dados do
exemplo 23.
De acordo com a formula 37,
= 30
c = lO
b. 1 = f mo - /ant = lO - 3 = 7
62 =/mo -/post= 10 - 9 = l
b.1
M0 =I+ c ----
1::,.1 + b.2
7
= 30 + lo m = 30 + 8,75 = 38,75
I M0 = 38,75 1
c. l) Determinariio Grdfica da Moda pelo Metodo de Czuber
Para determinar graficamente a moda, Segundo 0 metodo de Czuber,
partiremos de um histograma. Por simplifica�ao, construiremos apenas os tres
retangulos correspondentes as classes de interesse. 149
0
150
s
P=Mo
Temos que:
At =Imo - /ant;
L'.2 =Imo - /post;
T
1,
I = limite inferior da classe modal;
ls = limite superior da classe modal;
c = amplitude do intervalo de classe (constante).
GRAFICO 4.3
x
Consideremos os seguintes triangulos semelhantes QRS e QTU. Em
virtude da propriedade dos triangulos semelhantes, podemos escrever a
seguinte proporyao:
Mas,
CQ
=
QD
SR TU
CQ = M0 - l
SR = t:.1
Assim sendo:
M0 - l
A 1
QD =ls - Mo
TU = t:.2
A determina¢o de M0 e feita a partir dessa ultima relayao:
(M0 - I )t:.2 =Os - Mo)A1
M0 A2 -- l b.2 = ls A1 -- M0 A1
M0t:.2 + M0A1 = I A2 + l5A1
I t:.2 + lsA1
Mo =
----
A1 + A2
Como 18 = I + c, o denominador da expreSSfo ficar4:
I f:i.2 + lsA1 =I A2 + (I + c)f:i.1 =I f:i.2 + / A1 + cA1 =
=I (f:i.1 + A2) + cA1
Portanto,
I (A 1 + A2) + c f:i.1
Mo = -------
f:i.1 + f:i.2
f:i.1
= 1 + c '
f:i.1 + A2
conforme a expressio (37).
Examinando a Figura 4.3, podemos afirmar, entao, que a moda
corresponde a abscissa P = M0 do ponto de interse�o Q das linhas
RT e SU.
Observ0f6es:
I) 0 lei tor que estiver familiarizado com os conhecimentos de catculo
podera encontrar a formula de Czuber atraves de uma parabola construida
de modo a passar pelos pontos medios da classe modal e das classes contfguas
a ela. Desse modo, a parabola Y = ax2 + bx + c passara pelas extremidades
das tres ordenadas: f ant. fmo e [post·
Em seguida deverao ser determinados os parametros da parabola, a, b,
c, atraves de um sistema de tres equa�aes a tres inc6gnitas, com a origem
no ponto medio da classe modal, chegando-se a seguinte expressao:
fant + fpost -- 2fmo 2
+
fant + fpost
+ I' y =
2
2 x
2
x Jmo c
� '--v--1·
a b c
0 maximo de y (freqilencia) e obtido por deriva�o. 0 valor de x,
correspondente ao valor maxima de y' sera dado por
x =
fant - fpost X __£__
!ant + fpost - 2[ mo 2
Mudando a origem para o limite inferior da classe modal, obtem-se:
Assim,
, cifmo - fant) A1
x = =c ----
2fmo - ifant + fpost) A1 + A2
I M0 = I + x' = I + c __
f:i._l _
_
f:i. 1 + A2
2) Seria possivel obter outras formulas da moda considerando outros
criterios, como, por exemplo, utilizando as freqilencias de todas as classes.
Entretanto, todo esse rigor nao se justifica, em virtude do pouco uso
dessa medida. 151
152
4.4. MEDIANA
Simbolo: Md OU x.
A mediana e a terceira medida de tendencia central e pode ser defi·
nida como o valor que divide uma serie ordenada de tal forma que pelo
menos a metade ou cinqilenta por cento dos itens sejam iguais ou maiores
do que ela, e que haja pelo menos outra metade ou cinqilenta por cento de
itens maiores do que ela. A mediana e considerada uma separatriz, por ser
um promedio que divide a distribui9ao ou conjunto de dados em partes
iguais. Trata-se de uma medida muito utilizada na amilise de dados estatis
ticos, especialmente quando se atribui pouca importancia aos valores extremos
da varili vel.
Elemento Mediano
Por ser uma separatriz, isto e, em virtude de a mediana se constituir
em um valor que separa a distribui¢o em partes de tal sorte que uma fra¢o
(0,5 ou 1/2) de valores lhe seja inferior e os restantes superiores, podemos
concluir que essa medida apresenta um numero de ordem. Assim e que,
ordenando os valores da serie, a mediana e um valor que ocupa uma deter
minada ordem ou posi9ao na serie ordenada. 0 numero que indica a ordem
em que se encontra o valor correspondente a mediana e denominado ele
mento mediano, cujo simbolo e EMd·
4.4.1. Determina�o da Mediana de Valores Nio-Tabulados
A determina9ao da mediana de valores nao-tabulados processa-se a
partir de um rol ou lista ordenada dos dados. Podem ocorrer duas hipoteses
com rela9ao ao numero de observa96es n: que ele seja impar ou par. Veremos
os dois casos.
a) 0 Numero de Observaroes e fmpar
0 procedimento para o calculo da mediana quando a lista de valores
contiver um nilmero fmpar de observa9oes requer, em primeiro lugar, que
se determine a ordem em que se encontra a mediana na serie. Deve-se,
entao, encontrar o valor do elemento mediano, o que e feito da seguinte
forma:
I EMd=� I (38)
O passo seguinte sera localizar a mediana na lista de valores, de
acordo com o resultado obtido no calculo do elemento mediano.
Exemplo 25:
Calcular a mediana do seguinte conjunto de numeros:
x = {2, 3, 6, 12, 15, 23, 30}
Solurao:
A primeira providencia a ser adotada seria a de ordenar os valores.
Neste exemplo, os valores da serie ja se encontram ordenados.
Em seguida, determinaremos o valor do elemento mediano, utilizando
a formula (38), uma vez que o numero de observay5es e impar (n = 7).
E - � - 2-±_J_ - 4 Md - 2 - 2 -
Ressalte-se o fato de que o valor 4 e um numero ordinal. Assim,
E Md = 4 indica que a mediana e o valor que se en contra na quarta posiyao
da lista ordenada de valores, e 0 quarto numero da serie.
Finalmente, procuraremos no conjunto qual o valor que se encontra
no quarto lugar da lista. Esse numero c;orrespondera a mediana do conjunto.
No exemplo:
�, M.-d
-
=
-
12
--.,
Observe que existem tres valores menores do que doze (2, 3 e 6) e
tres valores maiores (15, 23 e 30), o que corresponde a cinqilenta por
cento (ou metade) de itens maiores e menores do que a mediana.
b) 0 Num ero de Observafoes e Par
0 procedimento para calcular a mediana de ·um numero par de obser
vay5es e ligeiramente diferente do adotado para 0 caso em que n e impar.
Assim e que 0 elemento mediano Sera determinado, agora, atraves da
seguinte expressao:
I E Md = ; I (39)
· Exemplo 26:
Calcular a mediana do conjunto:
x = (3, 6, 9, 12, 14, 15, 17, 20}.
So/ufiio:
Como vemos, n = 8.
0 elemento mediano sera, de acordo com a formula (39),
n 8
EMd =1=2= 4
Seguindo a mesma linha de raciocinio do exemplo anterior, identifi
carfamos a mediana coma 0 quarto elemento da lista, OU seja, Md= 12.
Entretanto, esse procedimento de identificayao resultaria em um valor da
mcdiana que contrariaria a defini\:ao, uma vez que naoteriamos a mesma
propor9ao de valores menores e maiores do que o valor doze. Haveria, 153
154
entiio, tres valores menores do que doze (3, 6 e 9) e quatro maiores
(14, 15, 17 e 20).
Toda vez que houver um numero par de observa�oos a lista apresen
tara dois valores centrais e a mediana sera determinada calculando a media
aritmetica deles. No exemplo, teriamos:
Md = 12 + 14 = 13
2
Percebe-se, agora, a ocorrencia de igual numero de valores maiores
(14, 15, 17 e 20) e menores (3, 6, 9, 12) do que a mediana.
4.4.2. Determina\:iO da Mediana de Valores Tabulados
nio Agrupados em Classes
Quando os valores da variavel estiverem ja tabulados, o procedimento
a ser adotado sera praticamente identico ao anterior.
Em primeiro lugar, deve-se verificar se o numero de observa�oes e
impar ou par e, conforme o caso, aplicar as formulas (38) ou (39), para o
calculo do elemento mediano.
Em seguida, acrescentamos uma coluna a tabela de freqiiencias original,
onde serao determinadas as freqiiencias acumuladas. Comparando o resultado
obtido no calculo do elemento mediano com os valores constantes dessa
coluna, determinaremos a mediana.
Exemplo 27:
Calcular a mediana dos valores apresentados nas Tabelas 4.28 e
4.29.
TABELA 4.28 TABELA 4.29
Va/ores FrsqiilJncias Valor• F mqiilncias
Xj fj Xj fj
2 5 3 3
3 10 4 6
4 15 5 9
5 12 6 8
6 5 7 6
7 3 8 3
n = 50 n = 35
Solufao:
a) 0 numero de observa�OeS da variavel, conforme a Tabela 4.28, e
n = 50. Assim sendo, fazemos:
n 50 EMd =1= 2 = 25
A mediana devera ser o vtges1mo quinto elemento, se levarmos em
considera\:li'O os valores do conjunto ordenados, ou seja:
{2, 2, 2, 2, 2, 3, 3, 3, . . . ' 7, 7, 7}
0 passo seguinte sera o calculo das freqilencias acumuladas, o que
sera feito com o recurso da tabela auxiliar 4.30.
TABELA 4.30
Xj fj Fj
2 5 5
3 10 15
4 15 30
5 12 42
6 5 47
7 3 50
n = 50
Examinando a coluna das freqilencias acumuladas verificaremos que
ate o valor dois, inclusive, existem cinco observa\:oes, o que equivale a
dizer que o quinto elemento da lista e igual a dois. Portanto, a mediana
nao pode ser dois, uma vez que ela equivale ao vigesimo quinto valor, e
ate dois temos apenas cinco observa\:OeS. Assim, iremos percorrendo a
coluna ate encontrar um valor (freqilencia acumulada) igual ou maior que
o elemento mediano. A freqilencia acumulada seguinte e quinze, que, por
ser inferior a vinte e cinco, indica que tres nao e a mediana. Ja a freqilencia
acumulada ate o valor quatro da variavel e superior a vinte e cinco. Portanto,
a mediana desse conjunto e
I Md= 41
Observ()fiio: Em virtude de o numero de observa\:OeS ser par, teremos
dois valores centrais, que no caso sao iguais. Assim,
1Md=�=41
b) 0 conjunto de observa\:oes, neste caso, e fmpar: n = 35.
0 elemento mediano sera:
E - � -
35 + 1 18 Md - 2 - 2
A mediana sera o decimo oitavo valor da lista. A Tabela 4.31 mostra
que ate cinco, inclusive, temos dezoito observa�es. Conseqilentemente, 155
156
TABELA 4.31
Xj fj Fj
3 3 3
4 6 9
5 9 18
6 8 26
7 6 32
8 3 35
n = 35
Se tivessemos os valores dispostos individualmente, teriamos a seguinte
lista:
/1 =3 /2 =6 fs =6 !6 =3
� ,.....--.....
3,3,3,4,4,4,4,4,4,5,5,5,5,5,5,5,5,5,6,6,6,6,6,6,6,6,7,7,7,7,7,7,8,8,8
i
Md= 5 ou 189 elemento da lista
Exemplo 28:
Calcular a mediana dos valores constantes da Tabela 4.32.
TABELA 4.32
Xj fj Fj
3 3 3
4 6 9
5 9 18
6 8 26
7 6 32
8 4 36
n = 36
Solu�iio:
Temos n = 36 � n e par. Entao,
n 36 EMd =1=2= 18
A mediana e o decimo oitavo elemento, numero esse que coincide
com o valor da freqilencia acumulada ate cinco: F3 = 18. Mas como quando
n for par a mediana seni igual a media aritmetica dos dais valores centrais,
teremos:
Md=�=55
2 '
4.4.3. Determina�o da Mediana de Valores Tabulados
Agrupados em Classes
Quando os valores da variavel estiverem agrupados em classes, o
calculo da mediana seni realizado por interpola�ao. Tratando-se de dados
agrupados, admite-se que os valores da variavel na distribui�ao de freqiiencias
distribuam-se continuamente. A mediana seni, neste caso, o valor da variavel,
para o qual metade ou cinqiienta por cento da freqiiencia total ( �) flea
situada abaixo e outra metade acima dele. Geometricamente, isso equivale
a dizer que a mediana e 0 valor de x (eixo das abscissas) que corresponde a
perpendicular que divide o histograma em duas partes que apresentam
areas iguais.
No Grafico 4.4, o histograma apresenta-se dividido pela linha tracejada
OP em duas partes exatamente iguais quanto as suas areas.
GRAFICO 4.4
45
0 E 40
35 I
30 I
I
25 101 30
20
I
I
15
35 I
I
10 20 I 40
I 25
5 10 I 15
A 8
0 10 20 30 40 \;so 60 70 80 x
Md=42,5
A mediana sera, entao, a abscissa correspondente a linha OP, a qual
divide o histograma em duas partes iguais. Em virtude de as areas dos
retangulos do histograma corresponderem as freqiiencias das respectivas
classes, OP seni tal que a soma das areas situadas a sua esquerda OU a sua
direita seni sempre igual a metade da freqiiencia total, ou seja, igual ao
elemento mediano. Examinando o Grafico 4.4, podemos ver que
n = 10 + 20 + 35 + 40 + 25 + 15 + 5 = 150,
e que
157
158
Dessa forma, podemos afirmac que a linha OP devera dividir o histograma
em duas partes, sendo a area de cada uma delas igual a 75. Observando
novamente a figura verificaremos que as areas APOD e PBEO correspondem
respectivamente as freqiiencias 10 e 30. Portanto, ate chegar a linha OP, a
area total sera igual a 75, incluindo APOD:
APOD
t 10 + 20 + 35 + 10 = 75
Considerando a area a direita da linha OP, teremos igualmente uma
area numericamente igual a 75, incluindo PBEO.
PBEO
t
30 + 25 + 15 + 5 = 75
Para encontrar a mediana, basta verificar qual o valor da variavel
(eixo das abscissas) que divide o histograma em duas partes iguais. 0 proce
dimento e simples. Se somarmos as freqiiencias das tres primeiras classes,
chegaremos a 65 observayoos, que correspondem ao valor numerico da
soma das areas dos respectivos retangulos do histograma. Podemos dizer,
entao, que ate o valor 40 da variavel (abscissa) houve 65 observayoos.
Como precisamos de 75 observayOeS ( E Md =
1 ;0
= 75) para chegar a
mediana, ha n�cessidade de consideram�os �ais dez valores (observ�goos)
da classe segumte. Em termos proporC1ona1s, devemos considerar
40
de
valores da classe mediana. Uma vez que a amplitude do intervalo de classe
e igual a dez, para chegar a mediana iremos considerar apenas uma fra9ao
dessa amplitude, ou seja: � . Simbolicamente:
AP = 4010 • AB = !Q_ • 10 = 2 5 40 '
Assim, a mediana sera igual a:
Md = 40 + 2,5 = 42,� I Md = 42,5 I
0 mesmo resultado seria obtido a partir do poligono de freqiiencias
acumuladas. Consideremos irlicialmente a Tabela 4.33, que recomp0e os
dados do problema anterior.
TABELA 4.33
Classes 'i Fj
10 f-- 20 10 10
20 f-- 30 20 30
30 f--40 35 65
Classe Mediana- 40 f--50 40 105 EMd = 75
50 f--60 25 130
60 f-- 70 15 145
70 f--80 5 150
150
Fj Frj(%)
160 Loo
140
120 80
100
60 GRAFICO 4.5
80
EMd=75-
·-·-·-
-50%
60 40
40
20
20
0
0 10 20 30 40"' 50 60 70 80 x
Md=42,5
Examinando o poligono de freqiiencias acumuladas representado no
Gnifico 4.5, podemos ver que a mediana ea abscissa do ponto P do poligono
de freqiiencias acumuladas, cuja ordenada e o elemento mediano (EMa = 75), no caso de freqiiencias absolutas, e cinqiienta por cento, no caso de freqiien
cias relativas. Para calcular o valor da mediana, recorremos aos triangulos
semelhantes, RQP e RST, que gozam da propriedade:
RQ = PQ
RS ST
Para determinar a mediana, teremos que fazer:
Md= I + RQ
onde I = limite inferior da classe mediana.
Mas
En tao,
RQ =RS · PQ
ST
RS = c = amplitude do intervalo de classe
PQ = EMd - Fant
Fant = freqiiencia acumulada ate a classe anterior a classe mediana
ST = freqiiencia simples da classe mediana = fmuito numeroso de individuos, que sao semelhantes
quanto a pelo menos uma caracteristica especifica. Freqiientemente, os
metodos deterministas sao inaplicaveis ao estudo de caracteristicas pr6pria�
de conjuntos muito numerosos de fodividuos, face a extrema complexidade
ou mesmo as condi96es peculiares e a natureza do fenomeno estudado.
Trata-se, em particular, do caso em que o conjunto das ocorrencias rela
cionadas com o comportamento da caracteristica analisada esta sujeito ao
acaso. Atraves de uma tecnica de sintese, que e uma caracteristica de seus
metodos, a Estatistica torna possivel analisar os padroes de comportamento
da caracteristica em estudo, conseguindo superar a ir.cetermin�9ao que se
manifesta em casos particulares.
Fisher refere-se a Estatistica como o ramo da Matematica Aplicada
dedicado a analise de dados de observa9ao. A despeito das criticas que esta
coP.cep9ao possa merecer, ela evidencia claramente dois aspectos importantes
do metodo estatistico: o tratamento quantitativo a ser aplicado ao fenomeno
e � observa9ao, tomada em seu sentido mais amplo. Assim sendo, qualquer
ciencia experimental nao pode prescindir das tecnicas proporcionadas pela
Estatistica, citando-se, a guisa de exemplo, a Fisica, a Biologia, a Adminis- ·
tra9ao de Empresas, a Economia, a Psicologia, a Agronomia e outras. Todos
esses ramos de· atividade profissional tern necessidade de um instrumental
que se preocupa com o tratamento quantitativo dos fenomenos de massa
ou coletivos, cuja mensura9ao e analise requerem uin conjunto de obser
va96es de fenomenos individuais ou particulares. Esse mecariismo de amilise
refere-se a um processo de generaliza9ao, a partir de resultados individuais.
Assim, se for observado um certo padrao de regularidade nos resultados de
um experimento qualquer, provavelmente existe uma caracteristica corres
pondente a uma ampla classe de experiencias. Verificando-se a comprova9ao
dessa caracteristica atraves de testes estatisticos adequados, pode-se fazer a
generaliza9ao da caracteristica para todas as categorias de fenomenos seme
lhantes.
Para esclarecer e fixar melhor o conceito de Estatistica, sera inte
ressante dizer-se alguma coisa sobre aquilo que ela nao e.
Em primeiro lugar, a Estatistica nao e, de forma alguma, um metodo
mediante o qual se pode provar tudo aquilo que se deseja. Na realidade, nao
ha nada nos metodos estatisticos capaz de evitar que um indivfduo super-
ficial ou inescrupuloso extraia de um estudo estatistico suas pr6prias con
clus0es, apesar da existencia dos dados numericos. Em segundo lugar, a
EstatiStica nao e simplesmente uma coleyao de dados (estatisticos) nem
constitui um substituto do pensamento abstrato. te6rico ou do exame minu
dente dos casos excepcianais. Dessa forma, os metodos estatisticos nao se
opoem, de modo algum, a analise qualitativa dos casos particulares. Ambos
OS metodos se completam. Alem disso, nao e correto afirmar-se que a EstJ
tistica somente seja aplicavel em presenya de um grande numero de caso�
ou que nao possa ser usada em estudos exploiat6rios.
Para estabelecer o ambito dos estudos da disciplina e adotando-se um
esquema pratico de raciocinio, pode-se dizer que a Estatistica compreende
duas funyoes (ou campos) hem amplas. A primeira funyao e descritiva, e a
segunda e indutiva.
1.2. ESTATISTICA DESCRITIVA E ESTATISTICA INDUTIVA
1.2.1. Estatrstica Descritiva
Principalmente em pesquisa social, o analista defronta-se amiude com
a situayao de dispor de tantos dados que se torna dificil absorver completa
mente a informayliQ que esta procurando investigar. E extremame.rt.ti_ dificil;
captar intuitivamente todas as infomiayoes que os dados contem. Eneces
sario, portanto, que as informayoes sejam reduzidas ate o ponto em que se
possa interpreta-las mais claramente. Em outras palavras, e indispensavel
resumi-las, atraves do uso de certas medidas-sinteses, mais comumente conhe
cidas como estatisticas descritivas ou simplesmente estatisticas. Por conse
guinte, a estatistica descritiva e um numero que sozinho descreve uma
caracteristica de um conjunto de dados. Trata-se, portanto, de um numero
-resumo que possibilita reduzir os dados a proporyoes mais facilmente inter
pretaveis. Evidentemente, ao resumir os dados atraves do uso de estatisticas
descritivas, muita informayao ira necessariamente se perder, alem de ser
provavel a obtenyao de resultados distorcidos, a menos que eles sejam inter
pretados com muita precauyao.
Em um seritido mais amplo, a Estatistica Descritiva pode ser inter
pretada como uma funyao cujo objetivo e a observayao de fenomenos de
mesma natureza, a coleta de dados numericos referentes a esses fenomenos, a
organizayao e a classificayaoMd
I Md =I + c
EMd -
F,,.
. [Md
No exemplo, teremos:
75 - 65 . 100 Md = 40 + 10 40 = 40 + 40 = 42,5
(40)
Md= 42,5 159
160
Observaroes:
1) Tratando-se da distribuiyao de freqiiencias de dados tabulados
agrupados em classes, o elemento mediano seni sempre igual a E Md = � ,
nao se fazendo distinyfo entre numero par OU fmpar de observay6es.
2) 0 calculo da mediana pode ser feito a partir das freqiiencias
relativas. Neste caso,
0,50 - Frant
Md= I+ c ----
frMd
(41)
Fr ant = frequencia reiativa acumulada ate a classe anterior a med1ana
frMd =
freqiiencia simples relativa da classe mediana
No exemplo acima:
65 75 - 65
0•50 -
150 150
Md = 40 + 10 = 40 + 10 ----
40 40
150 150
= 40 + 10 � =
·
42,5
Exemplo 29:
Calcular o consumo mediano de eletricidade (kw/hora) dos 80 uswirios,
utilizando os dados do exemplo 7.
a) Por formula.
b) Por interpola"iio.
c) Graficamcnte.
Solu�iio:
A Tabela 4.34 apresenta os dados do problema.
"TABELA 4.34
Consumo Numero de Fj kwh usuarios: fj
5 i:-- 25 4 4
251--- 45 6 10
451--- 65 14 24
651--- 85 26 50
85 f---105 14 64
105 f---125 8 72
125 1--145 6 78
145 1--165 2 80
80
a) Primeiro Metodo: Resolurao por Formula
Para aplicayao da f6nnula, precisamos dos seguintes dados:
n 80
EMd =1=2= 40
Classe mediana: 6Sf---
-
85, uma vez que, ate 85, temos cinqiienta
observayaes, e ate 65 apenas 24.
/. = limite inferior da classe mediana = 65
c = amplitude do intervalo de classe = 20
f Md = freqilencia simples da classe mediana = 26
Fant = freqilencia acumulada ate a classe anterior a classe mediana = 24
Conforme a formula (40), devemos ter:
EMd - Fant Md=! +c ---- = 65 + 20 40 - 24 =
fMd
= 65 + 320 = 65 + 12 31 26 '
26
I Md= 77,31 I
0 consumo mediano, por conseguinte, e de 77,31 kwh.
b) Segu.ndo Metodo: Por Interpolarao
Admite-se que o consumo se distribui continuamente e o consumo
mediano e o valor tal que metade dos 80 valores lhe seja inferior e metade
superior. Para obter a mediana, devemos localizar o quadragesimo elemento,
ja. que EMd = 40. Percorrendo a Tabela 4.34 na coluna de freqiiencias
acumuladas, verificaremos que o quadragesimo elemento encontra-se na
quarta classe: 65f----85. Como ate a terceira classe, inclusive, acumulamos
24 observaiyoes, precisamos de mais 16 para completar as 40 necessarias.
Assim sendo, se tomarmos todo o intervalo da quarta classe, estaremos
considerando todas as observaiyaes dessa classe (26). Entretanto, interessam
-nos apenas 16 observayoes para atingir o ponto que corresponde a mediana.
Para saber que parcela. do intervalo da classe mediana (c = 20) devemos
levar em consideraiyao, faremos a seguinte regra de tres simples:
{26 ----20
16 ----- x
x = 20 ;6
16 = 12,31
Acrescentando-se esse valor ao limite inferior da classe mediana,
chegaremos a
.... , M_d_=_6 _5 -+-12-, -31 _=_ 7_7-,3 -1--.I
valor igual conseguido com o uso da f6rmula (40). Na realidade, esse ultimo
e apenas o resultado de interpolaiyao. Assim, de acordo com o que vimos
acima, 161
on de
=
20 x 16
= 20 � x 26 26
20 = c
16 = 40
- 24 = EMd - Fant
26 =[Md
Substituindo os numeros pelos simbolos que os representam, temos
EMd - Fant
x=c
f Md
que, somado ao limite inferior da classe mediana (/ ), reproduz a formula (40).
EMd - Fant
Md =I+ c ----
[Md
c) Terceiro Metodo: Determinariio Grtifica da Mediana
Inicialmente construiremos o poligono de freqtiencias acumuladas
(ogiva).
N(lmerode
Usu6rios
80
70
60
60
EMd =40
30
20
10
Fj
Pon:entagem de
Usudrios
Fri(%}
100
76
- -- - - -- 60
26
O 5 25 45 66 \ss 106 126 146 166 Consumo kwh
Md= 77,31
GRAFICO 4.6
A partir do eixo das ordenadas na altura correspondente ao elemento
mediano (40), no caso de freqtiencias absolutas, ou a cinqtienta por cento,
no caso de freqtiencias relativas, tra�amos uma paralela (linha interrompida)
ao eixo das abscissas, ate encontrar o ponto P na ogiva. ·nesse ponto,
baixamos uma perpendicular ao eixo das abscissas, encontrando nesse o
valor da variavel representativo da mediana Md = 77 ,31. E natural que
a leitura da mediana no grafico s6 pode ser realizada aproximadamente.
0 valor exato so se consegue mediante a aplica�ao da formula (40), ou
162 pelo metodo de interpola�ao, que lhe e equivalente.
Exemplo 30:
Calcular a mediana do problema do exemplo 29:
a) Utilizando a formula das freqiiencias relativas; e
b) Graficamente, atraves do histograma.
Solufiio:
a) Primeiro Metodo: Por Fonnu/a
A Tabela auxiliar 4.35 fornece OS dados necessarios para 0 calculo
da mediana.
TABELA 4.36
Consumo Numerode
kwh usu6rios: fj
5l--25 4
251--45 6
451--65 14
Classe Mediana 651--85 26
851--105 14
1051--125 8
1251--145 6
1451--165 2
n = 80
0 elemento mediano, como vimos, e
n 80
EMd =1= 1= 40.
Porcentagem de
usuarios: ''i (%)
5,0
7,5
17,5
''Md 32,5
17,5
10,0
7,5
2,6
100,0
Fri
6,0
12,5
30,0
62,5
80,0
90,0
97,5
100,0
Em termos porceqtuais, o elemento mediano corresponde a cinqiienta
por cento da distribuiyao. Com esse valor, localizamos -a classe mediana
(65f--85). Assim sendo; teremos, de acordo com a formula (41),
Md = I + c
0,50 - Frant
= 65 + 20
0,50 - 0,30
=
fr Md 0,325
= 65 +
0
:
25
= 65 + 12,31 I Md= 77,31 I
'
b) Segundo Metodo: Por Grtifico
Observando o Grafico 4.7, podemos notar que ate a ierceira classe
(45 f--65), inclusive, houve 24 observayoos (4 + 6 + 14). Como o elemento
mediano e igual a 40, precisamos ainda tomar 16 _observayoos das 26 da
classe seguinte (40 ___:___ 24). Em termos proporcionais, precisamos de ;� c,
onde c e a amplitude do intervalo de classe.
16 �����������
26 X
20 = 12,31 Md= 65 + 12,31 = 77,31
163
NUmero de
usuarios
'i
28
24
20
16
12
8
4 14
0 6 26 45
10
-c-
I
I
I
I
I
I
I
I
I
16 �
I
I
I
I 14
2,311
66 \ 85 105 126
MU= 77,31
146 165
= 80
EMd= -!!J! =40
Classe Med;ana: 65 I-- 85
= 20
Consumo �h
GRAFICO 4.7
4.5. CONSIDERACOES ADICIONAIS SOBRE A MEDIA
ARITMETICA, A MODA E .A MEDIANA
164
Dentre as varias medidas de tendencia central, seguramente a media
aritmetica e a mais utilizada. Entretanto, existem casos que justificam o
emprego de outra medida. Antes de entrarmos nesses pormenores, vejamos
como podem ser relacionadas as tres principais medidas de tendencia central:
media (aritmetica), moda e mediana.
4.5.1. Rela�o Empfrica entre a M6dia, a Moda e a Mediana
Karl Pearson desenvolveu uma f6rmula empirica de relaylio entre a
media, a moda e a mediana. Existem algumas condiyoos a serem satisfeitas
para que a relaylio proposta por Pearson se verifique com maior aproximaylio:
a) A distribuiQiio (curva) de freqiiencias deve ser unimodal.
b) A distribui9ao de freqiiencias deve ser fracamente assimetrica.
c) 0 numero de observaQoes deve ser suficientemente grande e · pequena
a escala de unidades que divide a distribuiQiio.
A relayliO de Pearson e a seguinte:
I x -M0 = 3(x - Md) I (42)
Se quisermos calcular cada medida a partir dessa relaya'o, teremos:
x 3Md -Mo
-
2
M0 = 3Md - 2x (43)
Md= 2x +Mo
3
Exemplo 31:
Utilizando os dados dos exemplos 7 e 29, calcular a media, a moda
(Czuber) e a mediana e comparar os resultados com os da relayao empirica
de Pearson.
Solu(iio:
lnicialmente, reproduziremos na Tabela 4.36 OS dados necessarios a
resoluc;ao do problema.
TABELA 4.36
Classe Modal
Classe Medians
Devemos ter:
k
Consumo
kwh
51---- 25
251---- 45
451---- 65
651---- 85
851----105
1051---- 125
1251---- 145
1451---- 165
Numerode
usufJrios: fj
4
6
14
26
14
8
6
2
n = 80
L Xjfi 6 360 = 79 5 j=l
n 80 '
Xj
15
35
55
75
95
115
135
155
Xjfj
60
210
770
1 950
1 330
920
810
310
6 360
x = 79,5
Fj
4
10
24
50
'64
72
78
80
n = 80
k = 8
b.1 Mo= I + c --
t::..1 + t::..2
= 65 + 20 (26 - l4) = 75 (26 - 14) +(26 - 14)
I M0 = 75 l
Md = l + c EM�:aFant = 65 + 20 40 2� 24 = 77,31 IMd = 77,311
Pela relac;ao empfrica
Mo = 3Md - 2.X = (3 X 77,31) - (2 X 79,5) =
= 231,93 - 159,0 = 72,93 £: 73
Md = 2.X + Mo = (2 X 79,5) + 75 78 3 3
M0 = 73
I Md= 78 I
- 3Md - Mo - (3 X 77,31) - 75 78,465 ::::: 78,5 I x = 78,5 - 2 - 2 . 165
Como pode ser visto, nao ha uma discordancia acentuada entre as
medidas calculadas pelos dois processos.
4.5.2. Caracterrsticas da Media, da Mediana e da Moda
Uma forma util de comparar as medidas de tendencia central e
atraves da utilizayao de um diagrama. Devemos, entretanto, lembrar, antes
de qualquer considerayao, que tais medidas se baseiam em conceitos distintos.
Assim e que a media aritmetica e a soma dos valores observados dividida
pelo numero total deles; a mediana e 0 valor que divide a serie em duas
partes iguais quanta ao numero de valores de cada parte e a moda e o
valor em cuja vizinhanya tendem a se concentrar os valores da serie.
a) Conceitos Fisicos das Medidas de Tendencia Central
Conforme dito anteriormente, o conceito de media aritmetica corres
ponde ao de centro de gravidade estudado em Ffsica. Esse fato nos revela
que essa medida e afetada de maneira acentuada pelos valores extremos da
serie, o que nao acontece com a moda e a mediana. Assim, por exemplo,
Numero de
Observat;:6es 30
25
20
15
10
5
0
.( Empregado B
' ........................
2 x =2 3 Minutos
Os tempos obtidos por B revelam sua menor eficiencia em relat;:ao a A.
GRAFICO 4.8
duas series podem apresentar a mesma media mas suas distribuiyOeS serem
diferentes. Suponhamos que dois empregados executem uma determinada
tarefa, em media, em dais minutos, sendo esse resultado calculado a partir
de um certo numero de observayCies realizadas. Alguem poderia estar
tentado a concluir, com base nessa informayao, que ambos os empregados
apresentaram a mesma eficiencia. Um exame mais acurado da distribuiyao
dos tempos de execu\:aO da tarefa pode, entretanto, revelar resultados
discrepantes para essas pessoas, conforme pode ser notado no Grafico 4.8,
na pagina anterior.
Outro Grafico muito ilustrativo da influencia dos valores extremos
166 sobrc a media e 0 4.9.
GRAFICO 4.9
A c52lEJ��
Mo l •
cS 2l El �jB El 2l 2l El
Md
As disposi\!OeS A e B, embora revelem a mesma media aritmetica,
nao podem ser eonsideradas iguais. Em A, OS oito itens situados a esquerda
da media estlio compensados por apenas um que se encontra muito a sua
direita, de modo que o centro de equilfbrio esteja em x. Em B, os mesmos
oito itens a esquerda da media sao compensados por seis a sua direita. Nessa
dispoSi\!lIO, e pOSSlVel ainda vislumbrar 0 posicionamento tipiCO das medidas
de tendencia central em distribui�es ligeiramente assimetricas a direita.
Em termos de uma curva de freqiiencia, percebe-se melhor esse posiciona
mento (Gnifico 4.10).
GRAFICO 4.10
MoMd 'i"
SitN$1o de nttdi9 arhmttiA.. d• ,.....,. • • mead! .,. um• diltribuil;lo com _.....,.. ii diNIU
No exemplo 30, tivemos os seguin tes result ados, que confirmam o
que acabamos de dizer no que se refere a disposi�ao0 valor que 0 divide em duas partes iguais quanto ao numero
de elementos, isto e, cinqilenta por cento ou dois quartos dos valores
do conjunto sao menores, e os dois quartos restantes sao maiores do que ele.
O elemento mediano e calculado, como veremos, atraves da seguinte expressao:
2n n
EMd = EQ, = 4 - 2
c) Terceiro Quartil
Simbolo: Q3
DefinifiiO: Dado um conjunto ordenado (ordem crescente) de valores,
0 terceiro quartil e 0 valor que divide 0 conjunto em duas partes tais que
setenta e cinco por cento ou tres quartos dos valores sejam menores e
vinte e cinco por cento ou um quarto sejam maiores do que ele. 0 elemento
que indica a ordem em que n encontra o terceiro quartil e calculad0, para
dados tabulados, como segue:
EQ =
3n
• 4 '
oride n e 0 nilmero de valores observados�
Genericamen te, para determinar a ordem ou posi�ao do quartil a
ser calculado, usaremos a seguinte expressao:
onde:
�
�.
i = numero do quartil a ser calculado
n = m'.imero de observa�0es.
Sfmbolo: D; i = l , 2, . . . ' 9
(44)
4.6.2. Decis
A defini�ao dos decis obedece ao mesmo principio da dos quartis,
com a modifica�ao da porcentagem de valores que ficam aquem e alem do
decil que se pretenda calcular. Assim, por exemplo:
a) Primeiro Decil: D1
0 primeiro decil de um conjunto ordenado (ordem crescente) de valores
e o valor que divide um conjunto em duas partes tais que dez por cento ou
um decimo dos valores sejam menores e nove decimos ou noventa por cento
sejam maiores do que ele. 0 elemento que indica a posi�ao do segundo decil
e calculado pela seguinte expressao:
.
n
ED =-1 10
b) Segundo Decil: D2
Trata-se do valor que divide o conjunto em duas partes, tais que vinte
por cento ou dois decimos dos valores sejam menores e oitenta por cento
ou oito decimos dos valores sejam maiores; para saber a ordem do segundo
decil, usamos a expressao:
2n ED= -
2 10
De especial interesse e o quinto decil, que divide o conjunto em duas
partes, tais que cinco decimos ou cinquenta por cento dos valores sejam
menores e cinco decimos ou cinquenta por cento dos valores restantes
maiores do que ele. Assim sendo, o quinto decil e igual ao segundo quartil,
que por sua vez e igual a mediana. 0 elemento que indica a ordem do quinto
decil e igual ao elemento mediano, ou seja:
E =Sn = !: = 2n D, 10 2 . 4
Podemos, entao, afirmar que
I Md= Ds = Q2 I
De uma forma geral, para calcular os decis, recorreremos a seguinte
expressao que define a ordem em que o decil se encontra:
(45)
on de
n = numero de valores observados
i = numero que identifica o decil a ser calculado
4.6.3. Percentis ou Centis
Sfmbolo: C; i = 1, 2, 3, . . . ' 99
Neste caso; cada parte em que foram subdivididos os valores do
conjunto, atraves dos novcnta e nove centis, contara com um centesimo
ou um por cento dos valores do conjunto.
0 elemento que definira a ordem do centil, em uma distribui�ao de
frequencias de valores tabulados agrupados em classes, sera encontrado
pelo emprego da expressao:
on de
1�
=
�1
�
i = numero identificador do centil
n = nilmero total de observa�oos 171
172
E oportuno lembrar que os centis englobam todos os decis e quartis.
Assim, por exemplo:
a) Decimo Centi/: C10
0 decimo centil dividira o conjunto ordenado (ordem crescente) de
valores em duas partes, tais que dez por cento ou dez centesimos dos
valores do conjunto sejam menores e noventa por cento ou noventa cente
simos sejam maiores do que ele. Teremos, entao:
Ec,o
10 X n n
= 100 = 1Q = O,ln OU
EDi
I X n n O,ln = 10 = = IO
b) Vigesimo Centi/: C20
O vigesimo centil e igual ao segundo decil, porque
20 X n 2n
Ec20 = 100 = 0,2n = ED, =lo = 0,2n
c) 0 vigesimo quinto centil e igual ao primeiro quartil, porque
25n n }
Ee = - = - = 0 25n
25 100 4 '
Ec,s = EQ,
In
EQ = - = 025n
I 4 '
Esquematicamente, indicamos na Tabela 4.37 as equivalencias entre
centis, decis e quartis.
A formula de caiculo dos centis sera:
· Ee; - Fant
C;=l+c r
JC;
Exemplo 32:
(47)
Utilizando os dados do problema 29, calcular as seguintes medidas
(p. 160):
a) Trigesimo centil: C30
b) Quinquagesimo centil: C50
c) Septuagesimo quinto centil: C75
d) Decimo quinto .centil: C15
e) Vigesimo quinto centil: C2s
O Nono decil: D9
TABELA 4.37
Centi/ Dec ii auartil Justificativa pelo
C10 D1 -
C20 0-z -
C2s - a1
C30 D3 -
C40 D4 -
Cso Ds al=Md
c60 06 -
C70 07 -
C1s - a3
Cso Ds -
C90 D9 -
Solu�iio:
a) Trigesimo Centi/: C30
Ee;
10n Ec•o = 100 = 0, 1n
20n Ec20 = 100 = 0,2n
Ec,s
25n n
= 100 = 0,25n =4
JOn Ee» = 100 = O,Jn
40n Ee"' = 100 = 0,4n
50n Ecso = 100 = 0,5n
E _ 60n _
c(/J
-
100 - 0,6n
70n Ec10 = 100 = 0,7 n
75n Jn Ec,s = 100 = 0,75n =4
80n Ecao = 100 = o,an
E _ 90n _
C90 - 100
- 0,9n
1n E01 = 10 =0,1n
2n Eo2=10 =0,2n
'1n n Ea1 = 4 =4 = 0,25n
Jn Eo3=10 =O,Jn
E =
4n
=0 4n D4 10 '
{ ""
E05 = 10 = 0,5n;
n 2n EMd=2= 4 =0,5n
6n E06 = 10 = 0,6n
7n Eo, = 10 =0,7n
Jn Ea2 = 4 = 0,75n
8n E08=10 =O,Sn
9n Eo, = 10 =0,9n
a. I) Elemento que define a ordem ou posi�ao do trigesimo centil:
i. n Ee;=
100
conforme a expressao (46).
Neste caso, i = 30 e n = 80. Assim,
E _ 30 X 80 = 2 400 = 24
C,o - 100 100
Portanto, o trigesimo centil sera o vigesimo quarto elemento do con
junto ordenado de valores.
a.2) Localiza�ao da classe onde se encontra o trigesimo centil.
Percorrendo a coluna das freqiiencias acumuladas, verificaremos que o
vigesimo quarto elemento da lista se encontra na terceira classe:
451-----65. Como esse valor coincide com a freqiiencia acumulada
ate a terceira classe, deduziremos, de imediato, que C30 = 65. 173
a.3) Aplica1tlio da formula.
GRAFICO 4.11
174
Para comprovar que C30 = 65, apliquemos a f6rmula{47):
Eci - Fant
Ci = I + c ----
lei
Neste caso,
l = limite inferior de classe onde se encontra o trigesimo centil:
45
c = amplitude do intervalo de classe: 20
Eci = elemento indicativo da ordem ou posil(lio do trigesimo centil:
E =
30 X 80 =
240 C30 100
.
Fant freqiiencia acumulada ate a classe anterior a classe onde se
encontra o trigesimo centil: 10
lei = lc30 = freqiiencia simples de classe onde se encontra o
trigesimo centil: 14
Assim,
C30 = 45 + 20
24
-
10
= 45 + 20 = 65
14
C30 = 65
Interpreta1tlio: Trinta por cento (30%) dos usuarios apresentaram um
consumo de ate 65 kwh, enquanto. que setenta por cento apresentaram
um consumo superior a 65 kwh.
Graficamen te,
N7 86 14 ' '
e) Vigesimo Quinto Centi/: C2s
e. l ) Ordem ou posiylio do C25
E _ 25 X 80 = 209
Cis
-
100
Da mesma forma,
EQ = l X 80 = 209
I 4
Concluimos, entlio, que C25
=
Q1•
e.2) Classe onde se encontra o vigesimo quinto centil: 451----65.
e.3) Calculo do vigesimo _quinto centil.
20 - 10
C25 = 45 + 20
14
= 45 + 14,29 = 59,29
I C::is = Q1 = 59,29
f) Nono Decil: D9
f.1) Ordem ou posiylio do D9
D
_ 9 X 80
= 729 9 -
IO
De igual modo,
90 x 80
C90 =
lOO
= 729
En tao, C90 = D9.
f.2) Classe onde se encontra o nono decil: 1051--125.
f.3) Calculo do nono decil
D9 = 105 + 20
72 - 64
= 125
8
D9 = C90 = 125
Esse resultado ja era previsto, uma vez que 72 e um valor que coincide
com o encontrado na coluna de freqiiencias acumuladas.
Exemplo 33:
lnterpretar os seguintes resultados do problema 32.
a) C30 = 65
b) C25 = 59,29
c) D9 = 125
Soluriio:
a) C30 = 65
0 valor 65 refere-se ao consumo de energia em kwh. Como esse valor
corresponde ao trigesimo centil, podemos afirmar que trinta por cento dos
oitenta usuarios consumjram ate 65 kwh, ensiuanto que setenta por cento
consumiram mais de 65 kwh. Em termos da onlem ou posiyao que o trigesimo
centil ocupa na distribuiyao do consumo pelos usuarios, temos, conforme
foi visto: Ec30 = 24°.
b) C25 = 59,29
Neste caso, podemos dizer que um quarto ou vinte e cinco por cento
dos usuarios consumiram ate 59,29 kwh. Conseqtientemente, tres quartos ou
setenta e cinco por cento dos oitenta usuarios consumiram mais de 59,29 kwh.
Notar que
E
_ 25 X 80 _
E
80
C2s - 100 - Q1 = 4
c) D9 = 125
0 nono decil corresponde ao nonagesimo centil. Assim, podemos dizer
que nove decimos ou noventa por cento dos usuarios apresentaram um
consumo de energia igual ou inferior a 125 kwh, e dez por cento um
consumo superior.
EXERCfCIOS PROPOSTOS
4.1.- A tabela abaixo representa os salarios pagos a 100 operanos da empresa
GLT &Cia.
N9 de sa/srios Navaliar o grau de variabilidade ou dispersao dos valores de um
conjunto de numeros, lan�aremos rnio das estatfsticas denominadas medidas
de dispersao. Essas nos proporcionarao um conhecimento mais completo
do fenomeno · a ser analisado, permitindo estabelecer compara�aes entre
fenomenos de mesma natureza e mostrando ate que ponto os valores se
distribuern acima ou abaixo da tendencia central.
Iremos tratar de dois tipos de medidas de dispersao:
I) Medidas de Dispersiio Absoluta
a) Amplitude total;
b) Amplitude serni-interquartt1ica;
c) Desvio rnedio;
d) Variincia e desvio-padrao.
II) Medidas de Dispersiio Re/ativa
a) Desvio quartil reduzido;
b) Coeficiente de varia,.S:o de Pearson;
c) Coeficiente de varia�ao de Thorndike;
d) Coeficiente do intervalo quartiL
5.2. MEDIDAS DE DISPERSAO ABSOLUTA
5.2.1. Amplitude Total ou lntervalo Total
Simbolo: At
DefinifiiO: A amplitude total de um conjunto de numeros e a diferen�a
entre os valores extremos do conjunto.
Exemplo I:
182 Calcular a amplitude total dos seguintes conjuntos de numeros:
A = {10, 12, 13, 20, 25, 34, 45}
B = {17, 18, 19, 20, 21, 22, 23}
c = {-4, -3, -2, 3, 5}
Solu¢o:
Para o conjunto A, temos: At = 35 - 3 = 32
Para o conjunto B, temos: At = 23 - 17 = 6
Para o conjunto C, temos: At = 5 - (-4) = 9
Se os dados vierem dispostos em uma tabela de freqtiencias, com os
valores agrupados em classes, ha duas formas de se definir a amplitude total:
Primeiro Metodo: At = Ponto m�dio da ultima classe - ponto medio
da primeira classe.
Segundo Metodo: At = Limite superior da ultima classe - limite
inferior da primeira classe.
Exemplo 2:
Calcular a amplitude total dos valores dispostos na Tabela 5.1.
TABELA 5.1
Classes fj
101-20 5
201-30 12
301-40 20
401-50 14
501-60 10
601-70 4
n = 65
Solu¢o:
Pelo primeiro metodo: At= 65 - 15 = 50.
I At= 50 I
Nesse metodo OS valores extremos sao eliminados.
Pelo segundo metodo: At = 70 - 10 = 60.
Restriflies ao Uso da Amplitude Total
Xj
15
25
35
45
55
65
Embora a amplitude total seja a mais simples das medidas de dispersao,
ha uma forte restri?o ao seu uso em virtude de sua grande instabilidade,
uma vez que ela leva em conta apenas os valores extremos da serie. Compa-
remos os conjuntos A e B do exemplo I : 183
184
Con jun to Mlidia Amplitude
x total: At
A= {10, 12, J3, 15, 20, 25, 45} XA = 20 AtA = 35
8 = {17, 18, 19, 20, 21, 22, 23} xs = 20 Ats= 6
A media aritmetica de cada um
Md==>
03 ==>
TABELA 5.3
Classes fj
101--20 5
201--30 10
301--40 15
401--50 20
501--60 15
601--70 10
701--80 5
80
E - � = 80 = 200 Q. - 4 4 .
EMd = 2: = 2 X
4
80 = 409
3n 3 X 80
EQ3 = 4 = 4 = 609
De acordo com esses dados, calcularemos:
Q = 30 + 10 20 - 15 = 33 33 1
15
'
40 - 30
Q2 = Md = 40 + IO -w-- = 45
60 - 50 Q3 = 50 + IO
15 = 56,67
Dq = 56
,
67 ; 33,33 = l l ,67
Fj
5
15
30
50
65
75
80
{ Md - Dq = 45 - 11,67 = 33,33 = Q1
Md+ Dq = 45 + 11,67 = 56,67 = Q3
Como a distribuiyao e simetrica, OS limites do intervalo Md ± Dq
coincidem com os quartis primeiro e terceiro, o que equivale a dizer que
esse intervalo compreende cinquenta por cento das observay6es (40 obser
vay6es).
ObservQfoes:
1. 0 desvio quartil apresenta como vantagem o fato de ser uma medida
facil de calcular e de interpretar. Alem do mais, nllo e afetado pelos
186 valores extremos, grandes ou pequenos, sendo recomendado, por conse-
guinte, quando entre os dados figurem valores extremos que nao se
consideram representativos.
2. 0 desvio quartil devera ser usado preferencialmente quando ·a medida de
tendencia central for a mediana.
3. Trata-se de uma medida insensfvel a distribuiyao dos itens menores que
Qi, entre Qi e Q3, e maiores que Q3•
5.2.3. Oesvio M6dio
Sfmbolo: Dm
0 desvio medio OU media dos desvios e igua) a media aritmetica dos
valores absolutos dos desvios tomados em relayao a uma das seguintes
medidas de tendencia central: media ou mediana.
a) Desvio Medio para Dados Brutos
Quanda os valores nao vierem dispostos em uma tabela de freqiiencias,
o desvio medio sera calculado, de acordo com a definiyao, atraves do emprego
de uma das seguintes f6rmulas:
n
L Ix; - xi
i=i
Dm= ----n
onde d; = (x; - x) = desvio em relayao a media aritmetica.
n
L Ix; -Mdl
i=i
Dm= -----n
onde d; = x; - Md = desvio em relayao a mediana.
(2)
(3)
As barras verticais indicam que silo tomados os valores absolutos,
prescindindo do sinal dos desvios. Pode um dos n desvios ser tornado como
se fosse positivo.
Exemplo 4:
Calcular o desvio medio dos con1untos de nfuneros apresentados no
exemplo 1:
A = {10, 12, 13, 20,25, 34, 45}
B = {17, 18, 19, 20, 21, 22, 23}
c = {-4, -3, -2, 3, 5}
Os dados necessarios para 0 calculo do desvio medio silo:
XA = 10 + 12 + 13 + 20 + 25 + 34 + 45 159 = 22,714 7 =1
MdA = 20
XB = 17 + 18 + 19 + 20 + 21 + 22 + 23 = 140 = 20
7 7
MdB = 20 187
Xj
10
12
13
20
25
34
45
Xj
17
18
19
20
21
22
23
188
Xc=(-4)+(-3)+(-2)+3+5=-1 =-0,2 5 5
Mdc = -2
Desvio Media do Conjunto A
TABELA 5.5
Xj-X lxi-xl Xj-Md
10 -22,714 = -12,714 12,714 10 -20 = -10
12 -22,714 = -10,714 10,714 12-20=-8
13 -22,714 = -9,714 9,714 13-20=-7
20 -22,714 = -2,714 2,714 20-20=0
25 -22,714 = 2,286 2,286 25-20 = 5
34 - 22,714 = 11,286 11,286 34-20=14
45-22,714 = 22,286 22,286 45-20 = 25
Llxi- xl = o Llxi-xl=11.714
x = 22,714
Md= 20
Usando as formulas (2) e (3), chegaremos a:
Pela Media
7
L Ix; - 22,7141
i=l Dm =-------7
Pela Mediana
7
L: 1x;- 201
71�14 = 10,245
lxi-Mdl
10
8
7
0
5
14
25
Llxi-Mdl =69
Dm = 10,245
Dm = _i=_i _____ 69 = 9 857 7 7 ' Dm = 9,857
Desvio Media do Conjunto B
TABELA 5.6
Xj-X lxi-xl
17 -20=-3 3
18-20=-2 2
19 -20 = -1 1
20-20= 0 0
21 -20 = 1 1
22 -20 = 2 2
23-20 = 3 3
L(Xj-X) = 0 Llxi-xl= 12
�
�
x;-Md
17 -20 = -3
18-20=-2
19 -20 = -1
20-20 = 0
21 -20 = 1
22-20= 2
23-20= 3
lxj-Mdl
3
2
1
0
1
2
3
Llx;-Mdl= 12
Neste caso, o desvio medio e igual, tanto quando calculado a partir
da media como da mediana, uma vez que x =Md= 20.
Pela Media
7
I Ix; - 201
i=l 12 1,714 Dm = 1,714 Dm = -=
7 7
Pela Mediana
7
I Ix; - 201
i=l
Dm 7
Desvio Medio do Conjunto C
Xj
-4
-3
-2
3
5
x;-x
(-4) -(-0,2) = -3,8
(-3) -(-0,2) = -2,8
(-2) -(-0,2) = -1,8
3 -(-0,2)= 3,2
5 -(-0,2)= 5,2
x = -0,2
Md=-2
12 1,714 =-=
7
TABELA 5.7
lx;-xl x;-Md lx;-Mdl
3,8 -4-(-2)=-2 2
2,8 -3-(-2)=-1 1
1,8 -2 :-(-2)=0 0
3,2 3-(-2)=5 5
5,2 5-(-2)=7 7
�lx;-xl = 16,8 �lx;-Mdl= 15
Como ocorreu para o primeiro conjunto, o desvio medio neste caso
e menor quando tornado em relayliO a mediana do que em relayliO a
media.
Pela Media
�Ix; - (-0,2)1 16 8
Dm =
5 = S :::: 3,36
Pela Mediana
·� Ix; - (-2)1 15
Dm =
5
=
s
= 3
b) Desvio Medio para Dados Tabulados
Dm = 3,360
Dm = 3
Se os valores vierem dispostos em uma tabela de frequencias, agrupados
ou na:o em classes, sera:o usadas as seguintes f6rmulas:
Cdlculo pela Media
k•
L lx1 - xlfj
j=t
n (4)
onde x1 representa um valor individual ou um ponto medio da classe. 189
190
Cdlculo pela Mediana
k
I lxj - Mdlfj
= j=l
Dm
Exemplo5:
n (5)
Calcular o desvio medio dos valores representativos do consumo de
energia eletrica (em kwh) de 80 usuarios (exemplo 7 do Capftulo 4).
TABELA 6.B
I(= 79,5 Md= 77.31
NUmero de
I Consumo Usu,rios x; "i'i Xj-X lx;-xlf; Xj-Md lx;-Mdlf; F;
f;
5f-25 4 15 60 -64.5 64.6 x 4 =258 -62.31 62.31 x 4 = 249.24 4
25f-45 6
I
35 210 -44.5 44.5 x 6 = 267 -42.31 42.31 x 6 = 253.86 10
45f-65 14 55 770 -24.5 24.5 x 14 = 343 -·22.31 22.31 x 14 = 312.34
1: 65f-85 26 75 1 960 -4.5 4.5X26=117 -2.31 2.31 x 26 = 60.06
85f-105 14 95 1 330 I 15.5 15,5 x 14 = 217 17,69 17,69 x 14 = 247,66
105f-125 8 115 920 I 35,5 35,5 x 8 = 284 37,69 37,69 x 8 = 301,52 72
125f-145 6 135 810 55.6 55,5 x 6 =333 57,69 57,69 x 6 = 346,14 78
145f-165 2 155 310 75,5 75.5X2=151 77,69 77,69 x 2 = 155.38 80
I 80 "i:x;f;= 6 380 "i:lx1-xlf1= 1 970 °i:lx1-Mdlf;= 1 926,2
A media aritmetica fo1 calculada no exemplo 7 (x = 79,5), e a
mediana no exemplo 29 (Md = 77 ,31) do capftulo precedente. Teremos,
entao:
Cdlculo pela Media
8
I lxi - 79,5 lfj
_,_i_=_ l ----- = 1 970 = 24 625 80 80 '
Ctilculo pela Mediana
8
I IXj - 77,31 lfj
.._i_= l _____ = l 926,2 = 24,078 80 80
Temos novamente neste exemplo o desvio medio, calculado com base
na mediana, menor que o calculado com base na media aritnietica.
Observ(lfoes:
1. 0 desvio medio resulta mais vantajoso que as medidas de dispersao
precedentes, principalmente pelo fato de, em seu calculo, levar em consi
derayao todos os valores da distribuiyao.
2. 0 desvio medio, calculado levando-se em considerayao os desvios em
torno da mediana, e minimo, OU seja, e menor do que qualquer desvio
medio calculado com base em qualquer outra medida de tendencia central.
3. Apesar de o desvio medio expressar aceitavelmente a dispersao de uma
amostra, nao e tao frequentemente empregado como o desvio-padrao, o
qual sera descrito mais adiante, pois este se adapta melhor a uma ampla
gama de aplica�0es. Alem disso, 0 desvio medio despreza 0 fato de
alguns desvios serem negativos e outros positivos, pois essa medida os
trata como se fossem todos positivos. Todavia sera preferido o uso do
desvio medio em lugar do desvio-padrio, quando esse for indevidamente
influenciado pelos desvios extremos.
5.2.4. Desvio-padrio
Simbolo: S
0 desvio-padrio e a medida de dispersio mais usada, tendo em
comum com o desvio medio o fato de em ambos serem considerados os
desvios com rela�ao a x. S6 que, no calculo do desvio-padrio, em lugar de
serem usados os valores absolutos das discrepancias ou desvios calculam-se
os quadrados desses.
No capitulo anterior vimos que a media quadratica de um conjunto
de nfuneros (item 2.4) e a raiz quadrada da media aritmetica dos quadrados
dos valores desse conjunto. Pois bem, o desvio-padrao nao e seniio uma
media quadratica dos desvios em rela�o a media aritmetica de um conjunto
de nfuneros, ou seja, e a raiz quadrada da media aritmetica dos quadrados
dos desvios, estes tomados a partir da media aritmetica.
a) Desvio-padr(fo de Dados Brutos
Seja o seguinte conjunto de nfuneros: X = {x1, X
2
, • • • , Xn}. 0 desvio
-padrio OU a media quadratica dos desvios OU afastamentos em rela�ii'O a
media aritmetica desse conjunto Sera definido por:
M S= =
n
(x; - x)2
n
(6)
onde d; = (x; - x).
Se desenvolvermos o numerador da expressao sob o radical, chegaremos
a f6rmula desenvolvida do desvio-padrao:
I:(x; - x)2 = I:(xJ + x2 - 2x;x) = I:xf + I:x2 - 2I:x;x =
= I:xJ + nx2 - 2xI:x; =
2 ( I:x; )2 2(I:x;) (I:x;) _
= I:x1 + n -- - ·
n n
2
n(I:x;)2 2 (I:x;)2
2
(I:x;)2
= I:x1 + 2
= I:x; -
n n n
Dessa forma, podemos escrever:
S= _!_ [ I:x? -
(I:x;)2 ]
n 1 n
(7)
191
Observafao:
Quando o desvio-padrao representar uma descriyao da amostra e nao
da popula�o, caso mais freqiiente em estatistica, o denominador das
expressoes 6 e 7 seni igual an -1, em vez den. A razao desse procedimento
reside no fato de que, utilizando o divisor (n - 1), obtem-se uma estimativa
melhor do parametro de populayao. Alem do mais, apenas (n -1) das
discrepancias (x; - x) do independentes, uma vez que essas (n - 1) dis
crepancias determinam automaticamente a n-6sima. Para valores grandes
de n(n > 30) nao M grande diferenya entre os resultados proporcionados
pela utiliza�o de qualquer dos dois divisores, n ou n - 1. Entretanto,
daremos preferencia para a formula que proporciona uma estimativa mais
justa do desvio-padrao da popula�o, ou seja
S= =
(8)
1 n
L. xt =
i=l
Exemplo 6:
Calcular o desvio-padrao de cada um dos conjuntos de numeros do
exemplo 1.
Xi
10
12
13
20
25
34
45
�xi= 159
Desvio-padriio do conjunto A = {IO, 12, 13, 20, 25, 34, 45}.
TABELA 5.9
F6rmula Original
Xi-X
- 12,714
-10,714
- 9,714
- 2,714
2,286
11,286
22,286
2 . 2 di = lxi-xl
161,646
114,790
94,362
7,366
5,226
127,374
496,666
�lxi-xl2 = 1 007.430
F6rmula Desenvolvida
2 xi
100
144
169
400
625
1 156
2 025
2 �xi = 4 619
Resolvendo pela f6rmula original, devemos ter:
s = f___!_ f d� = /_J_ f (x; - x)2 .J;, - 1 ?- 1 .Jti - 1 L..
1=1 ;�1
192 onde n = 7 e x = 22,714.
s R 1 ± (Xi - 22,714)2 = A x 1.007,430 =
i=l
..; 167,905 = 12,958 SA = 12,958
UI ilizando a f6rmula desenvolvida:
S= !.� [};xf - �]
s = J� [ 4.619 - �] = j} [4.619 _
25;81] =
= )! (4.619 - 3.611,571) = jl.00�·429
=
= ..; 167,905 = 12,958 I SA = 12,958
Como pode ser observado,as duas expressi5es para o calculo do
desvio-padrlio slio equivalentes.
Desvio-padrao do conjunto B = {17, 18, 19, 20, 21, 22, 23}.
Teremos, neste caso,
x = 20
n = 7
Pela Formula Original
Sa= /_J_ �(x; -XJ2 = L..!.._ �(x; - 20)2 =
.Jn-I ..j ? - 1
t [01 -20)2 + (18-20)2 + (19 -20)2 + (20-20)2 + (21-20)2 + (22-20)2 + (23 -20)2 ] =
= J t [ 9 + 4 + I+ 0 +I + 4 + 9 ] = j'i[ = .j 4,667 = 2,160 Sa= 2,160
Pela Formula Desenvolvida
S = /�1-[};x-� _- (};-xi)-2] Jn - 1 I n
Temos:
};xi = 172 + 182 + 192 + 202 + 212 + 222 + 232 ,=
= 289 + 324 + 361 + 400 + 441 + 484 + 529 = 2.828
(};xi)2 _ (17 + 18 + 19 + 20 + 21 + 22 + 23)2
=
7 - 7
= (1�)2 = 19;00 = 2.800
193
194
s = j} [2.828 - 2.800]
I s8 = 2,160 I
/28 = .v 6 = v4,667 = 2,160
Desvio-padrllo do conjunto C = {-4, -3, -2, 3, 5}.
A m6dia do conjunto e x = -0,2 e n = 5
Pela Formula Original
1 2 2 2 2 2 S= s=T 1-4-(-0,2)1 +1-3-(-0,2)) +1-2-(-0,2)1 +13-(-0,2)1 +15-(-0,2))
+ (-l,8)2 + (-2,8)2 + (-1,8)2 + (3,2)2 + (5,2)2
=
= j-} (14,44 + 7,84 + 3,24 + 10,24 + 27,04) = j t x 62,8 = ..fTS,'i = 3,962 Sc = 3,962
Pela Formula Desenvolvida
Os dados do problema sllo:
n = 5
T.xf = (-4)2 + (-'3)2 + (-2)2 + 32 + 52 =
= 16 + 9 + 4 + 9 + 25 == 63
(T.x;)2
= ((-4) + (-3) + (-2) + 3 + 5]2 = (-1)2 = 0 2 n 5 5 '
S = }. _J_ [T.x� - (T.x;)2 ]
= n - 1 ' n
= /62,8' = - '157 = 3 962 v � � lJ,t '
Js � l ( 63 - 0,2] =
Sc= 3,962
Observa�oes:
1. Notar que 0 desvio-padrao e maior do que 0 desvio medio para OS tres
conjuntos, conforme pode ser visto confrontando-se os resultados ora
conseguidos com os do exemplo 4.
Conjunto
A
8
c
TABELA5.10.
Desvio-padrao
12,958
2,160
3,962
Dnvio m«Jio
10,245
1,714
3,360
SA> DmA
Ss > Dms
sc > Dmc
2. Se calcularmos o desvio-padrao utilizando as f6rmulas (6) e (7), ou
seja, adotando o divisor n, e possivel chegar aos mesmos resultados
que os conseguidos atraves das f6rmulas (8 ), mediante o emprego do
fa tor
Ji5 (9)
Esse fator e conhecido como fator de corre�ao de Bessel. · Assim,
j l;(x; - x)2 �· n S= · X --=
n n - 1
=
�1:(x; - x)2
=
j l;(xi - x)2
�(n -1) n - 1
No exemplo anterior, retomamos o calculo do desvio-padrao do
conjunto B, utilizando o divisor n =. 7. Devemos ter, de acordo com a
f6rmula (6):
s
=
j l;(x; - x)2 = j1 007•430 = - '143 919 = 11 997
n 7 v ' '
Aplicando a corr�ao de Bessel:
�= c:c:= . tr=1080 .j n::i ..;� ./6 '
Ss = 1,080 X 11,997 :::: 12,958 Ss = 12,958
b) Desvio-padriio de Dados Tabulados
Quando os valores vierem dispostos em uma tabela de freqiiencias, o
calculo do desvio-padrao se fara atraves de uma das seguintes f6rmulas:
S=
k k
L djf; L (x1 - x)2f;
/=1 = �1_·=_1 ____ _
n n
(10)
ou, pela f6rmula desenvolvida,
on de
S=
k
( f y,f,\)2
_!__ ""' Xj
2
f,. -�
n � I n
/=1
(11)
d1 = x1 - x = desvio em tomo da media;
Xj = valor isolado da variavel, OU ponto medio da classe, se OS
valores vierem agrupados em classe.
Pelos mesmos motivos expostos anteriormente, sera dada preferencia
ao divisor n - l, em vez de n, no caJ.culo do desvio-padrao para dados ta
bulados.
(Xj - X)2f;
S=
n -1 (12)
195
196
[± x/lj I =1
OU
S= (13)
n
utilizando a formula desenvolvida.
Essa ultima e facilmente deduzida a partir da (12). Tomemos apenas
a expressao do numerador de (12): ·
k
I (xi - x)2f;
j=l
n
Assim,
S=
Exemplo 7:
Com os dados do exemplo 5, calcular o desvio-padrao da distribui9ao
de freqiiencias do consumo de energia eletrica (kwh):
TABELA 5.11
Numero de 79,5
Consumo U1ulrios "i "i1i (Xj-X) (Xj -xJ2 '"i - x:J21i xf1i
'1
S f--- 25 4 16 60 -64,6 4 160,26 16 641,0 900
25 f--- 45 6 36 210 -44,6 1 980,26 11881,6 7 360
46f--- 65 14 55 770 -24,5 600,25 8 403,5 42 350
65 f--- 85 26 75 1 950 -4,5 20,25 526,5 146 250
85 f---105 14 96 1 330 15,5 240,26 3 363,5 126 360
105f---125 8 116 920 35,5 1 260,25 10 082,0 105 800
1251---145 6 135 810 55,5 3 080,25 18 481,5 1o9360
1451--- 165 2 155 310 75,5 5 700,25 11 400,6 48 050
°'£fj= 80 °'£xj'J=6 360 °'£(Xj- X)2 fj = 80 780 "£xj 'i = 586 400
A media aritmetica do consumo ja foi calculada· anteriormente:
x = "'£x;fj = 6.360 = 79 5
n 80 '
Cdlculo do Desvio-padrtio pela Formula Original ( 12)
S =
(x; - 79 ,5)2/j
n -1 80 -1
= j 80 7 80 =. 11 022 532 = 31 977 79 v ' ' s = 31,977
0 desvio-padrao do consumo de energia eletrica e 31,977 kwh. Recorde
-se qu� o desvio medio, calculado no exemplo 5, resultou em Dm =
24 ,625 kwh.
Pela f6rmula (13)
s2 =
[ ( k ) 2
k I x;IJ
_l_ ' x�f, _ ;=1 =
n -1 L... I i n j=l
= 6_ [586 400 - 40 449 600] = ../79 80
= /80780 = - '1022 532 = 31 977 ..; � v . ' '
c) Propriedades do Desvio-padrtio
I -Primeira Propriedade
s = 31,977
Somando ( ou sub train do) um valor constante e arbitrario, x0, a cada
elemento de um conjunto de numeros, o desvio-padrao nao se altera.
Essa propriedade e valida tanto para dados brutos como para dados
tabulados. Verificaremos essa propriedade para dados brutos por uma
questao de simplicidade, mas sem perda da generalidade.
Fa�amos x0 igual a constante arbitr y = -1 =
n
-2-1+0+1+2+3+4 7
=
7
=
1
=1
s = j(y;-y)
2
= ·Y n -1
(-2 -1)2 + (-1 -1)2 + (0 -1)2 + (2 -1)2 + (3 -1)2 + (4 -1)2 =
7-1
= j9 + 4 + 1 + 1 + 4 + 9 = fi8 = 2 160
6 ../ 6 ' Sy= 2,160
Por conseguinte,
I Sx =Sy I
on de
Yi =Xi -x0 =Xi - 19
0 leitor podera resolver o mesmo exercicio utilizando as f6rmulas
desenvolvidas
Sx=!.� [T,xl-�]
Sy = j. � 1
[ T-y{ -(T-�i)2]
Exemplo 9:
Considerando os mesmos dados do exemplo 8, adicionando a constante
arbitrana x0 = 2 a cada elemento do conjunto, comprovar a primeira pro
priedade do desvio-padrio. Utilizar af6rmula desenvolvida(8).
Temos:
x = {17, 18, 19, 20, 21, 22, 23}
X0 = 2 e n = 7
Daf, tiramos
y = {19, 20, 21, 22, 23, 24, 25}
ja que
Yi = Xf + x0 = Xi + 2
Assim sendo,
S _1_ ['T,x�-(T-xi)2] =J� . [2 . 828 - (140)2 ] = x= n-1 1 n 7 - 1 · 7
= }! [2 828 - 19�00 ] = }! [2 828 - 2 800]
fi8 = J
6 = ../4,667 = 2,160 � Sx = 2,160
s = 0_ ['T,y� -('T-Y1)2] =J�· [3 416 - (154)2] = y Jn - 1 I n 7 - 1 7 199
= )! [3 416 -
23 ;16 ] = )! [3 416 - 3 388] =
=JI[- = y 4,667 = 2,160 � Sy = 2,160
Xj
17
18
19
20
21
22
23
"I:.x;= 140
('I:.x;)2 = 19 600
TABELA 5.12
2 Xj
289
324
361
400
441
484
529
"I:. 2 x; = 2 828
Yi =x; + 2
19
20
21
22
23
24
25
"I:.y;=154
(.l:y;)2 = 23.716
I
I
2
Y;
361
400
441
484
529
576
625
2 LY; =3 416
Dessa forma, podemos dizer que os conjuntos abaixo possuem o
mesmo desvio-padrao S = 2,160.
x = {17, 18, 19, 20, 21, 22, 23}
Y = {19, 20, 21, 22, 23, 24, 25} onde Yi =Xi + 2
Z = {l,2, 3, 4, 5, 6, 7} onde Zi =Xi - 16
W = {- 2, - 1, 0, 1, 2, 3, 4} onde Wi = Xi - 19
P = {l 001, 1 002, 1 003, 1 004, 1 005, 1 006, 1 007} onde
Pi =Xi + 984
S = {l 017, 1 018, 1 019, 1 020, 1 021, 1 022, 1 023} onde
Si =Xi + 1 000
Exemplo 10:
Com os dados do exemplo 7, comprovar, por subtra9ao, a primeira
propriedade do desvio-padrao, fazendo x0 = 75.
TABELA 5.13
NfJmerode
Conwmo Usulrios "i "i'i x]t; Yj "ljfj y]fj
'i
5 I--- 25 4 15 60 900 15-75= -60 -240 14 400
251--- 45 6 36 210 7 360 36-75=-40 -240 9 600
451--- 66 14 65 770 42 360 56-75=-20 -280 5 600
651--- 85 26 75 1 960 146 260 75-75 = 0 0 0
851---106 14 95 1 330 126 360 95-75= 20 280 5 600
1051---125 8 115 920 105 800 115 - 75= 40 320 12 800
1251---145 6 135' 810 109 360 135-75= 60 360 21 600
1451---166 2 155 310 48 060 165-75= 80 160 12800
l:fi= sci l:xjfj = 6 360 l:x} 'i = 586 400 l:yjfj= 360 l:yJ'i = 82 400
200
No exemplo 7, ja foi calculado o desvio-padrao de X. Assim, pela
formula (13):
on de
s = _l_ [�x?f' . . _ (�x;fi)2] =jj_(586 400 - 505 620) =
n -1 I Jj n 79
= � = 31,977 Sx= 31,977
0 desvio-padrao de y sera dado por
S = _l - [� ?[,. - (� Y;/j )2 ] = / __
1_ [82 400 - (3
.
60)2 ] =
n-1 Y11 n y'80 - l 80
= ji [82 400 - 129 600 J = J. j_ (82 400 - 1 640) = 79 · 80 79
= � =31,977
Yi= x; - 75
Sy= 31,977' I
II - Segunda Propriedade
Multiplicando (ou dividindo) por um valor constante e arbitrario, c,
cada elemento de um conjunto de m'.uneros, o desvio-padrao flea multi
plicado (ou dividido) pela constante.
Da mesma forma que a primeira propriedade, a segunda e valida tanto
para o calculo com dados brutos como com dados tabulados, agrupados ou
nao em classes.
on de
Assim, consideremos os seguintes conjuntos de m'.uneros:
x = {X1, Xz, X3, . • . , Xn}
Y = {yi, Yz, y3, · · · , Y n}
Xi
Yi =c
0 desvio-padrlro de X sera dado pela formula original 8. j�(x; - x)2 s -x- n-1
e o deYporl - j}:;(yj - y)2 Sy - n - 1
De acordo com a quinta propriedade da media, se multiplicarmos
(ou dividirmos) todos os elementos de um conjunto de numeros por uma
constante arbitraria, a media do conjunto ficara multiplicada (ou dividida)
por essa constante. Assim sendo 201
202
Xi
Yi =7
Podemos escrever, entlo,
- x
y
=
.
c-
-j"T,(yi - Y'f -Sy - -
n - 1
-
(
Xi x
)
2 �
[
l l2
T- c - c T- --C(Xi -x)
= n-1 n-1
= n - 1
�� � quando � (14)
Da mesma forma, podedamos mostrar que, se Y = cX, segue-se que
I Sy = cSx I (15)
T, [c(Xi - x)l2
s -j"T.(yi - y)2
=J
T,(cxi -cx)2
= ----- = y- n-1 n-1
=)
T.c2(Xi - x)2
= j
c2T-(Xi - x)2
= n-1 n-1
j T-(xi -x)2
= c n -1 = cSx
Exemplo 11:
Dados os conjuntos de nfuneros
X = {l, 2, 3, 4, 5} e
y = {10, 20, 30, 40, 50},
Sy= cSx
comprovar a segunda propriedade do desvio-padrao.
Temos, neste caso,
n - 1
X = {l, 2, 3, 4, 5} - � Yi� CXi = lOxi Y = {10, 20, 30, 40, SO} c = 10
De acordo com a segunda propriedade do desvio-padrlo, devemos ter:
Yi= cx1 => Sy= cSx = lOSx
Pela f6rmula original (8),
j T-(Xi -x)2 . - "T.Xi 1 + 2 + 3 + 4 + 5 = � = 3 Sx = n - l onde x = n =
- 5 5
e
jJ;(y; - y)2 - J;y;
Sy = n _ 1 onde y = -n- =
= 10 + 20 + 30 + 40 + 50 = 150 = 30 5 5
Entio,
_ jJ;(x; - 3)2 _
Sx
-
5 - 1 . -
- j(l - 3)2 + (2 - 3)2 + (3 - 3)2 + (4 - 3)2 + (5 - 3)2 =
-
4
- j4 + 1 + 0 + 1 + 4 = (10 = '25 .= 1 581 -
4 .J 4 v .,,) '
jI:(y; - 30)2
Sy= 5 - 1 . =
= (10 - 30)2 + (20 - 30)2 + (30 - 30)2 + (40 - 30)2 + (50- 30)2 =
4
= J 400 + 100 + � + 100 + 400 = JI¥- = ./250 = 15,81
Assim,
Sy = c • Sx
.J. .J. .J.
15,81 = 10 x 1,581
Utilizando agora a f6rmula desenvolvida, conforme dados da Tabela
auxiliar 5.14,
TABELA 5.14
2 2 x; JC; Yi Y;
1 1 10 100
2 4 20 400
3 9 30 900
4 16 40 1 600
5 25 50 2.500
2 I:x; = 15 I:x; = 55 I:y; = 150 2 I:y; = 5 500
(I:x;l2 = 225 (I:Y;l2 = 22 500
Sx = / _J_ [J;x? - (J;x;)2 ] = 6_ [55 - 225] = ../ n - 1 I n ../5 - 1 5
= )! (55 - 45) = � = ....rr:s = 1,581
203
204
Sy = 6_ [� x� _ (�Y;)
2 J = . /ii [s 500 _ 22 500] = Jn - 1 .I n J4 5
js.soo - 4 soo {lOoO . rycn =
4
= ..j
�
-
4
- = v ... so = 15,81
Exemplo 12:
x·
Consideremos os dados do exemplo 10 e fayamos Yi = -f .
Neste caso, c = 5.
TABELA 5.15
Consumo Numero de
Yj = � Usuarios Yjfj
2 Yj fj Energia Xj
'i
51-- 25 4 15 15/5 = 3
251-- 45 6 35 35/5 = 7
451-- 65 14 55 55/5 = 11
651-- 85 26 75 75/5 = 15
85 I---- 105 14 95 95/5 = 19
105 I---- 125 8 115 115/5=23
125 I---- 145 6 135 135/5 = 27
1451-- 165 2 155 155/5 = 31
.'i:Jj = 80
Do exemplo 10, tiramos
Sx = 31,977
12 36
42 294
154 1 694
390 5 850
266 5 054 .
184 4 232
162 4 374
62 1 922
�Yjfj = 1 272 2
� Vj fj = 23.456
0 desvio-padrao de Y = ; devera ser igual a 6,3954, ou seja,
Sy = 31,977
= 6 3954
5 '
Aplicando a formula desenvolvida,
1 [� 2,. (�Yjfj)
2 ]-Sy = n-=1 ""'YjJj - n
-
= _1 [23 456 - (1 272)2 J =
79 80
6__[23 456 - 1 617 984 ]
= ../79 80
)* (23 456 - 20 224,8) = � =
= .J 40,90126 = 6,3954
Sx = 31,977}
Sy = 6,3954
III - Terceira Propriedade
Y= ...K_ e c=5
5
Sx Sx
� S y= 7 = -
5
-
0 desvio-padrao e maior que 0 desvio medio.
Essa propriedade pode ser comprovada numericamente, atraves dos
resultados dos exemplos 4 e 6 para dados brutos e 5 e 7 para dados
tabulados.
No exemplo 4, foram apresentados os seguintes conjuntos:
A = {10, 12, 13, 20, 25, 34, 45};
B = {17, 18, 19, 20, 21, 22, 23}; e
c = {-4; -3; -2; 3; 5},
cujos desvios medios e desvios-padrao sao (Veja Tabela 5.10):
SA = 12,950 DmA = 10,249
S8 = 2,160
Sc= 3,962
Dm8 = 1,714
Dmc = 3,360
Os resultados dos exemplos 5 e 7 fornecem-nos:
S = 31,977 kwh e Dm = 24,625 kwh.
d) Processo Breve para o Ca/culo do Desvio-{Xldriio
0 desvio-padrao pode ser calculado com o recurso de formulas simpli
ficadoras, as quais tornam mais rapida a solu¢o dessa medida. Tais formulas
derivam diretamente das duas primeiras propriedades do desvio-padrao.
A variavel a ser utilizada e chamada, como vimos no caso da media (Cap. 4,
4.2.1, item d), de variavel reduzida:
Xi - Xo
dj = ---
c
Xj - Xo
dj = �-
c
--
para dados brutos
para dados tabulados
Utilizando essas variaveis em lugar das originais, podemos obter o
desvio-padrao dessas ultimas atraves das seguintes formulas:
Para dados brutos:
Sx= c
n
I_1_0_ =1 (1 -0,5) = 0,5
50 50-30
-1-0-=2 (2 -0,5) = 1,5
60 60-30
_1_0_ =3 (3 -0,5) = 2,5
6
L.dr= 3
i=t
(l::djl2 = 9
Calculemos inicialmente d':
n
L,d;
d'=�
n
3 =-=OS 6 '
(d�-d'l2
I
6,25
2,25
0,25
0,25
2,25
6,25
l:: {dj -d')2 = 17,50
d�2
I
4
1
0
1
4
9
l::dj2 == 19
207
208
A f6rmula original (16) nos da:
L(dj-d')2 � Sx = c
n- I = lOV -y--5- = 10�=
= IO X 1,8708 = 18,708
Sx = IO X I,8708 = 18,708
.j, .j,
c SD'
0 mesmo resuitado seria alcanyado usando a formula desenvolvida:
Sx = c _I_ [Ld'.2 - (Ldj)2] = IO
n - I 1 n
= IO j f 09 - 1,5) =IO JIJf = 10 X I,8708 = I8,708
Exemplo 14:
Calcular o desvio-padrao do consumo de energia eletrica, usando os
dados do problema I 2.
·
·
Para calcular o desvio-padra:o pelo processo breve, escolheremos x0 e
c usando os mesmos criterios que os apresentados para o calculo da media
aritmetica pelo processo breve, quais sejam:
I. Xo = ponto medio da classe de rnaior freqiiencia, se k (numero de classes)
for par, ou ponto medio de uma classe intermediaria, se k for fmpar.
2. c = amplitude do intervalo de classe ou diferenya entre dois valores conse
cutivos (para tabelas de freqiiencias com valores isolados ).
Classes fj Xj
5 1--- 25 4 15
251-- 45 6 35
45 1-- 65 14 55
651-- 85 26 75
85 1-- 105 14 95
105 f-- 125 8 115
125 1-- 145 6 135
145 f--- 165 2 155
k = 8 (par) Lfj=80
x0 =76ec=20
TABELA 5.17
, Xj -75 di=-w-
15 -75 =-3 20 35-75 =-2 20 55 -75 = -1 20 75 -75
20=0
95-75 = 1 20 115 - 75 =2 20 135 -75 =3 20 155-75 =4 20
df'j dj2fj
-3X 4=-12 (-3) (-121=36
-2 x 6= -12 (-2) (-12) = 24
-1 x 14 =-14 (-111-14) = 14
0 x 26 = 0 ox O=O
1 x 14 = 14 1x14=14
2X 8=16 2X16=32
3X 6= 18 3X18=54
4X 2=8 4X 8=32
'f,djfj= 18
'f,dj2fj=206
('f,df fj12 = 324
Como sabemos, o desvio-padrao do consumo de energia eletrica pelos
80 usuarios e Sx = 31,977 kwh.
A formula desenvolvida permite chegar ao mesmo resultado com
muito menos trabalho e numeros bem menores:
Sx = c _1_ ['f-d'.21,. - ('f-djt/]=
n - 1 I I n
= 20) -1- (106- 182)= 2oji_fio6 - 324) = 80 - 1 80 79 ,. 80
= 20)206 - 4,o5 = 20 fiOfJ5 = 20../2 5563 = 79 ..; �
'
= 20 x 1,5988 = 31,977
-1- -1-
c X SD
I Sx = 31,977 I
Evidentemente, o mesmo resultado seria obtido se escolhessemos
qualquer outro valor para x0 e para c. 0 leitor podera comprovar isso
fazendo, por exemplo, x0 = 95 e c = 10.
e) /nterpreta�iio do Desvio-padriio
0 desvio-padrao nao tern uma interpretayao fisica, como ocorre com
a media, mediana, moda e OS quantis. Contudo, e possivel interpreta-lo de
fortna analitica. Consideremos, por exemplo, que dois estudantes tenharn
obtido os seguintes resultados em 5 provas de Estatistica, realizadas ao longo
do ano letivo:
Estudante A : 40 50 60 70 80
Estudante B: 20 40 60 80 100
Ambos os estudantes foram aprovados na disciplina, pois suas medias
foram iguais a 60:
xA = 40 + 50 + 60 + 70 + 80 = 300 = 60 5 5
Xo = _20 + 40 + 60 + 80 + 100 = 300 = 60
D 5 5
Entretanto, a variayao das notas em torno das respectivas medias
difere do aluno A para o aluno B, esse ultimo apresentando maior dispersao
do que aquele. E possivel perceber ainda que a diferenya entre pares
sucessivos de notas do aluno B e igual a duas vezes a do aluno A, que a
amplitude total das notas de B e igual ao dobro da de A. Assim sendo,
podemos afirmar que o aluno B apresentou resultados com uma variayao
media igual ao dobro da do aluno B. 0 desvio-padrao das notas permite
comprovar o que foi dito: 209
210
j'E(x;- x)2
= n -1 .
= (40 - 60)2 + (SO -60)2 + (60 -60)2 + (70 -60)2 + (80 -60)2
s -1 =
=
j 400 + 100 + � + 100 + 400 = '1250 = s ../TO
(20 - 60)2 + (40 -60)2 + (60 - 60)2 + (80 - 60)2 + (100 -60)2
SB=
S -1 =
= jJ .600 + 400 + � + 400 + 1 600
= .jTOOO = 10 ../TO'
I SB= 2SA I
Por ai se depreende que o desvio-padrao e realmente uma medida
satisfat6ria de dispersao, embora nao se possa afumar muita coisa quanto i
sua magnitude.
5.2.5. VariAncia
Sfmbolo: S2
a) Defini¢o da Vari4ncia
Conforme se pode perceber pelo sfmbolo, a varrancia e o quadrado
do desvio-padrio, OU, se se preferir, 0 desvio-padrllo e a raiz quadrada da
variancia. Dessa forma, pode-se dizer que a formula da variincia e igual i
eJ;tpressao do desvio-padrllo, sem o sinal do radical. Adiantamos que as
defini�oes que se seguem aparecem com a corre�ao de Bessel, isto e, com o
divisor n - 1.
Varidncia de Dados Brutos
Processo longo n
L (x; -x)2
s2 = _;=_1 ____ =
n -1
4-
f6rmula original
Processo breve
_1 [f x? _ (t. Xt )']
n-1 L.. 1 n
i=l
•
f6rmula desenvolvida
n [ (n )2 ]
c2 I 2 I d'
s2 = __ ;_= _1 ____ = � � d'.2 - i=1 I
n-1 n-1 L.. 1 n
i=l
(20)
(21)
Varidncia de Dados Tabulados
Processo longo
k
I (x; - x)2f;
s2 = �;_=1 ___
__ - 1
n-1 - n-1
Processo breve
k
c2 I (dj - a')2t;
k
(± x;f;)2
2 ;=1
L x;f;- n j=l
;=1 82=-�-----
n -1
[ k
·( ± djfj)2
_1_ ' d'.2f,. -_1_· =_1 -�
n - l L.. 1 1 n /=1
Exemplo 15:
Calcular a variincia dos seguintes conjuntos de numeros:
A = {10, 12, 13, 20, 25, 34, 45}
B = {17 , 18, 19, 20, 21, 22, 23}
c = {-4; -3; -2; 3; 5}
(22)
(23)
No exemplo 6, ja foi calculado o desvio-padrllo de cada conjunto.
Os dados para a determinayao de variancia foram extraidos desse exemplo.
Sabemos que
xA = 22,714
xs = 20
xc = -0,2
Entao,
�(x; - 22,714)2
s� = ------ = 167 ,905 7 - 1
s2 = 'B
�(x; - 20)2
7 -1 = 4,667
�[x; - (-0,2)]2
5 - 1
= 15,7
Exemplo 16: .
Calcular a variincia do consumo de energiil eletrica de 80 uswirios,
com os dados do exemplo 7.
k
I
II - Segunda Propriedade
2 2 Sy= Sx
2 2 Sy= Sx
(24)
Multiplicando (ou dividindo) por um valor constante e arbitrario, c,
cada elemento de um conjunto de numeros, a variancia flea multiplicada
(ou dividida) pelo quadrado da constante ..
Para
x
y=
c
y =ex
=EIJ
OU
> S2 2s2 y = c x
III - Terceira Propriedade
(25)
(26)
Consideremos dois conjuntos de n1 e n2 valores, respectivamente,
sen do
S� = variancia (parcial) do primeiro conjunto.
sJ = variancia (parcial) do segundo conjunto.
x1 = media (parcial) do primeiro conjunto.
x2 = media (parcial) do segundo conjunto.
x = media geral, incluindo os valores dos dois conjuntos.
A variancia combinada das duas distribuiyoos sera dada por
1 2 2 - - 2 - - 2
2 (n1 - )S1 + (n2 - l)S2 + (n1 - l)(x - x1) + (n2 - l)(x - x2) s = -------�--,------=---------�
ni + n2 - 2
(27)
Examinando a primeira expressa:o, pode-se dizer que a variancia combi
nada consta de duas parcelas:
- Media aritmetica ponderada das variancias parciais
(n1 - l)s: + (n2 - l)Si
(primeira parcela)
ni + n2 - 2
2 - Variancia (ponderada) das medias parciais
(n1 - l)(.X - .X1)
2
+ (n2 - l)(.X - .X2)
2
Exemplo 17:
A estatura media de um grupo de 50 rapazes e de 172 cm, com
variancia de 36,69 cm2 , e a de um grupo de 40 moyas e de 161 cm, com
variancia de 27 ,04 cm2 • Qual a media, a variancia e o desvio-padrao das
estaturas dos dois grupos reunidos?
Cdlculo da Media Geral
Para calcular a media do conjunto formado por todas as estaturas,
tanto as dos rapazes como as das moyas, recorreremos a terceira proprie
dade da media aritmetica (expressao 6 do capitulo anterior).
k
L x1n1
/=1
on de
XJ = medias parciais
n1 = numero de elementos do conjunto j
/=1
Neste caso,
j = 1,2 e k=2.X1 = 172 n1 = 50
X2 = 161 n2 = 40
(172 x 50) + (161 x 40)
-
8 600 + 6 440
x =
50 + 40 - 90
=
= 167,11 x = 167,11 cm
Cdlculo de Varidncia Combinada
Temos s: = 36,69 e s; = 27,04
15 040
90
( l)s
2
s
2 - - 2 - - 2
=
2 ni - 1 + (n2 - 1) 2 + (n1 - 1) • (x - xi) + (n2 - 1) • (x - x2)
s = =
ni + n2 - 2
- (49 x 36,69) + (39 x 27,04) + 49(167,11 - 172)2 + 39(167,11 - 161)2
-
so + 40 - 2
=
1.797,81 + 1 054,56 + 49 x 4,892 + 39 x 6,112
=
88
=
1 797 ,81 + 1 054,56 + 1 171,69 + 1 455,95
= .
88 213
Cdlculo do Desvio-padriio Combinado
Basta extrair a raiz quadrada do resultado anterior.
S = vfsl = J 62,27 = 7 ,89 cm.
A justifica tiva te6rica da terceira propriedade da variancia e bem
simples. Consideremos para tanto as seguintes variaveis:
X1 com media .X1, variancia S� e n1 valores
X2 com media .X2 , variancia s; e n2 valores
Tomemos ainda
x = media geral e s 2
= varrancia geral.
A variancia geral sera calculada somando todos os quadrados dos
desvios tanto dos valores de X1 como de X2 em torno da media geral .X, e
dividindo o resultado por (n1 + n2 - 2) ou por (n1 + n2), dependendo
de como se toma o denominador. Faremos a demonstraylio para esse ultimo
caso por questao de simplicidade. Partiremos entJo da seguinte expressao
de variancia conjunta:
n1 n2
� -2 � -2
2 ._ (X1 - X) + ._ (X2 - X)
S = n1 + n2
OU
n1 n2
1;
2
+ 1; (x2 -x>2
=
Enti'o,
(n1 + n2)S2
= n1S� + n'ls; + n1 (x - xif + n2 (x - x2)2
OU
2 n1S� + n'ls; + n1 (x - xif + n2 (x - x2)2
S = n1 + n2 (28)
Se em lugar de n1 e n2 tivessemos usado (n1 - 1) e (n2 - 1), chega
rfamos a expressi'o 27.
No caso particular de as tres medias coincidirem, x1 = x2 c: x, a
expressi'o (28) ficara reduzida a uma media ponderada das variincias:
2 n1S� + n2Si s = �����-n 1 + n2 (29)
c) Controle de Charlier
A prova de Charlier e utilizada para averiguar a exatidi'o do calculo
da media e da variancia ( e conseqiientemente do desvio-padri'o) principal
mente quando utilizamos o processo breve de calculo dessas medidas em
uma tabela de freqiiencias. Essa prova baseia-se na seguinte equa?o:
Para comprovar essa igualdade, tomemos inicialmente
(d] + 1 )2 = dj2 + 2dj + 1
Multiplicando ambos os membros por fi,
(dj + 1 )2fi = dj2/j + 2dj/j + fi
Aplicando o operador sornat6rio
I;(dj + 1)2fi = I;dj2/j + 2I;dj/j + "i:.fi
Exemplo 18:
(30)
Utilizar o controle de Charlier para a variancia e a media usando os
dados do exemplo 14.
No exemplo 14, fizemos x0 = 75 e c = 20.
TABELA 6.18
C/8#81 'i x; d' 1 djf; dj'f; dj+ 1 (dj + 112 (dj + 1i2f1 (dj +1)f
5 f--- 25 4 15 -3 -12 36 -2 4 16 -8
25 f--- 45 6 35 -2 -12 24 -1 1 6 -6
45 f--- 65 14 56 -1 -14 14 0 0 0 0
65 f--- 85 26 75 0 0 0 1 1 26 26
85 f--- 105 14 95 1 14 14 2 4 56 28
105 f--- 125 8 116 2 16 32 3 9 72 24
125 f--- 145 6 135 3 18 64 4 16 96 24
145 f--- 165 2 155 4 8 32 5 25 50 10
I
l:f; = 80 l:df'; = 18 l:dj2f; = 206 :!:ldj+1)2f1=322 .
:!:ldj+tlf;=98
215
Os dados necessarios para a prova de Chartier sao OS seguintes:
L(dj + 1)2/j = 322
Ldj2f; = 206
2Ldjf; = 2 X 18 = 36 e Lfj = n = 80
Ld}2f; + 2Ldjf; + Lf; = 206 + 36 + 80 = 322 = L(dj + 1)2/j
0 que garante a exatidao dos calculos.
Para comprovar a exatidao do calculo de media pelo processo breve,
devemos partir da igualdade
L(dj + l)f; = Ldjf; + L/j (31)
facilmente demonstravel
(dj + l)f; = djf; + f;
Aplicando L
L(dj + l)fj = Ldjf; + Lf;.
A Tabela 18 nos fornece os valores necessarios:
L(dj + l)f; = 98
Ldjf; = 18
Lf; = 80
-> Ldjfj + Lf; = 18 + 80 = 98 =
= L(dj + l )fj
d) Cor:re¢o de Sheppard para a Varidncia
Normalmente, quando os dados estiverem agrupados em classes,
ocorrem erros resultantes desse agrupamento, no calculo da variancia e do
desvio-padrao. Isto porque admitimos, ao agrupar os dados em classes, que
esses se distribuem simetricamente dentro de cada classe, razao pela qual
foi adotado o ponto medio de classe no cfilculo de medidas como a media
e a variancia. Ocorre, porem, que os dados nem sempre se distribuem
simetricamente em torno do ponto medio. Em conseqiiencia, o erro
de agrupamento aumenta o desvio-padrao e com grau tanto maior quanto
mais extensos forem os intervalos e menor o numero total de obser
vay6es.
Para corrigir o erro de agrupamento, usa-se um termo corretivo pro
posto por Sheppard, o qual e subtrativo em virtude de o agrupamento em
geral aumentar o valor da variancia e do desvio-padrao.
Nao existe um consenso entre os autores quanto a utilidade da
correyii'o de Sheppard. Isto porque, muitas vezes, ela tende a supercorrigir a
variiincia quando nao substitui erros anteriores por novos.
Neste livro apresentamos esse t6pico apenas por compromisso com a
literatura. Nao vemos, por outro lado, razoes que justifiquem seu emprego
216 na pratica.
Formula de Sheppard:
Consideremos S2 a variancia de um conjunto de valores dispostos em
uma tabela de freqiiencias. Tomemos ainda
c = amplitude do intervalo de classe
s; = variancia corrigida
I Si � s' - -r;- I
Exemplo 19:
(32)
Aplicar a correyiio de Sheppard para a variancia e desvio-padrao do
consumo de energia eletrica, usando os dados dos exemplos 7 e 16.
Os valores de que precisamos slro os seguintes:
s2 = 1 022,532 (kwh)2
s = 31,977
c =20 > c2 =400
Aplicando .a correyiio de Sheppard,
2 2 c2 400 8 Sc = S - IT = 1 022,532 - l2 = 9 9,199
Sc = js2 - � = y989,199 = 31,452
e) Relaroes Empiricas entre as Medidas de Dispersfio
Quando as distribuiyOeS se apresentarem fracamente assimetricas (pe
queno enviesamento ), podemos usar algumas relayoes empfricas para deter
minar certas medidas de dispersao a partir de outras. Tais relayoes slio:
Dm = ±s 5
Exemplo 20:
(33)
(34)
Comprovar a relayiO empirica entre 0 desvio quarti1ico, desvio medio
e desvio-padrao para o problema do consumo de energia eletrica por
80 usuarios.
Os resultados correspondentes ao desvio medio e ao desvio-padrlro ja
foram obtidos anteriormente:
Dm = 24,625 (exemplo 5)
S = 31,977.(exemplo 7) 217
218
Usaremos uma tabela auxiliar para proceder ao catculo do desvio
quartil.
TABELA 5.19
Numero de
·consumo Usullrios Fj
fj
Sf--- 25 4 4
25f--- 45 6 10
45f--- 65 14 24
651---- 85 26 50
851----105 14 64
105f---125 8 72
125f---145 6 78
145f---165 2 80
on de
n = 80
A f6rmula 1 nos fornece:
D -
Q3 - Qi
q - 1
E n 80 __ 20o Q. =4=4
Q3 = terceiro quartil
Qi = primeiro quartil
E
_ � _ 3 X 80 = 600
Q, - 4 - 4
n 4- Fant 20 10 Qi =I + c !. = 45 + 20 - = 45 + 14,286 = 14 Q,
= 59,286
3n
4 - Fant
Q3 =I + c f.
Q,
= 85 + 20 60 - 50
= 85 + 14,286 = 14
= 99,286
Q3 - Qi = 99,286 - 59,286 = 20 Dq = 2 2
Se usarmos as rela�0es empfricas, teremos:
4 4 Dm = 5S = 5 X 31,977 = 25,582
2 2 D = -S = - X 31 977 = 21 318 q 3 3 ' '
Dq = 20
Como pode ser observado, as f6rmulas empiricas slio validas para este
problema, nlio havendo grande discrepancia entre os valores determinados
empiricamente e os caiculados atraves das f6rmulas de definiylio das respec
tivas medidas.
Por outro lado,
Dm Desvio Medio 4 = =-= 080 S Desvio-padrlio 5 '
Dq Desvio Quartil
S
=
Desvio-padrlio
Neste problema temos:
Dm
=
24,625
= O 77
s 31,977 '
Dq 20
s
=
31,977
= 0•63
2
=-= 0667
3 '
5.3. MEDIDAS DE DISPERSAO RELATIVA
Para determinadas classes de problemas, as medidas de variabilidade ou
disperslio relativa em uma distribuiylio de freqiiencias proporcionam uma
avaliayao mais apropriada do grau de dispersao da variavel do que as de
disperslio absoluta. A disperslio relativa permite ainda comparar duas ou mais
distribuiyOes, mesmo que essas se refiram a diferentes fenomenos e sejam
expressas em unidades de medida distintas. As medidas de disperslio resultam,
em geral, de comparayao entre uma medida de dispersao absoluta e um
promedio, sendo seu resultado expresso em termos percentuais.
5.3.1. Desvio Quartil Reduzido
Simbolo: Dq,
0 desviomais
alguma coisa sobre as rendas das familias. Este conjunto, esta cole�ao de
observayoes, constituiria a populayao, ou seja, representaria todas as observa
yOeS possiveis relativas ao assunto, que e a caracteristica que se pretende estu
dar. Poder-se-ia limitar a popula9ao apenas ao Estado de Sao Paulo. Agora, o 1
estudo censitario das rendas das fam11ias abrangeria apenas aquele Estado.
E importante ficar bem claro que uma populayaO e estudada em termos
de observa9oes de caracteristicas nos individuos, e nao em termos de pessoas
ou objetos em si. Assim, por exemplo, as alturas dos cidadaos do Brasil cons
tituem uma popula9ao. Poderia haver uma populayao correspondente aos
pesos desses mesmos cidadaos.
Quanto ao numero de elementos, a populayao pode ser finita ou infi
nita. A primeira e aquela que apresenta um numero limitado de individuos.
Muitas vezes, entretanto, o numero de observa9oes e infinito. A populayao
sera, entao, infinita. Esta ultima normalmente esta associada a processos.
Assim, se um tecnico de laborat6rio quisesse pesar um certo material, por
maior que fosse o cuidado na experimentayao ele poderia, em cada pesagem,
obter uma leitura de certo modo diferente. Qualquer numero de observa9oes
que ele realizasse nao constituiria uma popula9ao completa, pois os resul
tados poderiam nao ser uniformes. 0 processo de pesagem poderia, desta
forma, continuar indefinidamente, prevalecendo as condiyoes basicas do
experimento. 0 numero de tais medi9oes (observa9oes) tenderia a ser iilfi
nito, dando origem a uma popula9ao infinita. Uma popula9ao infinita devera,
entao, ser concebida apenas como um esquema conceitual e te6rico.
1.4.2. Amostra
A amostra pode ser definida como um subconjunto, uma parte sele
cionada da totalidade de observa9oes abrangidas pela popula9ao, atraves da
qual se faz um juizo ou inferencia sobre as caracteristicas da populayao.
As caracteristicas da amostra sao chamadas de estatisticas (descritivas), sendo
simbolizadas por caracteres latinos, enquanto que os parametros da popu
la9ao terao como simbolos, via de regra, os caracteres gregos. Nesse texto, a
preocupayao seni, portanto, a de descri9ao da amostra atraves da comumente
chamada Estatistica Descritiva.
Suponha-se, para exemplificar, que se pretenda conhecer o conteudo de
ferro natural a ser exportado por um navio. 0 agregado ou populayao
consiste em todo o minerio de ferro a ser exportado por esse navio. Parte do
minerio e examinada, a fim de determinar seu teor de ferro, com o objetivo
de tirar uma conclusao a respeito do teor de ferro natural do embarque
completo. A parte de mineral selecionado constitui a amostra do embarque.
'
Uma vez que se fara inferencia sobre todo o minerio embarcado a partir de 17
18
apenas Utna pOryaO dele, a base do proceSSO e a infonnayao incompleta OU
de amostra.
1.5. FENOMENOS ESTATISTICOS
0 fenomeno em estatistica relaciona-se com qualquer evento que se
pretenda analisar, cujo estudo seja passivel da aplicayao da tecnica estatistica.
A Estatfstica dedica-se ao estudo dos fenomenos de massa, que sao resul
tantes do concurso de um grande numero de causas, total ou parcialmente
desconhecidas, que serao chamadas de "fenomenos estatisticos".
E possivel nao se conhecerem exatamente as causas subjacentes aos
fenomenos, pois pode-se estuda-los atraves de suas manifestayoes, desco
brindo-se neles alguns aspectos globais, sem remontar a essas causas. 0 que
caracteriza tais fenomenos (sociais, biol6gicos etc.) e o fato de serem eles
provenientes de um concurso de causas nem sempre totalmente conhecidas
pelo analista.
Os fenomenos classificam-se em tres tipos:
1.5.1. Fenomenos Coletivos ou Fenomenos de Massa
Os fenomenos coletivos sao aqueles que nao podem ser definidos por
uma simples observayao. A natalidade, a mortalidade, a nupcialidade, o preyo
medio de veiculos usados, vendidos diariamente em uma grande cidade,
sao fenomenos coletivos.
'
1.5.2. Feoomenos lndividuais ou Particulares
-OS fenomenos individuais sao aqueles que irao compor os fenomenos .
coletivos. Cada nascimento, cada individuo que morre, cada casamento que
ocorre, cada veiculo usado que se vende diariamente em uma grande cidade,
sao fenomenos individuais.
1.5.3 Fenomenos de Multidio
Os fenomenos de multidao distinguem-se dos fenomenos coletivos pelo
fato de as caracteristicas observadas para a massa nao se verificarem para o
particular, para o individuo isoladamente.
De acordo com a forma como se manifestam, os fenomenos podem ser
classificados sob dois aspectos:
a) Fenomenos Tipicos
Os fenomenos tipicos sao aqueles que se manifestam de forma regular,
revelando um comportamento definido.
b) Fenbmenos Atipicos
Os fenomenos atipicos referem-se aqueles fenomenos cuja manifestayao
se da atraves de um comportamento irregular, nao revelando uma tendencia
definida.
1.6. ATRIBUTO E VARIAVEL
Embora na grande maioria dos problemas estatisticos os dados sejam
de natureza quantitativa, isto nem sempre acontece. Os dados muitas vezes
se apresentam sob o aspecto qualitativo. Por essa razao, costumam-se dividir
os dados estatisticos segundo dois aspectos:
1.6.1. Presen(:CI ou Ausencia de um Atributo
0 observador podera limitar-se a notar a presenya ou ausencia de um
atributo em uma serie de individuos, e contar o numero dos que o possuem
e o dos que dele carecem. Seria possivel, por exemplo, classificar individuos
segundo o sexo. Haveria, entlio, duas classes distintas de dados observados:
uma classe representando os individuos de sexo masculino e outra os de sexo
feminino. Ve-se claramente, atraves do exemplo, que a variayao nlio e quanti
tativa. Costuma-se estabelecer uma correspondencia entre os resultados
possiveis e numeros, de modo a se ter sempre um carater numerico associado
a observayliO estatistica.
Quando os dados estatisticos apresentam um carater qualitativo, o
levantamento e os estudos necessarios ao tratamento desses dados slio
designados genericamente como estatistica de atributo. Considera-se um
carater como qualitativo quando as modalidades que o comp0em formam
um conjunto amorfo, nlio estruturado numericamente, ou seja, quando nlio
ha ligaylio entre essas modalidades, independentemente do fato de consti
tuirem um conjunto completo.
Os atributos admitem dois tipos de classificaylio:
1. ClassificafiiO Dicotomica ou Dicotomia
Existe uma dicotomia quando cada classe em que o atributo e consi
derado admite uma subdivislio em apenas duas subclasses. Por exemplo, a
classifica�ao dos individuos de uma localidade quanto ao sexo.
2. Classi[icafiio Mu/tip/a ou Policotomica
Ocorre uma policotomia quando cada classe se subdivide em mais de
duas subclasses. A classificaylio das pessoas segundo o estado civil e uma
policotomia.
1.6.2 Variavel
0 observador podera tambem anotar ou medir a intensidade efetiva de
um carater variavel em cada um dos objetos ou pessoas observadas. Pode, por
exemplo, registrar a idade das pessoas ao morrer, a estatura ou o peso dos indi
vfduos, o rendimento das fam11ias em uma grande cidade, o numero de empre
gados dispensados, por mes, em uma grande empresa e assim por diante.
Os resultados das observayoes serlio expressos sempre atraves de valores
numericos. Os dados sao de carater nitidamente quantitativo, e o conjunto 19
dos resultados possui uma estrutura numerica. Dir-se-a, entao, que se trata de
estatistica quantitativa ou estatistica de variavel.
1.7. VARIAVEL DESCONTiNUA OU DISCRETA E
VARIAVEL CONTfNUA
Tratando-se de estatistica de variavel, e possivel distinguir duas cate
gorias de variavel: discreta, ou descontinua, e continua.
1.7.1. Variavel Discreta ou Oescontinua
Suponha que uma instituis:ao de ensino esteja interessada em saber
qual 0 numero de alunos presentes as aulas de um determinado professor' em
certo periodo da vida escolar. Se X simbolizar esse ntimero, entao X sera
uma variavel que s6quartil e uma medida de disperslio relativa resultante do
quociente entre o desvio quartil reduzido e a mediana. Simbolicamente,
Q3 - Q;
_ Dq _ 2
Dq, - Md - --M-'d--
=
1--------�ou---------1
Q3 - Qi Dq, = 2Md X 100
Exemplo 21:
(35)
Retomemos os dados do exemplo 20 e calculemos o desvio quartil
reduzido:
Temos: Dq = 20 219
n --Ft 2 an
Md= I + c Ji
Md
�-24 2 65 + 20 26
320
= 65 + 26 = 65 + 12,31 = 77,31
Dq 20
Dq, =Md
X 100 = 77 31 X 100 = 25,87%
'
=
Md= 77,31
Dq, = 25,87%
5.3.2. Coeficiente de Varia�o
0 coeficiente de variayao ou coeficiente de varia�o relativa e uma
porcentagem cujo calculo resulta da comparayiio entre o desvio-padrao ou o
desvio medio e a media ou a mediana. Definiremos os seguintes coeficientes
de variayiio:
a) Coeficiente de Variariio de Pearson
Simbolo: C Vp
0 coeficiente de varia�o de Pearson e igual ao quociente entre o
desvio-padrao e a media aritmetica.
s
CVp =--=
x
ou-----1
s
CVp=--=--· 100
x
Exemplo 22:
(36)
Para exemplificar o conceito de CVp, suponhamos que uma empresa
fabricante de pneumaticos tivesse desenvolvido um novo produto com um
cordel que proporcionasse maior resistencia as flexoes repetidas e maior
resistencia a tra9ao do que o original. Tendo submetido esse componente a
prova, chegou-se a conclusao de que a resistencia as flexoos repetidas,
testada em um aparelho de dobrar cordeis, foi, em media, de 139 minutos
com desvio-padrao de 15 minutos contra a media de 88 minutos e desvio
·padrao de 14 minutos do cordel comum. Comparando os valores dos
desvios-padroes, parece nao haver diferenya significativa quanto a dispersao
dos tempos de resistencia a flexiio. Entretanto, deve-se ter presente que o
desvio-padrao para o novo cordel se refere a uma maior resistencia media as
flex0es repetidas, e e neste aspecto que se baseia o conceito de dispersao
relativa refletido pelo resultado do indice CVp. Calculemos, entao, o CVp
220 para os dois casos.
Para o novo cordel:
I CVp = -& = 0,108 OU 10,8%
Para o cordel antigo:
I CVp = * = 0,159 OU 15,9%
Comparando os resultados, ve-se que a variayao relativa e muito menor
para o novo cordel do que para o antigo.
Suponhamos agora que o novo cordel tenha sido submetido a um
teste de resistencia a trayao, tendo sido obtidos os seguintes resultados:
Resistencia media a trayao
·
: 18 libras
Desvio-padrao: 0,73 libras
O coeficiente de variacao de Pearson sera igual a
CVp = �;; = 0,03989
'
OU 3,99%
Exemplo 23:
Poderfamos estar interessados em saber se o novo cordel apresenta
maior dispersao de resistencia a trayao ou a flexoes repetidas. Neste caso,
nao e possfvel comparar as dispersoes absolutas, uma vez que as unidades de
medida e os fenomenos sao distintos. Estarfamos comparando, se assim
procedessemos, minutos (unidade de tempo) com libras (unidade de peso).
Por essa razao, a (mica comparayao compatfvel com a natureza dos dados e a
proporcionada pela dispersao relativa. Dessa forma, terfamos:
TABELA 5.20
ResisttJncia Dispersao Re/ativa (%)
As Flexoes Repetidas CVp = 10,8 � 11
Tra.;lfo CVp = 3,99 � 4
Muitas vezes e util considerar o coeficiente de variayao de Pearson
como o desvio-padrao das porcentagens dos valores em relayao a media,
conforme pode ser esclarecido no exemplo seguinte:
Exemplo 24:
Tomemos o seguinte conjunto de numeros: X = {2, 3, 7} e calculemos
o CVp. 221
222
Xj
2
3
7
"E.Xj = 12
e
TABELA 5.21
(xj-X) (Xj-X)2
-2 4
-1 1
3 9
"E.lxi-x12 = 14
_ �Xi 12 x=-n=3=4
S2 �(xi -x)2
= _!± = 7 x= n-1 2
Sx = ft= 2,6458
CVp = 8! = 2•646 = 0 66 OU 66%
x 4 , CVp = 66
Consideremos agora o conjunto Y, formado pela razao entre os valores
de x e a media X, OU seja,
lremos verificar que o desvio-padrao de Y, Sy, sera igual ao coeficiente
de varia�o de Pearson, calculado anteriormente:
TABELA 5.22
Xj
(%) Yi= x • 100 n- ¥
2 4. 100 = 50 -50
3 4. 100 = 75 -25
7 4. 100 = 175 75
"E.Yj = 300
y = �Yi = 300 = lOO n 3
(yj- y)l
2.500
625
5.625
"£ (Yj - ¥12 = 8.800
s: = ��i_-tf -8·�00 = 4.400 => Sy= v' 4.400 2!: 66%
Por conseguinte,
I CVp =Sy
Em resumo, quando comparamos dispersaes, podem ocorrer tres tipos
de situay0es:
1. As series vem expressas na mesma unidade de medida, e suas medias sao
iguais OU muito pr6ximas. Neste caso, e valido comparar OS valores de s,
nao se obtendo informayao adicional significativa com o uso do CVp.
Exemplo 25:
Um teste de estatistica aplicado a dois grupos de SO alunos apresentou
os seguintes resultados:
Grupo
A
B
TABELA 5.23
Midis das Notas
6
6,2
Desvio-padrlio das Notas
2
1,5
Nao ha necessidade de muito esforyo de raciocinio para concluir que
o grupo B apresentou menos dispersao, tanto absoluta como relativa. Apenas
para confirmar:
Grupo
A
B
TABELA 5.24
CVp
2
6 = 0,33
�=025 6 '
2. As series podem apresentar-se expressas nas mesmas unidades de medidas,
mas as medias aritmeticas sao significativamente diferentes. As comparay5es
podem ser feitas atraves da dispersao absoluta ( desvio-padrao ). Entretanto,
nestas circunstiincias, poder-se-a obter uma comparayao mais reveladora,
utilizando medidas de dispersao relativa, como o coeficiente de Pearson.
Trata-se do caso apresentado no exemplo 22, quando comparamos a
resistencia media dos cordeis as flexoes repetidas. Como se recorda, as medias
para os dois tipos de cordel eram bem diferentes (139 contra 88).
3. As series podem vir expressas em unidades de medida diferentes. Neste
caso, e totalmente inviavel estabelecer comparayao a partir do desvio-padrao
(dispersao absoluta), sendo plenamente justificavel o exemplo do coeficiente
de variac;:ao de Pearson. 223
0 exemplo 23 visa exatamente a esclarecer esse aspecto do uso do
coeficiente de variayao de Pearson.
b) Coeficiente de Variarao de Thorndike
Sfmbolo: CVT
· 0 coeficiente de varia�o de Thorndike e igual ao quociente entre o
desvio-padrao e a mediana.
s CVr = Md
OU
s CVr = Md • 100
Exemplo 26:
(37)
Calcular o coeficiente de Thorndike com os dados do exemplo relativo
ao consumo de energia eletrica de 80 usuarios comerciais.
Os dados para resolver o problema ja sao conhecidos:
s = 31,977
Md= 77,31
CV. = 31•977
• 100 = 41,36% T 77,31
O coeficiente de Pearson para o mesmo problema e
CVp = 31•977
• 100 = 40,22% 79,5
c) Coeficiente Quart([ico de Variarao
Sfmbolo: CVQ
Esse coeficiente e definido pela seguinte expressao:
OU
Exemplo 27:
(38)
Calcular o coeficiente quartflico de variayao para o consumo de energia
224 eletrica por 80 usuarios, usando os dados do exemplo 20.
No exemplo 20, foram calculados o primeiro e terceiro quartis, cujos
valores sao:
Q3 = 99,286
Qi = 59,286
CV. =
99,286 - 59,286
Q 99,286 - 59,286
40
---
= 0,252 OU 25,2%
158,572
CVQ = 25,2%
EXERCiCIOS PROPOSTOS
5.1. Com os dados do exercicio 4.1 do Capftulo 4, determinar:
5 .1.1 . Desvio Quartil.
5.1.2. Desvio Medio.
5.1.3. Desvio-padrao.
5.2. Com os dados do exercfcio 2.4 do Capftulo 2, determinar:
5.2.1. A variancia da distribui9ao.
5.2.2. 0 desvio-padrao.
5.2.3.
5.2.4.
0 coeficiente de varia9ao de Pearson.
0 desvio quartil.
5.3. Dados os conjuntos de numeros A = { 1.000, 1.001, 1.002, 1.003,
1.004, 1.005} e B = {0, 1, 2, 3, 4, S} podemos afirmar que:
a) o desvio-padrao A e igual a 1.000 vezes o desvio-padrao de B;
'
-
b) o desvio-padrao de A e igual ao desvio-padrao de B;
c) o desvio-padrao de A e igual ao desvio-padrao de B multiplicado
pelo quadrado de 1.000;
d) o desvio-padrao de A e igual ao desvio-padrao de B dividido por
1.000;
e) o desvio-padrao de A e igual ao quadrado do desvio-padrao de B.
SA. Realizou-se uma prova de estatfstica para duas turmas, cujos resultados
foram os seguintes:
Turma A: x = 5 e S = 2,5
Turma B: x = 4 e S = 2
Esses resultados permitem afirmar que:
a) a turma B apresenta maior dispersao absoluta;
b) a dispersao absoluta e igualpara ambas as turmas;
c) a dispersao relativa e igual a dispersao absoluta; 225
226
d) a dispersao relativa e a absoluta para a turma B sao iguais;
e) a dispersao relativa da turma A e igual a da turma B.
5.5. A tabela abaixo representa a vida util de postes telefonicos de madeira:
Anos N9 de Postes
Substitufdos
0,5---; 2,5 11
2,5---; 4,5 47
4,5---; 6,5 87
6,5---; 8,5 134
8,5 ----110,5 200
10,5 ----112,5 198
12,5 ----114,5 164
14,5 ----116,5 102
16,5 ---; 18,5 48
18,5 ---i20,5 6
20,5 ----122,5 3
Pede-se:
5.5.1. o desvio-padrlro.
5.5.2. o coeficiente de varia�lfo.
RESPOSTAS DOS EXERCfCIOS PROPOSTOS
5.1. 5.1.1. 1,88
5.1.2. 2,02
5.1.3. 2,48
5.2. 5.2.l. 0,2169
5.2.2. 0,4657
5.2.3. 21,2%
5.2.4. 0,2509
5.3. b
5.4. e
5.5. 5.5.1. 3,767
5.5.2. 0,353 OU 35 ,3%
Medidasde
Assimetria e Curtose
6.1. INTRODUCAO
As medidas de assimetria e curtose sao as que restam para completarmos
o quadro das estatisticas descritivas, que proporcionam, juntamente com
as medidas de posiyao e de dispersao, a descriyao e compreensao completas
da distribuiyao de freqilencias estudada.
Como ja foi dito anteriormente, as distribuiyoes de freqilencias nao
diferem apenas quanto ao valor medio e a variabilidade, como tambem
quanto a sua forma. Do ponto de vista desse ultimo aspecto, as caracteristicas
mais importantes sao o grau de defonnayao ou assimetria e o grau de
achatamento ou afilamento da curva de freqilencias ou do histograma. Para
estudar as medidas de assimetria e curtose, e necessario o conhecimenfo
de certas quantidades conhecidas como momentos.
6.2. MOMENTOS
Os momentos podem ser caracterii.ados como quantidades numericas,
calculadas a partir de uma distribuiyao de freqilencias (ou de probabilidades),
e que sao utilii.adas para fornecer descriyoes resumidas da distribuiyao estu
dada. Dentro da ampla classe dos momentos estao inclufdas duas importantes
medidas estudadas anteriormente: a media e a variiincia.
Como vemos, a noyao de momento e generica e abrange igualmente
aquelas duas medidas. Apenas nos as tratamos. separadamente devido a sua
grande importancia no contexto da Estatistica Descritiva.
6.2.1. Momento Natural (Absoluto) de Ordem r
Sfmbolo: m; onde r e um numero inteiro positivo.
0 momento natural de ordem r de um conjunto de niJmeros e definido
da seguinte forma: 227
228
a) Para Dados. Brutos
I
m =
r
x� + xr + . . . + x�
n
b) Para Dados Tabelados
k
Ixffi
I /=1
m, =
n
(1) =---
n
(2)
Quando os valores estiverem agrupados em classes x1 serao os pontos
medios de classe.
Exemplo 1:
Calcular os momentos naturais de primeira, segunda, terceira e quarta
ordens do conjunto de numeros x = {2, 3, 5, 7, 8}.
Recorramos a tabela auxiliar 6.1 para realizar OS cfilculos:
(r = 1)
x;
2
3
5
7
8
s
Ix;= 25
i=l
5
TABELA6.1.
(r= 2) (r = 3)
2 x; x�
I
4 8
9 27
25 125
49 343
64 512
5
Ixf = 151 Ixl = 1.015
i=l i=l
(r-= 4)
4 x;
16
81
625
2.401
4.096
5
Ixt=1.219
i=l
Momento natural de primeira ordem (ou primeiro momento natural)
5
Ix;
=� = 2+3+5+7+8 =�=5
5 5 5
Notar que o momento natural de primeira ordem e a pr6pria media
aritmetica, ou
Momento natural de segunda ordem (segundo momento natural)
n
L,xr
I i= 1 m2=--
n
- =
x2 + x2 + x2 + x2 + x2
1 2 3 4 5
5
=
=
4 + 9 + 25 + 49 + 64
5
= 1;1 = 30,2 I m� = 30,2 I
Momento natural de terceira ordem (terceiro momento natural)
n
L,xr
i=l x� + xi + xt + x! + xf =---= =
n 5
=
= 23 + 33 + 53 + 73 + 83
5
8 + 27 + 125 + 343 + 512
5
=
= l.�15 = 203 I m� = 203 I
Momento natural de quarta ordem (quarto momento natural)
n
L,xt
i=1 x� + xi + xj + x: + x: =---=
=
n 5
24 + 34 + 54 + 74 + 84
5
=
16 + 81 + 625 + 2.401 + 4.096
5
7.219 = -
5
- = 1.443,8
........ m-� -=-1-.44-3- .-8__,I
Exemplo.2:
Calcular o momento natural de primeira, segunda, terceira e quarta
ordens da seguinte distribui\:ao de freqi.iencias:
Classes 'i •j
10 f---20 2 1 15
20 f---30 4 25
30 f---40 5 I 35
40 f---50 8 45
50 f---60 5 55
60 f---70 4 65
70 f---80 2 75
7
L 'i=30
j=l
TABELA 6.2
Xjfj I "/'i
30 I 450
100· 2.500
175 I 6.125
360 I 16.200
27.5 I 15.125
260 I 16.900
150 11.250 , I ' ? xjfj=1.350 ?x/ti=68.550
/=:1 /"'I
I
I
I
I
I
xjfi x/fi
6.750 I 101.250
62.500 1.562.600
214.375 7.5031125
729.000 I 32.805.000
831.875 I 45.753.125
1.098.500 71.402.500
843.750 63.281.250
7 7
L x/'i = 3.1ss.1so L x/'i = 222.4os.1su
j=J i·-1 229
-
230
Momento natural de primeira ordem: r = 1
7
Ixjt;
I j=l
=
1.350
= 45 mi =�-n-- 30
Momento natural de segunda ordem: r = 2
7
Ix/1;
m� = 45
I _ j=l - 68.550 _
2 285 m2 - n - � - . m� = 2.285
Momento natural de terceira ordem: r = 3
7
Ixlt;
j=
1n =
3.78�0750
= 126.225
Momento natural de quarta ordem: r = 4
7
m� = 126.225
Ixlt;
m;· =
i=1
n =
222.4��·750
= 7.413.625 1 m; = 7.413.625
6.2.2. Momento de Ordem r em Rela�o a uma Ori gem Qualquer x 0
Sfmbolo: xomr
0 momento de ordem r em relayao a origem arbitraria x0 e definido
da seguinte maneira:
a) Para Dados Brutos
n
L (xi - xoY
i=l
n
b) Para Dados Tabulados
k
L (Xj - xof f;
j=l
xomr = ____ n __ _
Exemplo 3:
(3)
(4)
Considerando x0 = 4, calcular os momentos de primeira e segunda
ordens do conjunto x = {2, 3, 5, 7, 8} em relayao aquela origem.
TABELA6,3
4
t
Ix; - xol2
x; Ix; - xol
2 2-4=-2 (-2)
2
= 4
3 3-4=-1 (- 1 1
2
= 1
5 5-4=1 1
2
= 1
7 7-4=3 3
2
= 9
8 8-4=4 4
2
= 16
'E.x; = 25 'E.(x; - 4) = 5 l;(x/ - 41
2
= 31
Recorrendo a f6rrnula (3), obteremos o
Momento de primeira ordem em relaylio a origem x0 = 4; r = I
'f.(Xi - 4)1
5
=
=
(-2) + (-I) + I + 3 + 4
= I 5
e o Momento de segunda ordem em relayao A origem x0 = 4; r = 2
'f.(Xj- 4)2
- (-2)2+(-1)2+12 + 32 +42
Exemplo 4:
5
-
5
=
4 +I+ I +9 + 16
= B_ = 6 2 5 5 '
Dada a tabela abaixo, calcular os momentos de primeira, segunda e
terceira ordens em relayao a origem x0 = 40:
TABELA 6.4
Claa.1 fj "i (Xj-Xg) lxj-xoifj lxj-xol'fj lxj-xol'fj
10t---- 20 2 15 15-40= -25 -50 1.250 -31.250
20t---- 30 4 25 25-40=-15 -60 900 -13.500
30t---- 40 5 35 35-40= -5 -25 125 -625
40t---- 50 8 45 45-40= 5 40 200 1.000
50 I-- 60 6 55 55-40= 15 75 1.126 16.876
601-- 70 4 65 65-40=25 100 2.500 62.500
70 I-- 80 2 75 75-40=35 70 2.450 86.750
I:fj=30 2: (Xj - 401fj = 160 I:(2 -51=-3 (-312 = 9 (-313 = -27
(3 -51=-2 (-212 =4 (-213= -8
(5 -51=0 02 =O 03 =O
(7 -51 =2 22 =4 23 =8
(8-51 =3 32 =9 33 =27
5 5 s
(x;-xJ4
81
16
0
16
8r
5
:L x;=25 :L (x;-51=0 L (x;-xl2=26 L (x;-xl3=0 :Ltx;-xl4= 194
i=l i=l i=l i=l
Momento centrado de primeira ordem
�(x; - x) o m1 = = -= 0 ==> m1 = 0
n 5
Momento centrado de segunda ordem (variancia)
i=l
�(x; - x)2 26 m2 =
n
= 5 = 5,2 ==> m2 = 5,2
233
234
Momento centrado de terceira ordem
l:(x; - x)3 0 m3 = n =5= 0 >
Momento centrado de quarta ordem
l:(x; - x)4
194 m4 = n = -
5
- = 38,8 > m4 = 38,8
Notar que os momentos centrados de primeira ordem sa-o sempre nulos.
m1 = 0
Exemplo 6:
Usando os dados da distribuiyll'o de freqtiencias do exemplo 4, calcular
os quatro prirneiros momentos centrados. Usando uma tabela auxiliar, temos:
TABELA 6.6
Class.s f; Xj Xjfj (xj - X)fj fx; - xPt; fJ(j - XJ3 fj
10 t-- 20 15 30 1-JOJ x 2 = -60 1.800 -54.000
20 t-- JO 4 25 1tlO 1-20) x 4 = -80 1.600 -32.000
30 t-- 40 5 35 175 l-10IX5=·-50 500 -5.000
40 1--- 50 45 360 OX8=0 0
50 t-- 60 55 275 10 x 5 = 50 500 5.000
60 t-- 70 65 260 20X4=80 1.600 32.000
70 f-- 80 75 150 30X2=60 1.800 54.000
-
n=30 'f.xjfj = 1.350 Eix;-451f;=O Elx;-4512f;= 7.800 'ilx1-�)3fj = 0
x = "'E.xifi = 1.350 = 45 n 30 · x = 45
Momento centrado de prirneua ordem:
k
L (x i - x)ft
j=l 0 m1 = -'---- n--- = _3_0_ = 0 =>
Momento centrado de segunda ordem (variancia):
k
L (xi - x)2
fi
m2 = ..:..i_=_1 __ n ___ = 7 ·:: = 260 >
fx; - XJ4fj
1.620.000
640.000
50.000
0
50.000
640.000
1.620.000
EIXf- xl4f; =4.620.ooo
m2 = 260 I
Momento centrado de terceira ordem:
k
L (x; - x)3f;
j=t 0 m3 = n = 30 = 0 m3 = 0
Momento centrado de quarta ordem:
k
L (x; - x)4f;
j= t m4 = �--n---- =
I m4 154.ooo
4.620.000
30 = 154.000
6.2.4. Rela�o Geral entre os Momentos Centrados na Media
e os Momentos Naturais
E possivel determinar os momentos centrados na media a partir dos
momentos naturais (hem como a partir dos momentos centrados em rela�o
a uma origem arbitniria x0). Para chegarmos a relayao geral entre tais
momentos, partiremos da expressao (6):
k
L (x; - x)'t;
j = l m, =
_,_ ___ n __ _
Desenvolvendo o segundo membro de 6,
_ 1 � [ r (r) r-t(-) + (r) r-2(-)2 + mr - n f..... Xj - l Xj X 2 Xj X - • • •
J = l
+ (-I)s(:)x;-s(x)s + ... + (- l)r-1(r�1)x1(x)'-1 +
+ (-1)'(x)'] t;
onde s m1 = m1 - 1 m1 • m1-1 = m; - m;-= 0
Parar= 2 ==> m2 =m� -(i)m: • m�-1 +(;)(m;)2m�-2
= m� - 2(m;)2 + (m;)2 = m� - (m;)2
, (3) , , (3)( ')2 , Parar=3 => m3=m3 - 1 m1•m3-1 + 2 m1 m3-2
(3) m4 = m� - ( i)m:m�-1 + ( �)(m;)2m�-2
- (�)(m;)3m�-3 +(!)m;)4m�-4 =
= m� - 4m; ·mi+ 6(m;)2m� - 4(m;}3 • m; +
236 + (m;)4 = m� - 4m; • mi+ 6(m;)2� - 3(m;)4
Em resumo,
r m,
1 m1 = 0
2 , ( ')2 m2 = m2 - m1
3 m3 = m� - 3m;m� + 2(mD3 (8)
4 m4 = m� - 4m;m� + 6(m�)2m� - 3(m�)4
Exemplo 7:
Usando os dados do exemplo 2, calcular os seguintes momentos:
m1, m2, m3 e m4.
No exemplo 2, foram calculados os quatro primeiros momentos na
turais cujos resultados sao:
m� = 45 m� = 2.285 m� = 126.225 m� = 7.413.625
Levando esses resultados nas express5es indicadas acima,
m1 = 45 - 45 = 0
m2 = m� - (mD2
= 2.285 - (45)2
= 2.285 - 2.045 = 260
m3 = m� - 3m;m� + 2(m;)3
= 126.225 - 3. 45 • 2.285 +
+ 2(45)3 = 126.225 - 308.475 + 182.250 = 0
m4 = m� - 4m;m� + 6(m;)2m� - 3(mD4
= 7.413.625 -
- 4 • 45 • 126.225 + 6 • (45)2
• 2.285 - 3 • (45)4
=
= 7.413.625 - 22.720.500 + 27.762.750 - 12.301.875 =
= 154.000
I m1 = 0 I I m2 = 260 I I m3 = 0 I I m4 = 154.000
Esses resultados podem ser confrontados com os valores obtidos no
exemplo 6.
6.2.5. Relat;io entre Momentos Centrados na Mlkiia e Momentos
Centrados em uma Origem Arbitraria x0
Da mesma forma como no caso anterior, e possivel estabelecer rela�oes
entre m, e x0m,. Apresentaremos apenas as express5es dos quatro primeiros
momentos e as rela�oes serao desenvolvidas a partir das formulas para dados
agrupados em classes. As formulas (4) e (6) estabelecem
k
L (x1 - Xo)'fj
j=I
xomr =
n
e m, =
k
L (x1 - x)'fj
j=I
n 237
238
onde x; representa um ponto medio de classe generico.
Fa\:amos, para simplificar, x; - x0 = D;. Assim, podemos escrever
k
LDffj
j=I
xomr = n
Essa expressao representa, em ultima analise, a media aritmetica pon
derada das r-esimas potencias dos desvios D; = x; - x0 , ou, mais simples
mente:
Dessa forma,
Para r = I > x0m1 = l5
r = 2 > xom2 = fj2
-3 r = 3 > x0m3 = D
-4 r = 4 > x0m4 = D
(9)
Vejamos agora como relacionar os momentos centrados na media com
os centrados em uma origem arbitraria x0•
a) Para
"i:.(x; - x)fj
r = I > m1 = = 0 n (primeira propriedade
da media)
b) Demonstrafiio para r = 2
Como se sabe, D; = Xj - x0 ou x; = D; + x0
Multiplicando por fj
x;fj = (D; + Xo )fj = D;f + Xofj
Aplicando "i:.,
"i:.x;fj = "i:.D;f; + "i:.xof; = "i:.D;fj + Xo "i:.fj
Dividindo por "i:.f = n, . ---n
'J:,x·J;· "i:.D·J;· :£fr __ I _I = __ /_/
+ Xo -- OU
n n ..n-
ou ainda
X = 15 + Xo
(x; - x) = x; - (l5 + x0) = x; - xo - 15 = (D; - 15)
�
D;
Nestas condi«;oes,
k k
L (xi - x)2 ii L (Di - l5)2 ii j= l
=
j=l m2 =�-
-n--- = n
l [ 2 = - "LD· /,· -n I I
�ifi
r =
"L�/fj -
(
L�ii
)
2
c) Demonstra¢o para r = 3
k
.i. .i.
L (Dj - D)3 ii
j=l l [ 2 m3 = n = n LD/fj - 3DLDiii +
+ 3 (l5)2 r.Diii - (f5)3Lfj] =
OU
(10)
= __ ,_I - __ ,_, • __ I _I + 3 _,_, - ___
,
_ :0::
LD�J;· 3LD·J;· LD?-J;.
(
LD·J;-0
Q
LD·J;i
)
3
n n n n n
= "f.D/ii - 3 LDjii
•
"f.Dj fj
+ 2(
"£,Djfj 3
OU n n n n
d) Demonstra¢o para r = 4
-4
(11)
L(Dj - D) fj l [ 4 - 3 - 2 m4 = n = n LD/ii - 4D"f.Djf; + 6(D)2"i,Diii -
- 4(l5)3"f.Difi + (D)4'f-ii] =
"i,D�J;·
(
"i,D·J;·
) (
LD�fi
) (
LD·J;·
)
2
•
"LD1°?-J; 1· _
= --1- 1 - 4 --1-1 --1-1 + 6 -1-1 n n n n n
("LD·J;-
)
3
(
LD·J;·
) (
"f.D·J;·
)
4 - 4 --1-1 • __ , _,
+ __ , _,
239 n n n
240
Exemplo 8:
m4 = x0m4 - 4(x0m1)(x0m3) + 6(x0m1)2(x0m2) -
- 3(x0m1)
4 (12)
Calcular os quatro primeiros momentos centrados na media, a partir
dos momentos centrados em rela\:iio a origem x0 = 40, com os dados dos
exemplos 4 e 6.
De acordo com os resultados dos exemplos 4 e 6, temos:
m1=0 40m1=5
m2 = 260 40m2 = 285
m3 = 0 40m3 = 4.025
m4 = 154.000 40m4 = 193.625
Confirmaremos tais resultados atraves das formulas demonstradas
acima:
a) Momento centrado de primeira ordem: m1
m1 = 0
b) Momento centrado de segunda ordem: m2
m2 = 40m2 -- (40m1)2 = 285 - 52 = 260
c) Momento centrado de terceira ordem: m3
m3 = 40m3 - 3(40m1)(40m2) + 2(40m1)
3 =
= 4.025 - 3(5)(285) + 2(5)
3 =
= 4.025 - 4.275 + 250 = 0
d) Momento centrado de quarta ordem: m4
m4 = 40m4 - 4(40mi)(40m3) + 6(40m1)2(40m2) - 3(40m1)
4 =
= 193.625 - 4 • 5 • 4.025 + 6 • 52
• 285 - 3 • 54 =
= 193.625 - 80.500 + 42.750 - 1.875 = 154.000
0 resultado seguinte nao foi ainda calculado.
_ '1:.(Xj -40)4/j _
40m4-
n
-
m4 = 154.000
lOs momentos podem ser calculados atraves do processo breve (ou
metodo abreviado ), o qual parte dos mesmos principios que aqueles ja
apresentados para a media e para 0 desvio-padrao (OU variancia ). Como 0
leitor deve recordar-se, o processo breve e desenvolvido com o recurso da
variavel transformada dj,tambem chamada de Msvio reduzido, cuja defini-rao
e, para dados agrupados em classes:
, Xj - Xo
di=�-c
onde Xj = ponto medio de classe generico;
x0 = constante arbitraria, geralmente escolhida como o ponto
medio de classe de maior freqtiencia;
c = amplitude do intervalo de classe.
Para apresentar as formulas que deverao ser usadas no calculo dos
momentos atraves do processo breve, recorreremos a um exemplo, o que
facilitara a demonstra-rao e a comprova-rao dos resultados.
Exemp/o 9:
A Tabela 6. 7 fornece os dados relativos ao quociente de inteligencia de
480 alunos de determinada escola. Calcular as seguintes quantidades:
a) 94m1
b) 94m2
c) 94m3
d) 94m4
i) m
'
1
j) m
'
2
k) m
'
3
I) m
'
4
TABELA 6.7
Quociente de Numero de
I nteliglincia Estudantes
681--- 72 4
12r-- 76 9
761--- 80 16
801--- 84 28
84r-- 88 45
881-'--- 92 66
921--- 96 85
961--- 100 72
100 I-- 104 54
1041--- 108 38
1081---112 27
112 r--116 18
1161--- 120, 11
120 I-- 124 5
124 l-'---128 2
n = 480
241
Xj
70
74
78
82
86
90
94
98
102
106
110
114
118
122
126
242
Utilizaremos, para n calculos necessarios, a Tabela 6.8 auxiliar.
TABELA6.8
fj , Xj-94
di= -
4
- df'j dj2fj d/ ti dj4fi
4 -6 -24 144 -864 5.184
9 -5. -45 225 -1.125 5.625
16 -4 -64 256 -1.024 4.096
28 -3 -84 252 -756 2.268
45 .... 2 -90 180 -360 720
66 -1 -66 66 -66 66
85 0 0 0 0 0
72 1 72 72 72 72
54 2 108 216 432 864
38 3 114 342 1.026 3.078
27 4 108 432 1.728 6.912
18 5 90 450 2.250 11.250
11 6 66 396 2.376 14.256
5 7 35 245 1.715 12.005
2 8 16 128 1.024 8.192
15
L fj=n=480 �df'j=236 �dj2fj=3.404 �dj3ti=6.428 �dj4fj=14.588
j=I
I - Oilculo dos momentos centrados na origem Xo = 94.
Antes de procederrnos aos calculos, devemos lembrar que
, Xj - Xo Xj - 94
di = c =
4
ou seja,
x0 = 94 (media arbitraria)
c = 4 (ponto medio de classe).
Os momentos centrados em rela¢o a origem x0 apresentam a seguinte
propriedade:
onde dj
. r 'f.dj' fj
xomr = c -n-
= Xj - Xo
c Xj
�[� -..xol'fj
= n n
=
�(cdj)'fj c'�dj' fj , 'f.dj' fj
= = c --.-
n n n
(13)
Em particular,
'l;djf; 3 'l;dj3f;
Xomt = c -n- x0m3 = c n
2 'l;dj2 f; 4 'l;dj4f;
xom2 = c -n
- xom4 = c - n
--
No problema em questio, teremos, de acordo com os valores cons
tantes da tabela 8:
'l;d'fi 94m1 = 4 _J_j_ = 4 X 236
= 1 9667 I 94m1 = 1,9667
480 480 ' .
2 'l;dj2 f; 16 x 3-404 94m2 = 4 • "480 =
480
. = 113,4667
I 94m2 = 113,4667 I
'l;d!3 Ii 64 x 6.428 94m3 = 43
• � =
480 = 857,0667
I 94m3 = 857,0667 I
4 'l;dj4f; 256 x 74.588 94m4 = 4 • � =
480 = 39.780,2667
I 94m4 = 39.780,2667 I
II - Cdlculo dos momentos centrados na media.
Neste caso, recorreremos as identidades 10, 11 e 12.
Momento de primeira ordem centrado na media: m1
mi =
'l;(x; - x)f; = ..!_ ( 2-:xfi· - 'l;x"·) n n II 11 = l..(2-:x;f; - x2-:f;) = n .._..,
'l;x;f; xJ( _ _
= -- --=x -x=O
n J(
I m1 = 0
n
Momento de segunda ordem
,
centrado na media: m2
Tomemos a rela?o 10
m2 = x0m2 - (x0m1)2
No problema em questao:
m2 = 94m2 - (94mi)2 = 113,4667 - {l,9667)2 = 109,5988
I m2 = 109,5988 I
Momento de terceira ordem centrado na media: m3 243
244
Devemos ter agora, conforme expressao {11 ),
m3 = xom3 - 3(xom1)(xom2) + 2(xom1)3 =
= 857,0667 - 3(1,9667)(113,4667) + 2(1,9667)3 = 202,8158
m3 = 202,8158 I
Momento de quarta ordem centrado na media: m4
A relayao 12 nos da
m4 = x0m4 - 4(x0m1Hx0m3) + 6(x0m1)2(x0m2) - 3(x0m1)4 ""
= 39.780,2667 - 4{1,9667)(113,4667) +
+ 6(1,9667)2(113,4667) - 3(1,9667)4 = 35.627,2853
m4 = 35.627,2853 I
III - Cdlculo dos momentos naturais
Da mesma forma como fizemos para os momentos centrados numa
origem arbitraria Xo, podemos utilizar 0 metodo abreviado para 0 calculo
dos momentos naturais.
'Partiremos da relayiio
x· - x0 d} = / = desvio reduzido, c
de onde tiramos Xj = cdj +. x0
Assim,
. m' = LxJfj = L(cdj + x0)'fj
r n n
Para r=l
m� =
L(cdj + x0)fj =
CLdjfj + Xo L/j
= c
Ldjfj
+ Xo n n n
Ld/fi -, = Xo + c --= x0 + cd n .
m� = x0 + cd'
Para r = 2
{14)
,
m"l = L(cdj + xo)2fj 1
n = n [LC2dj2fj + 2cXoLd}fj + Xo2Lfj] ::::
2
Ldj2fj
+ 2cx
Ldjfj
+ xl =c-n
- o n
I 2 'i:.djfj 2 'i:.dj2 ii m2 = Xo + 2cxo-- + c --·-
Parar=3
n n
'i:.(cd! + x )3/i· 1 I - I 0 I - [r, 3d '31'. + 3 2 "'f.d '21'. + m3 - n - n C j Jj C Xo j Jj
+ 3cx02'i:.djfj + xJ'i:.ii]
Para r = 4
, _ 'i:.(cdj + xo>4ii 1 [ 4 14 3 13 m4 - n = n. c "'f.di f; + 4c x0'i:.dj ii +
+ 6c2x'6r.dj2ii + 4cxgr.dfii + x:r.ii]
13 14
3 'i:.dj f; 4 'i:.dj ii
+ 4c x0 -- + c --
n n
Em termos do problema:
Momento natural de primeira ordem: m; para x0 = 94 e c = 4
Basta recorrer agora aos dados expostos na Tabela 8.
m; = 94 +
4 :8i
36
= 95,9667 m; = 95,9667
Momento natural de segunda ordem: m;
m2' = (94)2 + 2 X 4 X 94 X 236
+ 42 X 3·404
= 480 480
= 8.836 + 369,7333 + 113,4667 = 9.319,2
m; = 9.319,2 I
Momento natural de terceira ordem
I = (94)3 + 3 X 4 x (94)2 x 236 + 3 X 42 X 94 x 3.4o4
+ m3 480 480
(15)
(17)
+ 43 x 64��8 = 245
= 830.584 + 52.132,4 + 31.997,6 + 857,0667 = 915.571,06
m� = 915.571,06 I
Momento natural de quarta ordem
I
= 944
+ 4 x 4 X 943 x 236
+ 6 x 42 x 942 x 3·404 + m4 480 480
+ 4 x 43 x 94 x 6.428
+ 44 x 74.588 =
480 480
= 78.074.896 + 6.533.927,3 + 6.015.548,4 + 322.257,06 +
+ 39.780,27 = 90.986.409
I I
.
I _ m4 = 90.986.409 _
0 leitor podera comparar os resultados acima calculando os momentos
centrados na media a partir desses momentos naturais, utilizando as ex
pressoes (8). Os resultados deverao ser pr6ximos dos seguintes ja calculados
nesse exemplo (as pequenas diferen9as, porventura existentes, deverao ser
resultantes de arredondamentos):
m1 = 0
m2 = 109,6
m3 = 202,8
m4 = 35.627,3
6.2.7. Controle de Charlier e Corre�o de Sheppard para os Momentos
a) Controle de Charlier
0 controle de Charlier, apresentado no capitulo precedente, pode ser
generalizado a todos os momentos, sendo de grande utilidade no processo
breve de determinac;:ao dessas quantidades, quando os dados vierem dispostos
em tabelas de freqiiencias. 0 controle proposto por Charlier recorre as
seguintes identidades:
I;(dj + l)f; = I;djfj + n �I;f;
I;(dj + 1)2!; = I;dj2fi + 2"'Edffj + n
"'E(dj + 1)3!; = I;dj3f; + 3I;dj2fj + 3I;djfj + n
(18)
"'E(dj + 1)4!; = "'Ed}4fj + 4"'Edj3fj + 6"'£dj2fj + 4"'Edjfj + n
Exemplo 10:
Com os dados do problema 9, utilizar o controle de Charlier para
comprovar os calculos daquele problema.
A Tabela 6.8 fornece os seguintes valores, os quais deverlfo ser utili-
246 zados no desenvolvimento do controle de Charlier:
n = "T.,f; = 480
"T.,dffj = 236
"l:,,dj2fj = 3.404
"T.,dJ3fj = 6.428 e
"l:,,dJ4fj = 74.588.
A Tabela 6.9 apresenta as demais quantidades necessarias para se
processar o controle. As tres primeiras colunas foram repetidas por conve
niencia apenas.
TABELA6.9
Xj t; d:
I
dj+ 1 ldj+ 11f; ldj + 1Pt; ldj + 1i3r; ldj + 114f1
70 4 -6 -5 -20 100 - 500 2.500
74 9 -5 -4 -36 144 -576 2.304
78 16 -4 -3. -48 144 -432 1.296
82 28 -3 -2 -56 112 -224 448
� 45 -2 -1 -45 45 -45 45
90 66 -1 0 0 0 0 0
94 85 0 1 85 85 85 85
98 72 1 2 144 288 576 1.162
102 54 2 3 162 486 1.458 4.374
106 38 3 4 152 608 2.432 3.728
110 27 4 5 135 675 3.375 16.875
114 18 5 6 108 648 3.888 23.328
118 11 6 7 77 539 3.773 26.411
122 5 7 8 40 320 2.560 20.480
126 2 8 9 18 162 1.458 13.122
n= _T.f;=480 T.V:tf+11f;=716 'I:, V:tf + 1 l2f; = 4.356 T.V:tj + 1l3f1=17.828 T.Vif +114f;= 122.148
}";(dj + l)f; == 716 e (r.dffj + n) == 236 + 480 == 716
r.(dj + 1)2!; == 4.356 e ("T.,dJ2fj + 2"J;djfj + n) =
== 3.404 + (2 x 236) + 480 = 4.356"J;(dj + 1)3!; == 17.828 e ("J;dj3fj + 3"J;dj2fj + 3"J;djfj + n) ==
== 6.428 + (3 x 3.404) + (3 x 236) + 480 == 17.828
"J;(dj + 1)4!; == 122.148 e ("T.,dJ4fj + 4"kdj3fj + 6"kdj2fj +
+ 4"kdjfj + n) == 74.588 + (4 X 6.428) +
+ (6 x 3.404) + (4 x 236) + 480 == 122.148
Esses resultados perrnitem afirmar que os caJ.culos dos valores cons
tantes da Tabela 8 estao corretos.
b) Co"effio de Sheppard para os Momentos
Os momentos centrados sao corrigidos atraves das seguintes express6es,
onde c == amplitude do intervalo de classe: 247
248
Var!iincia corrigida (momento centrado de segunda ordem corrigido)
m2 ( corrigido) = m2 - /
2
c2
.-------OU ------1
1 2 s2 ( corrigido) = s2 - TI c
Momento centrado de quarta ordem corrigido
c2m2 7c
4
m4 ( corrigido) = m4 - -2- + 240
onde m2 = s2•
(19)
(20)
Observa�o: os momentos de primeira e terceira ordem nao sao corrigidos.
Exemp/o 11:
Usando OS dados do problema 9, corrigir, pelo metodo de Sheppard OS
momentos centrados (na media) de segunda e quarta ordens.
Os momentos centrados na media, de segunda e quarta ordens, obtidos
no exemplo 9, sao:
m2 = 109,5988 m4 = 35.627,2853 e c=4
Assim,
2 42
a) m2 (corrigido) = m2 - TI = 109,5988 - TI = 108,2655
I m2 (corrigido) = 108,2655 I
2 7c
4
b) m4 (corrigido) = m4 -
c ;2
+ 240
=
42 x 109,5988 7 x 4
4
= 35.627,2853 -
2 + �
=
= 34.757,9616
m4 (corrigido) = 34.757,9616
Observa�o: Quando os momentos se referirem a popula�ao, ao inves de
serem simbolizados por m serao pela letra grega µ (pronuncia-se mi). Assim,
µ; = momento natural de ordem r para a popula�ao;
xoµ; = momento de ordem r em rela�ao a origem arbitraria x0;
µ, = momento de ordem r centrado da media.
Na populayao,
µ: OU simplesmente µ representa a media (momento natural de primeira
ordem);
µ� ou a2 (sigma) designa a variancia (momento centrado de segunda
ordem).
6.3. MEDIDAS DE ASSIMETRIA OU DE ENVIESAMENTO
Assimetria, como o pr6prio nome insinua, significa desvio ou afasta·
mento da simetria. Em outros termos, assimetria e o grau de deformayao
de uma curva de freqiiencias (polfgono po lido).
Quanto ao grau de deformayao ou assimetria, podemos ter tres tipos
de curvas de freqiiencia:
a) Curva Simetrica ou Distribuifffo Simetrica
Uma distribuiyao de freqiiencias simetrica apresenta como caracteris
tica principal o fato de as tres medidas de tendencia central mais usadas -
moda, media aritmetica e mediana - serem iguais. Em termos graficos, a
curva de freqiiencias apresentara as duas caldas com a mesma configurayao
(Grafico 6.1).
GRAFICO 6.1 - CURVA DE i=REQU£NCIAS SIMETRICA,
SEM DEFORMACAO
er x=Md=Mo
x =Md= Mo j (21}
Xj
b) Curva ou Distribuifffo de Frequencias As simetrica Positiva ou
Desviada (Deformada) a Direita
Toda distribuiyao deformada e sempre assimetrica. Entretanto, a assi
metria pode dar-se na cauda esquerda ou na direita da curva de freqiiencias.
Uma distribuiyao com deformayao positiva se apresenta com uma
cauda mais alongada a direita da ordenada maxima (ordenada correspondente
a moda) do que a esquerda. 0 Grafico 6.2 ilustra melhor. 249
250
Nas distribui�oos assimetricas a direita, ha uma predominancia de
valores superiores a moda. Os valores concentram-se na extremidade inferior
da escala. Nestas circunstancias podemos escrever: Mo Mo > Assimetria positiva
x = Mo > Simetria
x ' x =
n
"£x;f ; - I x = --
n
"£x;f;
- I x = --
n
Cdlculo das Modas (Metodo de Czuber)
= = 36,82 55
1.575 = 35 45
1.825 = 33,18
55
fMo - fant
Da Tabela 6.13 >Mo =I+ c 2 F - {F + [, . ) = JMo Vant post
20 - 15 = 40 + 10 (2 x 20) - (15 + 5) =
= 42,50
15 - 10
Da Tabela 6.14 > Mo = 30 + 10 (2 X 15) _ (10 + 10) =
= 35
20 - 5
Da Tabela 6.15 ===>Mo= 20 + 10 (2 X 20) _ (5 + 15) =
252 = 27,50
Temos, entlfo,
Primeira Distribuiylfo
x = 36,82 e Mo = 42,5 ===> x Assimetria Nega-
tiva
Segunda Distribuiylfo
x = 35 e Mo = 35 x = Mo Simetria
Terceira Distribuiylfo
x = 33,18 e Mo= 27,5 x >Mo Assimetria Posi
tiva
6.3.2. Coeficiente Hndice) de Pearson
Uma medida usada muito freqiientemente para avaliar o grau de
assimetria ou de deformaylfo de uma distribuiylfo e o coeficiente sugerido
por Karl Pearson, o qual se calcula mediante as expressoes:
a) Primeiro Coeficiente de Enviesamento (ou Assimetria) de Pearson
Sfmbolo: e1
Definiyao:
x -Mo
s
b) Segu,ndo Coeficiente de Assimetria de Pearson
Sfmbolo: e2
Definiylfo:
3(x - Md)
s
Observa�s:
(24)
(25)
1. Alguns autores preferem o s{mbolo Sk em lugar do sfmbolo e pa�a
designar a assimetria de uma distribuiylfo;S e k correspondem as primeiras
letras da palavra inglesa "skewness", traduzida por deformaylfo ou assi
metria.
2. A expresslio 25 decorre da relaylfo empirica proposta por Pearson, apre
sentada no Capitulo 4 (expresslfo 42):
(x - Mo)=== 3(x - Md)
Da expresslfo (24) tiramos, por substituiylio:
x -M0 ::: 3(x - Md)
s s
que e a formula (25) vista acima.
Como essas relay6es slfo aproximadas e nao exatas, somente quando a
distribuiylfofor simetrica elas se equivalerlfo. 253
A (24) tern o inconveniente de requerer a determina9lio previa da moda.
Tratando-se, entretanto, de distribui9oes que nao se apresentem com
forte assimetria, deve-se dar preferencia a expressao (25).
3. A expresslio (25) pode alcanyar um valor te6rico de ±3. Todavia, nao 6
comum o aparecimento de curvas de freqilencias com deforma9lio
superior a ± 1.
Exemplo 13:
Admitindo-se que numa distribui9lio de freqilencias x = 95, Md= 90
e s = 33,33, calcular o segundo coeficiente de Pearson e interpretar o
resultado.
= 3(x -Md) e2
s
j e2 = 0,45 ou 45%
Exemplo 14:
3(95 - 90)
33,33
15
33 33 = +o.45
'
===> Assimetria positiva
Calcular o primeiro e o segundo coeficientes de Pearson para as distri
bui90es de freqilencias do exemplo 12.
Os valores necessarios para determinar as medidas que comporlio o
coeficiente de Pearson ja se encontram calculados nas tabelas constru{das
na solu9ao do exemplo 12.
Stlgunda Oi6tribu!Po Terct1in1 Di1tribuifio
(Tabela 131 (Tabela 141 ITabela 151
ii = 'E.x;fj = 2.025 = 36 82 · n 66 ' ii= 'E.x;f; = 1.5 75 = 35 n 4 5 ii= 'E.xjfj. = 1.825 = 33 18 n 5 5 '
Mode (Czuborl
Mo= 40 + 10 12 X 2�� = 11,5
5 + 51 = 42,5 0 Mo= 30+1012 x 11:,::: :�o+ 101
=36 Mo =20+1012 x 2::;:=�5 + 151 =27,50
.!!.-Fant
Md=!+ c-2 __ = 30+10 27,5-15 = Md= 30+10 22,5
15-
15 =35
fMd 15
Md=30+10 27�;25 =31,67
254
=38.33
Ji
curva sim�trica
b) Cdlculo do Segundo Coeficiente de Pearson
A formula 25 nos da
ez =
3(.X - Md)
s
Primeira Distribuii;io
3 (36,82 - 38,33)
62 =
11,24
=
=-0.40
Assimetria negativa
Segunda Distribuii;io
82 =
3 (35 -35)
= 0
11,68
Assimetria nu la >
� simetria
Terceira Distribuii;io
=
33,18 -27,50
046 81 12,45
•
Assimetria positiva
Terceira Distribuii;io
.3 (33,18 - 31,67) =
83 =
12,45
= 0,36
Assimetria positiva
Os primeiro e segundo coeficientes de Pearson difei:em em valor, mas
nao em sinal, como pode ser observado nos resultados apresentados nas
Tabelas 18 e 19. 255
256
6.3.3. Coeficiente Quartil de Assimetria
Sfmbolo: eQ
Outra medida de assimetria freqiientemente usada e o coeficiente
quartil de assimetria, que, em seu calculo, recorre aos tres quartis. Trata-se
de uma medida muito util quando nlro for possfvel empregar o desvio-padriio
como medida de dispersao, mas apenas alguma medida que dependa dos
quartis .
0 coeficiente quartil de assimetria e definido pela seguinte relayiio:
(Q3 - Md) - (Md - Qi)
eQ
(Q3 - Md) + (Md - Qi)
OU (26)
Q3 -2Md+ Qi eQ =
Q3 - Qi
a qual revela que a assimetria e uma quantidade tomada como o quociente
entre a diferenya entre os afastamentos dos quartis e sua soma.
0 coeficiente quartil de assimetria assume valores entre os limites
+l e-1. 1..----1- �-e-Q-�-1 ....... I
Exemplo 15:
Calcular o coeficiente quartil de assimetria para as tres distribuiyoes
do exemplo 12.
A mediana (segundo quartil) das tres distribuiyoes ja foi calculada no
exemplo anterior:
Primeira distribuiyiio: Md = 38,33
Segunda distribuiyiio: Md = 35
Terceira distribuiyiio: Md = 31,67
Resta calcular os primeiro e segundo quartis:
Primeira Distribuit;io
n
01 =l+c
4-Fant
'a,
=
= 20 + 10 13•75 - 5 = 28 75 10 '
3n
03 =·/ + c
4 -Fant
'o,
=
=40 + 10 41,25-30 = 20
=45,625
Ssgunda Distribuir;lo
o, =20+ 10 11,25-5 = 10
=26,25
Q = 40 + 10 33,75 - 30
3 10
= 43,75
=
Terceira Distribuir;iio
a, = 20 + 10 13,75 - 5 = 20
= 24,375
0 =40+1041,25-40
3 10
= 41,25
=
Determinemos agora o coeficiente quartil de assimetria.
Primeira Distribuirao
Q3 - 2Md +Qi 45,625 - 2 x 38,33 + 28,75
= =
Q3 - Qi
- 2,285
16 875
= - 0•135
'
45,625 - 28,75
eQ = - 0,135 > Assimetria Negativa
Segunda Distribuifiio
43,75 - 2 x 35 + 26,25
eQ =
43,75 - 26,25
I eQ = o I > Simetria
Terceira Distribui¢o
=0
41,25 - 2 x 31,67 + 24,375
eQ =
41,25 - 24,375
2,285
=
16,875
= 0•135
I eQ = 0,135 I ==> Assimetria Positiva
6.3.4. Coeficiente de Assimetria entre os Percentis 10 e 90
Sfmbolo: ec
0 coeficiente de assimetria entre os percentis 10 e 90 obedece ao
mesmo principio que o coeficiente quartil de assimetria, mas, neste caso,
temos um quociente entre a diferenya entre os afastamentos dos percentis
em relayao a mediana (quinquagesimo centil) e sua soma. Em termos de
f6rmula:
(C90 - Md) - (Md - C10)
(C90 - Md)+ (Md - C10)
,__�����ou�����-- Assimetria Negativa
= O
> Simetria
Terceira Distribuifllo
49,5 - 2 x 31,67 + 20,25 ec =
49,5 "'."" 20,25
= ��
5
= 0,219
' -1 e-c =-0-,2 -19--.1 ===:> Assimetria Positiva
6.3.5. Coeficiente Momenta de Assimetria
Slmbolo: eM
Outra medida utilizada para avaliar a assimetria de uma distribui¢o
de freqiiencias e o coeficiente momenta de assimetria, calculado com base
nos momentos centrados da segunda, terceira e quarta ordens, que e definido
por:
on de
Vb. (b2 + 3)
mi m4
b1 = -3 e b2 = -2 m2 m2
(28)
Algumas vezes utiliza-se apenas a raiz quadrada de b1 para representar
o coeficiente de assimetria, ou seja:
onde m2 = s2 e '17ii; = s.
Exemplo 17:
=--
s3 (29)
Com os dados do exemplo 9, calcular o coeficiente momento de
assimetria da distribui�o dos coeficientes de inteligencia.
Precisaremos, para resolver o problema, dos seguintes dados ja calcu
lados no exemplo 9 (item II), os quais serao arredondados ate a segunda
casa decimal:
m2 = 109,60 >mi = 12.012,16 ===> m: =
= 1.316.532,74 ===> v'm� = 1.147,40
m3 = 202,82 > mi = 41.135,95
m4 = 35.627,29
Com esses dados, podemos calcular o coeficiente momenta de assi
metria. Antes, porem, e Conveni.ente determinar OS valor es de bl e b2•
(202,82)2
(109,60)3
41.135•95
= 0,0312457 1.316.521,74 259
260
e VF; = 0,1768
b =
m4
=
35.627,29
= 2 9659 2 2 12 012 16 ' m2
.
'
VF; (b2 + 3)
eM
= =
1 2(5b2 - 6b1 - 9)
=
0,1768 (2,9659 + 3)
= 2[(5 x 2,9659) - (6 x 0,0312457) - 9] 1,0548 1,0548
= 2(14,8295 - 0,1875 - 9) = 2 x 5,6420 = o,o93
==:> Pequena Assimetria Positiva _
eM2
=
Vf};
=
202,82
= 0,1768 � 1.147,40
6.4. MEDIDAS DE CURTOSE
eM2
= 0,1768
A curtoseou excesso indica ate que ponto a curva de frequencias de
urna distribui�ao se apresenta mais afilada ou mais achatilda do que urna
curva-padrao, denorninada curva normal. De acordo com o grau de curtose,
podemos ter tres tipos de curvas de frequencia:
a) Curva ou Distribui¢o de Frequencias Mesocilrtica
Se a curva de frequencias apresentar um grau de achatamento equiva
lente ao da curva normal, ela sera denominada curva mesocfutica (Grafico 6.4).
GRAFICO 6.4 - CURVA DE FREQUISNCIAS NORMALMENTE ACHATADA
(MESOCURTICAI
b) Curva ou Distribuifiio de Frequendas Platic:Urtica
Urna curva platicfutica apresenta-se com alto grau de achatamento,
superior ao da normal, conforme pode ser observado no Grafico 6.5.
c) Curva ou Distribuifiio de Frequencias Leptocilrtica
Urna curva leptocurtica revela um alto grau de afilamento, superior ao
normal.
GRAFICO 6.5 - CURVA DE FREQUENCIAS EXCESSIVAMENTE ACHATADA
(PLATICURTICAI
GRAFICO 6.6 - CURVA DE FREQUENCIAS MUITO AFILADA
(LEPTOCURTICAI
Para avaliar o grau de curtose de uma curva ou distribui�ao de fre
qtiencias, usaremos dois tipos de medidas:
6.4.1. Coeficiente Percentrlico de Curtose
Simbolo: k
0 coeficiente percenti1ico de curtose e a medida mais elementar usada
para avaliar o grau de curtose de uma distribui�ao ou curva de freqtiencias.
E definido pela seguinte expressao:
k = Dq · I C90 - Cao _
(30)
261
262
on de
Q3 - Qi
Dq = Desvio quartilico (Capitulo 5)" =
2
C90 = Nonagesimo centil
C1o = Decimo centil
Se
k = 0,263 > curva ou distribui?o mesocurtica
k > 0,263 ==> curva ou distribuiyao platicurtica
k curva ou distribuiyao leptocurtica
Exemplo 18:
Calcular o coeficiente percentilico de curtose das distribuiy6es de
frequencias apresentadas no exemplo 12.
Os dados necessarios para determinar o coeficiente percentilico de
curtose encontram-se ja calculados nos exemplos 15 e 16, a saber:
Primeira Distribuit;iio
03 = 45,625
01 = 28,75
(03 - 011 = 16,875
03 - 01
Dq = 2 = 8,4375
C90 = 49,75
C10 = 20,5
(C90 - C1ol = 29,25
Segunda Distribuii;iio
03 = 43,75
01 = 26,25
(03 - 011 = 17,5
Dq = 8,75
C90 = 51
C10 = 19
(C90 - C1ol = 32
Terceira Distribuii;iio
03 = 41,25
01 = 24,375
(03 - 011 = 16,875
Dq = 8,4375
C90 = 49,5
C10 = 20,25
(C90 - C1ol = 29,25
0 calculo do coeficiente agora e imediato:
Primeira Distribuirilo
Ds
k=
C9-0 - C10
I k = o,288
Segunda Distribuirilo
k =
Dq
C90 - C10
1 k = 0,273 1
Terceira Distribuirilo
D
k = q
C90 - C10
k = 0,288
=
8,4375
= 0 288 29,25 '
> Distribui?o Platicurtica
8•75 = 0 273
32 '
> Distribuiyao Platicurtica
8,4375 = 0 288
29,25 '
> Distribuiyao Platicurtica
6.4.2. Coeficiente Momento de Curtose
Simbolo: b2
· 0 coeficiente mQmento de curtose utiliza-se do quociente entre o
momento centrado de quarta ordem e .o quadrado do momento centrado
de segunda ordem ( variancia ), ou seja:
OU (31)
Obserw�o: A quantidade b2 aparece na formula do coeficiente momento
de assimetria apresentado anteriormente (item 6.3.5).
Se b2 = 3 > distribuiyao ou curva mesoc6rtica
Exemplo 19:
b2 distribui�o ou curva platicurtica
b2 > 3 > distribui�o ou curva leptoc6rtica.
Calcular o coeficiente momento de curtose da distribuiyao dos coefi
cientes de inteligencia com os dados do problema 9.
Recorreremos aos seguintes valores ja calculados no exemplo 9.
m4 = 35.627,29
m2 = s2 = 109,60 > mi = 12.012,16
Entao,
=
35.627,29
2 966 - 3 0
12.012,16 = ' = '
b2 = 2,966 === 3,o I ==> Distribui�o Mesocurtica
A curtose pode ser medida igualmente pelo coeficiente c2:
I C2 = b2 - 3
Teriamos, entao:
c2 = 0 curva mesocurtica
c2 > 0 · > curva leptocurtica
c2 curva platicurtica
(32)
263
264
EXERCfCIOS PROPOSTOS
6.1. Dada a distribui�o de salarios abaixo, determinar:
6.1.1. A mediana.
6.1.2. Primeiro quartil.
6.1.3. Terceiro quartil.
6.1.4. Momento natural de H ordem.
6.1.5. Momento natural de 2� ordem.
6.1.6. Desvio quartil.
6.1.7. Momento centrado de 2� ordem.
6.1.8. Segundo coeficiente de assimetria de Pearson.
Sa/Arias Freqiiincias
201---25 10
251---30 15
301--- 35 20
351--- 40 18
401-- 45 4
67
6.2. Com os dados do exercicio anterior, determinar:
6.2.1. Primeiro coeficiente de assimetria.
6.2.2. Coeficiente quartil de assimetria.
6.2.3. Coeficiente percentilico de curtose.
6.3. A tabela abaixo apresenta a porcentagem de bacterias encontradas
por cm em 100 amostras de determinado produto.
Classes Freqiiincias
% fj
0,0----10,1 2
0, 1 ----1 0,2 5
0,2 ----1 0,3 10
0,3----10.� 15
0.4 ----10,5 18
0,5 ----10,6 18
0,6----10,7 15
0,7 ----10,8 10
0,8 ----1 0,9 5
0,9 ----l 1,0 2
100
Pede-se:
6.3.1. Coeficiente percentilico de curtose.
6.4.
6.3.2. Coeficiente quartil de assimetria.
6.3.3. Primeiro coeficiente de assimetria.
6.3.4. Segundo coeficiente de assimetria.
6.3.5. Coeficiente de assimetria entre os percentis 10 e 90.
Determinar o coeficiente percentilico de curtose dos dados da tabela
seguinte:
ClaSSllS
21-- 4
41-- 6
61-- 8
81---10
101---12
2
8
10
8
2
30
6.5. Assimetria ou enviesamento :
a) ocorre quando uma curva de frequencias apresenta um desvio-padrao
grande;
b) e o grau de deforma9ao de uma curva de freqilencia;
c) e o achatamento de uma curva de freqilencias;
d) e o desvio de uma curva de freqilencias com rela9ao a uma origem
arbitraria;
e) n.r.a.
6.6. Dados os resultados:
M0 = 30
Md= 28
x = 22
podemos afirmar que a curva de freqilencias e:
a) mesocurtica;
b) simetrica;
c) assimetrica negativa;
d) assimetrica positiva;
e) assimetrica leptocurtica.
6. 7. 0 coeficiente de curtose para uma determinada distribui\:ifo de fre·
qilencias apresentou o seguinte resultado: k = 0,278. Podemos, entio,
afirmar que a curva e:
a) assimetrica positiva;
b) leptocurtica;
c) mesocurtica;
d) simetrica;
e) platicurtica.
6.1. 6.1.1.
6.1.2.
32;13
27,25
RESPOSTAS DOS EXERC[CIOS PROPOSTOS
265
266
6.1.3. 36,46
6.1.4. 31,83
6.1.5. 1.045,80
6.1.6. 4,61
6.1.7. 32,76
6.1.8. -0,16
6.2. 6.2.1. -0,30
6.2.2. -0,06
6.2.3. 0,29
6.3. 6.3.1. 0,272
6.3.2. zero
6.3.3. zero
6.3.4. zero
6.3.5. zero
6.4. 0,295
6.5. b 6.6. c 6.7.
OUTROS EXERC[CIOS COM SOLUC0ES
1. Seja a tabela abaixo:
ClaSS111
1001--110
1101--120
1201--130
1301---140
1401--150
Freqiilncia1
2
4
6
6
2
e
a) construir o histograma da distribui�ao de freqiiencias correspondente
(freqiiencias absolutas e freqiiencias relativas).
b) construir o poligono de freqiiencias absolutas e relativas.
c) construir o polfgono de frequencias acumuladas "abaixo de" (absolutas e
relativas).
2. Tres moedas foram lan�adas duzentas vezes, sendo anotado o nfunero de
coroas que apareceram em cada lance.
Nfunero de coroa1
Xf
0
1
2
3
Numero de lanCBI
'i
16
51
84
49.
a) Construir o grafico correspondente a distribui�ao de freqiiencias expressa
pela tabela.
b) Construa a tabela de freqiiencias absolutas acumuladas e o grafico
corresponden te.
3. Os dados abaixo representam os acidentes com veiculos ocorridos no
munidpio de Gerivo no periodo de 1966 a 1970.
Numero de acidentes Numero de meses
fj
1 0001---1 100 3
1 1001---1 200 8
1 2001---1 300 10
1 3001---1 400 20
1 4001---1 500 11
1 5001--1 600 5
1 6001---1 700 3
a) Construir o poligono de freqiiencias absolutas e relativas.
b) Construir o poligono de freqiiencias acumuladas absolutas e relativas.
c) Qua! a percentagem de meses com mais de 1 400 acidentes?
d) Qual a percentagem de meses com menos de 1 500 acidentes?
e) Qual a percentagem de meses com mais de 1 300 e menos de 1 600 aci
dentes?
4. Uma empresa procurou estudar a ocorrencia de acidentes com seus
empregados, tendo, para isso, realizado um levantamento abrangendo um
periodo de 36 meses, conforme tabela:
Numero de operarios
acidentados par mis (xjl
1
2
3
4
56
7
8
9
10
Numero de meses
(fjl
1
2
4
5
7
6
5
3
2
a) Construir um grafico representando as freqiiencias simples absolutas.
b) Construir um grafico representando as freqiiencias acumuladas "abaixo
de". 267
268
c) Em quantos por cento dos meses houve seis empregados acidentados?
d) Em quantos por cento dos meses houve ate quatro empregados aci
dentados mensalmente?
5. Uma empresa apresentou a seguinte evolu�ao de vendas de um de seus
artigos, no periodo de dois anos, computados trimestralmente:
Peflodo ft) 1971 1972
Trimestres 19 29 39 49 19 29 39 49
Vendas 100 120 95 90 120 140 113 108
Representar a evolu�ao das vendas, atraves de um grafico em linha.
6. Um produto e vendido por apenas tres empresas, em um determinado
mercado. Em 1972, para um total de 18 000 unidades vendicias, tivemos
a seguinte distribui�ao das vendas pelas tres empresas:
Empress A B c
Vendas 7 200 4 800 6 000
Representar graficamente (grafico em setores) a distribui�ao das vendas
de cada empresa (distribui�ao absoluta e percentual).
7. Calcular a media aritmetica do seguinte conjunto de valores: {5, 7, 3,
2, 9, 10, 11, 6, 5, 2}.
8. A tabela seguinte representa a distribui1Jao dos salarios mensais dos ope
rarios de uma empresa.
Sa/Brios Numero de
(Cr$) empregados ff)
2801-- 400 15
4001-- 520 30
5201-- 640 20
6401-- 760 10
7601-- 880 4
8801--1 000
Calcular 0 Salano medio pago aos operanos.
9. Uma prova de estatistica realizada numa classe com cinqiienta alunos
apresentou os seguintes · resultados:
Notas (xj) 0 2 3 4 5 6 7 8 9 10
NC? de alunos (fj) 2 4 5 6 7 8 7 5 3 2
Calcular a media aritmetica das notas.
10. Seja o seguinte conjunto de nfuneros: {5, 7, 9, 11, 13}. Mostrar que
somando ou subtraindo, a cada valor do conjunto, a constante 4, a
media resultante ficara somada ou subtraida dessa quantidade.
11. Considere o seguinte conjunto de mimeros: {210, 212, 223, 231, 242,
253, 264, 275}.
a) Calcular a media aritmetica desses nfuneros pelo metodo normal.
b) Calcular a media aritmetica pelo metodo abreviado, fazendo Xo = 230
(media arbitraria).
c) Compare os resultados.
12. Dada a seguinte distribui�ao de frequencias:
Classes
Ol-- 4
41-- 8
81---12
121---16
161--20
201---24
241---28
281---32
a) Calcular a media aritmetica pelo metodo normal.
2
4
7
16
26
12
6
2
b) Fazendo agora x0 = 16 (media arbitraria), calcular a media pelo
metodo abreviado.
13. Um aluno recebeu as seguintes notas finais: 82 em Matematica, 90 em
Estatistica, 65 em Hist6ria e 70 em Geografia. Atribuindo-se a essas
materias, respectivamente, os pesos 3, 3, 2, 1 calcular a media aritmetica
das notas recebidas pelo aluno.
14. Em uma classe, dez alunos tern 18 anos de idade, quinze tern 19
anos, catorze tern 20 anos, e um tern 21 anos. Calcular a idade media
da classe.
15. Se tomarmos x0 = 10 como a media arbitraria de um conjunto
de mimeros, chegaremos aos seguintes desvios, calculados em rela�ao
a x0: {-4, -1, 2, 0, 3, -3, 5, 1}. Calcular a media verdadeira do
conjunto. 269
16. Considere a seguinte distribuiyiio de freqiiencias:
Vari,val (x) 870 871 872 873 874 875 876
Fr«1iilncias (f) 2 4 6 8 7 4
Calcular a media aritmetica dos valores pelos metodos normal e abreviado.
Para 0 segundo metodo, tomar Xo = 873.
17. A tabela seguinte refere-se a uma distribui�o de freqiiencias do compri
mento de cem barras de ferro:
Comprirmmto (cm) Numero de barras (f)
751----100 2
100 I-- 125 4
125 I-- 150 11
150 I-- 175 18
175 I-- 200 31
200 I-- 225 22
225 I-- 250 9
250 I-- 275 2
275 I-- 300 1
Calcular a media aritmetica das cem barras, usando o metodo abreviado
e fazendo x0 = 187,5 e c = 25.
18. Sejam os seguintes conjuntos de nfuneros: A= {10, 11, 12, 13, 14, 15} e
B = {0, 1, 2, 3, 4, 5}. Calcular a media aritmetica dos dois conjuntos
e comparar os resultados,
19. Calcular a moda dos seguintes conjuntos: A = {3, 5, 7, 9, ll};B = {3, 5,
5, 7, 7, 7, 9, 9, 11} e C = {l, 3, 5, 5, 5, 7, 7, 7, 9, 9, 11}.
20. Numa certa seyiio de uma empresa foram levantadas as idades dos fun
cionarios, chegando-se aos seguintes resultados:
ldades (x) 25 26 27 28 29 30
N9 de emprsgados (f) 2 4 6 7 5
Qual a idade modal dos empregados dessa seyiio?
21. Calcular a moda dos valores apresentados na tabela abaixo.
a) Pelo metodo de King.
270 b) Pelo metodo de Czuber.
Classes fj
10f--20 5
20f--30 10
30f--40 15
40 1--50 8
501--60 2
40
22. Seja a seguinte tabela:
Classes
Freqiiencias acumuladas
"Abaixo de"
Of-- 4
41-- 8
Sf-- 12
121--16
161--20
201--24
241--28
281--32
a) Qual e a classe modal?
2
6
13
29
55
67
73
75
b) Qual e o valor da moda bruta da distribui�ao?
c) Determinar a moda pelo metodo de Czuber (pela formula e grafica
mente ).
23. Determinar o elemento mediano dos seguintes conjuntos de numeros:
A = {2, 4, 11, 13, 16, 18, 20} e
B = {2, 4, 11, 13, 16, 18}.
24. A tabela abaixo apresenta as notas obtidas por vinte alunos, em uma
prova de Estatistica:
Nora (x) 2 3 4 5 6 7 8
/119 de alunos ff) 2 3 5 4 3 2
Determinar a nota mediana.
25. As notas obtidas por 21 alunos em uma prova de Conhecimentos Gerais
estao anotadas na tabela abaixo:
Notas (x) 4 5 6 7 8 9 10
/119 de alunos ff) 2 4 5 4 4
Calcular a nota mediana da classe. 271
272
26. Calcular a mediana da seguinte distribui�ao de freqtiencias:
Classe.s Freqiilncia.s (f}
401-- 50 1
501-- 60 3
601---- 70 6
701--- 80 11
801--- 90 19
901----100 35
1001---110 27
1101--120 15
1201---130 14
1301---140 7
1401---150 5
1501---160 2
1601--170
27. Dado o histograma abaixo, no interior de cujos retangulos foram anotadas
as freqtiencias simples absolutas, calcular a mediana do conjunto (Gra
fico XIV).
GRAFICO XIV
rif1h __
1
.._
0
__
2
_.
0
___ 30..__ __ 40...._ _ __.50.__ __ 60......___,.� Classes
28. Dado o histograma abaixo, no interior de cujos retangulos foram anotadas
as freqilencias simples relativas, calcular a mediana do conjunto (Gra
fico XV).
GRAFICO XV
15% 20% 30% 25% 10%
__, __ __._ __ ..._ __ '--_ __._ __ .....___.� Classes
10 20 30 40 50 60
29. Dado abaixo o poligono de freqiiencias relativas acumuladas, determinar
a mediana do conjunto (Grafico XVI).
F rj Pol (gono de freqii6ncias relativas acumulades
100
90
80
70
60
50
40
30
20
10
GRAFICOXVI
0 .....__,._ _ __..__ _ _._ __ .._...._ ........ __ ..._ _ __._ JC
50 150 250 350 400 450 550 650
30. Seja o seguinte histograma, no interior de cujos retangulos estao anotadas
as freqiiencias simples absolutas (Grafico XVII).
100 200
5 6 4 3
300 400 500 600
GRAFICO XVII
JC
273
a) Calcular a media, a moda (Czuber) e a mediana do conjunto.
b) Calcular a moda, usando a rela�io de Pearson.
31. Seja a seguinte distribui�ao de freqiiencias:
501-- 60
60r--- 70
701-- 80
80r--- 90
901--100
1001--110
1101--120
Freqiiincias ff)
8
10
17
13
9
6
2
a) Calcular o primeiro, o segundo e o terceiro quartis.
b) Calcular o primeiro, o segundo e o oitavo decis.
c) Calcular o vigesimo, o trigesimo quarto e o septuagesimo quinto centis.
32. Dado o poligono de freqiiencias abaixo, calcular o primeiro quartil e a
mediana da distribui�o (Grafico XVIII).
GRAFICO XVIII
7
6
5
4
3
2
0 10 20 30 40 50
33. Seja a seguinte tabela de freqiiencias:
Clas!llll f
Of-- 20 2
201---- 40 3
401---- 60 6
601---- 80 3
801----100 2
27 4 Calcular a media, a moda e a mediana.
60
34. A amplitude total de urn conjunto de n6meros e 500. Se a distribui�ao
de freqiiencias apresenta vinte classes, qual devera ser o limite inferior e
0 ponto medio da quinta classe, se 0 limite superior da primeira classe
e igual a 35?
35. Dado o conjunto de n6meros, A = {-10, -5, 2, 3, 6, 9, 10}, qual e
o valor da amplitude total do conjunto?
36. Calcular o desvio medio do seguinte conjunto de n6meros:A = {300, 400,
500, 600, 700}.37. Dada a distribui�ao de freqiiencias abaixo, calcular 0 desvio medio.
2 3 4 5 6
3 5 5 3
38. Considere a seguinte tabela de freqiiencias:
1,5.1--1,6
1,61--1,7
1,71--1,8
1,81---1,9
1,91--2,0
2,01--2,1
2.11---2.2
f
4
8
12
15
12
8
4
Calcular o desvio medio da distribui�o.
39. Calcular a variincia e o desvio padrio dos seguintes conjuntos de n6meros:
A= {O, 0, 0,1, 1, l} e B = {-2,-1, 0, 1, 2}.
40. A distribui�o de freqiiencias seguinte representa o n6mero de pe�as
defeituosas produzidas por uma maquina em 31 dias de observa�ao.
Calcular o desvio padrao do n6mero de pe�s defeituosas pela f6rmula
original e pela f 6rmula desenvolvida.
N9 de di• (f)
2 3 4
3 5 15 5 3
41. A distribui�ao de freqiiencias dos pesos de cem operarios de uma fabrica
e a seguinte:
c1- (f>B$os} N9 de operlrios (f}
501--58 10
581--66 15
661--74 25
741--82 24
821--90 16
_
_ so
_
1--__ e
_
8_
�
____ 10 __
__
275
276
Calcular o desvio padrao dos pesos dos cem operarios, pela f6rmula ori
ginal e pela f6rmula desenvolvida.
42. Usando os dados do problema 41, calcular o desvio padrao pelo processo
breve, fazendo x0 = 70.
43. A distribuiyao da renda semanal proveniente do aluguel de duzentas
casas pertencentes a uma empresa imobiliaria encontra-se na tabela
abaixo.
Renda semanal Numero de casas (f)
751----125 12
1251----175 26
1751---- 2251 45
2251----275 60
2751---- 325 37
3251---- 375 13
375f---425 7
Calcular o desvio padrao da renda semanal, pelo processo breve e com o
uso da variavel reduzida, fazendo x0 = 250 e c = 50.
44. Dados os conjuntos de m1meros,
A = {220, 230, 240, 250, 260} e
B = {20, 30, 40, 50, 60},
que relayao existe entre os desvios padr5es dos dois conjuntos?
45. Considere os seguintes conjuntos de m1meros:
A = {10, 20, 30, 40, 50} e
B = {100, 200, 300, 400, 500}.
Que relayao existe entre os desvios padroes dos dois conjuntos de
nfuneros?
46. Um teste de estatistica foi aplicado em duas classes, e os resultados da
avaliaylio foram os seguintes:
ClasseA { :X=6
ClasseB { x=7
s=2 s=l
Calcular o coeficiente de variayao de Pearson para os dois conjuntos.
47. Considere os seguintes resultados relativos a tres tabelas de freqiiencias:
Distribui�io A
X=50
Md=50
Mo= 50
Distribui�io B
X=4S
Md=49
Mo =50
Distribui�io C
X= 51
Md=50
Mo =49
Quanta ao enviesamento das curvas de freqiiencia correspondentes, que
tipo de distribuiyao temos em cada caso?
48. Examinando o Grafico XIX, indicar qual das distribuiyOeS apresenta um
desvio padrao maior (supor que as areas sob as curvas sejam iguais).
8
GRAFICOXIX
49. Considere o polfgono de freqiiencias relativas acumuladas do Grafico XX.
GRAFICO XX
Fr FreqUlnciu relatives
acumuladas
100
90
so
..Eq3---------------------
70
60
50 _Emd·-----------------
40
30
20
10
0 100 200 300 400 500
a) Calcular o desvio quartilico.
b) Calcular a mediana.
600 700
277
278
50. Calcular o valor do primeiro coeficiente de assirnetria de Pearson usando
os resultados do problema 4 7, sabendo-se que as variancias das distri
bui�oes sao, respectivamente: sJ = 4, sj = 4, st: = 2,25.
51. Sejam as seguintes tabelas de freqiiencias
I U m
Classes fj CIS!J$1JS fj Claues
101--20 2 101--20 3 10.1--20
201--30 4 201--30 5 201--30
301---40 6 301---40 7 301---40
401--50 4 401---50 2 401---50
501---60 2 501--60 501----60
a) Calcular o prirneiro coeficiente de assirnetria de Pearson.
b) Calcular o segundo coeficiente de assirnetria de Pearson.
c) Calcular o coeficiente quartil de assirnetria.
52. Seja a seguinte tabela de freqiiencias:
Classes fj
1001--200 2
200 I-- 300 22
3001--400 52
4001--500 22
5001--600 2
Calcular o coeficiente de curtose da distribuicao. ·
RESOLU1
2
3
4
5
6
7
8
9
10
80
x = �x · f = 41 720 = 521 5 n 80 '
fj Xj' fj
1 0
2 2
4 8
5 15
6 24
7 35
8 48
7 49
5 40
3 27
2 20
50 268
340 5 100
460 13 800
580 11 600
700 7 000
820 3 280
940 940
41 720
- T-xr fj 268 x = = - = 5 36 n 50 '
A nota media e, portanto,
5,36.
10. lnicialmente, temos:
Xi = 5 + 7 + 9 + 11 + 13 = � = 9 5 5
Somando-se 4 a cada um dos valores do conjunto original, teremos:
{9, 11, 13, 15, 17}. A media desse novo conjunto sera:
x 2 = 9 + 11 + 13 + 15 + 17 = � = 13 5 5
A media resultante e igual a media do conjunto original mais a constante
4. Subtraindo-se, agora, a constante 4 de cada valor do conjunto original,
teremos: 285
286
{1 3 5 7 9} -= 1 + 3 + 5 + 7 + 9 = 25 = 5 , , , , e X3 5 5 .
Esse valor e igual a media do conjunto original menos a constante 4.
11. a) Metodo normal:
x
210
212
223
231
242
263
264
275
1:.x; = 1 910
x = �xi= 1 910 = 238 75
n 8 '
b) Metodo abreviado: x0 = 230
x;- x0 =
d;
-20
-18
- 7
1
12
23
34
45
Ll;=10
�d·
X =Xo +-
1
n
- 70 x = 230 +--s
x = 230 + 8,75 = 238,75
c) Os resultados sao absolutamente iguais.
12. a) Metodo normal
C/11$111$ Pontomldio
01--- 4 2
41--- 8 6
81---12 10
121--16 14
161--20 18
20t--24 22
241--28 26
281--32 30
'i
2
4
7
16
26
12
6
2
75
xi• fi
4
24
70
224
468
264
156
60
1 270
-x-· __ �r f;
t 210
n
=15==
== 16,93
13.
14.
15.
b) Metodo abreviado: x0 = 16
Ponto mtJdio fxj) dj=Xj- Xo
2 -14
6 -10
10 - 6
14 - 2
18 2
22 6
26 10
30 14
-28
-40
-42
-32
52
72
60
28
70
- T.df 70 x = x0 +
n
= 16 +75= 16 + 0,93 � 16,93
Nam (x) PBS06 (p)
82 3
90 3
65 2
70 1
9
/dade Xj N9 de alunos fj
18 10
19 15
20 14
21 1
40
ldade media da classe: � 19 anos.
"£d, - J x =x0 +n
x • p
246
270
130
70
716
Xjfj
180
285
280
21
766
x = 10 + (-4) + (-1) + 2 +8 0 + 3 + (-3) + 5 + 1
3 = 10 +g-= 10 + 0,375 = 10,375.
- 716
x =9 � 79,6
'T.xj· fj x = =
n
. = 766
= 19 15 40 '
287
288
16. a)
Xj 'i
870 2
871 4
872 6
873 8
874 7
875 4
876 1
32
Xj, fj
1 740
3 484
5 232
6984
6 118
3 500
876
27 934
-x = Der fj = 21 934 =
n 32
=
872,9375
b) Metodo abreviado: x0 = 873
dj = Xj- X o 'i dj. 'i
-3 2 -6
-2 4 - 8
-1 6 -6
0 8 0
1 7 7
2 4 8
3 1 3
32 -2
X = Xo
+ "Edrfj __ 2
n
873
+ �
2
= 873 - 0,0625
=
872,9375
17. Xo = 187,5 e c = 25 (constante arbitraria). Entao, o desvio reduzido,
d'; seni:
Xj -Xo
d'; = c
Classes
751---100
1001---125
1251---150
1501---175
1751---200
2001---225
2251---250
2501---275
2751---300
'i
2
4
11
18
31
22
9
2
1
100
Xj-187,5
25
xi
87,5
112,5
137,5
162,5
187,5
212,5
237,5
262,5
287,5
dj=-xj-XO
, Xj-XO
df'i dj=--
c
-100 -4 - 8
- 75 -3 -12
- 50 -2 -22
- 25 -1 -18
0 0 0
25 1 22
50 2 18
75 3 6
100 4 4
-10
('l;d,. ![\ 10
x = x0 + -J;-!1-..Jc = 187,5 + �OO • 25 = 187,5 - 2,5 =
= 185
0 comprimento medio das barras observadas e 185 cm.
18. Media do conjunto A:
- '£x 10 + 11 + 12 + 13 + 14 + 15 75
XA = -n =
6
= 6 = 12,5
Media do conjunto B:
XB =
'£x
=
0 + 1 + 2 + 3 + 4 + 5
=
.!..?_
= 2 5
n 6 6 '
Os valores do conjunto A sao iguais aos valores do conjunto B mais a
constante 10. En tao, a media de A devera ser igual a media de B mais a
constante 10. Trata-se de uma decorrencia da quarta propriedade da
media.
19. Moda do conjunto A: nlio M moda, pois nao M predominancia de
qualquer valor sobre os demais.
Moda do conjunto B: M0 = 7
{M = 5
Moda do conjunto C: M:
= 7
0 conjunto e bimodal
20. A idade modal e 28 anos, porqtJe a freqiiencia de 28 e maior do que a
de qualquer outro valor do conjunto.
21. Classe modal:.30f---40
a) Pelo metodo de King:
£ = 30 IMo = £ +
/pot;:. /ant •
cl
fpost = 8 8 M0 = 30 +
8 + 10 •
10
fant = 10
c = 10 80
= 30 + 18 + 4,44 = 34,44
b) Pelo metodo de Czuber:
£ = 30
81 = 15 -10 = 5
82 = 15 -8 = 7 c = 10
!Mo=£+
81 A� 82 •cl
= 30 + -5 - • 10 =
5 + 7
- 30 + 1Q. = 30 + 4,17 ::: 34,17 -
12 289
290
22. Para calcular a moda precisamos, inicialmente, construir a tabela de
freqilencias simples.
28
24
20
16
12
8
4
Classes Freqiiincias acumuladas Fj fj
01-- 4 2 2=2-0
41-- 8 6 4=6 - 2
8 1--12 13 7 = 13 -6
12 t--16 29 16 = 29 -13
16 t--20 55 26=55-29
20 1--24 67 12 = 67 -55
24 1--28 73 6 = 73 --' 67
28 t--32 75 2 = 75 - 73
a) Classe modal: 161---20
b) Moda bruta: M0 = 18 (ponto medio da classe modal)
c) Determin�ao da moda (f6rmula de Czuber):
I Mo =
2
+ D.1 ; D.2 • c I
16
D.1 = 26 - 16 = 10
D.2 = 26 - 12 = 14
c = 4
' I \ I "
I�
' \
\
\
10 40
Mo
= 10 + 14 •
4 = 16 + 24 =
= 16 + 1,67 == 17,67
GRAFICO XIII
0 .____,_�_._�....____..._.._._�......_�..___._.Xj 4 8 12 16 20 24 28 32
Mo= 17,67
23. Para o conjunto A, temos
ri+l 7+1 -
EMd =- 2- =- 2-= 4
0 elemento mediano sera entlio o 49 da lista. Para o conjunto B o ele-
d. , n 6 3 mento me 1ano sera =2 =2= .
24. Para calcular a mediana recorremos as freqilencias acumuladas:
Numero
Notas de alunos
Xj fj
2
3 2
4 3
5 5
6 4
7 3
8 2
0 elemento mediano e i�ual -a
' Ti 20
2=2= IO.
Freqiiencias
acumuladas
"Abaixo de" Fj
1
3
6
11
15
18
20
Pelas freqilencias acumuladas verificamos que ate a nota 5 acumulamos
11 observa�OeS. Portanto, a mediana e a nota 5.
25. Calculemos primeiramente as freqilencias acumuladas "abaixo de":
Not/ls
Numero de
Xj alunos
4
5
6
7
8
9
10
0 elemento mediano e
n + 1
=
21 + 1
= 11 2 2 '
2
4
5
4
4
Freqiilncia
fj acumulada Fj
3
7
12
16
20
21
que corresponde a nota 7. Portanto, a mediana e a nota 7. 291
26.
292
Classes fj FffJQiiiJncias acumuladas Fj
40f-- 50 . 1
50f-- 60 3
60f-- 70 6
70f-- 80 11
80f-- 90 19
90f--100 35
100f--110 27
110f--120 15
120f--130 14
130f--140 7
140f--150 5
150 .f--160 2
1601:--170 1
146
. , n 146
0 elemento med1ano e 73: 2= 2 = 73.
A classe mediana e: 90f--100.
JI = 90
c = 10
!Md= 35
Fant = 40
Md = 90 + 73 - 40
• 10
35
1
4
10
21
40
75
102
117
131
138
1.43
145
146
330 Md = 90 + 35 = 90 + 9,43 = 99,43
27. Somando-se as freqtiencias temos:
�fj = 8 + 13 + 19 + 14 + 7 = 60
0 elemento mediano e: EJfJ = 62° = 30. Entlio, a classe da mediana ea
terceira classe. Assim,
M = 30 + 30 - 21
• 10 = 30 + 9o = 30 + 5 = 35 d
!8 18
28. A mediana dos valores corresponde aquele valor ate o qual temos 50%
das observa�6es. Para chegarmos ate esse valor teremos que acumular as
percentagens de observa�6es ate que atinjamos os 50% das observa�0es.
Somando-se as percentagens das duas primeiras classes teremos 35% das
observ�oes. Para atingirmos os 50% precisamos ainda de 15%, exata-
mente a metade da percentagem de observacy6es da terceira classe. Por
conseguinte, o valor de mediana e Md = 35, ou o ponto medio c.Ja
terceira classe.
29. Como temos o poligono de freqilencias acumuladas, basta localizar no
eixo vertical a freqilencia acumulada cujo valor e 50%. Tracyando uma
paralela ao eixo das classes, atingiremos o polfgono de freqilencias em um
ponto a partir do qua! tracyamos uma perpendicular ao mesmo eixo das
classes. Essa perpendicular encontrara o eixo das classes exatamente no
ponto correspondente ao valor da mediana. Portanto Md = 400.
30. Vamos, inicialmente, construir a distribuicyao de freqilencias:
Classes fj Xj Xj • fj
1001---200 2 150 300
2001---300 5 250 1 250
3001---400 6 350 2 100
4001---500 4 450 1 800
5001---600 3 550 1 650
20 7 100
a) x = fa�. fj = 7 ;go = 355 (media)
l M0 = 300 + l+2 · 100 = 333,33 (moda)
Md = 300 +
lO �- 7 • 100 = 350 (mediana)
b) Pela relac;ao de Pearson devemos ter:
M0 = 3Md - 2x
M0 = 3 • (350) - 2(355) = 1 050 - 710 = 340
31. Vamos primeiramente calcular as freqilencias acumuladas:pode assumir valores inteiros, inclusive zero. Mais preci
samente, diz-se que X sera uma variavel discreta quando a menor diferen9a
nao-nula entre dois valores possiveis dessa variavel for finita.
Deve-se notar que, teoricamente, X pode variar em todo o conjunto de
numeros inteiros racionais, e nao apenas inteiros positivos de zero a infinito.
Normalmente a variavel discreta resulta de contagem, razao pela qual
seus valores sao expressos atraves de nutneros inteiros nao-negativos.
1.7.2. Variavel Continua
Se X representar, por exemplo, o numero de metros percorridos por
um atleta durante certo periodo de tempo em uma pis ta circular, X nao sera
certamente uma variavel discreta. Agora, X pode assumir o valor de qualquer
numero real positivo, uma vez que para o calculo do comprimento da circun
ferencia e necessario introduzir 0 numero real rr.
Formalmente, diz-se que X e uma variavel continua quando, ao passar
de um valor real a para outro valor b, assume todos os valores intermediarios
entre a e b. Assim sendo, pode-se dizer que a variavel continua resulta normal
mente de mensura9ao, e a escala numerica .de seus possiveis valores corres
ponde ao conjunto R dos numeros reais.
Para se fazer uma ideia concreta da variavel continua, basta pensar em
um filete de mercurio de um termometro com escala centigrada. Ao dilatar-se
o filete da temperatura a da escala para a b, ele passara por todas as tempe
raturas intermediarias.
1.8. FASES DO METODO ESTATiSTICO (ESTATiSTICA DESCRITIVA)
Quando se pretende empreender um estudo estatistico completo,
existem diversas fases do trabalho que devem ser desenvolvidas para se chegar
aos resultados finais do estudo. Essas etapas ou opera9oes sao chamadas fases
20 do trabalho estatistico e sao de ambito da Estatistica Descritiva.
As fases principais sao as seguintes:
- Defini�ao do Problerna
- Planejamento
- Coleta dos Dados
- Apura�o dos Dados
- Apresenta�o dos Dados
- Analise e Interpreta�o de Dados
1.8.1. Defini�ao do Problema
A primeira fase do trabalho estatfstico consiste em uma defini9ao ou
formula�ao correta do problema a ser estudado. Alem de considerar detida
mente o problema objeto do estudo, o analista devera examinar outros levan
tamentos realizados no mesmo campo e analogos, uma vez que parte da
informa�ao de que necessita pode, muitas vezes, ser encontrada . nesses
ultimos. Um fabricante de sabonete, que deseja lan�ar um produto novo no
mercado, poderia estar interessado em um estudo sobre as caracteristicas dos
consumidores atuais. Nao havendo estudos. semelhantes, ele devera formular
o problema com base em sua pr6pria experiencia. Uma lista de fatores rele
vantes devera resultar dessa investiga�o preliminar: numero de unidades
consumidas por familia em cada ano, numero medio de pessoas que compoe
cada familia, numero de membros adultos da familia, as marcas preferidas
e assim por diante. Saber exatamente aquilo que se pretende pesquisar e o
mesmo que definir corretamente o problema.
1.8.2. Planejamento
0 passo seguinte, ap6s a defini�ao do problema, compreende a fase do
planejamento, que consiste em se determinar o procedimento necessario para
resolver o problema e, em especial, coma levantar informa�oes sabre o
assunto objeto do estudo. Que dados deverao ser obtidos? Como se deve
obte-los? E preciso p/anejar o trabalho a ser realizado, tendo em vista o obje
tivo que se pretende atingir.
Mais . especificamente, na fase do planejamento a preocupa�ao maior
reside na escolha das perguntas, bem como sua correta formula�ao, qualquer
que seja a modaiidade de coleta dos dados.
E nessa fase que sera escolhido o tipo de levantamento a ser utilizado.
Sob esse aspecto, pode haver dois tipos de levantamento:
1. levantamento censitario, quando a contagem for completa, abrangendo
todo o universo.
2. levantamento por amostragem, quando a contagem for parcial.
Outros elementos importantes que devem. ser tratados nessa mesma
fase sao o cronograma das atividades, atraves do qual sao fixados os prazos
para as varias fases, os custos envolvidos, o exame das informa�oes dispo- 21
niveis, o delineamento da amostra, a forma como serao escolhidos os dados
e assim por diante. Os livros mais especfficos sobre pesquisa de mercado
poderao ser consultados, caso o leitor tenha maior interesse ne�e assunto.
1.8.3. Coleta dos Dados
0 terceiro passo e essencialmente operacional, compreendendo a coleta
das informayoes propriamente ditas. Formalmente, a coleta de dados se refere
a obtenylio, reunilio e registro sistematico de dados, com um objetivo deter
minado.
Antes de se tecer qualquer outra considerayao sobre esta fase do
metodo estatistico, convem estabelecer uma distinylio entre os dados estatis�
ticos.
Uma empresa, por exemplo, pode valer-se de·diversas fontes ao utilizar
os dados em seus trabalhos estatisticos. Assim, os seus registros contabeis
podem conter muitas informayoes uteis para outros fins, que nao meramente
o da avaliaylio do ativo, do passivo e do patrimonio, e a determinaylio dos
lucros e perdas. Os varios departamentos de uma organizaylio, no curso de
sua atividade normal, mantem igualmente registros de natureza estatistica.
Pode ocorrer, entretanto, que os registros da pr6pria empresa nao propor
cionem toda a informaylio necessaria para resolver determinado problema.
Por exemplo, para se saber se uma queda nas vendas esta sendo experimen
tada tambem por outras empresas do mesmo setor industrial em que opera,
a empresa nao ira recorrer simplesmente a seus registros internos. Podera
haver algum organismo especializado que reuna os dados e os distribua em
forma de publicayoes ou de qualquer outra maneira. De qualquer modo, os
registros internos nao serao suficientes nesta situaylio, necessitando a empresa
recorrer a fontes externas para obter as informayoes desejadas. Se a empresa
precisasse saber a opiniao dos consumidores sobre algum aspecto particular
do seu produto, um exame direto sobre eles seria recomendavel. E possivel,
pois, distinguir dois tipos de fontes externas, as quais darao origem a duas
especies de dados: dados primarios e dados secundarios.
Dados Primlirios
Os dados silo primarios quando slio publicados ou comunicados pela
pr6pria pessoa ou organizaylio que os haja recolhido.
Dados Secundirrios
Os dados slio secundarios quando sao publicados ou comunicados por
outra organizaylio.
Um conjunto de dados e, pois, primario ou secundario em relayao a
alguem. As tabelas do Censo Demografico slio fontes primanas. Quando
determinado jornal publica estatisticas extraidas de varias fontes e relacio
nadas com diversos setores industriais, os dados slio secundarios para quern
22 desejar utilizar-se deles em alguma pesquisa que esteja desenvolvendo. Embora
muitas vezes possa ser conveniente recorrer a fontes secundarias, e mais
seguro trabalhar com fontes primarias, por varias razoes:
1. Uma fonte primana oferece, em geral, inform�ao mais detalhada do que
uma fonte secundaria.
2. E mais provavel que as defini�0es de termos e de unidades figurem somente
nas fontes primarias.
3. 0 uso da fonte secundaria traz o risco adicional 'de erros d� transcri�o.
4, Uma Conte primaria podera vir acompanhada de copias dos impressos
utilizados para coletar as informa�oes, juntamente com o procedi
ritento adotado na pesquisa, a metodologia seguida e o tipo e tamanho
da amostra.
Essas informa�oos proporcionam ao usuario uma ideia do grau de
garantia que os dados oferecem.
A coleta de dados pode ser realizada de duas maneiras, direta ou indi
retamente.
Coleta Direta
A coleta e direta quando e obtida diretamente da fonte, como no caso
da empresa que realiza uma pesquisa para saber a preferencia dos consumi
dores pela sua marca.
Ha tres tipos de coleta direta:
a) Coleta Continua
b) Coleta Periodica
c) Coleta Ocasionill
A coleta de dados e continua quando estes sao obtidos ininterrupta
meqte, automaticamenteFreqiiencia
acumulada Fj
2
7
13
17
20
Classes fj Freqiiencia acumulada Fj
501-- 60 8 8
601-- 70 10 18
701--- 80 17 35
801-- 90 13 48
901---100 9 57
1001---110 6 63
1101---120 2 65
65 293
294
a) l classe do 19 quartil
Qi = 60 + 16•25 - 8
• IO = 68,25 IO
29 quartil
65 EMd = Eq2 =1 = 32,5
classe med1ana: 70 f-- 80
Md = Q2 = 70 +
32•5 - 18
• IO = 78,53 17
32} s = c • --· - . T,d>2·f; - pf
n·-1. II n
d/'J
-36
-52
-45
0
37
26
21
-49
s =so j...l... {409 - (-49)2} = 50 )396,9950
=
199 200 199
= sov'l,9949 =so x t,4124=10,62
.2 d if/
1 08
1 04
45
0
37
52
63
409
299
300
44. A = {220; 230; 240; 2SO; 260}
Xj x;-x fx;-xP
220 -20 400 XA = 240
230 -10 100
240 0 0 SA = /1¥"=
250 10 100 y'250 = lS,81
260 20 400
0 1 000
B = {20; 30; 40; SO; 60}
x; x;-x fx;-xP
20 -20 400 :XB= 40
30 -10 100
Ss=� 40
=
0 0
50 10 100 = y'250 = lS,81
60 20 400
. Portanto, I SA = Ss I de acordo com a primeira propriedade do desvio
padrao.
45. A =;:= { 1,.0; 20; 30; 40; SO}
X; x;-x
10 -20
20 -10
30 0
40 10
50 20
B = { 1 00; 200; 300; 400; SOO}
X;
100
200
300
400
500
X·-X
I ,
-200
-100
0
100
200
400
100
0
100
400
1 000
fx;-xP
40 000
10 000
o ·
10 000 '
40oo0
100000
xB=300
/100000 Ss = ../ �= y25 000 = y250 X I 02 = 10 ..(250
Como SA = v'BO; teremos:
I Ss = IOSA I
de acordo com a segunda propriedade do desvio padrao.
46. Conjunto A Conjunto B
S 2 I VA= x=6=
3
5 I Vs= g=7
0
. t A t . di - l ti l>l conJun o apresen a maior spersao re a va porque T 1 .
4 7. Distribuiylio A: distribuiylio simetrica porque X = Md = M0•
Distribuiylio B: distribuiyliO assimetrica negativa OU a esquerda, porque
X Q = 500 - 300 = 100 2
Md = 400 (determinaylio direta no grafico)
Distribui�o A Distribui�o B Distribui�io C
J( =
50
J( = 48 x = 51
Md=
50
Md=49 Md=50
M0 =50 M0 =50 M0 =49
s = 2 s = 2 s = 1,5 301
302
Primeiro coeficiente de assimetria de Pearson.
a) Distribui�ao A:
x - Mo
=
50 - 50 = 0 As= S 2
b) Distribui�ao B:
x -M0 48 - 50 2 As= S = 2 =-
2=-l >
assimetrica negativa
c) Distribui�ao C:
x -M0
As= s
51 - 49 2
= =- = 1,5 1,5
=::::> assimetrica positiva
1,33 =>
51. Para calcular os coeficientes pedidos, temos necessidade de saber o valor
das seguintes medidas: X. M0, Md, S, Q1 e Q3•
(/) Classes fj Xj
101-----20 2 15
201-----30 4 25
301-----40 6 35
401-----50 4 45
501-----60 2 55
18
-· = "1:.xf =
630 = 35 x
N 18
Xj • fj 2 Freqiilincias
x jfj acumuladas Fj
30 450 2
100 2500 6
210 7 350 12
180 8 100 16
110 6 050 18
630 24 450
N
2- Fant 9 - 6 30
Md = £ +
[
· c = 30 + -6-
• IO = 30 + 6 =
= 30 + 5 = 35
Ll, 2
M0 (Czuber) = £ X Lli + b.2 • c = 30 + 2 + 2 • IO =
= 30 + 20 = 30 + 5 = 35 4
(II)
N -- Fant
Q.e na vigencia de um determinado periodo: um ano,
por exemplo. Os registros de nascimento, de casamento, de 6bito podem ser
considerados como uma forma de coleta direta continua.
A coleta de dados e peri6dica quando e realizada em perfodos curtos,
determinados, de tempos em tempos. 0 recenseamento demografico, a
cada dez anos, e o censo industrial, anualmente, sao exemplos de coleta
peri6dica.
A coleta de dados e ocasional quando os dados forem colhidos espora
dicamente, atendendo a uma conjuntura qualquer ou a uma emergencia.
A coleta de casos fatais em um surto epidemico e o registro de pedidos de
um determinado artigo que uma grande empresa recebe em um dia de greve
sao fonnas de coleta ocasional.
Coleta Indireta
A Coleta dos dados e indireta quando e inferida a partir dos elementos
conseguidos pela coleta direta, ou atraves do. conhecimento de outros fenO- 23
24
menos que, de algum modo, estejam relacioriados com o fenomeno em
questao. E feita, portanto, por dedu90es e conjeturas, podendo ser realizada:
a) Por analogia
b) Por proporcionaliza�ao
c) Por indfoios
d) Por avalia�iio
A coleta de dados e feita por analogia quando o conhecimento de um
fenomeno e induzido a partir de outro que com ele guarda rela96es de
casualidade.
A coleta de dados e feita por proporcionaliza9ao, quando o conheci
mento de um fato se induz das condi96es quantitativas de uma parte dele.
A coleta por indicios se da quando sao escolhidos fenomenos sintoma
ticos para discutir um aspecto geral da vida social.
A coleta e feita por avaliayao quando, atraves de informa96es fide
dignas ou estimativas cadastrais, se presume o estado quantitativo de um
fenomeno.
1.8.4. Apura�io dos Dados
Antes de come9ar a analisar os dados, e conveniente que lhes seja dado
algum tratamento previo, a fim de torna-los mais expressivos. A quarta etapa
do processo e, entao, a da apura9ao ou sumariza9ao, que consiste em resumir
os dados, atraves de sua contagem e agrupamento. E um trabalho de conden
sa9ao e de tabula9ao dos dados, que chegam ao analista de forma desorgani
zada, tornando impossivel a tarefa de apreender todo o seu significado pela
simples leitura.
Hli varias formas de se fazer a apura9ao, dependendo das necessidades
e dos recursos disponiveis do interessado: manual, mecanica, eletromecanica
ou eletronica.
A apurayao e manual quando nao recorre a qualquer maquina para ser
realizada. Quando a apurayao for feita com o auxilio de maquinas mecdnicas,
como as de somar e de calcular, comuns em qualquer escrit6rio, ela seni
meciinica.
A apurayao eletromecdnica e realizada com maquinas que diferem das
itnteriores pelo fato de suas engrenagens internas serem movidas a energia
eletrica. Finalmente, as maquinas eletronicas dao origem ao Ultimo tipo de
apura9ao. Essas maquinas efetuam as opera96es atraves de impulsos eletricos,
dispensando qualquer tipo de engrenagem, o que lhes confere uma velocidade
infinitamente maior que a das anteriores.
Por conseguinte, atraves da apurayao, tem-se a oportunidade de con
densar os dados, de modo a obter um conjunto compacto de numeros, o
qual possibilita distinguir melhor o comportamento do fenomeno na sua
totalidade.
Entretanto, a contrapartida da melhor aprecia�ao dos dados em seu
conjunto e a perda correspondente de detalhes, uma vez que se trata de um
processo de sintetiza�ao.
1.8.5. Apresenta�iio dos Dados
A apresenta�ao ou exposic;ao dos dados observados constitui a quint�
fase do metodo estatlstico.
Ha duas formas de apresentac;ao, que naci se excluem mutuamente:
1. Apresenta�ao Tabular
A apresentac;ao tabular e uma apresentac;ao numerica dos dados. Con
siste em dispor os dados em linhas e colunas distribuidas de modo ordenado,
segundo algumas regras praticas adotadas pelos diversos sistemas estatfsticos.
As regras que prevalecem no Brasil foram fixadas pelo Conselho Nacional de
Estatistica. Tais regras acham-se publicadas e dispoom sobre os elementos
essenciais e complementares da tabela, a especificac;ao dos dados e dos sinais
convencionais, o procedimento correto a ser desenvolvido no preenchimento
da tabela e outros dispositivos importantes. 0 leitor que estiver interessado
podera adquirir essas normas junto a qualquer agencia do IBGE, uma vez que
nlfo e o objetivo desse livro entrar nesses pormenores. As tabelas tern a van
tagem de conseguir expor, sinteticamente e em um s6 local, os resultados
sobre determinado assunto, de modo a se obter uma vislfo global mais rapida
daquilo que se pretende analisar.
De maneira mais formal, define-se como tabela a disposic;ao escrita que
se obtem, fazencio-se referir uma colec;ao de dados numericos a uma deter
minada ordem de classificac;ao.
2. Apresenta¢o Grd[ica
A apresentaylfo grafica dos dadosnumericos constitui uma apresentac;ao
geometrica. Embora a apresentac;ao tabular seja de extrema importancia; no
sentido de facilitar a analise numerica dos dados, nlfo permite ao analista
obter uma visao tlfo rapida, facil e clara do fenomeno e sua variac;ao como a
conseguida atraves de um grafico. No Capitulo 3, serlfo desenvolvidos os
diversos tipos de graficos e sua utilizac;ao.
1.8.6. Analise e lnterpreta�lo dos Dados
A ultima fase do trabalho estatistico e a mais importante e tambem a
mais delicada. Nesta etapa, o interesse maior reside em tirar conclusoes que
auxiliem o pesquisador a resolver seu problema. A analise dos dados esta
tisticos esta ligada essencialmente ao calculo de medidas, cuja finalidade
principale descrever o fenomeno. Assim, o conjunto de dados a ser analisado
pode ser expresso por numeros-resumos, as estatisticas, que evi,denciam 25
caracteristicas particulares desse conjunto. 0 significado exato de cada um
dos valores obtidos atraves do calculo das varias medidas estatisticas dispo
niveis deve ser hem interpretado. E possivel mesmo, nesta fase, arriscar
algumas generalizar;oes, as quais envolverao, naturalmente, algum grau de
incerteza, porque nao se pode estar seguro de que o que foi constatado para
aquele conjunto de dados (a amostra) se verificara igualmente para a popu
lar;ao. 0 processo de generalizar;ao, como afirmado anteriormente, esta alein
do escopo deste livro, constituindo um campo mais avanr;ado da Estatistica,
que e 0 da Estatfstica Indutiva OU lnferencia Estatistica.
1.9. AS SERIES ESTATISTICAS
Uma vez coletados OS dados, nao e conveniente apresenta-los para ana
lise, sob a forma a que se chegou pela simples apurayao. Muitas vezes o con
junto de valores e extenso e desorganizado, e seu exame requer maior
atenr;ao. Alem disso, com_o ja foi salientado, ha o perigo de se perder a visao
global do fenomeno analisado, quando a lista de dados for extensa e desor
denada.
Por outro lado, se a lista original de valores puder ser apresentada de
uma forma mais simples· e compacta, havera menor dificuldade em interpretar
os dados e trabalhar com eles. Reunindo, pois, os valor,es em tabelas com
pactas, consegue-se apresenta-los e descrever-lhes a varutr;ao mais eficiente
mente. Essa condensayao dos valores permite ainda a utilizar;ao de represen
tar;ao grafica, que normalmente representa uma forma mais util e elegante
de apresentar;ao da caracteristica analisada. Enfim, qualquer processo de
representar;ao que contribua para proporcionar uma visao mais sintetica do
fenomeno estudado, sem tirar-lhe a precisao primitiva, contribuira igualmente
para facilitar e encaminhar qualquer desses estudos, quer seja o de caracteri
zayao de um conjunto, o de comparayao com outros semelhantes ou ainda o
de previsao de valores possiveis. E o caso, por exemplo, da serie estatistica.
Uma serie estatistica define-se como toda e qualquer coler;ao de dados
estatisticos referidos a uma mesma ordem de classificayao: quantitativa. No
sentido mais amplo, serie e uma sucessao de numeros referidos a qualquer
variavel. Se OS n\.tmeros expressarem dados estatisticos, a serie sera chamada
de serie estatfstica.Em sentido mais estreito, pode-se dizer que uma serie
estatistica e uma sucessao de dados estatisticos referidos a caracteres quali
tativos, ao passo que uma sucessao de dados estatisticos referidos a caracteres
quantitativos configurara uma seria�ao. Em outros termos, a palavra serie e
usada normalmente para designar �m conjunto de dados dispostos de acordo
com um carater variavel, residindo a qualidade serial na disposir;ao desses
valores, e nao em uma disposiyao temporal ou espacial de individuos. Para
diferenciar uma serie estatistica de outra, ha que se levar em conta, entao,
26 os tres caracteres presentes na tabela que as apresenta:
- A Epoca (fator temporal ou cronologico) a que se refere o fenomeno analisado.
- 0 Local (fator espacial ou geogr.ifico) onde o fenomeno acontece.
- 0 Fenomeno (especie do fato OU fator especificativo) que e descrito.
As series estatisticas podem ser de quatro tipos, conforme varie um
desses caracteres ou fatores. Embora seja a variayao desses elementos a
caracteristica diferenciadora das series, costuma-se dividi-las em dois grupos�
0 das series hom6gradas e 0 das heter6gradas.
1.9.1. Serie Homograda
Serie homograda e aquela em que a variavel descrita apresenta variayao
discreta OU descontinua. Sao series hom6gradas a serie temporal, a serie
geografica e a sene especifica.
1.9.2. Serie Heterograda
A serie heterograda e aquela na qual 0 fenomeno OU 0 fato apresenta
gradayoes ou subdivis.Oes. Embora fixo, o fenomeno varia em intensidade.
A distdbuiyiiO de freqiiencias OU seriayiiO e uma sene heterograda.
1.9.3. Os Ouatro Tipos de series Estatfsticas
As series estatisticas, conforme visto, diferenciam-se de acordo com a
variayiiO de um desses tres elementos: epoca, local, fato.
1. Serie Temporal
A Serie temporal, igualmente chamada serie cronol6gica, serie historica,
serie evolutiva ou marcha, identifica-se pelo carater variavel do fator crono
logico. Assim, deve-se ter:
a) Elemento Variavel: epoca (fator cronol6gico)
b) Elementos Fixos: local (fator geografico)
fenomeno (fator especificativo)
Exemplo: 0 diretor de marketing da empresa G.L.T. S.A., fabricante de
componentes eletronicos, deseja examinar a evolu�iio de suas vendas em
1975, mes a mes. Para tanto, solicitou ao Departamento de Analise de
Mercado a tabela da qua! constam os valores de vendas no perlodo desejado
(Tabela 1.1 ).
Como pode ser observado, o unico carater variavel e o tempo, aqui
representado pelos meses.
Da mesma forma, os valores sucessivos apresentados pelo censo demo
grafico de uma cidade formariio a marcha da populayiio dessa cidade.
2. Serie Geogrtifica
Tambem denominada serie territorial, sene espacial OU Serie de locali
zayiiO, a serie geografica apresenta como elemento ou carater variavel
somente o fator geografico. Assim: 27
a) Elemento Variavel: local (fator geognifico)
b) Elemenfos Fixos: epoca (fator cronol6gico)
fenomeno (fa tor especificativo)
TABELA 1.1 - G.L.T. S.A. - INDUSTRIA DE COMPONENTES ELETRONICOS
Vandas - Mercado lnterno - 1975
Meses
Janeiro
Fevereiro . . . . . . . . . . . . . . . . . •
Man;:o . . . . • . . . . . . . . . . . . . . .
Abril . . • . . . . . . . • . . • . . . . • . .
Maio . . . . . . . . • • . • . • . . • . . . •
Jun ho . . • • . . . . . . . . • . . . • . . .
Jul ho . . . . . . • . . . • . . • . • . . . .
Agosto ................... .
Setembro . . . • . . . . . . . . . . . . . .
Ou tu bro .................. .
Novembro . • • . . · . . . . . . . . . . . . .
Dezembro . . . .. . • . • . . . . . . . . . .
TOTAL ANUAL . . . . . . . . . • . . . .
Fonte: Departamento de Analise de Mercado.
Vendas (em mi/hares de cruzeiros)
2300
1 800
2 200
2 210
2360
2600
2690
3 050
3 500
344 0
3 100
2 760
31.510
Se o diretor de marketing da G.L.T. S .A . desejar saber, agora, o com
portamento das vendas dessa empresa efetuadas nos varios Estados do Brasil,
durante o exercicio fiscal de 1975, o fator diferenciador das vendas seria o
geografico.
A tabela correspondente ficaria assim:
TABELA 1.2 - G.L.T. S.A. - INDUSTRIA DE COMPONENTES ELETRONICOS
Vendes por Unidade da Federat;lio - · 1975
Unidades da Federa�5o
Minas Gerais . • . •. . . . . . . . . • . . •
Parana . . . . . . . . . . . . . . . . . • . •
Rio Grande do Sul . . • . • . • • . . • .
Rio de Janeiro . . • • • • . · • • . • . . . .
Sio Paulo . • . • • • • • • _ • . • . . . . • .
Outros • . . . . . . . . . . . . . . . . . . .
TOTAL - BRASIL • . . . • • . . . . • •
28 Fonte: Departamento de Analise de Mercado.
Vendas (em mi/hares de cruzeiros)
4.000
2.230
6.470
8.300
10.090
420
31.510
3. Serie Especifica
A serie especffica recebe tambem outras denominay6es: serie cate
g6rica OU serie por categoria. Agora, 0 carater variavel e 0 fenomeno.
a) Elementu Variavel: fenomeno (fator especificativo)
b) Elementos Fixos: epoca (fator cronologico)
.local (fator geogr3fico)
Suponha que o diretor de marketing esteja agora interessado em.
conhecer o comportamento das vendas de cada um de seus produtos, os
quais foram agrupados em tres categorias ou linhas, dada a grande variedade
de componentes fabricados pela empresa. A tabela contendo essas infor
mayoes representaria uma serie especifica.
Os dados da Tabela 1.3 revelam que cinquenta por cento do fatura
mento da empresa G.L.T. S.A. sao representados pelos produtos da linha C.
Esse fato revela a importancia de urna tabela, como forma de apresentayao
sintetica e elegante dos valores representativos de um fenomeno qualquer.
Os tres tipos de serie apresentados constituem exemplos de series
hom6gradas.
TABELA 1.3 - G.L.T. S.A. - INPUSTRIA DE COMPONENTES ELETRONICOS
Vendas por Linha de Produto - 1975
Linha do Produto
Linha A . . . . . . . . . . . . . . . . . • .
Lin ha B . . . . • . • • . • . • . . • . • . •
Linha C . . . • • • . . . • • • . . . • • . •
TODOS OS PRODUTOS . . . . . . . . •
Fonte: Oepartamento de Analise de Mercado.
4. Distribuifffo de Freqilencias - Seriafiio
Vendas (em mi/hares de cruzeiros)
6.450
9.310
15,750
31.510
As distribuiyoes de frequencias OU distribuiyoes por frequencias sao
series heter6gradas. Neste caso, todos OS elementos - epoca, local e fenO
meno - sao fixos. Embora fixo, o fenomeno ou fator especificativo
apresenta-se agora atraves de grada9oes, isto e, OS dados referentes ao fen(>.
meno que se esta representando sao reunidos de acordo com sua magnitude.
Normalmente, os problemas de tabula9ao sao enquadrados nesse tipo de serie.
Nas distribui9oes de frequencias, os dados estatisticos sao dispostos
ordenadamente em linhas e colunas, de modo a permitir sua leitura nos
sentidos horizontal e vertical. Na tabela resultante desse procedimento, sao
fixos a epoca, o local e o fenomeno, estando os dados agrupados de acordo
com a intensidade ou varia9ao quantitativa do fenomeno. 29
TABELA 1.4
Numero de Empregados das Virias Cla- de Salirios
no Estado de Sio Paulo - 1968
Classes de SaltJrios (Cr$)
At4! 80 . • • . . . . . . . . . • . . . • . . . . .
De 80 a 119 • . . . • . • . . • . . . . . . . .
De 120 a 159 . . • . • . . . • . • . • . . . .
De 160 a 199
De 200 a 399
De 400 a 599
De 600 a 799
De 800 a 999
1.000 e mais . . . . • . • . • . • • • • • . • •
TOTAL . . . • • • . • . • • . . . . . • . • . .
Fonte: Servico de Estatfstica da Previctencia e Trabalho.
Numero de Empregados.
41 326
123 236
428 904
324 437
787 304
266 002
102 375
56 170
103.788
2 233 542
Um exemplo de distribuiyao de freqtiencias encontra-se na Tabela 1.4,
que descreve os salarios no Estado de Sao Paulo em 1968, classificados e
distribuidos Conforme O numero de empregados.
Esta tabela apresenta o numero de empregados que percebiam, na
epoca, um salario que estivesse incluido em uma dessas classes ou faixas
salariais. Da mesma forma, seria possivel agruparas vendas da empresa
G.L.T. S.A. em classes de faturamento e analisar o numero de meses em
que se verificaram os varios faturamentos incluidos nas diferentes classes
(Tabela 1.5).
TABELA 1.5 - G.L.T. S.A. - INDUSTRIA DE EQUIPAMENTOS ELETRONICOS
Numero de Meses Segundo o Faturamento
Vendas (em mi/hares de cruzeiros)
De 1.800 a 2.199 . . • • • • • • • • • • • • • • • • •
2.200 a 2.599 • • • • . • . • • • • . • • . . • . .
2.600 & 2.999 . • • . . . • • • • , . • • • • • . •
3.000 a 3.399 • • . • . . • • • • • • • • • . • • .
3.400 a 3. 799 . • • . • • • • • • • • • . • . • . •
TOTAL DE MESES • . • • • • • • . • • • . . . • . .
Fonte: Departamento de Anlilise de Mercado.
Numero de Me1es
1
4
3
2
2
12
0 processo de construyao das tabelas representativas de uma distri-
30 buiirao de freqtiencias sera visto mais adiante.
1.9.4. Tabelas de Dupla Entrada
As tabelas apresentadas ate o presente sao tabelas estat(sticas simples,
as quais siio formadas por uma coluna indicadora (coluna matriz), onde
siio inscritos os valores ou as modalidades. classificadas, e por outra coluna
onde se inserem as ocorrencias ou as intensidades do fenomeno analisado.
E comum, todavia, haver necessidade de apresentar, em uma (mica
tabela, mais do que uma serie. Quando as series aparecerem conjugadas,
tem-se uma tabela de dupla entrada. Essa tabela e apropriada, portanto, a
apresentayiio das distribuiy5es a dois atributos, havendo duas ordens de
classificayiio: uma horizontal (linha) e outra vertical (coluna). A Tabela 1.6
apresenta uma tabela de dupla entrada, onde estiio conjugados dois tipos de
serie: temporal e especffica.
TABELA 1.6
Populai;:io Economicamente Ativa por Setor de Atividade - Brasil
Popula�io (1 000 hab.)
Setor
1940 1950 1960
Primario ................... 8968 10 255 1 2 163
Secundario ........ ....... .. 1 414 2 34'7 2962
Terciario ......... . . ....... 3620 4 516 7 525
Fonte: IPEA.
Cada linha, encabeyada pela designayiio do setor - "primario'', "secun
dario" e "terciario" -, constitui uma serie temporal. Por outrPorcentagem
significa, portanto, "por cem". A soma das proporyoes e igual a 1, e a soma
das porcentagens e sempre igual a 100, a menos que as categorias nao sejam
mutuamente exclusivas e exaustivas.
As porcentagens sao mais usadas do que as proporyoes para repro
duzir resultados. Os valores constantes da Tabela 1.10 poderiam perfeita-
34 mente ser expressos em porcentagem.
S6cios
Praticantes
TABELA 1.13
Porcentagem de Sbcios Praticantes e Nio-Praticantes de Futebol
em Dois Clubes Hipotltticos
Clube 1 Clube 2
Numero % Numero
(exclusivamentel de:
%
Futebol de salao . . . . . . . . . . . . . 580 10,0 680 5,3
Futebol de campo .......... . . 430 7.4 1 369 10,6
Nfo-Praticantes . . . . . . . . . . . . . . . . 4 810 82,6 10 811 84,1
TOTAL . . . . . . . . . . . . .. . . . . . . . 5 820 100,0 12 860 100,0
Normalmente, as porcentagens sao arredondadas ate a primeira casa
decimal, ajustando-se os Ultimos dlgitos, de modo que o total seja igual a
100. 0 emprego de porcentagens requer que o numero total de casos
seja suficientemente grande, evitando assim que sejam cometidas inter
pretayoes equivocadas.
Ha algumas regras gerais importantes, que orientam o emprego das
porcentagens e das propory6es:
1. Deve-se sempre indicar o numero de casos juntamente com as porcentagens
ou as propor�oes.
2. Nao se deve calcular uma porcentagem a menos que o numero que serve
de base para 0 calculo esteja proximo de so OU mais. Se 0 numero de
casos for muito pequeno, e prefer{vel in�car 0 numero efetivo deles, sem
recorrer as porcentagens.
3. Para determinar 0 numero de indiv{duos pertencentes a uma determinada
categoria a partir do total de indiv{duos, basta multiplicar esse total pela
propor�ao dos indiv{duos na categoria. Assim, se o clube 1 tivesse
8 000 socios e fosse sabido que a propor�iio de praticantes de futebol
de salao e de 0,054, 0 numero desses praticantes seria de 8 000 x 0,054 =
= 432. Empregando·se porcentagem, chegar-se-ia ao mesmo resultado:
Total de s6cios: 8 000
Porcentagem de praticantes de futebol de saliio: 5,4%
Numero de praticantes de futebol de salao:
8 OO�
O
� 5•4
= 432
4. As porcentagens e propor�es tern por finalidade principal, em Estatistica,
estabelecer compara�oes relativas. As vendas de duas emprcsas foram as
seguintes nos dois anos comparados:
TABELA 1.14
Faturamento (1.000 cruzeiros)
Aumen to
Aumen to
Empresa relativo
1974 1975
absoluto
(percentual)
A 2.000 3.000 1.000 50
B 20.000 25.000 5.000 25
%
35
Em termos absolutos, a empresa B teve um aumento de faturamento
superior ao da empresa A. Entretanto, se a compara-rao for efetuada em
termos relativos, a empresa A apresentara um desempenho hem superior: a
porcentagem de aumento de faturamento da empresa A foi 50%, contra
apenas 25%1 de aumento conseguidos pela empresa B.
1. 10.3. Razao
A razao de um numero A em rela-rao a outro numero B define-se
como A dividido por B. A quantidade precedente e colocada no numerador,
enquanto que a seguinte ira para o denominador.
Atraves de uma enquete realizada em determinada cidade, descobriu-se
que, das pessoas entrevistadas, 300 se manifestaram favoraveis a uma deter
minada medida adotada pela prefeitura local, 400 ficaram contra a medida e
70 eram indiferentes. Neste caso, a razao dos contrarios para os favoraveis
a medida e de �� ; a dos favoraveis e contra para OS indiferentes e de
(300 + 400)
D'fi d - - d
· '
70
. 1 erentemente a proporyao, a razao po e ser supenor a
unidade. Por outro lado, e possfvel reduzir a razao a uma expressao mais
simples, simplificando os fa tores comuns do numerador e do denominador.
Assim, por exemplo, a razao dos entrevistados contrarios a medida para os
favoraveis poden1 ser expressa como j, ou, de forma equivalente, 4 : 3.
Em certas ocasioes, e conveniente expressar a razao em termos de um
denominador representado pela unidade. Neste caso, pode-se afirmar que a
razao dos CODtrarios para OS favoraveis e de 1,33 para 1, C a dos favoraveis
e contrarios para OS indiferentes e de I 0 para I.
As propor\:oes, na realidade, representam um tipo particular de razao,
na qual o denominador constitui o numero de casos e o numerador uma
fra-rao daquele. Entretanto, o termo razao e usado, normalmente, quando A
e B representam categorias separadas e distintas.
Se houver apenas duas categorias, sera possfvel calcular a propor-rao
diretamente a partir da razao e vice-versa. Sabendo-se, por exemplo, que a
razao dos homens para as mulheres entre os membros associados de um
clube e de ; , pode-se concluir que em cada cinco associados havera
uma media de 3 homens e duas mulheres. A proporyao dos homens sera,
entao, de � , ou 0,6.
1.10.4. Taxa
Taxa e uma quantidade expressa em rela\:ao a outra quantidade, como
2 cruzeiros por quilograma, 40 quilometros por hora, 3 cruzeiros de ativo
36 por 1 cruzeiro de passivo, 2 por cento de juros. Dessa forma, os quilometros
por hora, por exemplo, sao obtidos dividindo-se o total de quilometros pelo
numero total de horas. Assim, tambem, todos os demais exemplos constituem
razoes. Uma razao, expressa em relayao a 100, e uma porcentagem. Portanto,
uma razao e um caso particular de taxa, uma porcentagem e uma razao
expressa de uma certa forma e uma taxa pode, as vezes, ser uma media.
1.11. ARREDONDAMENTO DE NUMEROS
0 arredondamento de um dado estatistico deve obedecer a algumas
regras:
I . Arredondamento por Falta
Quando 0 primeiro dfgito, aquele situado mais a esquerda entre OS
que irao ser eliminados, for igual ou menor que quatro, nao devera ser
alterado o digito remanescente.
Numero a arredondar
12,489
20,733
35,992
2. Arredondamento por Excesso
TABELA 1.15
Arredondamento para
lnteiros
Decimos
Centesimos
Numero arredondado
12
20,7
35,99
Quando 0 primeiro digito ap6s .aquele que sera ar.redondado fQr maibr
ou igual a cinco seguido por digitos maiores que zero, o digito remanescente
seni acrescido de uma unidade.
Numero a arredondar
15,504
16,561
17,578
TABELA 1.16
Arredondamento para
lnteiros
Decimos
Centesimos
3. Arredondamento de Digitos Seguidos do Cinco
Numero arredondado
16
16,6
17,58
Quando 0 digito situado mais a esquerda dos que serao eliminados for
um cinco ou urn cinco seguido somente de zeros, o Ultimo digito remanescente,
se for par, nao se alterara, e se for impar sera aumentado de uma unidade.
(TABELA 1.17)
4. Arredondamento de Soma
Quando se trata de soma, deve-se arredondar primciro o total, e
posteriormente as parcelas. Ha aqui dois casos a considerar:
a) Se a soma das parcelas da seric arrcdondada for superior ao total, deve-sc 37
38
Numero a arredondar
215,500
216,500
216,150
216,705
!
TABELA 1.17
Arredondamento para
lnteiro
lnteiro
Decimos
Centesirnos
Numero arredondado
216
216
216,8
216,70
rdomar a seric original. arredondando-sc, por falta, tantas parcelas quantas
fort·m as unidadcs l'Xcedl·ntes. Ser.Io cscolhidas as parcelas antcrior
mente arredondadas por exccsso e cu.ias fra1;oes desprezadas representem
o menor erro rclativo. ( TABELA 1.18)
TABELA 1.18
Serie original Serie arredondada Serie corrigida
6,51 7 7
7,50 8 8
14,63 15 15
20,10 20 20
24.73 25 24.
26,52 27 25�
99,99 102 > 100 100
Arredondarnentos refeitos.
b) St• a soma das pan:elas da scrie arredondada for infntos refoitos.
1.12. SOMATORIO
A Matematica fornece ainda outra no�ao de grande utilidade para a
Estatistica: