Prévia do material em texto
PEDRO A. BARBETTA – Estatística Aplicada às Ciências Sociais 6ed. Editora da UFSC, 2006.
Estatística Aplicada às Ciências SociaisEstatística Aplicada às Ciências Sociais
Sexta EdiçãoSexta Edição
Pedro Alberto Barbetta
Florianópolis: Editora da UFSC, 2006
Cap. 1 Cap. 1 –– IntroduçãoIntrodução
PEDRO A. BARBETTA – Estatística Aplicada às Ciências Sociais 6ed. Editora da UFSC, 2006.
EstatísticaEstatística
• Problema de estudo
• Coleta dos dados
• Dados
• Análise descritiva dos dados
• Análise exploratória dos dados
• Inferências
• Interpretação dos resultados à luz do problema
PEDRO A. BARBETTA – Estatística Aplicada às Ciências Sociais 6ed. Editora da UFSC, 2006.
Estatística descritiva e análise exploratória de dadosEstatística descritiva e análise exploratória de dados
• Distribuição de freqüências;
• Tabelas e gráficos
• Medidas-resumo
PEDRO A. BARBETTA – Estatística Aplicada às Ciências Sociais 6ed. Editora da UFSC, 2006.
DadosDados
• Pesquisa em uma amostra de famílias de um bairro de Florianópolis
núm. local p.a.p instr. tam. renda
1 1 0 3 4 10,3
2 1 0 3 4 15,4
3 1 1 2 4 9,6
4 1 0 2 5 5,5
5 1 1 3 4 9
6 1 1 1 1 2,4
7 1 0 3 2 4,1
8 1 1 3 3 8,4
9 1 1 3 6 10,3
10 1 1 2 4 4,6
11 1 0 2 6 18,6
12 1 1 1 4 7,1
13 1 0 2 4 12,9
14 1 0 2 6 8,4
15 1 0 3 3 19,3
16 1 0 2 5 10,4
17 1 1 3 3 8,9
18 1 0 3 4 12,9
... ... ... ... ... ...
RÓTULOS
local 1=Monte Verde,
2=Parque da Figueira,
3= encosta do morro
p.a.p (programa de alimentação popular)
0=não usa
1=usa
instr. (grau de instrução do chefe da casa)
1=nenhum
2=fundamental
3=médio
tam. número de moradores
renda renda familiar em salários mínimos
Que informações têm nos dados ?
PEDRO A. BARBETTA – Estatística Aplicada às Ciências Sociais 6ed. Editora da UFSC, 2006.
Distribuição de freqüênciasDistribuição de freqüências
• A distribuição de freqüências compreende a
organização dos dados de acordo com as ocorrências dos
diferentes resultados observados.
• Exemplos:
PEDRO A. BARBETTA – Estatística Aplicada às Ciências Sociais 6ed. Editora da UFSC, 2006.
Distribuição de freqüênciasDistribuição de freqüências
Nível de instrução do chefe da casa
32%
32%
36%
nenhum
fundamental
médio
Figura 1.1 Distribuição de freqüências do nível de instrução do chefe
da casa. Amostra de 120 famílias do bairro Saco Grande II,
Florianópolis-SC, 1988.
Que informações você extrai do gráfico?
PEDRO A. BARBETTA – Estatística Aplicada às Ciências Sociais 6ed. Editora da UFSC, 2006.
Distribuição de freqüênciasDistribuição de freqüências
Distribuição da renda familiar. Amostra de 120 famílias do bairro
Saco Grande II, Florianópolis-SC, 1988.
Renda (em sal. mín.)
Fr
eq
üê
nc
ia
Que informações você extrai do gráfico?
E se você quisesse informações por localidade?
PEDRO A. BARBETTA – Estatística Aplicada às Ciências Sociais 6ed. Editora da UFSC, 2006.
MedidasMedidas--resumoresumo
• Exemplo:
Local Num. Média Mediana Desvio padrão
Monte Verde 40 8,09 7,7 4,28
Pq. da Figueira 42 5,83 5,5 2,57
Morro 37 5,02 3,9 4,52
Medidas descritivas da renda familiar (em sal. mín.),
por localidade
PEDRO A. BARBETTA – Estatística Aplicada às Ciências Sociais 6ed. Editora da UFSC, 2006.
ConceitosConceitos
• População é o conjunto de elementos para os quais
desejamos que as nossas conclusões sejam válidas – o
universo de nosso estudo. Uma parte desses elementos é
dita uma amostra.
• Um parâmetro é uma medida que descreve certa
característica dos elementos da população.
PEDRO A. BARBETTA – Estatística Aplicada às Ciências Sociais 6ed. Editora da UFSC, 2006.
Inferência: EstimaçãoInferência: Estimação
• Conhecer aproximadamente (estimar) uma característica
da população (parâmetro) através dos resultados de uma
amostra.
• Exemplos: pesquisas de mercado, pesquisas eleitorais,
pesquisas do IBGE.
PEDRO A. BARBETTA – Estatística Aplicada às Ciências Sociais 6ed. Editora da UFSC, 2006.
AMOSTRAPOPULAÇÃO
π = ?
π = p ± erro amostral
Exemplo: Pesquisa eleitoralExemplo: Pesquisa eleitoral
X1 X2 X3 ...Voto do eleitor: p
Parâmetro
Estatística
PEDRO A. BARBETTA – Estatística Aplicada às Ciências Sociais 6ed. Editora da UFSC, 2006.
Inferência: Testes de HipótesesInferência: Testes de Hipóteses
• Analisar a admissibilidade de uma certa hipótese sobre
alguma característica populacional, usando como base de
decisão os dados amostrais.
PEDRO A. BARBETTA – Estatística Aplicada às Ciências Sociais 6ed. Editora da UFSC, 2006.
Testes de HipótesesTestes de Hipóteses
• Exemplo: Qual sistema computacional é melhor para a
Empresa?
– Sistema 1 ou Sistema 2 ?
• Hipótese: Um dos sistemas, em média, funciona melhor.
PEDRO A. BARBETTA – Estatística Aplicada às Ciências Sociais 6ed. Editora da UFSC, 2006.
Pesquisa experimental para comparação de dois Pesquisa experimental para comparação de dois
sistemas computacionaissistemas computacionais
sistema 1 sistema 2
Cargas de trabalho
(1) (2) ... (n)
x11 x12 x1n... x21 x22 x2n...
Cargas de trabalho
(1) (2) ... (n)
Observação do
desempenho
(dados):
PEDRO A. BARBETTA – Estatística Aplicada às Ciências Sociais 6ed. Editora da UFSC, 2006.
Inferência estatística:Inferência estatística:
Estimação e Testes de HipótesesEstimação e Testes de Hipóteses
universo do estudo (população)
dados observados
O raciocínio indutivo da estimação e dos testes estatísticos
PEDRO A. BARBETTA – Estatística Aplicada às Ciências Sociais 6ed. Editora da UFSC, 2006.
ProbabilidadeProbabilidade
• Mensuração da chance de ocorrência de fenômenos
aleatórios, mostrando como poderão ocorrer os fatos.
• Base teórica para a inferência estatística (Estimação de
parâmetros ou Teste de hipóteses).
PEDRO A. BARBETTA – Estatística Aplicada às Ciências Sociais 6ed. Editora da UFSC, 2006.
ProbabilidadeProbabilidade
Universo do estudo (população)
Hipóteses, conjeturas, ...
Resultados ou
dados observados
O raciocínio dedutivo da probabilidade
PEDRO A. BARBETTA – Estatística Aplicada às Ciências Sociais 6ed. Editora da UFSC, 2006.
O processo iterativo da evolução do O processo iterativo da evolução do
conhecimento. conhecimento.
dados informações novos conhecimentos,
novas hipóteses.
pesquisa
PEDRO A. BARBETTA – Estatística Aplicada às Ciências Sociais 6ed. Editora da UFSC, 2006.
PEDRO A. BARBETTA – Estatística Aplicada às Ciências Sociais 6ed. Editora da UFSC, 2006.
• Como planejar adequadamente a coleta dos dados
• Como alguns conceitos básicos da Estatística podem
auxiliar no planejamento da pesquisa
• Capítulos 2 e 3
PEDRO A. BARBETTA – Estatística Aplicada às Ciências Sociais 6ed. Editora da UFSC, 2006.
Estatística Aplicada às Ciências SociaisEstatística Aplicada às Ciências Sociais
Sexta EdiçãoSexta Edição
Pedro Alberto Barbetta
Florianópolis: Editora da UFSC, 2006
Cap. 2 Cap. 2 –– Pesquisas e DadosPesquisas e Dados
Este capítulo teve a participação da Profa
SÍLVIA MODESTO NASSAR (INE – CTC – UFSC)
PEDRO A. BARBETTA – Estatística Aplicada às Ciências Sociais 6ed. Editora da UFSC, 2006.
Pesquisa, dados e estatísticaPesquisa, dados e estatística
Metolo-
-logia
estatís-
tica
Tema, definição do problema, objetivos, ...
Planejamento da pesquisa
Dados
Análise dos dados
Resultados
Conclusões
Execução da pesquisaExecução da pesquisa
Metodo-
-logia da
área em
estudo
PEDRO A. BARBETTA – Estatística Aplicada às Ciências Sociais 6ed. Editora da UFSC, 2006.
Tipos de Pesquisa quantitativaTipos de Pesquisa quantitativa
• DE LEVANTAMENTO
Características de interesse de uma
população são levantadas (observadas
ou medidas), mas sem manipulação.
• EXPERIMENTAL
Grupos de indivíduos (ou animais,
ou objetos) são manipulados para se
avaliar o efeito de diferentes tratamentos.
PEDRO A. BARBETTA – Estatística Aplicada às Ciências Sociais 6ed. Editora da UFSC, 2006.
Pesquisa de levantamento ou Pesquisa de levantamento ou observacionalobservacional
POPULAÇÃO: todos os
funcionários da empresa
AMOSTRA: parte dos
funcionáriosda empresa
Plano de amostragem
Aplicação de um
questionário
Conjunto de dados observados
• Exemplo 2.1:
PEDRO A. BARBETTA – Estatística Aplicada às Ciências Sociais 6ed. Editora da UFSC, 2006.
Pesquisa experimentalPesquisa experimental
• Exemplo 2.2:
Grupo 1 de funcionários
Grupo 2 de funcionários
Amostra 1 de valores
de produtividade
Amostra 2 de valores
de produtividade
Método padrão
Método novo
PEDRO A. BARBETTA – Estatística Aplicada às Ciências Sociais 6ed. Editora da UFSC, 2006.
PesquisaPesquisa
• Quem?
– os elementos a serem pesquisados POPULAÇÃO
• O quê?
– características a serem observadas VARIÁVEIS
• Como?
– o instrumento de coleta de dados QUESTIONÁRIO /
ENTREVISTA ESTRUTURADA
PEDRO A. BARBETTA – Estatística Aplicada às Ciências Sociais 6ed. Editora da UFSC, 2006.
POPULAÇÃOPOPULAÇÃO (Quem?)(Quem?)
• População é o conjunto de elementos (p. ex.,
indivíduos) que queremos abranger em nosso estudo e
que são passíveis de serem observados, com respeito às
características (variáveis) que pretendemos levantar.
– Muitas vezes vamos chamar de população a todo o conjunto de
observações da variável de interesse.
Abrangência
da pesquisa
Toda a população Censo
Parte da população Amostragem
PEDRO A. BARBETTA – Estatística Aplicada às Ciências Sociais 6ed. Editora da UFSC, 2006.
VARIÁVEISVARIÁVEIS (O quê?)(O quê?)
• Variáveis são as características que podem ser
observadas (ou medidas) em cada elemento da
população, sob as mesmas condições.
– A variável deve estar definida de tal forma que cada elemento
observado tenha um – e apenas um – resultado (valor ou
atributo) associado a essa variável.
PEDRO A. BARBETTA – Estatística Aplicada às Ciências Sociais 6ed. Editora da UFSC, 2006.
Dados e variáveisDados e variáveis
• Ex: Alunos da turma
Variáveis
Dados
............
8,000masc.10
5,406masc.9
7,304fem.8
7,002fem.7
4,909fem.6
6,300fem.5
10,000masc.4
8,505fem.3
9,001masc.2
9,202masc.1
NotaFaltasSexoAluno
Casos
(elementos
observados da
população)
PEDRO A. BARBETTA – Estatística Aplicada às Ciências Sociais 6ed. Editora da UFSC, 2006.
Dados e variáveisDados e variáveis
Variável
qualitativa
ou categórica
quantitativa
dados qualitativos
ou categorizados
dados quantitativos
PEDRO A. BARBETTA – Estatística Aplicada às Ciências Sociais 6ed. Editora da UFSC, 2006.
Instrumentos de coleta de dadosInstrumentos de coleta de dados (Como?)(Como?)
• Questionários
• Entrevistas
• Instrumentos da Web
PEDRO A. BARBETTA – Estatística Aplicada às Ciências Sociais 6ed. Editora da UFSC, 2006.
Exemplo de questionárioExemplo de questionário
1) Qual é o curso que você está realizando na UFSC? _____________.
2) Qual é a fase predominante em que você se encontra? __________.
3) Dê uma nota de 1 (um) a 5 (cinco), sendo 1 o nível mínimo e 5 o nível máximo, para
as seguintes características relacionadas com você e seu curso.
a) Didática dos professores de seu curso ( 1 2 3 4 5 )
b) Nível de conhecimento dos professores ( 1 2 3 4 5 )
c) Bibliografia disponível ( 1 2 3 4 5 )
d) Laboratórios e outros recursos materiais ( 1 2 3 4 5 )
e) Conteúdo dos programas das disciplinas oferecidas( 1 2 3 4 5 )
f) Encadeamento das disciplinas ( 1 2 3 4 5 )
g) Satisfação com o curso, num sentido geral ( 1 2 3 4 5 )
4) Apresente o principal ponto positivo e negativo de seu curso.
POSITIVO:________________________________________________.
NEGATIVO:_______________________________________________.
5) Anote o seu Índice de Aproveitamento Acumulado _____________ (ver tabela com o
aplicador).
PEDRO A. BARBETTA – Estatística Aplicada às Ciências Sociais 6ed. Editora da UFSC, 2006.
Dados da pesquisaDados da pesquisa
no do 3(a) 3(b) 3(c) 3(d) 3(e) 3(f) 3(g) 4(a) 4(b) 5
quest. didat. conhec. bibl. labor. disc. curric. satisf. posit. negat. desemp.
1 2 4 2 1 2 2 2 1 2 1,95
2 2 3 2 1 2 3 3 9 1 1,72
3 3 2 1 1 3 2 3 3 3 2,39
4 2 2 3 1 4 4 3 3 5 2,57
5 3 3 4 3 3 4 2 3 1 2,51
... .... ... ... ... ... ... ... ... ... ...
Item do questionário
PEDRO A. BARBETTA – Estatística Aplicada às Ciências Sociais 6ed. Editora da UFSC, 2006.
Estatística Aplicada às Ciências SociaisEstatística Aplicada às Ciências Sociais
Sexta EdiçãoSexta Edição
Pedro Alberto Barbetta
Florianópolis: Editora da UFSC, 2006
Cap. 3 Cap. 3 –– Técnicas de Técnicas de
amostragemamostragem
Este capítulo teve a participação da Profa
SÍLVIA MODESTO NASSAR (INE – CTC – UFSC)
PEDRO A. BARBETTA – Estatística Aplicada às Ciências Sociais 6ed. Editora da UFSC, 2006.
POPULAÇÃO
X1 X2 X3 ...Característica X observável:
População e a variável a ser observadaPopulação e a variável a ser observada
PEDRO A. BARBETTA – Estatística Aplicada às Ciências Sociais 6ed. Editora da UFSC, 2006.
AMOSTRA:
uma parte dos
eleitores
X1 X2 X3Voto do eleitor:
POPULAÇÃO:
eleitores brasileiros
Pesquisa eleitoral: um exemplo dePesquisa eleitoral: um exemplo de
levantamento por amostragemlevantamento por amostragem
PEDRO A. BARBETTA – Estatística Aplicada às Ciências Sociais 6ed. Editora da UFSC, 2006.
Amostragem e Inferência estatísticaAmostragem e Inferência estatística
Universo do estudo (população)
Dados observados
(amostra)
Amostrageminferência
PEDRO A. BARBETTA – Estatística Aplicada às Ciências Sociais 6ed. Editora da UFSC, 2006.
PopulaçãoPopulação
• População: é o conjunto de elementos para os quais
desejamos que as conclusões da pesquisa sejam válidas,
com a restrição de que esses elementos possam ser
observados ou mensurados sob as mesmas condições.
– Muitas vezes vamos chamar de população a todo o conjunto de
observações da variável de interesse.
– Parâmetro é uma medida que descreve certa característica dos
elementos da população (uma média, uma proporção,... da
variável de interesse).
PEDRO A. BARBETTA – Estatística Aplicada às Ciências Sociais 6ed. Editora da UFSC, 2006.
Amostra e amostragemAmostra e amostragem
• Amostra: parte dos elementos de uma população.
– Muitas vezes vamos se referir à amostra como uma parte das
possíveis observações de uma variável de interesse.
• Amostragem: o processo de seleção da amostra.
– Estimativa: valor calculado com base na amostra, e usado com
a finalidade de avaliar aproximadamente um parâmetro.
PEDRO A. BARBETTA – Estatística Aplicada às Ciências Sociais 6ed. Editora da UFSC, 2006.
AMOSTRAPOPULAÇÃO
π = ?
π = p ± erro amostral
Exemplo: Pesquisa eleitoralExemplo: Pesquisa eleitoral
X1 X2 X3 ...Voto do eleitor: p
Parâmetro
Estatística
Amostragem
Resultado estatístico:
PEDRO A. BARBETTA – Estatística Aplicada às Ciências Sociais 6ed. Editora da UFSC, 2006.
• Censo: Estudo através da observação de todos
os elementos da população.
• Amostragem: Estudo por meio da observação
de uma amostra.
Censo x AmostragemCenso x Amostragem
PEDRO A. BARBETTA – Estatística Aplicada às Ciências Sociais 6ed. Editora da UFSC, 2006.
Por que fazer amostragem?Por que fazer amostragem?
• Economia
• Menor tempo
• Maior qualidade nos dados levantados
• População infinita
• Mais fácil, com resultados satisfatórios.
PEDRO A. BARBETTA – Estatística Aplicada às Ciências Sociais 6ed. Editora da UFSC, 2006.
Quando fazer censo?Quando fazer censo?
• População pequena (tamanho da amostra
grande em relação ao da população).
• Quando se exige o resultado exato.
• Quando já se dispõe dos dados da população.
PEDRO A. BARBETTA – Estatística Aplicada às Ciências Sociais 6ed. Editora da UFSC, 2006.
N
n
Amostra representativa:
10% da população
Tamanho da amostra Tamanho da amostra (n)(n) ee
tamanho da população tamanho da população (N)(N)
100 1.000
10
100
A relação não é linear
PEDRO A. BARBETTA – Estatística Aplicada às Ciências Sociais 6ed. Editora da UFSC, 2006.
N
n
IMPORTANTE: forma de seleção da amostra
Tamanho da amostra (n)Tamanho da amostra (n) ee
tamanho da população (N)tamanho da população (N)
10
10
10.000
Bem menos que 10.000PEDRO A. BARBETTA – Estatística Aplicada às Ciências Sociais 6ed. Editora da UFSC, 2006.
Amostragem Amostragem
• O processo de seleção da amostra
PEDRO A. BARBETTA – Estatística Aplicada às Ciências Sociais 6ed. Editora da UFSC, 2006.
Técnicas de Amostragem Técnicas de Amostragem
• Amostragem probabilística (aleatória) - a probabilidade
de um elemento da população ser escolhido é conhecida.
– Usa alguma forma de sorteio - aleatoriedade
• Amostragem não-probabilística (não-aleatória) - Não se
conhece, a priori, a probabilidade de um elemento da
população vir a pertencer à amostra.
PEDRO A. BARBETTA – Estatística Aplicada às Ciências Sociais 6ed. Editora da UFSC, 2006.
Amostragem ProbabilísticaAmostragem Probabilística
• Amostragem aleatória simples
• Amostragem sistemática
• Amostragem estratificada
• Amostragem por conglomerados
PEDRO A. BARBETTA – Estatística Aplicada às Ciências Sociais 6ed. Editora da UFSC, 2006.
Amostragem Aleatória Amostragem Aleatória
Simples (Simples (AASAAS))
• Faz-se uma lista da população e sorteiam-se os
elementos que farão parte da amostra.
• Pode-se utilizar uma tabela de números aleatórios.
• Propriedade básica: cada subconjunto da população com
o mesmo nº de elementos tem a mesma chance de ser
incluído na amostra. Em particular, cada elemento da
população tem probabilidade p = n/N de pertencer à
amostra.
PEDRO A. BARBETTA – Estatística Aplicada às Ciências Sociais 6ed. Editora da UFSC, 2006.
ExemploExemplo
05. Bernardino
10. Hercílio
15. Fabrício
20. João da Silva
25. José de Souza
30. Mauro
04. Bartolomeu
09. Ermílio
14. Felício
19. Hiraldo
24. José da Silva
29. Ma Cristina
03. Arnaldo
08. Cláudio
13. Francisco
18. Getúlio
23. Joaquina
28. Maria José
02. Anastácia
07. Carlito
12. Endevaldo
17. Gabriel
22. Joaquim
27. Josefina
32. Paulo César
01. Aristóteles
06. Cardoso
11. Ernestino
16. Geraldo
21. Joana
26. Josefa
31. Paula
População:
Selecionar uma amostra de n = 5 elementos.
Números aleatórios:
59 58 48 36 47 92 85 05 38 65 47 49 10 41 05 10 75 59 75 99 17 28 97 99 75
53 26 21 50 21 37 93 85 52 86 86 22 75 34 37 69 85 25 03 78 50 26 18 25 10
PEDRO A. BARBETTA – Estatística Aplicada às Ciências Sociais 6ed. Editora da UFSC, 2006.
59 58 48 36 47 92 85 05 08 65 47 49 10 41 05 10 75 59 75 99 17 28 97 99 75
53 26 21 50 21 37 93 85 52 86 86 22 75 34 37 69 85 25 03 78 50 26 18 25 10
ExemploExemplo
05. Bernardino
10. Hercílio
15. Fabrício
20. João da Silva
25. José de Souza
30. Mauro
04. Bartolomeu
09. Ermílio
14. Felício
19. Hiraldo
24. José da Silva
29. Ma Cristina
03. Arnaldo
08. Cláudio
13. Francisco
18. Getúlio
23. Joaquina
28. Maria José
02. Anastácia
07. Carlito
12. Endevaldo
17. Gabriel
22. Joaquim
27. Josefina
32. Paulo César
01. Aristóteles
06. Cardoso
11. Ernestino
16. Geraldo
21. Joana
26. Josefa
31. Paula
População e amostra:
Números aleatórios:
Obs. Há um erro no livro (6 ed.): foi pulado o número 08, associado ao Cláudio.
PEDRO A. BARBETTA – Estatística Aplicada às Ciências Sociais 6ed. Editora da UFSC, 2006.
Amostragem SistemáticaAmostragem Sistemática
• Os elementos da população apresentam-se
ordenados e são retirados periodicamente (de
cada k elementos, um é escolhido)
PEDRO A. BARBETTA – Estatística Aplicada às Ciências Sociais 6ed. Editora da UFSC, 2006.
Amostragem EstratificadaAmostragem Estratificada
• Usada quando a população pode ser dividida em
subgrupos (estratos) relativamente homogêneos.
• A seleção em cada estrato deve ser aleatória
PEDRO A. BARBETTA – Estatística Aplicada às Ciências Sociais 6ed. Editora da UFSC, 2006.
POPULAÇÃO:
comunidade da escola
20%
60%
20%
professor
servidor
aluno
AMOSTRA: parte da
comunidade da escola
20%
20%
60%
Ilustração de uma amostragem estratificada
proporcional
PEDRO A. BARBETTA – Estatística Aplicada às Ciências Sociais 6ed. Editora da UFSC, 2006.
Amostragem Estratificada. Amostragem Estratificada. ExemplosExemplos
• Pesquisas de mercado:
– homens e mulheres;
– faixas etárias.
• Pesquisas eleitorais:
– região demográfica;
– cidades pequenas médias e grandes;
– área urbana e rural.
PEDRO A. BARBETTA – Estatística Aplicada às Ciências Sociais 6ed. Editora da UFSC, 2006.
Amostragem por ConglomeradosAmostragem por Conglomerados
• Usada quando a população pode ser naturalmente dividida em
vários subgrupos (conglomerados).
– Ao contrário dos estratos, espera-se que os conglomerados sejam quase
tão heterogêneos quanto à população toda.
• Num primeiro estágio, a amostragem é feita sobre os conglomerados,
e não mais sobre os indivíduos da população.
PEDRO A. BARBETTA – Estatística Aplicada às Ciências Sociais 6ed. Editora da UFSC, 2006.
☺☺☺
2° ESTÁGIO:
seleção aleatória de
elementos
☺
☺
☺
☺☺☺☺☺
☺☺☺
☺☺☺
☺☺
1° ESTÁGIO: seleção
aleatória de conglomerados
Amostragem por ConglomeradosAmostragem por Conglomerados
Amostra:
PEDRO A. BARBETTA – Estatística Aplicada às Ciências Sociais 6ed. Editora da UFSC, 2006.
Tamanho da amostraTamanho da amostra
• Supondo amostragem aleatória simples.
• Supondo que o objetivo é estimar determinadas
proporções.
• Quantos elementos da população devemos pesquisar?
– Digamos que não queremos errar em mais que E0, com alto
nível de confiança (digamos 95%). Ou seja, a proporção a ser
calculada na amostra não deve diferir da verdadeira proporção
(na população) em mais que E0 unidades, com 95% de
probabilidade.
– E0 = limite superior provável para o erro amostral.
PEDRO A. BARBETTA – Estatística Aplicada às Ciências Sociais 6ed. Editora da UFSC, 2006.
Tamanho da amostraTamanho da amostra
• Uma expressão genérica (mais detalhes
no Cap. 9 ) : E
1 = n
0
20
0n =n se N é muito grande ou desconhecido
n+ N
n.N =n
0
0 se N não for muito grande e for
conhecido
n = n0 de elementos da amostra
N = n0 de elementos da população
Exemplos 3.8 e 3.9: ler e discutir.
PEDRO A. BARBETTA – Estatística Aplicada às Ciências Sociais 6ed. Editora da UFSC, 2006.
N
n
Tamanho da amostra (n)Tamanho da amostra (n) ee
tamanho da população (N)tamanho da população (N)
10
10
10.000
Bem menos que 10.000
Considerando a relação acima, pense como ficam as inferências
sobre subgrupos de uma população.
PEDRO A. BARBETTA – Estatística Aplicada às Ciências Sociais 6ed. Editora da UFSC, 2006.
Fazer Exercício 8Fazer Exercício 8
Numeração dos domicílios:
Número de cômodos (variável X de estudo) :
PEDRO A. BARBETTA – Estatística Aplicada às Ciências Sociais 6ed. Editora da UFSC, 2006.
40 50 60 70 80 90 100
Taxa de alfabetização
0
2
4
6
8
10
12
Fr
eq
ü
ên
ci
a
de
m
u
n
ic
íp
io
s
Avaliação
Bom
45%
Regular
35%
Ruim
20% Informação
Dados
Pesquisa
Conhecimento
Novas hipóteses
PEDRO A. BARBETTA – Estatística Aplicada às Ciências Sociais 6ed. Editora da UFSC, 2006.
• Como extrair informações dos dados.
• Como construir, apresentar e interpretar tabelas, gráficos
e medidas descritivas.
• Capítulos 4, 5 e 6
PEDRO A. BARBETTA – Estatística Aplicada às Ciências Sociais 6ed. Editora da UFSC, 2006.
Estatística Aplicada às Ciências SociaisEstatística Aplicada às Ciências Sociais
Sexta EdiçãoSexta Edição
Pedro Alberto Barbetta
Florianópolis: Editora da UFSC, 2006
Cap. 4 Cap. 4 –– Dados categorizadosDados categorizados
PEDRO A. BARBETTA – Estatística Aplicada às Ciências Sociais 6ed. Editora da UFSC, 2006.
Dados (ver Anexo do Cap. 4)Dados (ver Anexo do Cap. 4)
..................
7,14nenhumusaMonte Verde12
18,66fundamentalnão usaMonte Verde11
4,64fundamentalusaMonte Verde10
10,36médiousaMonte Verde9
8,43médiousaMonte Verde8
4,12médionão usaMonte Verde7
2,41nenhumusaMonte Verde6
94médiousaMonte Verde5
5,55fundamentalnão usaMonte Verde4
9,64fundamentalusaMonte Verde3
15,44médionão usaMonte Verde2
10,34médionão usaMonte Verde1
RendaTam.InstruçãoP.A.P.Local Família
PEDRO A. BARBETTA – Estatística Aplicada às Ciências Sociais 6ed. Editora da UFSC, 2006.
Classificação simplesClassificação simples• Distribuição de Freqüências: organização dos
dados de acordo com as ocorrências dos
diferentes resultados observados.
Pode ser apresentada:
em tabela ou em gráfico;
com freqüências absolutas ou relativas.
PEDRO A. BARBETTA – Estatística Aplicada às Ciências Sociais 6ed. Editora da UFSC, 2006.
Variável:Variável:
Nível de instruçãoNível de instrução
Nível de instrução do chefe da casa, numa amostra de 40
famílias do Conj. Resid. Monte Verde, Florianópolis, SC,
1988.
PEDRO A. BARBETTA – Estatística Aplicada às Ciências Sociais 6ed. Editora da UFSC, 2006.
Distribuição de FreqüênciasDistribuição de Freqüências
• Formas gráficas.
PEDRO A. BARBETTA – Estatística Aplicada às Ciências Sociais 6ed. Editora da UFSC, 2006.
0 4 8 12 16 20 24
Gráfico de BarrasGráfico de Barras
nenhum
nível fundam.
nível médio
Número de famílias
Nível de Instrução do Chefe da Casa
PEDRO A. BARBETTA – Estatística Aplicada às Ciências Sociais 6ed. Editora da UFSC, 2006.
Cuidados na Construção de GráficosCuidados na Construção de Gráficos
• O gráfico deve ser ressaltado. Linhas auxiliares e eixos
devem ser “discretos”.
PEDRO A. BARBETTA – Estatística Aplicada às Ciências Sociais 6ed. Editora da UFSC, 2006.
Gráfico de BarrasGráfico de Barras
0 4 8 12 16 20 24
nenhum
nível fundam.
nível médio
número de famílias
Nível de Instrução do Chefe da Casa
PEDRO A. BARBETTA – Estatística Aplicada às Ciências Sociais 6ed. Editora da UFSC, 2006.
• A escala das freqüências deve iniciar no zero.
Cuidados na Construção de GráficosCuidados na Construção de Gráficos
PEDRO A. BARBETTA – Estatística Aplicada às Ciências Sociais 6ed. Editora da UFSC, 2006.
4 8 12 16 20 24
Gráfico de BarrasGráfico de Barras
nenhum
nível fundam.
nível médio
número de famílias
Nível de Instrução do Chefe da Casa
PEDRO A. BARBETTA – Estatística Aplicada às Ciências Sociais 6ed. Editora da UFSC, 2006.
Gráfico em colunasGráfico em colunas
Nível de instrução do chefe da casa
0
5
10
15
20
25
nenhum fundam. médio
nú
m
er
o
de
fa
m
ília
s
PEDRO A. BARBETTA – Estatística Aplicada às Ciências Sociais 6ed. Editora da UFSC, 2006.
Gráfico de SetoresGráfico de Setores
Nível de Instrução do Chefe da Casa
nenhum (15,0 %)
nível fundam.
(27,5 %)
nível médio
(57,5 %)
PEDRO A. BARBETTA – Estatística Aplicada às Ciências Sociais 6ed. Editora da UFSC, 2006.
GráficosGráficos
• Que tipo de gráfico usar?
– Ver comentários no livro (final da seção 4.2)
PEDRO A. BARBETTA – Estatística Aplicada às Ciências Sociais 6ed. Editora da UFSC, 2006.
Distribuição de FreqüênciasDistribuição de Freqüências
MúltiplaMúltipla
LocalidadeNível de
Instr ução
nenhum
médio
fundam.
Total
Pq. da
Figue ira
14 (32,6)
14 (32,6)
15 (34,8)
43 (100,0)
Encosta
do Mo rro
18 (48,7)
13 (35,1)
6 (16,2)
37 (100,0)
Monte
Verde
6 (15,0)
11 (27,5)
23 (57,5)
40 (100,0)
PEDRO A. BARBETTA – Estatística Aplicada às Ciências Sociais 6ed. Editora da UFSC, 2006.
Distribuição de Freqüências MúltiplaDistribuição de Freqüências Múltipla
Nível de Instrução do Chefe da Casa
0 10 20 30 40 50 60 70
Morro
Pq. da Figueira
Monte Verde
Porcentagem de famílias
nenhum
fundamental
médio
PEDRO A. BARBETTA – Estatística Aplicada às Ciências Sociais 6ed. Editora da UFSC, 2006.
Dupla classificaçãoDupla classificação
• Permite verificar se os dados de duas variáveis indicam
alguma associação.
• A associação entre duas ou mais variáveis implica que o
conhecimento de uma altera a probabilidade de algum
resultado da outra.
PEDRO A. BARBETTA – Estatística Aplicada às Ciências Sociais 6ed. Editora da UFSC, 2006.
Dupla classificaçãoDupla classificação
1 3 0
Dados
família
Nível de
instrução
uso de
programas
2 3 0
3 2 1 / /
4 2 0
5 3 1 / /
. . . . . . . . .
construção da tabela
uso de Nível de instrução
programas 1 2 3
1
0 /
PEDRO A. BARBETTA – Estatística Aplicada às Ciências Sociais 6ed. Editora da UFSC, 2006.
Distribuição ConjuntaDistribuição Conjunta
Uso de Nível de Instrução do Chefe da Casa
programas nenhum fundam. médio Total
sim 31 22 25 78
não 7 16 19 42
Total 38 38 44 120
PEDRO A. BARBETTA – Estatística Aplicada às Ciências Sociais 6ed. Editora da UFSC, 2006.
Uso de Nível de Instrução do Chefe da Casa
programas nenhum fundam. médio Total
sim 31 (81,6) 22 (57,9) 25 (56,8) 78 (65,0)
não 7 (18,4) 16 (42,1) 19 (43,2) 42 (35,0)
Total 38 (100,0) 38 (100,0) 44 (100,0) 120 (100,0)
Perfil ColunaPerfil Coluna
Interpretar
PEDRO A. BARBETTA – Estatística Aplicada às Ciências Sociais 6ed. Editora da UFSC, 2006.
Uso de Nível de Instrução do Chefe da Casa
programas nenhum fundam. médio Total
sim 31 (39,7) 22 (28,2) 25 (32,1) 78 (100,0)
não 7 (16,7) 16 (38,1) 19 (45,2) 42 (100,0)
Total 38 (31,7) 38 (31,7) 44 (36,7) 120 (100,0)
Perfil LinhaPerfil Linha
Interpretar
PEDRO A. BARBETTA – Estatística Aplicada às Ciências Sociais 6ed. Editora da UFSC, 2006.
Estatística Aplicada às Ciências SociaisEstatística Aplicada às Ciências Sociais
Sexta EdiçãoSexta Edição
Pedro Alberto Barbetta
Florianópolis: Editora da UFSC, 2006
Cap. 5 Cap. 5 –– Dados quantitativosDados quantitativos
Análise descritiva e exploratória de variáveis
quantitativas
PEDRO A. BARBETTA – Estatística Aplicada às Ciências Sociais 6ed. Editora da UFSC, 2006.
Variáveis quantitativasVariáveis quantitativas
• O resultado é um número numa escala determinada
• Ex.
– número de filhos,
– renda,
– tempo de resposta de um sistema.
Discreta
Contínua
Variável
quantitativa
PEDRO A. BARBETTA – Estatística Aplicada às Ciências Sociais 6ed. Editora da UFSC, 2006.
Distribuição de freqüências para variáveis Distribuição de freqüências para variáveis
discretasdiscretas
• Exemplo (Tabela de freqüências): Distribuição de freqüências do número de
pessoas residentes no domicílio, numa amostra de quarenta residências do
Conjunto Residencial Monte Verde, Florianópolis – SC, 1988.
Freqüência Porcentagem
de residências de residências
1 1 2,5
2 3 7,5
3 6 15
4 13 32,5
5 11 27,5
6 4 10
7 0 0
8 2 5
Número de
pessoas
PEDRO A. BARBETTA – Estatística Aplicada às Ciências Sociais 6ed. Editora da UFSC, 2006.
Distribuição de freqüências para variáveis Distribuição de freqüências para variáveis
discretasdiscretas
• Exemplo (Gráfico de freqüências): Distribuição de freqüências do número de
pessoas residentes no domicílio, numa amostra de quarenta residências do
Conjunto Residencial Monte Verde, Florianópolis – SC, 1988.
0
2
4
6
8
10
12
14
1 2 3 4 5 6 7 8
Número de pessoas residentes
Fr
eq
ü
ên
ci
a
de
r
es
id
ên
ci
as
PEDRO A. BARBETTA – Estatística Aplicada às Ciências Sociais 6ed. Editora da UFSC, 2006.
Distribuição de freqüências para variáveis Distribuição de freqüências para variáveis
discretasdiscretas
0
2
4
6
8
10
12
14
1 2 3 4 5 6 7 8
Número de pessoas residentes
Fr
eq
ü
ên
ci
a
d
e
re
si
dê
n
ci
as
• Exemplo (Gráfico de freqüências): Distribuição de freqüências do número
de pessoas residentes no domicílio, numa amostra de quarenta residências do
Conjunto Residencial Monte Verde, Florianópolis – SC, 1988.
PEDRO A. BARBETTA – Estatística Aplicada às Ciências Sociais 6ed. Editora da UFSC, 2006.
Distribuição de freqüências para variáveis Distribuição de freqüências para variáveis
contínuascontínuas
• Diagrama de pontos: quando se tem poucas observações
PEDRO A. BARBETTA – Estatística Aplicada às Ciências Sociais 6ed. Editora da UFSC, 2006.
Distribuição de freqüências para variáveis Distribuição de freqüências para variáveis
contínuascontínuas
• Exemplo (Diagrama de pontos): Índice de Desenvolvimento
Humano (IDH) de duas amostras aleatórias de quatorze
municípios: uma da Região Sul e outra da Região Norte.
PEDRO A. BARBETTA – Estatística Aplicada às Ciências Sociais 6ed. Editora da UFSC, 2006.
Distribuição de freqüências para variáveis Distribuição de freqüências para variáveis
contínuascontínuas• Exemplo: Valores da taxa de alfabetização, relativos a uma amostra
aleatória de municípios brasileiros, ano 2000.
57,25 76,85 92,90 89,07 75,49 84,33 65,28 94,59 71,20 82,30
72,81 66,01 90,52 87,94 58,88 86,34 45,37 81,15 94,83 81,42
54,70 67,95 69,91 95,02 77,62 57,14 91,22 64,65 85,70 81,34
59,07 68,04 73,22 95,34 88,40 83,52 64,19 64,17 95,34 84,66
classes contagem freqüência
40 |— 50 | 1
50 |— 60 ||||| 5
60 |— 70 ||||| ||| 8
70 |— 80 ||||| | 6
80 |— 90 ||||| ||||| || 12
90 |— 100 ||||| ||| 8
PEDRO A. BARBETTA – Estatística Aplicada às Ciências Sociais 6ed. Editora da UFSC, 2006.
Distribuição de freqüências para variáveis Distribuição de freqüências para variáveis
contínuascontínuas
• Exemplo (Tabela de freqüências):
Freqüência Porcentagem
de de
municípios municípios
40 |— 50 45 1 2,5
50 |— 60 55 5 12,5
60 |— 70 65 8 20
70 |— 80 75 6 15
80 |— 90 85 12 30
90 |— 100 95 8 20
Classes da
taxa de
alfabetização
Ponto
médio
PEDRO A. BARBETTA – Estatística Aplicada às Ciências Sociais 6ed. Editora da UFSC, 2006.
Distribuição de freqüências para variáveis Distribuição de freqüências para variáveis
contínuascontínuas
• Exemplo (Histograma de freqüências):
40 50 60 70 80 90 100
Taxa de alfabetização
0
2
4
6
8
10
12
Fr
eq
ü
ên
ci
a
de
m
u
n
ic
íp
io
s
PEDRO A. BARBETTA – Estatística Aplicada às Ciências Sociais 6ed. Editora da UFSC, 2006.
5,2 6,4 5,7 8,3 7,0 5,4 4,8 9,1
5,5 6,2 4,9 5,7 6,3 5,1 8,4 6,2
8,9 7,3 5,4 4,8 5,6 6,8 5,0 6,7
8,2 7,1 4,9 5,0 8,2 9,9 5,4 5,6
5,7 6,2 4,9 5,1 6,0 4,7 18,1 5,3
4,9 5,0 5,7 6,3 6,0 6,8 7,3 6,9
6,5 5,9
Salários (em quantidade de salários mínimos) dos Salários (em quantidade de salários mínimos) dos
50 funcionários da Empresa AAA:50 funcionários da Empresa AAA:
ExemploExemplo
PEDRO A. BARBETTA – Estatística Aplicada às Ciências Sociais 6ed. Editora da UFSC, 2006.
DADOS:
4,7 18,1
4 195 6 7 ...
5,2 6,4 5,7 8,3 7,0 5,4 4,8 9,1
5,5 6,2 4,9 5,7 6,3 5,1 8,4 6,2
8,9 7,3 5,4 4,8 5,6 6,8 5,0 6,7
8,2 7,1 4,9 5,0 8,2 9,9 5,4 5,6
5,7 6,2 4,9 5,1 6,0 4,7 18,1 5,3
4,9 5,0 5,7 6,3 6,0 6,8 7,3 6,9
6,5 5,9
PEDRO A. BARBETTA – Estatística Aplicada às Ciências Sociais 6ed. Editora da UFSC, 2006.
5,2 6,4 5,7 8,3 7,0 5,4 4,8 9,1
5,5 6,2 4,9 5,7 6,3 5,1 8,4 6,2
8,9 7,3 5,4 4,8 5,6 6,8 5,0 6,7
8,2 7,1 4,9 5,0 8,2 9,9 5,4 5,6
5,7 6,2 4,9 5,1 6,0 4,7 18,1 5,3
4,9 5,0 5,7 6,3 6,0 6,8 7,3 6,9
6,5 5,9
DADOS:
4 195 6 7 ...8 9
PEDRO A. BARBETTA – Estatística Aplicada às Ciências Sociais 6ed. Editora da UFSC, 2006.
salário
nú
m
er
o
de
fu
nc
io
ná
rio
s
0
2
4
6
8
10
12
14
16
18
20
4 6 8 10 12 14 16 18
HistogramaHistograma dos salários dos funcionários da dos salários dos funcionários da
Empresa AAA:Empresa AAA:
PEDRO A. BARBETTA – Estatística Aplicada às Ciências Sociais 6ed. Editora da UFSC, 2006.
salário
nú
m
er
o
de
fu
nc
io
ná
rio
s
0
2
4
6
8
10
12
14
16
18
20
4 6 8 10 12 14 16 18
Polígono de freqüênciasPolígono de freqüências dos salários dos dos salários dos
funcionários da Empresa AAA:funcionários da Empresa AAA:
PEDRO A. BARBETTA – Estatística Aplicada às Ciências Sociais 6ed. Editora da UFSC, 2006.
Polígonos de freqüências: Polígonos de freqüências: distribuição de renda distribuição de renda
em duas localidadesem duas localidades
0
8
16
24
32
40
48
0 5 10 15 20 25 30
Renda familiar (em salários mínimos)
P
or
ce
nt
ag
em
d
e
fa
m
íli
as
Monte Verde
Encosta do Morro
PEDRO A. BARBETTA – Estatística Aplicada às Ciências Sociais 6ed. Editora da UFSC, 2006.
Formas de uma distribuição de freqüênciasFormas de uma distribuição de freqüências
(b) Distribuições diferentes
quanto à dispersão
(a) Distribuições diferentes
em termos da posição
central
(c) Distribuição simétrica (d) Distribuição assimétrica
PEDRO A. BARBETTA – Estatística Aplicada às Ciências Sociais 6ed. Editora da UFSC, 2006.
RamoRamo--ee--folhasfolhas
57 76 92 89 75 84 65 94 71 82
72 66 90 87 58 86 45 81 94 81
54 67 69 95 77 57 91 64 85 81
59 68 73 95 88 83 64 64 95 84
4 5
5 78479
6 56794844
7 651273
8 942761151834
9 24045155
PEDRO A. BARBETTA – Estatística Aplicada às Ciências Sociais 6ed. Editora da UFSC, 2006.
RamoRamo--ee--folhasfolhas
57 76 92 89 75 84 65 94 71 82
72 66 90 87 58 86 45 81 94 81
54 67 69 95 77 57 91 64 85 81
59 68 73 95 88 83 64 64 95 84
4 5
5 78479
6 56794844
7 651273
8 942761151834
9 24045155
4 5
5 47789
6 44456789
7 123567
8 111234456789
9 1244555
PEDRO A. BARBETTA – Estatística Aplicada às Ciências Sociais 6ed. Editora da UFSC, 2006.
Estatística Aplicada às Ciências SociaisEstatística Aplicada às Ciências Sociais
Sexta EdiçãoSexta Edição
Pedro Alberto Barbetta
Florianópolis: Editora da UFSC, 2006
Cap. 6 Cap. 6 –– Medidas descritivasMedidas descritivas
Análise descritiva e exploratória de variáveis
quantitativas
PEDRO A. BARBETTA – Estatística Aplicada às Ciências Sociais 6ed. Editora da UFSC, 2006.
Medidas DescritivasMedidas Descritivas
• Descrevem características importantes de distribuições de valores
• Exemplo:
Famílias Renda média
Local observadas (sal. mín.)
Monte Verde 40 8,1
Pq. Da Figueira 42 5,8
Encosta do Morro 37 5,0
PEDRO A. BARBETTA – Estatística Aplicada às Ciências Sociais 6ed. Editora da UFSC, 2006.
ExemploExemplo
• Notas finais dos alunos de três turmas
Turma Notas dos alunos
A 4 5 5 6 6 7 7 8
B 1 2 4 6 6 9 10 10
C 0 6 7 7 7 7,5 7,5
• Qual turma teve melhor desempenho?
– Vamos calcular as médias
n
X
X ∑=
PEDRO A. BARBETTA – Estatística Aplicada às Ciências Sociais 6ed. Editora da UFSC, 2006.
ExemploExemplo
• Notas finais dos alunos de três turmas
• A média é uma medida-resumo (não fornece todas as
informações dos dados)
n
X
X ∑=
Turma Notas dos alunos Média da
turma
A 4 5 5 6 6 7 7 8 6,00
B 1 2 4 6 6 9 10 10 6,00
C 0 6 7 7 7 7,5 7,5 6,00
PEDRO A. BARBETTA – Estatística Aplicada às Ciências Sociais 6ed. Editora da UFSC, 2006.
Diagrama de PontosDiagrama de Pontos
A: 4 5 5 6 6 7 7 8
4
Média
5 6 7 8
PEDRO A. BARBETTA – Estatística Aplicada às Ciências Sociais 6ed. Editora da UFSC, 2006.
Diagrama de pontos das três turmas e Diagrama de pontos das três turmas e
indicação das respectivas médiasindicação das respectivas médias
0 2 4 6 8 10 12
notas
Turma A
Turma B
Turma C
PEDRO A. BARBETTA – Estatística Aplicada às Ciências Sociais 6ed. Editora da UFSC, 2006.
Como medira dispersão?Como medira dispersão?
Exemplo: Turma A (4 5 5 6 6 7 7 8)
4 5 6 7 8
Distância (desvio) de um valor em relação à média
PEDRO A. BARBETTA – Estatística Aplicada às Ciências Sociais 6ed. Editora da UFSC, 2006.
Desvios quadráticos e a variânciaDesvios quadráticos e a variância
Descrição Notação Resultados numéricos Soma
Valores (notas dos alunos) X 4 5 5 6 6 7 7 8 48
Média 6
Desvios -2 -1 -1 0 0 1 1 2 0
Desvios quadráticos 4 1 1 0 0 1 1 4 12
X
XX −
( )2XX −
( )
1
2
2
−
−
= ∑
n
XX
S
S2 = (4 + 1 + 1 + 0 + 0 + 1 + 1 + 4) / 7 = 12 / 7 = 1,71
PEDRO A. BARBETTA – Estatística Aplicada às Ciências Sociais 6ed. Editora da UFSC, 2006.
Desvio Padrão: SDesvio Padrão: S
• O desvio padrão (S) é a raiz quadrada da variância.
• Ex:
31,171,1 ==S
PEDRO A. BARBETTA – Estatística Aplicada às Ciências Sociais 6ed. Editora da UFSC, 2006.
Comparação das três turmas pela média e Comparação das três turmas pela média e
desvio padrãodesvio padrão
turma notas X S
A 4 5 5 6 6 7 7 8 6 1,31
B 1 2 4 6 6 9 10 10 6 3,51
C 0 6 7 7 7 7,5 7,5 6 2,69
Interpretar
PEDROA. BARBETTA – Estatística Aplicada às Ciências Sociais 6ed. Editora da UFSC, 2006.
Cálculo de Cálculo de SS
X: 4 5 5 6 6 7 7 8
X2: 16 25 25 36 36 49 49 64
6=X
∑ =3002X
1
22
−
−∑
=
n
XnXS
PEDRO A. BARBETTA – Estatística Aplicada às Ciências Sociais 6ed. Editora da UFSC, 2006.
Cálculo de Cálculo de SS
6=X ∑ =3002X
1,31 =
7
12 =
7
288 300 =
7
)8.(6 300 = S
2 −−
1
22
−
−∑
=
n
XnXS
PEDRO A. BARBETTA – Estatística Aplicada às Ciências Sociais 6ed. Editora da UFSC, 2006.
TABELA Medidas descritivas das notas
finais dos alunos de três turmas
Turma Número de
alunos
Média Desvio
padrão
A
B
C
20
40
30
6,0
8,0
9,0
3,3
1,5
2,6
Outro exemploOutro exemplo
Interpretar
PEDRO A. BARBETTA – Estatística Aplicada às Ciências Sociais 6ed. Editora da UFSC, 2006.
25%
25%
25%
25%
Medidas baseadas na
ordenação dos dados
QI
Quartil
inferior
Md
mediana
QS
Quartil
superior
PEDRO A. BARBETTA – Estatística Aplicada às Ciências Sociais 6ed. Editora da UFSC, 2006.
0 10 20 30 40 50 60 70
Md = 22,5 X = 24,7
50% dos valores 50% dos valores
Média e mediana
PEDRO A. BARBETTA – Estatística Aplicada às Ciências Sociais 6ed. Editora da UFSC, 2006.
50%50%
média = mediana
(a) Distribuição
simétrica
50%
50%
mediana média
(b) Distribuição
assimétrica
Média e mediana
PEDRO A. BARBETTA – Estatística Aplicada às Ciências Sociais 6ed. Editora da UFSC, 2006.
Cálculo da mediana
• Conjunto de notas da Turma C: {0; 6; 7; 7; 7; 7,5 7,5}
• Posição da mediana com os dados ordenados: (n+1)/2
posição: (7+1)/2 = 4 Md = 7.
• E se n for par, fazendo com que (n+1)/2 seja fracionário?
PEDRO A. BARBETTA – Estatística Aplicada às Ciências Sociais 6ed. Editora da UFSC, 2006.
Dados:
{2, 0, 5, 7, 9, 1, 3, 4, 6, 8}
Md = (4+5)/2 = 4,5
0 1 2 3 4 5 6 7 8 9
Cálculo da mediana
n = 10
“Posição da mediana” : (n + 1) / 2 = 5,5
Ordenando os dados:
PEDRO A. BARBETTA – Estatística Aplicada às Ciências Sociais 6ed. Editora da UFSC, 2006.
Qi = 2 Qs = 7
0 1 2 3 4 5 6 7 8 9
Md = 4,5
Cálculo dos quartis
Ei = 0 Es = 9
PEDRO A. BARBETTA – Estatística Aplicada às Ciências Sociais 6ed. Editora da UFSC, 2006.
Qi = 2,5 Qs = 7,5
Exercício:
Cálculo dos quartis
Ei = 0 Md = 5
0 1 2 3 4 5 6 7 8 9 100
Es = 100
PEDRO A. BARBETTA – Estatística Aplicada às Ciências Sociais 6ed. Editora da UFSC, 2006.
Diagrama em caixasDiagrama em caixas
25%
25%
25%
25%
25% 25%
25%
25%
PEDRO A. BARBETTA – Estatística Aplicada às Ciências Sociais 6ed. Editora da UFSC, 2006.
Diagrama em caixasDiagrama em caixas
QS + 1,5(QS – QI)
QI
Md
QS
ES
EI
PEDRO A. BARBETTA – Estatística Aplicada às Ciências Sociais 6ed. Editora da UFSC, 2006.
Diagrama em caixasDiagrama em caixas
3
8
13
18
23
28
Monte
Verde
Encosta
do Morro
Renda
familiar
(sal. mín.)
Interpretar
PEDRO A. BARBETTA – Estatística Aplicada às Ciências Sociais 6ed. Editora da UFSC, 2006.
Análise exploratória de dadosAnálise exploratória de dados
Análise
univariada
Variável
qualitativa
Variável
quantitativa
Distribuição de
freqüências
Percentagens
Tabela
Gráfico de
barras,
colunas ou
setores
Distribuição de
freqüências
Medidas descritivas (média,
desvio padrão, mediana etc.)
Histograma
Ramo-e-folhas
PEDRO A. BARBETTA – Estatística Aplicada às Ciências Sociais 6ed. Editora da UFSC, 2006.
Análise exploratória de dadosAnálise exploratória de dados
Análise
biivariada
Uma variável quantitativa e
outra qualitativa
Duas variáveis qualitativas
Duas variáveis quantitativas
Medidas descritivas da variável
quantitativa em cada categoria da
qualitativa
Diagrama em caixas múltiplo
Tabela de contingência
Diagrama de dispersão
Coeficiente de correlação
PEDRO A. BARBETTA – Estatística Aplicada às Ciências Sociais 6ed. Editora da UFSC, 2006.
PEDRO A. BARBETTA – Estatística Aplicada às Ciências Sociais 6ed. Editora da UFSC, 2006.
• Como usar modelos de probabilidade para entender
melhor os fenômenos aleatórios
• Capítulos 7 e 8.
PEDRO A. BARBETTA – Estatística Aplicada às Ciências Sociais 6ed. Editora da UFSC, 2006.
Estatística Aplicada às Ciências SociaisEstatística Aplicada às Ciências Sociais
Sexta EdiçãoSexta Edição
Pedro Alberto Barbetta
Florianópolis: Editora da UFSC, 2006
Cap. 7 Cap. 7 –– Modelos de Modelos de
probabilidadeprobabilidade
PEDRO A. BARBETTA – Estatística Aplicada às Ciências Sociais 6ed. Editora da UFSC, 2006.
ProbabilidadeProbabilidade
Universo do estudo (população)
Hipóteses, conjeturas, ...
Resultados ou
dados observados
O raciocínio dedutivo da probabilidade
PEDRO A. BARBETTA – Estatística Aplicada às Ciências Sociais 6ed. Editora da UFSC, 2006.
Modelos de probabilidadeModelos de probabilidade
• Os modelos probabilísticos são construídos a
partir de certas hipóteses ou conjeturas sobre o
problema em questão e constituem-se de duas
partes:
1) dos possíveis resultados – o espaço amostral e
2) de uma certa lei que nos diz quão provável é cada
resultado (ou grupos de resultados) – as
probabilidades.
PEDRO A. BARBETTA – Estatística Aplicada às Ciências Sociais 6ed. Editora da UFSC, 2006.
Exemplo de um Exemplo de um
experimento aleatórioexperimento aleatório
• Selecionar uma pessoa ao acaso e observar
se é homem ou mulher.
• Resultados possíveis: homem, mulher
• Espaço amostral = {homem, mulher}
PEDRO A. BARBETTA – Estatística Aplicada às Ciências Sociais 6ed. Editora da UFSC, 2006.
Probabilidade de um resultadoProbabilidade de um resultado
• Qual a probabilidade de homem
e de mulher?
• P(homem) = 0,5
• P(mulher) = 0,5
• A probabilidade é um número
entre 0 e 1, sendo que a soma
das probabilidades de todos os
resultados possíveis deve ser 1.
50% homens
50% mulheres
PEDRO A. BARBETTA – Estatística Aplicada às Ciências Sociais 6ed. Editora da UFSC, 2006.
Modelo de probabilidadesModelo de probabilidades
20%
30%
50%
bom/ótimo
regular
ruim/péssimo
POPULAÇÃO
Opinião a respeito
do governo
AMOSTRA:
uma pessoa observada
ao acaso
Resultado Probab.
bom/ótimo 0,20
regular 0,30
ruim/péssimo 0,50
PEDRO A. BARBETTA – Estatística Aplicada às Ciências Sociais 6ed. Editora da UFSC, 2006.
ExemploExemplo
• Lançar um dado e observar a face voltada para cima.
Suponha que o dado seja perfeitamente equilibrado e o
lançamento imparcial.
• Espaço amostral = {1, 2, 3, 4, 5, 6}
• Probabilidades: P(1) = P(2) = ... = P(6) = 1/6
PEDRO A. BARBETTA – Estatística Aplicada às Ciências Sociais 6ed. Editora da UFSC, 2006.
EventoEvento
• Evento = um conjunto de resultados (um subconjunto
do espaço amostral)
Ex.
• Espaço amostral = {1, 2, 3, 4, 5, 6}
• Probabilidades: P(1) = P(2) = ... = P(6) = 1/6
• Eventos: A = número par, B = núm. menor que 3
• A = {2, 4, 6} B = {1, 2}
• P(A) = 1/2, P(B) = 2/6 = 1/3
PEDRO A. BARBETTA – Estatística Aplicada às Ciências Sociais 6ed. Editora da UFSC, 2006.
Variável aleatóriaVariável aleatória
• Variável aleatória = característica numérica dos
resultados de um experimento
• Ex.
X = número de caras em 2 lançamentos de uma moeda;
Y = percentagem de intenções de voto do candidato AAA numa
amostra de 2.000 eleitores a ser extraída aleatoriamente em Santa
Catarina.
PEDRO A. BARBETTA – Estatística Aplicada às Ciências Sociais 6ed. Editora da UFSC, 2006.
Exemplo de distribuição de probabilidadesExemplo de distribuição de probabilidades
X = número de caras em
dois lançamentos de
uma moeda;
x p(x)
0 0,25
1 0,5
2 0,25
0
0,25
0,5
1 2 3
x
p(x)
0 1 2
0
0,25
0,5
1 2 3
x
p(x)
0 1 2
PEDRO A. BARBETTA – Estatística Aplicada às Ciências Sociais 6ed. Editora da UFSC, 2006.
Construção de distribuições de probabilidades. Construção de distribuições de probabilidades.
Ex:Ex:
Sortear n = 2 bolas
com reposição
X = número de bolas pretas na amostra
PEDRO A. BARBETTA – Estatística Aplicada às Ciências Sociais 6ed. Editora da UFSC, 2006.
3/5
2/5
3/5
2/5
3/5
2/5X = número de bolas
pretas na amostra
x p(x)
0 9/25 (0,36)
1 12/25 (0,48)
2 4/25 (0,16)
(10) (20)
Sortear n = 2 bolas
com reposição
Exemplo:Exemplo:
PEDRO A. BARBETTA – Estatística Aplicada às Ciências Sociais 6ed. Editora da UFSC, 2006.
3/5
2/5
2/4
2/4
3/4
1/4
X = número de bolas
pretas na amostra
x p(x)
0 6/20 (0,30)
1 12/20 (0,60)
2 2/20 (0,10)
(10) (20)
Sortear n = 2 bolas
sem reposição
Exemplo:Exemplo:
PEDRO A. BARBETTA – Estatística Aplicada às Ciências Sociais 6ed. Editora da UFSC, 2006.
X = número de bolas
pretas na amostra
x p(x)
0 0,30
1 0,60
2 0,10
Distrib. de X
sem reposição
Distrib. de X
com reposição
x p(x)
0 0,36
1 0,48
2 0,16
independência
Sortear n = 2 bolas
PEDRO A. BARBETTA – Estatística Aplicada às Ciências Sociais 6ed. Editora da UFSC, 2006.
IndependênciaIndependência
• Dois eventos são independentes quando a
ocorrência de um deles não altera a
probabilidade da ocorrência do outro.
• Tem-se independência:
– em amostragens aleatórias com reposição;
– em amostragens aleatórias sem reposição, mas
quando a população for muito maior que a
amostra (p. ex., N > 20n).
PEDRO A. BARBETTA – Estatística Aplicada às Ciências Sociais 6ed. Editora da UFSC, 2006.
Experimento binomialExperimento binomial
• consiste de n ensaios;
• cada ensaio tem somente dois resultados: sim / não;
• os ensaios são independentes, com P(sim) = π
(0 < π < 1 constante ao longo dos ensaios).
X = número de sim nos n ensaios
PEDRO A. BARBETTA – Estatística Aplicada às Ciências Sociais 6ed. Editora da UFSC, 2006.
Distrib. de X
x p(x)
0 0,36
1 0,48
2 0,16
binomial com
n = 2 e π = 0,40
Ver Tabela 2
(apêndice)
Sortear n = 2 bolas
com reposição
X = número de bolas
pretas na amostra
Exemplo:Exemplo:
PEDRO A. BARBETTA – Estatística Aplicada às Ciências Sociais 6ed. Editora da UFSC, 2006.
70%
30%
favorável
contrário
POPULAÇÃO
Opinião a
respeito
do governo
AMOSTRA: 10 pessoas
observadas ao acaso
X = núm. de favoráveis
na amostra
binomial com
n = 10 e π = 0,7
Experimento binomial (Exemplo)Experimento binomial (Exemplo)
PEDRO A. BARBETTA – Estatística Aplicada às Ciências Sociais 6ed. Editora da UFSC, 2006.
Experimento binomial (exemplo)Experimento binomial (exemplo)
• Qual a probabilidade de exatamente
sete indivíduos da amostra serem
favoráveis?
• (X é binomial n = 10 π = 0,7)
• P(X = 7) = p(7) = 0,2668
n x π = 0,70
10 0 0,0000
1 0,0001
2 0,0014
3 0,0090
4 0,0368
5 0,1029
6 0,2001
7 0,2668
8 0,2335
9 0,1211
10 0,0282
Tabela da binomial
PEDRO A. BARBETTA – Estatística Aplicada às Ciências Sociais 6ed. Editora da UFSC, 2006.
Experimento binomial (exemplo)Experimento binomial (exemplo)
• Qual a probabilidade de a maioria da
amostra ser de favoráveis?
• (X é binomial n = 10 π = 0,7)
• P(X > 5) =
= p(6) + p(7) + p(8) + p(9) +
p(10)
n x 0,70
10 0 0,0000
1 0,0001
2 0,0014
3 0,0090
4 0,0368
5 0,1029
6 0,2001
7 0,2668
8 0,2335
9 0,1211
10 0,0282
Tabela da binomial
= 0,8497
PEDRO A. BARBETTA – Estatística Aplicada às Ciências Sociais 6ed. Editora da UFSC, 2006.
0 1 2 3 4 5 6 7 8 9 10
0,1
0,2
0,3
x
p(x)
X > 5
X é binomial com n = 10 π = 0,7
P(X > 5) = 0,8497 (Tabela 2)
PEDRO A. BARBETTA – Estatística Aplicada às Ciências Sociais 6ed. Editora da UFSC, 2006.
Média e variânciaMédia e variância
• X: variável aleatória
• possíveis valores: X1, X2, ... Xk
• probabilidades: p1, p2, ... pk
• Média:
• Variância:
∑=µ
i
iipX
( ){ }∑ µ−=σ
i
i
2
i
2 p X
PEDRO A. BARBETTA – Estatística Aplicada às Ciências Sociais 6ed. Editora da UFSC, 2006.
Média e variânciaMédia e variância
na na distribdistrib. binomial. binomial
• X: binomial n, π. Então:
– Média: µ = nπ
– Variância: σ2 = nπ(1 - π)
PEDRO A. BARBETTA – Estatística Aplicada às Ciências Sociais 6ed. Editora da UFSC, 2006.
Estatística Aplicada às Ciências SociaisEstatística Aplicada às Ciências Sociais
Sexta EdiçãoSexta Edição
Pedro Alberto Barbetta
Florianópolis: Editora da UFSC, 2006
Cap. 8 Cap. 8 –– Distribuições contínuas Distribuições contínuas
e modelo normale modelo normal
PEDRO A. BARBETTA – Estatística Aplicada às Ciências Sociais 6ed. Editora da UFSC, 2006.
Variável aleatóriaVariável aleatória
variável
aleatória
discreta
os possíveis resultados estão
contidos em um conjunto
finito ou enumerável
contínua
os possíveis resultados
abrangem todo um intervalo
de números reais
0 1 2 3 4 ... 0
Número de filhos
Ex. Ex.
Altura de um indivíduo
PEDRO A. BARBETTA – Estatística Aplicada às Ciências Sociais 6ed. Editora da UFSC, 2006.
Exemplo (Exemplo (com variável discreta)com variável discreta)
• Um jogo de azar é realizado da
seguinte forma: toma-se um círculo e
divide-se-o em quatro partes iguais, 1
a 4. Sobre o centro do círculo, é
fixado um ponteiro, o qual é girado e
anota-se o número do setor onde a
ponta do ponteiro parou.
00
43
2 1
PEDRO A. BARBETTA – Estatística Aplicada às Ciências Sociais 6ed. Editora da UFSC, 2006.
x p(x)
1 0,25
2 0,25
3 0,25
4 0,25
Total 1
Distribuição de probabilidadesDistribuição de probabilidades
1 2 3 4
0,25 0,25 0,25 0,25
x
p(x)
0,25
0
PEDRO A. BARBETTA – Estatística Aplicada às Ciências Sociais 6ed. Editora da UFSC, 2006.
Exemplo 8.1: com variável aleatória Exemplo 8.1: com variável aleatória
contínuacontínua
• Sobre o centro de um círculo, é fixado um ponteiro, o qual é
girado. Anota-se o ângulo formado pelo ponteiro com o eixo
horizontal, como na figura a seguir.
PEDRO A. BARBETTA – Estatística Aplicada às Ciências Sociais 6ed. Editora da UFSC, 2006.
Exemplo 8.1Exemplo 8.1
• Construir a
distribuição de
probabilidades para o
ângulo (α) obtido
neste experimento.
α
PEDRO A. BARBETTA – Estatística Aplicada às Ciências Sociais 6ed. Editora da UFSC, 2006.
f(x)
0o 360o
x
Área = 1
1
360
X = variável aleatória que
indica o ângulo formado
Exemplo 8.1Exemplo 8.1
PEDRO A. BARBETTA – Estatística Aplicada às Ciências Sociais 6ed. Editora da UFSC, 2006.
Exemplo 8.1Exemplo 8.1
• Qual é a probabilidade de se obter um ângulo entre
30o e 60o?
PEDRO A. BARBETTA – Estatística Aplicada às Ciências Sociais 6ed. Editora da UFSC, 2006.
Exemplo 8.1Exemplo 8.1
f(x)
0o 360o
x
1
360
= área = 0,0833
P(30o < X < 60o)
30o 60o
PEDRO A. BARBETTA – Estatística Aplicada às Ciências Sociais 6ed. Editora da UFSC, 2006.
Exemplo 8.2Exemplo 8.2
• Selecionar, aleatoriamente, de uma certa universidade,
um estudante do sexo masculino. Seja X a sua altura,
em centímetros.
PEDRO A. BARBETTA – Estatística Aplicada às Ciências Sociais 6ed. Editora da UFSC, 2006.
Exemplo 8.2Exemplo 8.2
130 140 150 160 170 180 190 200 210 x
f(x)
altura (em cm.)
PEDRO A. BARBETTA – Estatística Aplicada às Ciências Sociais 6ed. Editora da UFSC, 2006.
Distribuição normalDistribuição normal
µ + σµµ -σ x
σ
σ
f(x)
área total = 1
PEDRO A. BARBETTA – Estatística Aplicada às Ciências Sociais 6ed. Editora da UFSC, 2006.
Exemplo 8.2Exemplo 8.2
Representar:
• o evento: “o estudante selecionado ter 180 cm
ou mais” (X ≥ 180) e
• a probabilidade deste evento: P(X ≥ 180)
PEDRO A. BARBETTA – Estatística Aplicada às Ciências Sociais 6ed. Editora da UFSC, 2006.
Exemplo 8.2Exemplo 8.2
130 140 150 160 170 180 190 200 210 x
f(x)
altura (em cm.)
X ≥ 180
P(X ≥ 180)
PEDRO A. BARBETTA – Estatística Aplicada às Ciências Sociais 6ed. Editora da UFSC, 2006.
• Identificada pela
média (µ) e pelo
desvio padrão (σ) .
xµ
σ
Distribuição normalDistribuição normal
PEDRO A. BARBETTA – Estatística Aplicada às Ciências Sociais 6ed. Editora da UFSC, 2006.
Média e Desvio PadrãoMédia e Desvio Padrão
xµ1
Mesmo σ e diferentes µ
µ2 (µ2 > µ1)
PEDRO A. BARBETTA – Estatística Aplicada às Ciências Sociais 6ed. Editora da UFSC, 2006.Média e Desvio PadrãoMédia e Desvio Padrão
µ
σ1
σ2
x
Mesmo µ e diferentes σ
(σ2 > σ 1)
PEDRO A. BARBETTA – Estatística Aplicada às Ciências Sociais 6ed. Editora da UFSC, 2006.
• Simetria em relação à média.
xµ
50%
Distribuição normalDistribuição normal
xµ µ+aµ−a
a a
Áreas iguais
PEDRO A. BARBETTA – Estatística Aplicada às Ciências Sociais 6ed. Editora da UFSC, 2006.
• O valor z (valor padronizado) é uma medida relativa.
Mede o quanto x se afasta da média (µ), em unidade
de desvio padrão (σ).
Valor padronizadoValor padronizado
σ
x - µz =
xµ
σ
x
PEDRO A. BARBETTA – Estatística Aplicada às Ciências Sociais 6ed. Editora da UFSC, 2006.
Exemplo 8.2Exemplo 8.2
• Se a altura de um indivíduo for x = 190 cm, então qual
é o escore padronizado z correspondente?
2
10
170190
=
−
=
−
=
σ
µxz
PEDRO A. BARBETTA – Estatística Aplicada às Ciências Sociais 6ed. Editora da UFSC, 2006.
Exemplo 8.2Exemplo 8.2
2 z0
190
µ = 170
σ = 10
x
170 180
PEDRO A. BARBETTA – Estatística Aplicada às Ciências Sociais 6ed. Editora da UFSC, 2006.
Exemplo 8.2Exemplo 8.2
-1 1-3 32-2 z0
160 180140 200190150
µ = 170
σ = 10
x
170
σ
PEDRO A. BARBETTA – Estatística Aplicada às Ciências Sociais 6ed. Editora da UFSC, 2006.
Distribuição normalDistribuição normal
µ+σµ-σ µ
x
z
10-1
área = 68,3%
PEDRO A. BARBETTA – Estatística Aplicada às Ciências Sociais 6ed. Editora da UFSC, 2006.
Distribuição normalDistribuição normal
µ+2σµ-2σ µ x
z20-2
área = 95,4%
PEDRO A. BARBETTA – Estatística Aplicada às Ciências Sociais 6ed. Editora da UFSC, 2006.
Distribuição normalDistribuição normal
µ+3σµ-3σ µ x
z30-3
área = 99,7%
PEDRO A. BARBETTA – Estatística Aplicada às Ciências Sociais 6ed. Editora da UFSC, 2006.
Distribuição normal padrãoDistribuição normal padrão
P(X > 180) = P(Z > 1)
1
10
170180
=
−
=
−
=
σ
µxz
Distribuição de Z:
normal padrão
Distribuição de X:
normal com µ = 170 e σ = 10
PEDRO A. BARBETTA – Estatística Aplicada às Ciências Sociais 6ed. Editora da UFSC, 2006.
Tabela da distribuição normal padrãoTabela da distribuição normal padrão
(área na cauda
superior )
0,4168
0,0
0,1
0,2
...
9...210z
segunda decimal de z
(pela tabela)
Ex. Qual é a área acima de z = 0,21?
PEDRO A. BARBETTA – Estatística Aplicada às Ciências Sociais 6ed. Editora da UFSC, 2006.
Exercício: uso da tabelaExercício: uso da tabela
Com base na tabela da normal padronizada, calcular:
a) P(Z > 1)
z0 +1
0,1587 (tabela)
PEDRO A. BARBETTA – Estatística Aplicada às Ciências Sociais 6ed. Editora da UFSC, 2006.
ExercícioExercício
Com base na tabela da normal padronizada, calcular:
b) P(Z > 1,23)
z0 1,23
0,1093 (tabela)
PEDRO A. BARBETTA – Estatística Aplicada às Ciências Sociais 6ed. Editora da UFSC, 2006.
ExercícioExercício
c) P(-2 < Z < 2)
z0 2-2
0,0228 (tabela)
P(-2 < Z < 2) = 1 - 2.(0,0228) = 0,9544
PEDRO A. BARBETTA – Estatística Aplicada às Ciências Sociais 6ed. Editora da UFSC, 2006.
ExercícioExercício
• Selecionar, aleatoriamente, de uma certa universidade, um
estudante do sexo masculino. Seja X o valor de sua altura,
em centímetros. Admitindo que nesta universidade os
estudantes têm altura média de 170 cm com desvio padrão
de 10 cm, qual a probabilidade do estudante sorteado ter
altura superior a 185 cm?
PEDRO A. BARBETTA – Estatística Aplicada às Ciências Sociais 6ed. Editora da UFSC, 2006.
RespostaResposta
• x = 185 cm (µ = 170, σ = 10)
z = ?
5,1
10
170185
=
−
=
σ
µ−
=
xz
PEDRO A. BARBETTA – Estatística Aplicada às Ciências Sociais 6ed. Editora da UFSC, 2006.
Resposta:Resposta:
P(X > 185) = P(Z > 1,5) =
z0 1,5
0,0668 (tabela)
Então, P(X > 185) = P(Z > 1,5) = 0,0668
PEDRO A. BARBETTA – Estatística Aplicada às Ciências Sociais 6ed. Editora da UFSC, 2006.
Aproximação da binomial pela normalAproximação da binomial pela normal
x0 1 2 3 4 5 6 7 8 9 10
PEDRO A. BARBETTA – Estatística Aplicada às Ciências Sociais 6ed. Editora da UFSC, 2006.
Aproximação da binomialAproximação da binomial
pela normalpela normal
• Quando o número de ensaios (n) da binomial é grande,
a distribuição binomial pode ser aproximada por uma
distribuição normal com:
– média
– desvio padrão:
)1( ππ -nσ =
πµ = n
PEDRO A. BARBETTA – Estatística Aplicada às Ciências Sociais 6ed. Editora da UFSC, 2006.
Distribuições binomiais para diferentes valores de Distribuições binomiais para diferentes valores de nn e e ππ. .
0
0,1
0,2
0,3
0,4
0,5
0 1 2
p(x )
x
0
0,1
0,2
0,3
0,4
0,5
0,6
0,7
0 1 2
p(x )
x
n = 2
π = 0,5 π = 0,2
n = 2
PEDRO A. BARBETTA – Estatística Aplicada às Ciências Sociais 6ed. Editora da UFSC, 2006.
Distribuições binomiais para diferentes valores de Distribuições binomiais para diferentes valores de nn e e ππ. .
n = 10
π = 0,5 π = 0,2
n = 10
0
0,1
0,2
0,3
0 1 2 3 4 5 6 7 8 9 10
p(x )
x 0
0,1
0,2
0,3
0 1 2 3 4 5 6 7 8 9 10
p(x )
x
PEDRO A. BARBETTA – Estatística Aplicada às Ciências Sociais 6ed. Editora da UFSC, 2006.
Distribuições binomiais para diferentes valores de Distribuições binomiais para diferentes valores de nn e e ππ. .
n = 50
π = 0,5 π = 0,2
n = 50
0
0,05
0,1
5 15 25 35 45
p(x )
x 0
0,05
0,1
0,15
0 10 20 30
p(x )
x
PEDRO A. BARBETTA – Estatística Aplicada às Ciências Sociais 6ed. Editora da UFSC, 2006.
Distribuições binomiais para diferentes valores de Distribuições binomiais para diferentes valores de nn e e ππ. .
0
0,1
0,2
0,3
0,4
0,5
0 1 2
p(x )
x 0
0,1
0,2
0,3
0,4
0,5
0,6
0,7
0 1 2
p(x )
x
0
0,1
0,2
0,3
0 1 2 3 4 5 6 7 8 9 10
p(x )
x 0
0,1
0,2
0,3
0 1 2 3 4 5 6 7 8 9 10
p(x )
x
0
0,05
0,1
5 15 25 35 45
p(x )
x 0
0,05
0,1
0,15
0 10 20 30
p(x )
x
n = 50
n = 10
n = 2
π = 0,2π = 0,5
PEDRO A. BARBETTA – Estatística Aplicada às Ciências Sociais 6ed. Editora da UFSC, 2006.
Aproximação da binomial pela normalAproximação da binomial pela normal
• Em geral, a distribuição binomial pode ser aproximada
por uma normal quando:
nπ ≥ 5 e
n(1-π) ≥ 5
• Nesse caso,
)1( ππ -nσ = πµ = n
PEDRO A. BARBETTA – Estatística Aplicada às Ciências Sociais 6ed. Editora da UFSC, 2006.
Exemplo 8.9Exemplo 8.9
• Seja Y o número de caras em 10 lançamentos de uma
moeda perfeitamente equilibrada.
– Então, Y é binomial com n = 10 e π = 0,5.
• Calcular a probabilidade de ocorrer exatamente 4 caras.
PEDRO A. BARBETTA – Estatística Aplicada às Ciências Sociais 6ed. Editora da UFSC, 2006.
Cálculo pela normal e pela binomialCálculo pela normal e pela binomial
0
0,1
0,2
0 1 2 3 4 5 6 7 8 9 10
f(x )
x
P(Y = 4 ) = 0 ,2051
pela b inom ial
(Tabela 2 ) P(3,5 < X < 4 ,5 ) =
área sob a curva
de um a norm al
3 ,5 4 ,5
Exercício: fazer o cálculo pela normal (ver solução no livro)
PEDRO A. BARBETTA – Estatística Aplicada às Ciências Sociais 6ed. Editora da UFSC, 2006.
ExemploExemplo
• Em dez lançamentos de uma moeda “honesta”, qual é a
probabilidade de ocorrer mais de 6 caras?
• Pela binomial:
• P(Y > 6) = P(7) + P(8) + P(9) + P(10)
= 0,117 + 0,044 + 0,010 + 0,001
= 0,172
• E pela normal?
PEDRO A. BARBETTA – Estatística Aplicada às Ciências Sociais 6ed. Editora da UFSC, 2006.
ExemploExemplo
0,001 0,01
0,246
0,01 0,001
0,117
0,0440,044
0,205
0,117
0,205
-1 0 1 2 3 4 5 6 7 8 9 10 11
P(Y > 6) = 0,172
Observe que em termos de área devemos considerar
acima de 6,5 (correção de continuidade)
PEDRO A. BARBETTA – Estatística Aplicada às Ciências Sociais 6ed. Editora da UFSC, 2006.
ExemploExemplo
x0 1 2 3 4 5 6 7 8 9 10
P(X>6,5)
PEDRO A. BARBETTA – Estatística Aplicada às Ciências Sociais 6ed. Editora da UFSC, 2006.
ExemploExemplo
x5 6,5
P(X>6,5)
PEDRO A. BARBETTA – Estatística Aplicada às Ciências Sociais 6ed. Editora da UFSC, 2006.
ExemploExemplo
z =
x - µ
σ
6,5 - 5
1,581139
= = 0,95
µ = 5
σ = 1,581139
x = 6,5
PEDRO A. BARBETTA – Estatística Aplicada às Ciências Sociais 6ed. Editora da UFSC, 2006.
ExemploExemplo
z0 0,95
0,1711
Lembrando:a probab. exata
(pela binomial)
é de 0,1720
POPULAÇÃO:
eleitores brasileiros
AMOSTRA:
uma parte dos eleitores
brasileiros
amostragem
PEDRO A. BARBETTA – Estatística Aplicada às Ciências Sociais 6ed. Editora da UFSC, 2006.
• Como generalizar resultados de uma amostra para a população de onde ela foi
extraída – estimação de parâmetros (Cap. 9).
• Como testar hipóteses com base em amostras – testes de hipóteses (Cap. 10)..
inferência
Estatística Aplicada às Ciências SociaisEstatística Aplicada às Ciências Sociais
Sexta EdiçãoSexta Edição
Pedro Alberto Barbetta
Florianópolis: Editora da UFSC, 2006
Cap. 9 Cap. 9 –– Estimação de Estimação de
PEDRO A. BARBETTA – Estatística Aplicada às Ciências Sociais 6ed. Editora da UFSC, 2006.
Cap. 9 Cap. 9 –– Estimação de Estimação de
parâmetrosparâmetros
Estimação de ParâmetrosEstimação de Parâmetros
POPULAÇÃO (universo do estudo)
Parâmetros: π = ? µ = ?
Estimação de parâmetros
PEDRO A. BARBETTA – Estatística Aplicada às Ciências Sociais 6ed. Editora da UFSC, 2006.
O raciocínio indutivo da estimação de parâmetros
AMOSTRA
(dados observados)
AMOSTRA
POPULAÇÃO
ππππ = ?
Estimação de ParâmetrosEstimação de Parâmetros
PEDRO A. BARBETTA – Estatística Aplicada às Ciências Sociais 6ed. Editora da UFSC, 2006.
X1 X2 X3 ...Observações: p
ππππ = p ± erro amostral
Estimação de ParâmetrosEstimação de Parâmetros
População Amostra
σ 2
µ X
−−−−
PEDRO A. BARBETTA – Estatística Aplicada às Ciências Sociais 6ed. Editora da UFSC, 2006.
π
σ 2 S 2
P
Parâmetros Estatísticas
(estimadores)
Amostra
−−−−
População
Estimação de Parâmetros. Objetivo:Estimação de Parâmetros. Objetivo:
• Com base em uma amostra, estimar os parâmetros
populacionais.
PEDRO A. BARBETTA – Estatística Aplicada às Ciências Sociais 6ed. Editora da UFSC, 2006.
S2
X
−−−−
P π = ?
σ2 = ?
µ = ?
Estimação de uma proporção Estimação de uma proporção ππ
• Estimador: proporção amostral, P
• Relação entre o parâmetro π e a estatística P
���� base para calcular o erro amostral
PEDRO A. BARBETTA – Estatística Aplicada às Ciências Sociais 6ed. Editora da UFSC, 2006.
• Considerar-se-á que a amostragem será (ou foi)
aleatória simples.
Relação entre Relação entre ππ e P. Uma ilustraçãoe P. Uma ilustração
População
30%
contrários
Amostra aleatória com
n = 400 indivíduos
PEDRO A. BARBETTA – Estatística Aplicada às Ciências Sociais 6ed. Editora da UFSC, 2006.
70%
favoráveis
n = 400 indivíduos
Calcula-se P
Simulou-se 100 amostras desta forma
Histograma dos resultados das 100 amostras Histograma dos resultados das 100 amostras
simuladassimuladas
0
5
10
15
20
F
re
q
ü
ê
n
c
ia
PEDRO A. BARBETTA – Estatística Aplicada às Ciências Sociais 6ed. Editora da UFSC, 2006.
Em geral, erro amostral < 0,05
Em geral, o intervalo P ± 0,05 contém π
0
0,64 0,66 0,68 0,7 0,72 0,74 0,76
Valor calculado de P
0,70
0,05 0,05
Estimação de parâmetrosEstimação de parâmetros
• Na prática, examinamos apenas uma amostra, resultando em um
único valor para a estatística – uma estimativa. Porém, o
conhecimento da distribuição amostral da estatística permite
avaliarmos um limite superior para o erro amostral (margem de
erro), com certo nível de confiança.
PEDRO A. BARBETTA – Estatística Aplicada às Ciências Sociais 6ed. Editora da UFSC, 2006.
erro), com certo nível de confiança.
• A distribuição amostral de uma estatística é a distribuição dos
possíveis valores dessa estatística, se examinássemos todas as
possíveis amostras de tamanho n, extraídas aleatoriamente de uma
população.
• Desde que a amostra seja aleatória e razoavelmente
grande (n > 30, na maioria dos casos), tem-se:
– Os possíveis valores de P seguem uma distribuição (aproximada)
normal com média e desvio padrão dados por:
Distribuição amostral de uma proporção PDistribuição amostral de uma proporção P
PEDRO A. BARBETTA – Estatística Aplicada às Ciências Sociais 6ed. Editora da UFSC, 2006.
n
).(1
= P
π−π
σ
πµ = P
Distribuição de PDistribuição de P
≈≈≈≈ 95%
ππππ
PEDRO A. BARBETTA – Estatística Aplicada às Ciências Sociais 6ed. Editora da UFSC, 2006.
ππππ ±±±± 1,96σσσσp
ππππ
• O desvio padrão da distribuição amostral de uma estatística é
comumente chamado de erro padrão da estatística.
Erro padrão da proporçãoErro padrão da proporção
Na prática, estima-se o erro padrão da proporção
por:
n
)p.(1p
= SP
−
PEDRO A. BARBETTA – Estatística Aplicada às Ciências Sociais 6ed. Editora da UFSC, 2006.
n
( )
1
1
−
−
⋅
−⋅
N
nN
n
PP
= S p
Se o tamanho da população, N, for conhecido e não
muito grande (N < 20n), então estima-se o erro padrão
da proporção por:
Intervalo de confiança para Intervalo de confiança para ππ, ,
nível de confiança de 95%:nível de confiança de 95%:
P P + (1,96)⋅SP – (1,96)⋅S
Intervalo de 95% de confiança para π
PEDRO A. BARBETTA – Estatística Aplicada às Ciências Sociais 6ed. Editora da UFSC, 2006.
P P + (1,96)⋅SpP – (1,96)⋅Sp
E = margem de erro para 95% de confiança
Ver Exemplo 9.1
0 z -z
Área =
= n íve l de
con fiança
desejado
Intervalo de confiança para Intervalo de confiança para ππ, ,
nível de confiança de 95%:nível de confiança de 95%:
PEDRO A. BARBETTA – Estatística Aplicada às Ciências Sociais 6ed. Editora da UFSC, 2006.
Área 0,800 0,900 0,950 0,980 0,990 0.995 0,998
z 1,282 1,645 1,960 2,326 2,576 2,807 3,090
0 z -z
PSzE ⋅=
EP ±Intervalo de confiança para ππππ:
Margem de erro:
Resultados do Exemplo 9.1:Resultados do Exemplo 9.1:
Intervalo de 95% de confiança para π
Intervalo de 99% de confiança para π
(60,0 ± 6,3%)
PEDRO A. BARBETTA – Estatística Aplicada às Ciências Sociais 6ed. Editora da UFSC, 2006.
60,0%
Intervalo de 95% de confiança para π
(60,0 ± 4,8%)
55,2%53,7% 64,8% 66,2%
Distribuição da média amostralDistribuição da média amostral
População dos salários dos empregados
de certo setor da economia (N =1.000)
Distribuição de freqüências de médias
de amostras de tamanho n = 100
µ=)(XE
1
)(
−
−
=
N
nN
n
XDP
σ
µ=)(XE
σ=)(XDP
Distribuição da média amostralDistribuição da média amostral
Intervalo que abrange,
aproximadamente, 95%
das médias amostrais de
tamanho = 100 da
população de N = 1.000
saláriossalários
PEDRO A. BARBETTA – Estatística Aplicada às Ciências Sociais 6ed. Editora da UFSC, 2006.
Estimação de uma média Estimação de uma média µµ
• Estimador: média amostral,
• Estimativa do erro padrão:
n
X
X
∑
=
S
=S
PEDRO A. BARBETTA – Estatística Aplicada às Ciências Sociais 6ed. Editora da UFSC, 2006.
• Se o tamanho da população, N, for conhecido e não muito grande (N <
20n), então estima-se o erro padrão da média por:
n
=SX
1−
−
⋅=
N
nN
n
S
S
X
Margem de erro na estimação de uma médiaMargem de erro na estimação de uma média
• Se a amostra for grande (n > 30):
� onde z vem da distribuição normal padrão
• Se a amostra for pequena (n < 30):
X
SzE ⋅=
StE ⋅=
PEDRO A. BARBETTA – Estatística Aplicada às Ciências Sociais 6ed. Editora da UFSC, 2006.
• Se a amostra for pequena (n < 30):
� onde t vem da distribuição t com gl = n – 1
NOTA: Para n > 30, t ≅ z, assim, pode-se sempre usar t.
X
StE ⋅=
A distribuição A distribuição tt de Studentde Student
t com gl = ∞ (normal padrão)
t com gl = 3
f(x)
PEDRO A. BARBETTA – Estatística Aplicada às Ciências Sociais 6ed. Editora da UFSC, 2006.
t com gl = 1
x0
A distribuição A distribuição t t dede StudentStudent
Como usar a Tabela Como usar a Tabela tt
(Tabela 5 do Apêndice)(Tabela 5 do Apêndice)
• Ilustração com gl = 9 e nível
de confiança de 95%.
PEDRO A. BARBETTA – Estatística Aplicada às Ciências Sociais 6ed. Editora da UFSC, 2006.
ExemploExemplo
• Encontrar o valor de t para:
a) nível de confiança de 99%, com 19 graus de liberdade (amostra
com 20 elementos)
PEDRO A. BARBETTA – Estatística Aplicada às Ciências Sociais 6ed. Editora da UFSC, 2006.
Resp. t = 2,861Ver exemplos 9.2 e 9.3
Exemplo 9.3Exemplo 9.3
• Para verificar a eficácia de um programa de prevenção de acidentes de
trabalho, foi realizado um estudo experimental, implementando esse
programa em dez empresas da construção civil, escolhidas ao acaso, numa
certa região. Os dados abaixo se referem aos percentuais de redução de
acidentes de trabalho, nas dez empresas observadas.
• Estimar o parâmetro: µ = média da redução percentual de acidentes de
trabalho, em todas as empresas da construção civil da região, que venham a trabalho, em todas as empresas da construção civil da região, que venham a
serem submetidas ao programa preventivo.
PEDRO A. BARBETTA – Estatística Aplicada às Ciências Sociais 6ed. Editora da UFSC, 2006.
Amostra Estatísticas
20 15 23 11 29
5 20 22 18 17
Média: X = 18
Desvio padrão: S = 6,65
Tamanho de AmostrasTamanho de Amostras
• No planejamento de uma pesquisa, uma pergunta
natural é:
– Qual é o tamanho da amostra necessário? (n = ?)
PEDRO A. BARBETTA – Estatística Aplicada às Ciências Sociais 6ed. Editora da UFSC, 2006.
• No que segue, considerar-se-á que a amostragem será
aleatória simples.
Tamanho de amostraTamanho de amostra
• No caso de estimação de µ, podemos exigir erro
amostral menor que um dado E0, isto é:
0EX ≤− µ
PEDRO A. BARBETTA – Estatística Aplicada às Ciências Sociais 6ed. Editora da UFSC, 2006.
0E
n
z ≤
σ
E
z
n
0
2
22
σ
≥
ou:
ou:
Tamanho de amostraTamanho de amostra
• No caso de estimação de π:
4
1
)1.(2 ≤−= ππσ
σσσσ
2
= ππππ(1-ππππ )
1
⁄4
Assim:
PEDRO A. BARBETTA – Estatística Aplicada às Ciências Sociais 6ed. Editora da UFSC, 2006.
ππππ
0
1
⁄2 1 E
ππz
n
0
2
2 )1( −
≥
Ver discussão no livro.
E
z
n
4 0
2
2
=
Então, tomamos:
RESUMO: tamanho mínimo de uma amostra aleatória RESUMO: tamanho mínimo de uma amostra aleatória
simplessimples
Parâmetro de interesse Valor inicial do tamanho da amostra
uma média (µµµµ):
uma proporção (ππππ):
E
z
= n
0
2
22
0
σ
( )
E
z
= n
0
2
2
0
1 ππ −
z2
PEDRO A. BARBETTA – Estatística Aplicada às Ciências Sociais 6ed. Editora da UFSC, 2006.
várias proporções (ππππ 1, ππππ 2, ...):
Tamanho da amostra
População muito grande
(N >20n):
População de tamanho N:
E0
E
z
= n
4 0
2
2
0
0nn =
nN +
nN.
n =
0
0
PEDRO A. BARBETTA – Estatística Aplicada às Ciências Sociais 6ed. Editora da UFSC, 2006.
Estatística Aplicada às Ciências SociaisEstatística Aplicada às Ciências Sociais
Sexta EdiçãoSexta Edição
Pedro Alberto Barbetta
Florianópolis: Editora da UFSC, 2006
Cap. 10 Cap. 10 –– Testes estatísticos de Testes estatísticos de
hipóteseshipóteses
PEDRO A. BARBETTA – Estatística Aplicada às Ciências Sociais 6ed. Editora da UFSC, 2006.
Teste de hipótesesTeste de hipóteses
População / Universo de estudo
Hipóteses que se quer colocar à prova
Amostra
Dados que servirão de base para
aceitar ou rejeitar uma hipótese
Amostragem Decisão do
teste estatístico
PEDRO A. BARBETTA – Estatística Aplicada às Ciências Sociais 6ed. Editora da UFSC, 2006.
Problema e hipóteses Problema e hipóteses –– um exemploum exemplo
• Problema: Na região em estudo, a propensão de fumar
nos homens é diferente do que das mulheres?
• Hipótese nula, H0: A proporção de homens fumantes é
igual à proporção de mulheres fumantes, na população
em estudo.
• Hipótese alternativa, H1: A proporção de homens
fumantes é diferente da proporção de mulheres
fumantes, na população em estudo.
Discutir os conceitos
PEDRO A. BARBETTA – Estatística Aplicada às Ciências Sociais 6ed. Editora da UFSC, 2006.
ExemploExemplo
• Suspeita-se que uma moeda não seja
perfeitamente equilibrada (probab. de cara ≠
probab. de coroa ≠ 0,5).
• Parâmetro: π = probab. de cara
H0: π = 0,5
H1: π ≠ 0,5
PEDRO A. BARBETTA – Estatística Aplicada às Ciências Sociais 6ed. Editora da UFSC, 2006.
Amostragem para o exemplo da moedaAmostragem para o exemplo da moeda
• Amostragem: n = 10 lançamentos da moeda.
• Estatística do teste: Y = número total de caras nos n = 10
lançamentos.
• Amostra (após realizado os 10 lançamentos): 7 caras (3 coroas)
• Qual deve ser a decisão do teste? (Aceita H0 ou rejeita H0 em favor
de H1?)
PEDRO A. BARBETTA – Estatística Aplicada às Ciências Sociais 6ed. Editora da UFSC, 2006.
Distribuição de referênciaDistribuição de referência
• O que pode ocorrer na amostra de n = 10 lançamentos,
se H0 for verdadeira (moeda honesta)?
– Y tem distribuição binomial com n = 10 e π = 0,5.
• A idéia é comparar o resultado observado (7 caras) com
essa distribuição de referência.
– Se o resultado for muito “estranho” para essa distribuição, o
teste rejeita H0.
PEDRO A. BARBETTA – Estatística Aplicada às Ciências Sociais 6ed. Editora da UFSC, 2006.
Distribuição de referênciaDistribuição de referência
• Distribuição da estatística Y = número de caras em 10 lançamentos
da moeda, sob H0 (binomial com n = 10 e π = 0,5)
0 1 2 3 4 5 6 7 8 9 1 0
0 ,0 0 1
0 ,0 1 0
0 ,1 1 7
0 ,2 0 5
0 ,0 4 4
0 ,2 4 6
0 ,2 0 5
0 ,1 1 7
0 ,0 4 4
0 ,0 1 0
0 ,0 0 1
y
p (y )
µ
PEDRO A. BARBETTA – Estatística Aplicada às Ciências Sociais 6ed. Editora da UFSC, 2006.
Valor pValor p
• O valor p aponta o quão estranho foi o resultado da
amostra (no exemplo, 7 caras), se supusermos H0 a
hipótese verdadeira (moeda honesta).
• O valor p é calculado com base na distribuição de
referência.
PEDRO A. BARBETTA – Estatística Aplicada às Ciências Sociais 6ed. Editora da UFSC, 2006.
Valor pValor p
0 1 2 3 4 5 6 7 8 9 1 0
0 ,0 0 1
0 ,0 1 0
0 ,1 1 7
0 ,2 0 5
0 ,0 4 4
0 ,2 4 6
0 ,2 0 5
0 ,1 1 7
0 ,0 4 4
0 ,0 1 0
0 ,0 0 1
y
p (y )
µ
p = p(0) + p(1) + p(2) + p(3) + p(7) + p(8) + p(9) + p(10) =
= 0,001 + 0,010 + 0,044 + 0,117 + 0,117 + 0,044 + 0,010 + 0,001 =
= 0,344 (ou, 34,4%)
Valor p:
O teste deve rejeitar H0?
PEDRO A. BARBETTA – Estatística Aplicada às Ciências Sociais 6ed. Editora da UFSC, 2006.
Nível de significância do teste (Nível de significância do teste (αα ))
• É a probabilidade de o teste rejeitar H0, quando H0 for
verdadeira (uma decisão errada!).
• É comum usar α = 0,05 (α é arbitrado pelo
pesquisador).
PEDRO A. BARBETTA – Estatística Aplicada às Ciências Sociais 6ed. Editora da UFSC, 2006.
Regra de decisão baseada no Regra de decisão baseada no valor pvalor p
p ≤ α rejeita H0 (prova-se H1)
(os dados mostram evidência que ...)
p > α aceita H0 (não se prova H1)
(os dados não mostram evidência que ...)
Discutir sobre a probabilidade de erro em cada uma
dessas decisões.
PEDRO A. BARBETTA – Estatística Aplicada às Ciências Sociais 6ed. Editora da UFSC, 2006.
Realidade
Ho verdadeira Ho falsa
Tipos de erros num teste estatísticoTipos de erros num teste estatístico
PEDRO A. BARBETTA – Estatística Aplicada às Ciências Sociais 6ed. Editora da UFSC, 2006.
Realidade
Ho verdadeira Ho falsa
Aceitar
Ho
Rejeitar
Ho
D
e
c
i
s
ã
o
Tipos de erros num teste estatísticoTipos de erros num teste estatístico
PEDRO A. BARBETTA – Estatística Aplicada às Ciências Sociais 6ed. Editora da UFSC, 2006.
Realidade
Ho verdadeira Ho falsa
Aceitar
Ho
Rejeitar
Ho
D
e
c
i
s
ã
o
O K
O K
Tipos de erros num teste estatísticoTipos de erros num teste estatístico
PEDRO A. BARBETTA – Estatística Aplicada às Ciências Sociais 6ed. Editora da UFSC, 2006.
Realidade
Ho verdadeira Ho falsa
Aceitar
Ho
Rejeitar
Ho
D
e
c
i
s
ã
o
O K
E r r o
T i p o I
(α )
O K
Tipos de erros num teste estatísticoTipos de erros num teste estatístico
PEDRO A. BARBETTA – Estatística Aplicada às Ciências Sociais 6ed. Editora da UFSC, 2006.
Realidade
Ho verdadeira Ho falsa
Aceitar
Ho
Rejeitar
Ho
D
e
c
i
s
ã
o
O K
E r r o
T i p o I
(α )
O K
E r r o
T i p o II
( )β
Tipos de erros num teste estatísticoTipos de erros num teste estatístico
PEDRO A. BARBETTA – Estatística Aplicada às Ciências Sociais 6ed. Editora da UFSC, 2006.
Testesuni e bilateraisTestes uni e bilaterais
• Um teste pode ser unilateral ou bilateral, dependendo do
problema em estudo.
• Nos testes unilaterais, a probabilidade de significância é
computada em apenas um dos lados da distribuição de
referência.
PEDRO A. BARBETTA – Estatística Aplicada às Ciências Sociais 6ed. Editora da UFSC, 2006.
ExercícioExercício
• Exercício 13 - Para testar se uma criança tem algum conhecimento
sobre determinado assunto, foram elaboradas 12 questões do tipo
certo-errado. A criança acertou 11. Qual é a conclusão ao nível de
significância de 5%?
a) Formule as hipóteses em termos do parâmetro π = probabilidade de acerto
de cada questão.
b) Qual é o número esperado de acertos sob H0.
c) Calcule o valor p.
d) Qual é a conclusão do teste ao nível de significância de 5%?
– Observe que se a criança está respondendo apenas pelo palpite (H0),
então a chance de ela acertar uma questão é igual a chance de dar
cara no lançamento de uma moeda honesta.
PEDRO A. BARBETTA – Estatística Aplicada às Ciências Sociais 6ed. Editora da UFSC, 2006.
Estatística Aplicada às Ciências SociaisEstatística Aplicada às Ciências Sociais
Sexta EdiçãoSexta Edição
Pedro Alberto Barbetta
Florianópolis: Editora da UFSC, 2006
Cap. 11 Cap. 11 –– Testes de comparação Testes de comparação
entre duas amostrasentre duas amostras
PEDRO A. BARBETTA – Estatística Aplicada às Ciências Sociais 6ed. Editora da UFSC, 2006.
Planejamento da pesquisa e análise Planejamento da pesquisa e análise
estatísticaestatística
• A análise estatística dos dados depende:
– da forma como a pesquisa foi conduzida (p. ex., experimentos
que geram amostras independentes ou pareadas) e
– do tipo de dados gerado pela pesquisa (variável-resposta
quantitativa ou categórica)
PEDRO A. BARBETTA – Estatística Aplicada às Ciências Sociais 6ed. Editora da UFSC, 2006.
Planejamento do experimento:Planejamento do experimento:
amostras independentesamostras independentes
• Exemplo: experimento para comparação de dois métodos
de ensino.
Crianças selecionadas para o experimento:
☺ ☺ ☺ ☺
☺ ☺☺ ☺
Método BMétodo A
Notas das crianças
provindas do método B
Notas das crianças
provindas do método A
Divisão aleatória
PEDRO A. BARBETTA – Estatística Aplicada às Ciências Sociais 6ed. Editora da UFSC, 2006.
Planejamento do experimento:Planejamento do experimento:
amostras pareadasamostras pareadas
• Exemplo: experimento para comparação de dois métodos
de ensino.
Pares de
indivíduos
similares:
☺
☺
Método A
Método B
...
Em ordem
aleatória dentro
de cada par.
PEDRO A. BARBETTA – Estatística Aplicada às Ciências Sociais 6ed. Editora da UFSC, 2006.
Planejamento do experimento:Planejamento do experimento:
amostras independentes X amostras pareadasamostras independentes X amostras pareadas
• Dados gerados
Nota Nota
Par (método A) (método B)
1 X11 X21
2 X12 X22
... ... ...
n X1n X2n
Amostras independentes Amostras pareadas
Nota Nota
(método A) (método B)
X11 X21
X12 X22
... ...
X1n1 X1n2
PEDRO A. BARBETTA – Estatística Aplicada às Ciências Sociais 6ed. Editora da UFSC, 2006.
Testes estatísticosTestes estatísticos
• Os testes estatísticos permitem avaliar se as diferenças
observadas entre os dois grupos podem ser meramente
justificadas por fatores casuais (H0), ou se tais diferenças
são reais (H1).
PEDRO A. BARBETTA – Estatística Aplicada às Ciências Sociais 6ed. Editora da UFSC, 2006.
Testes dos sinaisTestes dos sinais
• Amostra pareada
• Em cada par tem-se apenas uma avaliação qualitativa:
+ (diferença no par compatível com H1) ou
– (diferença no par ao contrário do que afirma H1)
• Hipóteses (π = probab. de + num dado par):
H0: π = 0,5
H1: π ≠ 0,5 (podendo também ser unilateral)
PEDRO A. BARBETTA – Estatística Aplicada às Ciências Sociais 6ed. Editora da UFSC, 2006.
Exemplo 11.3(a)Exemplo 11.3(a)
• Com o objetivo de avaliar o efeito de um programa de
treinamento sobre a produtividade dos funcionários de uma
certa empresa, fez-se um estudo em que se observou a
produtividade de uma amostra de funcionários antes e depois
do programa de treinamento.
PEDRO A. BARBETTA – Estatística Aplicada às Ciências Sociais 6ed. Editora da UFSC, 2006.
Exemplo 11.3(a)Exemplo 11.3(a)
ANTES DEPOISTREINAMENTO
Melhorou
ou piorou?
PEDRO A. BARBETTA – Estatística Aplicada às Ciências Sociais 6ed. Editora da UFSC, 2006.
Exemplo 11.3(a)Exemplo 11.3(a)
• Hipóteses:
H0: π = 0,5
H1: π > 0,5
π = probabilidade melhorar (para um dado funcionário)
• Experimento com n = 10 funcionários,
observados antes e depois do treinamento
PEDRO A. BARBETTA – Estatística Aplicada às Ciências Sociais 6ed. Editora da UFSC, 2006.
Exemplo 11.3(a)Exemplo 11.3(a)
Resultado do experimento:
• Dos 10 funcionários, 7 melhoraram.
– Qual é o valor-p?
– Qual é a conclusão?
PEDRO A. BARBETTA – Estatística Aplicada às Ciências Sociais 6ed. Editora da UFSC, 2006.
p = 0,172 ou 17,2%
Exemplo 11.3(a) :Exemplo 11.3(a) :
uso da distribuição binomialuso da distribuição binomial
valor esperado
por H0
x
0.0010.010
0.044
0.117
0.205
0.246
0.205
0.117
0.044
0.0100.001
0 1 2 3 4 5 6 7 8 9 10
PEDRO A. BARBETTA – Estatística Aplicada às Ciências Sociais 6ed. Editora da UFSC, 2006.
Exemplo 11.3(a)Exemplo 11.3(a)
• Adotando α = 5%
• p = 17,2% > α ==> O teste aceita H0
• Não se pode afirmar que o programa de
treinamento realmente aumenta a
produtividade dos funcionários
PEDRO A. BARBETTA – Estatística Aplicada às Ciências Sociais 6ed. Editora da UFSC, 2006.
Teste t para dados pareadosTeste t para dados pareados
• Amostra pareada
• Em cada par tem-se uma avaliação quantitativa (medidas
quantitativas da variável-resposta X)
• Supõe-se que a distribuição de X seja aprox. normal
• Hipóteses feitas em termos de médias (ou valores
esperados):
H0: µ1 = µ2
H1: µ1 ≠ µ2 (podendo também ser unilateral)
PEDRO A. BARBETTA – Estatística Aplicada às Ciências Sociais 6ed. Editora da UFSC, 2006.
Exemplo 11.3(b)Exemplo 11.3(b)
ANTES DEPOISTREINAMENTO
De quanto
foi a
variação?
PEDRO A. BARBETTA – Estatística Aplicada às Ciências Sociais 6ed. Editora da UFSC, 2006.
Hipóteses:
H0: µdepois = µantes
H1: µdepois > µantes
µantes: produtividade esperada antes do
programa
µdepois: produtividade esperada depois do
programa
Exemplo 11.3(b)Exemplo 11.3(b)
PEDRO A. BARBETTA – Estatística Aplicada às Ciências Sociais 6ed. Editora da UFSC, 2006.
Exemplo 11.3(b): Exemplo 11.3(b): amostrasamostras
Produtividade
Func. antes depois diferença
João 22 25 3
Maria 21 28 7
José 28 26 -2
Pedro 30 36 6
Rita 33 32 -1
Joana 33 39 6
Flávio 26 28 2
Paulo 24 33 9
Catarina 31 30 -1
Felipe 22 27 5
PEDRO A. BARBETTA – Estatística Aplicada às Ciências Sociais 6ed. Editora da UFSC, 2006.
Exemplo 11.3(b): Exemplo 11.3(b): amostrasamostras
Produtividade
Func. antes depois diferença
João 22 25 3
Maria 21 28 7
José 28 26 -2
Pedro 30 36 6
Rita 33 32 -1
Joana 33 39 6
Flávio 26 28 2
Paulo 24 33 9
Catarina 31 30 -1
Felipe 22 27 5
Média amostral das diferenças: 3,4
Desvio padrão amostral das diferenças: 3,81
n
D
D ∑=
1
22
−
−
= ∑
n
DnD
SD
PEDRO A. BARBETTA – Estatística Aplicada às Ciências Sociais 6ed. Editora da UFSC, 2006.
-2 0 2 4 6 8 10
A análise é feita com a variável
diferença: D = depois - antes
D: 3, 7, -2, 6, -1, 6, 2, 9, -1, 5
Valor esperado
de D, µD, sob H0
Exemplo 11.3(b): Exemplo 11.3(b): amostrasamostras
Média dos valores
observados de D:
4,3=D
PEDRO A. BARBETTA – Estatística Aplicada às Ciências Sociais 6ed. Editora da UFSC, 2006.
Estatística do testeEstatística do teste
S
n . D =t
D
onde
n: número de pares (antes, depois) observados;
: média das diferenças observadas e
SD : desvio padrão das diferenças observadas
D
PEDRO A. BARBETTA – Estatística Aplicada às Ciências Sociais 6ed. Editora da UFSC, 2006.
3,4 =
10
34 =
n
D = D ∑ 3,81 =
1 10
)(10).(3,4 246 =
1 n
D.n D = S
222
D −
−
−
−∑
Exemplo 11.3(b):Exemplo 11.3(b): resultadosresultados
Produtividade
Func. antes depois diferença
João 22 25 3
Maria 21 28 7
José 28 26 -2
Pedro 30 36 6
Rita 33 32 -1
Joana 33 39 6
Flávio 26 28 2
Paulo 24 33 9
Catarina 31 30 -1
Felipe 22 27 5
Média amostral das diferenças: 3,4
Desvio padrão amostral das diferenças: 3,81
2,82 =
3,81
10 . 3,4 =
S
n . D =t
D
PEDRO A. BARBETTA – Estatística Aplicada às Ciências Sociais 6ed. Editora da UFSC, 2006.
Distribuição de referênciaDistribuição de referência
• Assumindo que D tenha distrib. normal, sob H0, t tem
distrib. “t” com gl = n - 1.
-4 -3 -2 -1 0 1 2 3 4
0
0,1
0,2
0,3
0,4
t
f(t)
Possíveis valores da estatística t
PEDRO A. BARBETTA – Estatística Aplicada às Ciências Sociais 6ed. Editora da UFSC, 2006.
0 t = 2,82
P = 0,010 (tabela t)
Distrib. de referência: t com gl = n - 1 = 9
Exemplo 11.3(b): Exemplo 11.3(b): obtenção do valorobtenção do valor--pp
PEDRO A. BARBETTA – Estatística Aplicada às Ciências Sociais 6ed. Editora da UFSC, 2006.
Exemplo 11.3(b):Exemplo 11.3(b): uso da Tabela tuso da Tabela t
p = 0,01
gl 0,25 0,1 0,05 0,025 0,01 0,005
...
9 0,703 1,383 1,833 2,262 2,821 3,250
...
Área na cauda superior
Amostras
t = 2,82
gl = 9
PEDRO A. BARBETTA – Estatística Aplicada às Ciências Sociais 6ed. Editora da UFSC, 2006.
• O teste rejeita H0 ao nível de significância de
5%.
• O programa de treinamento aumenta a
produtividade dos funcionários
Exemplo 11.3(b): Exemplo 11.3(b): conclusãoconclusão
PEDRO A. BARBETTA – Estatística Aplicada às Ciências Sociais 6ed. Editora da UFSC, 2006.
Teste t para amostras independentesTeste t para amostras independentes
• Amostras independentes
• Variável-resposta X quantitativa)
• Supõe-se que a distribuição de X em cada grupo seja
aprox. normal
• Supõe-se que as variâncias sejam aproximadamente
iguais nos dois grupos
• Hipóteses feitas em termos de médias (ou valores
esperados):
H0: µ1 = µ2
H1: µ1 ≠ µ2 (podendo também ser unilateral)
PEDRO A. BARBETTA – Estatística Aplicada às Ciências Sociais 6ed. Editora da UFSC, 2006.
Exemplo 11.7Exemplo 11.7
Problema: comparação de dois métodos de ensino.
H0: Em média, os dois métodos produzem os mesmos resultados;
H1: Em média, os dois métodos produzem resultados diferentes.
ou H0: µ1 = µ2 e H1: µ1 ≠ µ2
µ1: nota média de indivíduos submetidos ao método A de ensino;
µ2: nota média de indivíduos submetidos ao método B de ensino.
PEDRO A. BARBETTA – Estatística Aplicada às Ciências Sociais 6ed. Editora da UFSC, 2006.
Exemplo 11.7: Exemplo 11.7: o experimentoo experimento
Crianças selecionadas para o experimento:
☺ ☺ ☺ ☺
☺ ☺☺ ☺
Método BMétodo A
Notas das crianças
provindas do método B
Notas das crianças
provindas do método A
Divisão aleatória
(Grupo 1 de valores) (Grupo 2 de valores)
PEDRO A. BARBETTA – Estatística Aplicada às Ciências Sociais 6ed. Editora da UFSC, 2006.
Exemplo 11.7: Exemplo 11.7: amostrasamostras
Grupo 1 Grupo 2
45 45
51 35
50 43
62 59
43 48
42 45
53 41
50 43
48 49
55 39
Média 49,9 44,7
Variância 35,66 42,23
30 35 40 45 50 55 60 65
nota
método A
método B
PEDRO A. BARBETTA – Estatística Aplicada às Ciências Sociais 6ed. Editora da UFSC, 2006.
A importância da análise da variabilidadeA importância da análise da variabilidade
a) Evidência de grupos diferentes
b) Não evidência de grupos diferentes
PEDRO A. BARBETTA – Estatística Aplicada às Ciências Sociais 6ed. Editora da UFSC, 2006.
A estatística do testeA estatística do teste
onde 2
2
2
2
12 SSSa
+
=
( ) 221 2 aS
n
XX t = ⋅−
a) Se n1 = n2 = n b) Se n1 ≠ n2
n
+
n
.S
X X t =
a
21
21
11
−
( ) ( )
gl
Sn + Sn = Sa
2
2
21
2
12 11 ⋅−⋅−
gl = n1 + n2 – 2: gl = 2n - 2 e
PEDRO A. BARBETTA – Estatística Aplicada às Ciências Sociais 6ed. Editora da UFSC, 2006.
( ) ( ) 86,1
)95,38(2
1070,4490,49
2 221
=⋅−=⋅−
aS
n
XX t =
Exemplo 11.7: Exemplo 11.7: resultadosresultados
95,38
2
89,77
2
25,4264,35
2
2
2
2
12 ==
+
=
+
=
SSSa
Amostra 1 Amostra 2
n 10 10
média 49,9 44,7
variância 35,66 42,23
PEDRO A. BARBETTA – Estatística Aplicada às Ciências Sociais 6ed. Editora da UFSC, 2006.
Exemplo 11.7: Exemplo 11.7: uso da tabela tuso da tabela t
gl 0,25 0,1 0,05 0,025 0,01 0,005
...
18 0,688 1,33 1,734 2,101 2,552 2,878
...
Área na cauda superiorAmostras
t = 1,86
gl = 18
0 t = 1,86
Pela tabela t :
área entre 0,025
e 0,05
0 1,86
Valor p entre
0,05 e 0,10
-1,86
Como o teste é
bilateral:
PEDRO A. BARBETTA – Estatística Aplicada às Ciências Sociais 6ed. Editora da UFSC, 2006.
Valor p > 0,05 (nível de significância α
adotado).
Então o teste aceita H0 ao nível de
significância de 5%.
Os dados não comprovam diferença entre os
dois métodos de ensino.
Exemplo 11.7: Exemplo 11.7: conclusãoconclusão
PEDRO A. BARBETTA – Estatística Aplicada às Ciências Sociais 6ed. Editora da UFSC, 2006.
Teste tTeste t
• Ver, no livro, exemplo com amostras de tamanho
diferentes (Exemplo 11.8).
• Ver, no livro, exemplos de teste t em estudos não-
experimentais (amostras obtidas em levantamentos por
amostragem) (Exemplos 11.2 e 11.8).
PEDRO A. BARBETTA – Estatística Aplicada às Ciências Sociais 6ed. Editora da UFSC, 2006.
• Como medir e testar a significância da associação entre
duas variáveis qualitativas (Capítulo 12)
• Como estudar a correlação entre duas variáveis
quantitativas (Capítulo 13)
• Como construir modelos para o relacionamento entre
duas variáveis (Capítulo 13)
PEDRO A. BARBETTA – Estatística Aplicada às Ciências Sociais 6ed. Editora da UFSC, 2006.
Estatística Aplicada às Ciências SociaisEstatística Aplicada às Ciências Sociais
Sexta EdiçãoSexta Edição
Pedro Alberto Barbetta
Florianópolis: Editora da UFSC, 2006
Cap. 12 Cap. 12 –– Análise de dados Análise de dados
categorizadoscategorizados
PEDRO A. BARBETTA – Estatística Aplicada às Ciências Sociais 6ed. Editora da UFSC, 2006.
Comparação entre amostrasComparação entre amostras
• Comparação entre amostras em que a variável-resposta
é qualitativa (categórica).
– Exemplo: comparação entre amostras de homens e de mulheres
quanto ao tabagismo (fumante ou não-fumante)
• Como testar, com base em amostras, se as populações
que geraram as amostras têm a mesma distribuição de
probabilidades em termos das categorias da variável-
resposta? (Teste de homogeneidade qui-quadrado)
PEDRO A. BARBETTA – Estatística Aplicada às Ciências Sociais 6ed. Editora da UFSC, 2006.
Análise de associaçãoAnálise de associação
• Existe associação entre duas variáveis se o conhecimento
de uma altera a probabilidade de algum resultado da
outra.
– Exemplo: Clima (chuvoso ou ensolarado) e ir à praia (sim ou
não)
• Como testar se existe associação entre duas variáveis
qualitativas? (Teste de associação qui-quadrado)
• Como medir o grau de associação descrita pelos dados
amostrais? (Coeficientes de associação)
PEDRO A. BARBETTA – Estatística Aplicada às Ciências Sociais 6ed. Editora da UFSC, 2006.
Teste de associação Teste de associação quiqui--quadradoquadrado
(equivalente ao teste de homogeneidade qui-quadrado)
• Exemplo 12.1: Existe associação entre sexo (homem ou
mulher) e tabagismo (fumante ou não-fumante)?
• Hipóteses:
– H0: Sexo e tabagismo são variáveis independentes na população
em estudo.
– H1: Existe associação entre as variáveis sexo e tabagismo, na
população em estudo.
ou:
H0: πh = πm e H1: πh ≠ πm
πh = probabilidade de um homem ser fumante
πm = probabilidade de uma mulher ser fumante
PEDRO A. BARBETTA – Estatística Aplicada às Ciências Sociais 6ed. Editora da UFSC, 2006.
Exemplo 12.1: Exemplo 12.1: os dadosos dados
(100)(100)(100)(%)
300100200Total
(56,7)(62)(54)(%)
17062108não-fumante
(43,3)(38)(46)(%)
1303892fumante
Total (%)femininomasculinoTabagismo
Sexo
PEDRO A. BARBETTA – Estatística Aplicada às Ciências Sociais 6ed. Editora da UFSC, 2006.
Exemplo 12.1: Exemplo 12.1: os cálculosos cálculos
Sexo
Tabagismo masculino feminino Total
fumante67,86
300
200130
=
×
=E 33,43
300
100130
=
×
=E 130
não fumante 33,113
300
200170
=
×
=E 67,56
300
100170
=
×
=E 170
Total 200 100 300
( ) ( )
( )ltotal gera
olunatotal da c inhatotal da lE = ×
PEDRO A. BARBETTA – Estatística Aplicada às Ciências Sociais 6ed. Editora da UFSC, 2006.
Exemplo 12.1: Exemplo 12.1: os cálculosos cálculos
( )∑ −=χ E
EO 22Estatística do teste:
Sexo
Tabagismo masculino feminino
fumante ( ) 328,0
67,86
67,8692 2
=
− ( ) 656,0
33,43
33,4338 2
=
−
não fumante ( ) 251,0
33,113
33,113108 2
=
− ( ) 501,0
67,56
67,5662 2
=
−
χ2 = 0,328 + 0,656 + 0,251 + 0,501 = 1,74
PEDRO A. BARBETTA – Estatística Aplicada às Ciências Sociais 6ed. Editora da UFSC, 2006.
Distribuição de referênciaDistribuição de referência
• Sob H0, os possíveis valores de χ2 seguem uma
distribuição qui-quadrado com graus de liberdade:
onde l é o número de linhas e c é o número de colunas
da tabela.
• Supõe-se que as amostras sejam razoavelmente grandes
(todas as freqüências esperadas pelo menos iguais a
cinco).
( ) ( )11 −⋅−= cgl l
PEDRO A. BARBETTA – Estatística Aplicada às Ciências Sociais 6ed. Editora da UFSC, 2006.
VValoralor--pp
x
f(x)
χ2
valor p
Amostra
Ver Tabela 6 no apêndice do livro
PEDRO A. BARBETTA – Estatística Aplicada às Ciências Sociais 6ed. Editora da UFSC, 2006.
Exemplo 12.1: Exemplo 12.1: uso da Tabela uso da Tabela QuiQui--quadradoquadrado
Valor p entre 0,10 e 0,25. Portanto, o teste
aceita H0 ao nível de significância de 5%.
x
f(x)
χ2 = 1,74
0,10 < valor p < 0,25
PEDRO A. BARBETTA – Estatística Aplicada às Ciências Sociais 6ed. Editora da UFSC, 2006.
Correção em tabelas Correção em tabelas 2 x 22 x 2
• No cálculo do qui-quadrado, subtrai-se 0,5 unidades na
magnitude da diferença entre as freqüências observada e
esperada, em cada casela.
( )
∑
−−
=
2
2 50
E
,EO
χ
Refazer o Exemplo 12.1
PEDRO A. BARBETTA – Estatística Aplicada às Ciências Sociais 6ed. Editora da UFSC, 2006.
Medidas de associaçãoMedidas de associação
• Um coeficiente de associação descreve, em termos das
amostras observadas, o quanto os dados de duas
variáveis se mostram associados.
• É uma medida descritiva da(s) amostra(s). Não é uma
inferência como o teste qui-quadrado!
• Em geral, os coeficientes geram valores entre 0
(independência) e 1 (associação perfeita)
PEDRO A. BARBETTA – Estatística Aplicada às Ciências Sociais 6ed. Editora da UFSC, 2006.
Coeficiente de contingênciaCoeficiente de contingência
χ
χ
2
2
+ n
C =
PEDRO A. BARBETTA – Estatística Aplicada às Ciências Sociais 6ed. Editora da UFSC, 2006.
Coeficiente de contingência modificadoCoeficiente de contingência modificado
)()1( 2
2
χ⋅−
χ⋅
+n k
kC* =
onde k é o menor valor entre l (número de linhas da tabela)
e c (número de colunas da tabela).
PEDRO A. BARBETTA – Estatística Aplicada às Ciências Sociais 6ed. Editora da UFSC, 2006.
Exemplo: Exemplo: coeficiente de contingência modificadocoeficiente de contingência modificado
Tabagismo homem mulher
fumante 80 (40%) 40 (40%)
não-fumante 120 (60%) 60 (60%)
Total 200 (100%) 100 (100%)
Sexo
Amostra A
Tabagismo homem mulher
fumante 200 (100%) 0 (0%)
não-fumante 0 (0%) 100 (100%)
Total 200 (100%) 100 (100%)
Amostra B
Sexo
0 =
300)+(01)(2
(0)(2)
=
⋅−
⋅C*
Independência!
C* 1 =
300)+(3001)(2
(300)(2)
=
⋅−
⋅
Associação perfeita!
Ver, no livro, outros coeficientes de associação.
PEDRO A. BARBETTA – Estatística Aplicada às Ciências Sociais 6ed. Editora da UFSC, 2006.
Estatística Aplicada às Ciências SociaisEstatística Aplicada às Ciências Sociais
Sexta EdiçãoSexta Edição
Pedro Alberto Barbetta
Florianópolis: Editora da UFSC, 2006
Cap. 13 Cap. 13 –– Correlação e Correlação e
RegressãoRegressão
PEDRO A. BARBETTA – Estatística Aplicada às Ciências Sociais 6ed. Editora da UFSC, 2006.
CorrelaçãoCorrelação
• X e Y variáveis quantitativas
X Y
PEDRO A. BARBETTA – Estatística Aplicada às Ciências Sociais 6ed. Editora da UFSC, 2006.
CorrelaçãoCorrelação
• X e Y estão positivamente correlacionadas
quando elas caminham num mesmo
sentido;
• Estão negativamente correlacionadas
quando elas caminham em sentidos
opostos.
PEDRO A. BARBETTA – Estatística Aplicada às Ciências Sociais 6ed. Editora da UFSC, 2006.
CorrelaçãoCorrelação
• Correlação não implica relação de causa-e-
efeito
PEDRO A. BARBETTA – Estatística Aplicada às Ciências Sociais 6ed. Editora da UFSC, 2006.
ExemploExemplo
• Amostra de municípios. Variáveis:
– DistCap: distância à capital da respectiva Unidade da
Federação.
– EspVida: esperança de vida ao nascer
– MortInf: mortalidade (número médio de mortes em
1.000) até um ano de idade.
– Alfab: taxa de alfabetização (percentagem da
população adulta alfabetizada).
– Renda: renda per capita do município (R$).
PEDRO A. BARBETTA – Estatística Aplicada às Ciências Sociais 6ed. Editora da UFSC, 2006.
Tabela 13.1Tabela 13.1
125,7581,8237,0467,42167Ipaba (MG)
196,5190,4332,8168,6814Vespasiano (MG)
58,6859,7251,5762,45175Jandaíra (BA)
80,6969,9544,1864,4665Malhada dos Bois (SE)
264,5589,2815,6971,3683Paraíba do Sul (RJ)
150,6777,5416,6271,01486São José das Palmeiras (PR)
60,0065,8147,0863,6540Lagoa do Piauí (PI)
173,3883,3831,7168,10468Campo Erê (SC)
65,3479,3366,0558,9678Porto Rico do Maranhão (MA)
66,9663,6463,3259,58150Monção (MA)
74,7963,0056,5661,19278Nova Redenção (BA)
188,2986,2323,1967,99365Araruna (PR)
RendaAlfabMortInfEspVidaDistCapMunicípio
Fonte: Atlas de Desenvolvimento Humano (www.pnud.org.br/atlas)
PEDRO A. BARBETTA – Estatística Aplicada às Ciências Sociais 6ed. Editora da UFSC, 2006.
Diagrama de dispersão:Diagrama de dispersão:
y
x
59
61
63
65
67
69
100 150 200 250 300 350 400
PEDRO A. BARBETTA – Estatística Aplicada às Ciências Sociais 6ed. Editora da UFSC, 2006.
Tabela 13.1Tabela 13.1 Diagramas de dispersão:Diagramas de dispersão:
Interpretar a correlação entre as duas variáveis.
50 150 250
60
70
80
90
Renda per capita (R$)
Ta
xa
d
e
al
fa
be
tiz
aç
ão
(%
)
PEDRO A. BARBETTA – Estatística Aplicada às Ciências Sociais 6ed. Editora da UFSC, 2006.
Tabela 13.1Tabela 13.1 Diagramas de dispersão:Diagramas de dispersão:
Interpretar a correlação entre as duas variáveis.
60 65 70
15
25
35
45
55
65
Esperança de vida ao nascer
Ta
xa
d
e
m
or
ta
lid
ad
e
in
fa
nt
il
PEDRO A. BARBETTA – Estatística Aplicada às Ciências Sociais 6ed. Editora da UFSC, 2006.
Tabela 13.1Tabela 13.1 Diagramas de dispersão:Diagramas de dispersão:
Interpretar a correlação entre as duas variáveis.
15 25 35 45 55 65
60
70
80
90
Taxa de mortalidade infantil
Ta
xa
d
e
al
fa
be
tiz
aç
ão
(%
)
PEDRO A. BARBETTA – Estatística Aplicada às Ciências Sociais 6ed. Editora da UFSC, 2006.
Tabela 13.1Tabela 13.1 Diagramas de dispersão:Diagramas de dispersão:
Interpretar a correlação entre as duas variáveis.
5004003002001000
90
80
70
60
Distância à capital (km)
Ta
xa
d
e
al
fa
be
tiz
aç
ão
(%
)
PEDRO A. BARBETTA – Estatística Aplicada às Ciências Sociais 6ed. Editora da UFSC, 2006.
Correlação não linearCorrelação não linear
PEDRO A. BARBETTA – Estatística Aplicada às Ciências Sociais 6ed. Editora da UFSC, 2006.
Coeficiente de CorrelaçãoCoeficiente de Correlação
• Não deve depender da unidade de medida das variáveis
• Padronização (x, y) (x’, y’) para cada par de valores:
S
X x = x
x
−′
S
Y y = y
y
−′
Média dos valores de X
Desvio padrão dos valores de X
Média dos valores de XMédia dos valores de Y
Desvio padrão dos valores de Y
PEDRO A. BARBETTA – Estatística Aplicada às Ciências Sociais 6ed. Editora da UFSC, 2006.
Efeito da padronizaçãoEfeito da padronização
0
2
4
6
8
10
12
14
0 2 4 6 8
y
x
( )yx,
PEDRO A. BARBETTA – Estatística Aplicada às Ciências Sociais 6ed. Editora da UFSC, 2006.
PadronizaçãoPadronização
-2
-1
0
1
2
-2 -1 0 1 2
y'
x'
(0, 0)
PEDRO A. BARBETTA – EstatísticaAplicada às Ciências Sociais 6ed. Editora da UFSC, 2006.
Padronização Padronização -- Exemplo 13.1Exemplo 13.1
PEDRO A. BARBETTA – Estatística Aplicada às Ciências Sociais 6ed. Editora da UFSC, 2006.
Idéia de construção do Idéia de construção do CoefCoef. de Correlação de . de Correlação de
PearsonPearson
Considere os produtos dos valores padronizados:
x’·y’
S
X x = x
x
−′
S
Y y = y
y
−′
PEDRO A. BARBETTA – Estatística Aplicada às Ciências Sociais 6ed. Editora da UFSC, 2006.
Sinais dos produtos dos valores padronizados:Sinais dos produtos dos valores padronizados:
Quadrante com
x’·y’ negativos
Quadrante com
x’·y’ positivos
Quadrante com
x’·y’ negativos
Quadrante com
x’·y’ positivos
x’
y’
PEDRO A. BARBETTA – Estatística Aplicada às Ciências Sociais 6ed. Editora da UFSC, 2006.
Sinais dos produtos dos valores padronizados:Sinais dos produtos dos valores padronizados:
x’
y’
Quadrante com
x’·y’ positivos
Quadrante com
x’·y’ positivos
0'' >⋅∑ yx
PEDRO A. BARBETTA – Estatística Aplicada às Ciências Sociais 6ed. Editora da UFSC, 2006.
Sinais dos produtos dos valores padronizados:Sinais dos produtos dos valores padronizados:
x’
y’
0'' <⋅∑ yx
Quadrante com
x’·y’ negativos
Quadrante com
x’·y’ negativos
PEDRO A. BARBETTA – Estatística Aplicada às Ciências Sociais 6ed. Editora da UFSC, 2006.
Sinais dos produtos dos valores padronizados:Sinais dos produtos dos valores padronizados:
x’
y’Quadrante com
x’·y’ negativos
Quadrante com
x’·y’ negativos
Quadrante com
x’·y’ positivos
Quadrante com
x’·y’ positivos
0'' ≈⋅∑ yx
PEDRO A. BARBETTA – Estatística Aplicada às Ciências Sociais 6ed. Editora da UFSC, 2006.
Idéia de construção do Idéia de construção do CoefCoef. de Correlação de . de Correlação de PearsonPearson
• Padronização (x, y) (x’, y’) :
( )
1
''
−
⋅∑
n
yx
r = Coef. de Correlação de Pearson::
S
X x = x
x
−′
S
Y y = y
y
−′
Mede a correlação linear entre X e Y.
PEDRO A. BARBETTA – Estatística Aplicada às Ciências Sociais 6ed. Editora da UFSC, 2006.
Exemplo 13.1Exemplo 13.1
( )
981,0
7
87,6
==
−
′⋅′∑
1n
yx
= r
PEDRO A. BARBETTA – Estatística Aplicada às Ciências Sociais 6ed. Editora da UFSC, 2006.
Valores possíveis de Valores possíveis de rr e interpretação da correlaçãoe interpretação da correlação
+1
0
-1
Sentido Força
Negativa
Ausência
Forte
Moderada
Fraca
Positiva
Fraca
ModeradaModerada
Forte
Valor
de r
PEDRO A. BARBETTA – Estatística Aplicada às Ciências Sociais 6ed. Editora da UFSC, 2006.
Matriz de correlações. Dados da Matriz de correlações. Dados da TabTab. 13.1. 13.1
Interpretar.
10,863-0,8600,8650,205RENDA
0,8631-0,6840,7180,087ALF
-0,860-0,6841-0,983-0,400MORTINF
0,8650,718-0,98310,337ESPVIDA
0,2050,087-0,4000,3371DISTCAP
RENDAALFMORTINFESPVIDADISTCAP
PEDRO A. BARBETTA – Estatística Aplicada às Ciências Sociais 6ed. Editora da UFSC, 2006.
Fórmula direta de calcular Fórmula direta de calcular rr
( ) ( ) ( )
( ) ( )2222 Y Yn X Xn
YX YXnr =
∑−∑⋅∑−∑⋅
∑⋅∑−⋅∑⋅
Ver exemplo desses cálculos no livro (Tabela 13.3)
Ver, também, no livro:
- Teste de hipóteses sobre a correlação
- Correlação com variáveis indicadoras
- Correlação por postos
PEDRO A. BARBETTA – Estatística Aplicada às Ciências Sociais 6ed. Editora da UFSC, 2006.
Regressão linear simplesRegressão linear simples
• A análise de regressão é geralmente feita sob um
referencial teórico que justifique a adoção de alguma
relação matemática de causalidade.
X Y
Variável independente ou
Variável explicativa
Variável dependente ou
Variável resposta
PEDRO A. BARBETTA – Estatística Aplicada às Ciências Sociais 6ed. Editora da UFSC, 2006.
• Predizer valores de uma variável dependente (Y) em
função de uma variável independente (X).
• Conhecer o quanto variações de X podem afetar Y.
Regressão linear simplesRegressão linear simples
PEDRO A. BARBETTA – Estatística Aplicada às Ciências Sociais 6ed. Editora da UFSC, 2006.
Exemplos de regressão:Exemplos de regressão:
Preço do imóvel (R$)
Área construída do imóvel (m2)
Tempo de resposta do sistema
(segundos)
Memória RAM do computador
(Gb)
Número de defeitos nos produtosGasto com o controle da
qualidade (R$)
Consumo (R$)Renda
Variável dependente
(Y)
Variável
independente (X)
PEDRO A. BARBETTA – Estatística Aplicada às Ciências Sociais 6ed. Editora da UFSC, 2006.
RegressãoRegressão
Amostra de observações
de (X, Y)
Conhecer o relacionamento
entre X e Y
PEDRO A. BARBETTA – Estatística Aplicada às Ciências Sociais 6ed. Editora da UFSC, 2006.
Regressão Regressão -- ModeloModelo
Y =
Predito por X, se-
gundo uma função Efeito aleatório+
Parâmetros
Regressão
Linear
Simples
eβ.xαy ++=
PEDRO A. BARBETTA – Estatística Aplicada às Ciências Sociais 6ed. Editora da UFSC, 2006.
Pressupostos do modelo de regressãoPressupostos do modelo de regressão
• Os erros (e´s) são independentes e variam
aleatoriamente segundo uma distribuição (normal) com
média zero e variância constante.
eβ.xαy ++=
PEDRO A. BARBETTA – Estatística Aplicada às Ciências Sociais 6ed. Editora da UFSC, 2006.
Estimativas dos parâmetros Estimativas dos parâmetros αα e e ββ
• Construção da equação de regressão com base nos dados:
160
164
168
172
176
180
160 164 168 172 176 180
Altura média dos pais ( X )
A
lt
u
ra
d
o
fil
h
o
( Y
)
bxay +=ˆ
PEDRO A. BARBETTA – Estatística Aplicada às Ciências Sociais 6ed. Editora da UFSC, 2006.
Estimativas dos parâmetros Estimativas dos parâmetros αα e e ββ
• Construção da equação de regressão com base nos dados:
bxay +=ˆ
( ) ( ) ( )
( )22 X Xn
YX YXnb =
∑−∑⋅
∑⋅∑−⋅∑⋅
n
X bY a = ∑⋅−∑
(estimativa do beta)
(estimativa do alfa)
PEDRO A. BARBETTA – Estatística Aplicada às Ciências Sociais 6ed. Editora da UFSC, 2006.
Estimativas dos parâmetros Estimativas dos parâmetros αα e e ββ
• Construção da equação de
regressão com base nos dados.
Exemplo 13.5:
X Y X 2 X ·Y
164 166 26.896 27.224
166 166 27.556 27.556
169 171 28.561 28.899
169 166 28.561 28.054
171 171 29.241 29.241
173 171 29.929 29.583
173 178 29.929 30.794
176 173 30.976 30.448
178 178 31.684 31.684
1.539 1.540 263.333 263.483
Dados Cálculos
( ) ( ) ( )
( )22 X Xn
YX YXnb =
∑−∑⋅
∑⋅∑−⋅∑⋅
n
X bY a = ∑⋅−∑
0,872 =
1.476
1.287 =
)(1.539 (263.333)9
(1.540)(1.539) (263.483)9
= 2−⋅
⋅−⋅
b
22,00 =
9
.539)(0,872).(1 1.540 = −a
PEDRO A. BARBETTA – Estatística Aplicada às Ciências Sociais 6ed. Editora da UFSC, 2006.
Estimativas dos parâmetros Estimativas dos parâmetros αα e e ββ
• Construção da equação de regressão com base nos dados.
Exemplo:
164
166
168
170
172
174
176
178
180
160 165 170 175 180
Altura média dos pais (X)
A
ltu
ra
d
o
fil
ho
(Y
)
xy 872,022ˆ +=
PEDRO A. BARBETTA – Estatística Aplicada às Ciências Sociais 6ed. Editora da UFSC, 2006.
Valores preditos e resíduosValores preditos e resíduos
x y Predito Resíduo
164 166 165,01 0,992
166 166 166,75 -0,752
169 171 169,37 1,632
169 166 169,37 -3,368
171 171 171,11 -0,112
173 171 172,86 -1,856
173 178 172,86 5,144
176 173 175,47 -2,472
178 178 177,22 0,784
xy 872,022ˆ +=
yye ˆˆ −=
PEDRO A. BARBETTA – Estatística Aplicada às Ciências Sociais 6ed. Editora da UFSC, 2006.
Valores preditos e resíduosValores preditos e resíduos
164 168 172 176
164
168
172
176
y
x
Resíduo associado ao oitavo
elemento da amostra.47,175ˆ8 =y
1738 =y
PEDRO A. BARBETTA – Estatística Aplicada às Ciências Sociais 6ed. Editora da UFSC, 2006.
Variação explicada e nãoVariação explicada e não--explicadaexplicada
164 168 172 176
164
168
172
176
y
x
xy )872,0(22ˆ +=
164 168 172 176
164
168
172
176
y
x
11,171=y
Variação explicada
pelo modelo de regressão
Variação em relação à média
aritmética (variação total)
Soma de quadrados devida ao
erro aleatório:
Soma de quadrado total:
( )2∑ −= yySQT
( )2ˆ∑ −= yySQE
PEDRO A. BARBETTA – Estatística Aplicada às Ciências Sociais 6ed. Editora da UFSC, 2006.
Variação explicada e nãoVariação explicada e não--explicadaexplicadaSoma de quadrado total: ( )2∑ −= yySQT
Soma de quadrados do erro: ( )2ˆ∑ −= yySQE
Soma de quadrados da regressão: SQESQTSQR −=
Coeficiente de determinação:
totalvariação
explicadavariação
SQT
SQRR ==2
10 2 ≤≤ R
PEDRO A. BARBETTA – Estatística Aplicada às Ciências Sociais 6ed. Editora da UFSC, 2006.
Variação explicada e nãoVariação explicada e não--explicada. explicada. Exemplo 13.5Exemplo 13.5
x y
164 166 -5,11 26,11
166 166 -5,11 26,11
169 171 -0,11 0,01
169 166 -5,11 26,11
171 171 -0,11 0,01
173 171 -0,11 0,01
173 178 6,89 47,47
176 173 1,89 3,57
178 178 6,89 47,47
0 177
171,11
Média
y yy − ( )
2yy −
( )2∑ −= yySQTX = altura média dos pais
Y = altura do filho
PEDRO A. BARBETTA – Estatística Aplicada às Ciências Sociais 6ed. Editora da UFSC, 2006.
Variação explicada e nãoVariação explicada e não--explicada. explicada. Exemplo 13.5Exemplo 13.5
x y
164 166 165,01 0,992 0,98
166 166 166,75 -0,752 0,56
169 171 169,37 1,632 2,66
169 166 169,37 -3,368 11,36
171 171 171,11 -0,112 0,01
173 171 172,86 -1,856 3,46
173 178 172,86 5,144 26,42
176 173 175,47 -2,472 6,1
178 178 177,22 0,784 0,61
0 52
Preditos
ŷ yy ˆ− ( )2ŷy −
( )2ˆ∑ −= yySQE
PEDRO A. BARBETTA – Estatística Aplicada às Ciências Sociais 6ed. Editora da UFSC, 2006.
Variação explicada e nãoVariação explicada e não--explicada. explicada. Exemplo 13.5Exemplo 13.5
Fonte de variação Somas de quadrados
SQR = 125
SQE = 52
Variação total SQT = 177
Explicada por X pelo modelo de regressão
(variação explicada )
Devida ao erro aleatório (variação não-
explicada )
70,6%ou 706,0
177
1252 ===
SQT
SQRR
Interpretar.