Prévia do material em texto
Estatística aplicada Aula 1 - Conceitos introdutórios Exemplo de Amostragem sem Reposição Pesquisa eleitoral: as pessoas devem ser ouvidas apenas uma vez, porque, em uma eleição, o voto é individual. Exemplo de Amostragem com Reposição Fila de banco: a mesma pessoa pode ser observada duas ou mais vezes, a cada vez que retorna ao banco. Aula 2 - Tipos de Dados Conceitos Básicos Dados Brutos - Normalmente, na prática, os dados originais de uma série de estatísticas não se encontram prontos para análise por estarem desorganizados. Por essa razão, costuma-se chama-los de dados brutos. ROL - É a lista ordenada dos dados de uma série estatística. Essa ordenação pode ser crescente ou decrescente. Aula 3 - Medidas de Posição Central Média Aritmética Uma média aritmética pode ser Simples, Ponderada ou Agrupada em Classe. Conheça a definição e exemplo de cada um dos tipos: Simples É a média aritmética, ou média, de um conjunto de N números X1, X2, ..., Xn é definido por: Exemplo: X1 = 1, X2 = 1, X3 = 3, X4 = 4 e X5 = 4. A média é: = (1 + 1 + 3 + 4 + 4) / 5 = 13/5 = 2,6 Ponderada Se os valores X1, X2, ..., Xn ocorrem com frequências f1 e f2, ..., fn, então: Agrupados Seja Xi o ponto médio da i-ésima classe, então: Aula 4 - Medidas de Ordenamento e Forma 1. Para pensar e calcular Considere a seguinte amostra de uma pesquisa feita com 15 consumidores que atribuíram as seguintes notas a uma mercadoria, numa escala de 0 a 100:65, 68, 70, 75, 80, 80 ,82 ,85, 88 ,90, 90, 95, 98, 100, 100. Com base nos dados ao lado, calcule: • 3º Quartil; • 7º Decil; • 60º Centil. GABARITO 3º Quartil Qnq = X ([nqn / 4 ] + ½) Q3 = X ([3 * 15 / 4 ] + ½) = X11,75 Q3 = X11,75 (Posição do 3º Quartil) X11 = 90 X12 = 95 Por regra de três, temos: 0,75 ------------------ 1 X ------------------ 5 (a diferença entre 90 e 95) X = 5 * 0,75 = 3,75, Logo somado a 90 temos Q3 = 90 + 3,75 = 93,75 7º Decil Dnq = X ([nqn / 10] + ½) D7 = X ([7 * 15 / 10] + ½ ) = X11 D7 = X11 (Posição do 7º Quartil) X11 = 90 D7 = 90 60º Centil Cnq = X (nqn / 100 + ½) C60 = (60 * 15 / 100 + ½) = X9,5 C60 = X9,5 C9 = 88 C0 = 90 Por regra de três, temos: 0,5 ----------------------------- 1 X -------------------------------- 2 (a diferença entre 90 e 88) X = 2 * 0,5 = 1, Logo somando a 88 temos X9,5 = 88 + 1 = 89 2. Abaixo, você encontra os dados agrupados de uma sondagem eleitoral de avaliação do Governador Maciel. Tomando-se estes dados por base, calcule: A - Qual será o 2º Quartil das notas agrupadas do Governador? B - Qual será o 6º Decil das C - Qual será o 72º Centil das notas agrupadas do Governador? GABARITO a) O segundo quartil corresponderá ao centil C C50 dividirá a distribuição em duas áreas, a primeira contendo 40 obse 0,50). A classe que contém esse valor é 60 Li = 60 ; Percentil = 50 ; Faant Assim C50 = 60 + (( 80*0,5-35 )/ 10 ) * 10 = 65 b) O sexto quartil corresponderá ao percentil C C50 dividirá a distribuição em duas áreas, a primeira contendo 48 observações ( = 80 * 0,60) . A classe que contém esse valor é 80 Li = 80 ; Percentil = 60 ; Faant Assim C60 = 80 + (( 80*0,6-45 )/ c) Como temos 80 dados agrupados, o C primeira contendo 57,6 observações ( = 80 * 0,72). A classe que contém esse valor é 80 - 90 e assim... Li = 80 ; Percentil = 72 ; Fa Assim C50 = 80 + (( 80*0,72 Aula 5 - Medidas de dispersã VARIÂNCIA A variância pode ser definida como uma medida de dispersão que é o quadrado do desvio padrão, ou se preferir, o desvio padrão é a raiz quadrada da variância. Qual será o 2º Quartil das notas agrupadas do Governador? Qual será o 6º Decil das notas agrupadas do Governador? Qual será o 72º Centil das notas agrupadas do Governador? a) O segundo quartil corresponderá ao centil C50. Como temos 80 dados agrupados, o dividirá a distribuição em duas áreas, a primeira contendo 40 observações ( = 80 * 0,50). A classe que contém esse valor é 60 - 70 e assim.... ant = 35 ; fi = 10 ; h = 10. 35 )/ 10 ) * 10 = 65 b) O sexto quartil corresponderá ao percentil C60 . Como temos 80 dado dividirá a distribuição em duas áreas, a primeira contendo 48 observações ( = 80 * 0,60) . A classe que contém esse valor é 80 - 90 e assim.... ant = 45 ; fi = 25 ; h = 20. 45 )/ 25 ) * 10 = 81,20 c) Como temos 80 dados agrupados, o C72 dividirá a distribuição em duas áreas, a primeira contendo 57,6 observações ( = 80 * 0,72). A classe que contém esse valor é 80 Li = 80 ; Percentil = 72 ; Faant = 45 ; fi = 25 ; h = 10. = 80 + (( 80*0,72-45 )/ 25 ) * 10 = 90,50 Medidas de dispersão A variância pode ser definida como uma medida de dispersão que é o quadrado do desvio padrão, ou se preferir, o desvio padrão é a raiz quadrada da variância. . Como temos 80 dados agrupados, o rvações ( = 80 * . Como temos 80 dados agrupados, o dividirá a distribuição em duas áreas, a primeira contendo 48 observações ( = 80 * dividirá a distribuição em duas áreas, a primeira contendo 57,6 observações ( = 80 * 0,72). A classe que contém esse valor é 80 A variância pode ser definida como uma medida de dispersão que é o quadrado do desvio padrão, ou se preferir, o desvio padrão é a raiz quadrada da variância. COEFICIENTE DE VARIAÇÃO Corresponde à relação entre o desvio padrão sobre a média. Onde: Cv: é o coeficiente de variação S: é o desvio padrão X: é a média dos dados O coeficiente de variação é dado em %, por isso a fórmula é multiplicada por 100. Aula 6 – Gráficos Elaborando um gráfico Para a elaboração de um gráfico devem ser considerado os seguintes itens: a) Um título geral indicando a situação estudada, época e local; b) escalas e as respectivas c) convenções adotadas; d) fonte de informação assinalando de onde foram retirados os valores. Aula 7 - Distribuições de Amostrage Atividade proposta O valor médio em dólar das vendas de um determinado produto no último ano é conhecida como seguindo a distribuição normal com media de R$ 3.400,00 por revendedor a varejo, com desvio padrão de R$ 200,00. Se um grande número de revendedores comercializar o amostra de tamanho n=25. GABARITO δx = δ / √n = 200 / √25 = 200 / 5 = 40 COEFICIENTE DE VARIAÇÃO lação entre o desvio padrão sobre a média. é o coeficiente de variação O coeficiente de variação é dado em %, por isso a fórmula é multiplicada por 100. Para a elaboração de um gráfico devem ser considerado os seguintes itens: a) Um título geral indicando a situação estudada, época e local; b) escalas e as respectivas unidades de medida; d) fonte de informação assinalando de onde foram retirados os valores. Distribuições de Amostragem O valor médio em dólar das vendas de um determinado produto no último ano é conhecida como seguindo a distribuição normal com media de R$ 3.400,00 por revendedor a varejo, com desvio padrão de R$ 200,00. Se um grande número de revendedores comercializar o produto, determine o erro padrão da media para uma amostra de tamanho n=25. O coeficiente de variação é dado em %, por isso a fórmula é multiplicada por 100. Para a elaboração de um gráfico devem ser considerado os seguintes itens: d) fonte de informação assinalando de onde foram retirados os valores. O valor médio em dólar das vendas de um determinado produto no último ano é conhecida como seguindo a distribuição normal com media de R$ 3.400,00 por revendedor a varejo, com desvio padrão de R$ 200,00. Se um grande número de produto, determine o erro padrão da media para uma Aula 8: Intervalos de Confiança 1. Atividade Em uma dada semana, uma amostra de 30 empregados horistas é selecionada de um grande número de empregados de uma fábrica, teve uma média da amostra de salários de R$ 180,00, com desvio padrão da amostra de R$ 14,00. Estimamos a média dos salários para todos os empregados horistas na empresa com intervalo estimado de formaque podemos estar em 95% confiantes de que o intervalo inclui o valor médio da população da seguinte maneira: a) 1ª Etapa – Calcular o Erro Amostral b) 2ª Etapa – Identificar o Número de Unidades de Desvio Padrão a partir da Média c) 3ª Etapa – Aplicar a fórmula do Intervalo de Confiança GABARITO a) δ x = 14 / √30 = 2,56 b) 95% ---------- 1,96 c) Xm + Z δ x = 180 + 2,56*1,96 = 185,02 Xm - Z δ x = 180 - 2,56*1,96 = 174,98 O Intervalo de Confiança será entre 174,98 e 185,02. 2. Atividade EM uma prova de AV1, uma amostra de 50 estudantes, uma média da nota de 6,5, com desvio padrão da amostra de 1,2, estimamos a média de notas de todos os alunos do EAD (Ensino a Distância) com intervalo estimado de forma que podemos estar em 99% confiantes de que o intervalo inclui o valor médio da população da seguinte maneira: a) 1ª Etapa – Calcular o Erro Amostral b) 2ª Etapa – Identificar o Número de Unidades de Desvio Padrão a partir da Média c) 3ª Etapa – Aplicar a fórmula do Intervalo de Confiança GABARITO a) δ x = 1,2 / √50 = 0,1697 b) 99% ---------- 2,58 c) Xm + Z δ x = 6,5 + 0,1697*2,58 = 6,94 Xm - Z δ x = 6,5 + 0,1697*2,58 = 6,06 O Intervalo de Confiança será entre 6,06 e 6,94. Aula 9: Distribuição Normal Para pensar e calcular Em homens, a quantidade de hemoglobina por 100ml de sangue é uma variável aleatória com distribuição normal de media 16g e desvio padrão de 1g. A) A probabilidade de um homem apresentar de 16g a 18g de hemoglobina por 100ml de sangue. B) A probabilidade de um homem apresentar mais de 18g de hemoglobina por 100ml de sangue. Em um exame final de Matemática, a média foi 6,5 e o desvio padrão foi de 1,0. Com base nestes dados, determine a % de estudantes que obtiveram as seguintes notas: a) x>7,5 b) x>7,0 c) x>8,0 d) x>5,0 GABARITO A) Na distribuição normal reduzida a média é 0. Para obter X= 18 na distribuição normal reduzida, calcule: Sendo que X= 18; A média = 16; Desvio Padrão = 1. Aplicando a formula cada valor em seus respectivos campos, encontra-se o resultado Z = 2. Na tabela de ESCORE Z, o valor = 0,9772, logo a P( 0,5 - 0,9772) = 0,4772 ou 47,72% B) Como a área que corresponde ao intervalo de 16 a 18g é igual a 0,9772, logo P(1- 0,9772) = 0,0228 ou 2,28% Aula 10: Teste de Hipóteses Para pensar e calcular Considere que um determinado professor anunciou que a média de nota de alunos em estatística foi de no mínimo 6,0 na AV1. Considerando um teste de hipótese com amostras de 50 elementos e um nível de significância de 5%, calcule: a) Se após os dados relativos a 50 elementos encontrarmos a média de 6,2 e desvio- padrão de 0,8. b) Se após os dados relativos a outra amostra com 50 elementos, encontrarmos a média de 5,7 e desvio-padrão de 1,2. GABARITO Etapa 1: H0 = 6,0 e H1<6,0 Etapa 2: Nível de Significância 5% Etapa 3: De acordo com a Distribuição Normal Reduzida, o Z para nível de significância de 5% é de – 1,65 Etapa 4: Utilização da fórmula Z = (6,2 -6) / (0,8/ √ 50) = 0,2 / 0,1131 = 1,7678 Como 1,7678> - 1,65, a hipótese nula será aceita. b) Etapa 1: H0 = 6,0 e H1<6,0 Etapa 2: Nível de Significância 5% Etapa 3: De acordo com a Distribuição Normal Reduzida, o Z para nível de significância de 5% é de – 1,65 Etapa 4: Utilização da fórmula Z = (5,7 -6) / (1,2/ √ 50) = -0,3 / 0,1131 = -2,6525 Como -2,6525 < -1,65, a hipótese nula será rejeitada. Ou seja, a informação da amostra não nos permite confirmar uma média 6,0 na prova com nível de significância de 5%.