Prévia do material em texto
ESTATÍSTICA APLICADA À EDUCAÇÃO Me. Claudio Ferreira de Carvalho GUIA DA DISCIPLINA 1 Estatística Aplicada à Educação Universidade Santa Cecília - Educação a Distância 1. CONCEITOS BÁSICOS PARA MANIPULAÇÕES NUMÉRICAS Objetivo Esta aula tem como objetivo apresentar alguns conceitos básicos de manipulação numérica que serão necessários para o desenvolvimento deste curso de probabilidade e estatística. 1.1. Variações percentuais A título de introdução, vamos supor que você anotou nos últimos meses a evolução do preço de seu prato favorito na cantina que você gosta de ir de vez em quando. Estes valores estavam em guardanapos guardados em sua gaveta de gastos e agora você os passou para seu bloco de anotações. Apenas observando os dados você pode tentar tirar conclusões, mas veja que, nem todas estão corretas: • Está certo falar que aumentou R$ 6,00 em seis meses? Sim, esta conclusão está correta. • Está certo falar que o aumento foi de R$ 1,00 por mês? Não, esta conclusão, não está correta. Não podemos tirar conclusões precipitadas. Você não pode concluir que se aumentou R$ 6,00 em seis meses o aumento foi de R$ 1,00 por mês, mas pode concluir que o aumento médio foi de R$ 1,00 por mês. Se você estendeu este exemplo, começou a compreender algo sobre a “análise de números” que falei no slide anterior. Observando os dados mais atentamente, você pode tirar algumas conclusões, estas sim corretas: O aumento não foi uniforme; Entre janeiro e fevereiro e entre maio e junho o aumento foi de R$ 2,00; Entre abril e maio, não houve aumento. Um gráfico também pode ajudar a visualizar como foram os aumentos. 2 Estatística Aplicada à Educação Universidade Santa Cecília - Educação a Distância Observe algumas informações que podemos obter observando o gráfico: • Entre os meses de janeiro e junho houve um aumento; • Entre os meses de janeiro e fevereiro o aumento foi maior que entre os meses de março e abril; • O preço entre dois meses nunca diminuiu; Tente fazer outras observações, mesmo que pareçam simples, você verá que apoiado em um gráfico mais ideias podem surgir na cabeça. Estas observações, sem dúvida ajudarão você a entrar no mundo da “análise de dados”. 1.2. Aumento Percentual Outro dado que pode nos ajudar a analisar valores é o “Aumento Percentual”, ele é sempre, a diferença entre o valor final e o valor inicial, dividida pelo valor inicial. Como o aumento é expresso em porcentagem o valor obtido deve ser multiplicado por 100. Veja os cálculos da tabela: O aumento percentual entre: Janeiro e fevereiro foi 8,0%; ( 𝑉𝑎𝑙𝑜𝑟 𝑓𝑖𝑛𝑎𝑙 −𝑣𝑎𝑙𝑜𝑟 𝑖𝑛𝑖𝑐𝑖𝑎𝑙 𝑣𝑎𝑙𝑜𝑟 𝑖𝑛𝑖𝑐𝑖𝑎𝑙 ) x 100 3 Estatística Aplicada à Educação Universidade Santa Cecília - Educação a Distância Fevereiro e março foi 3,7%; Março e abril foi 3,6%; Abril e maio foi 0; Maio e junho foi 6,9% Faça uma pequena pausa e confira estes valores. Veja também, que é possível obter o “Aumento Percentual” entre dois valores quaisquer. Apenas para exercitar. Qual seria o aumento percentual nos 6 meses? Faça a conta.... Obteve 24%? Muito bom! Veja agora algumas observações que podemos fazer sobre o aumento percentual. Os mesmos aumentos em moeda, não resultam obrigatoriamente nos mesmos aumentos percentuais pois eles dependem não só da diferença entre o valor final e o valor inicial, mas também do denominador da equação chamado por alguns livros de “valor de base”. O aumento de R$ 1,00 resultou em 3,7% entre fevereiro e março, mas somente 3,6% entre março e abril. O aumento de R$ 2,00 resultou em 8,0% entre janeiro e fevereiro, mas somente 6,9% entre maio e junho. Na verdade, você já sabia deste fato, mas talvez nunca tivesse reparado, mas pense bem, se você souber que o cafezinho vai aumentar 5% você ficará preocupado, pois ele passará de R$ 2,00 para R$ 2,10, mas quando você descobrir que seu plano de saúde que custa R$860,00 por mês vai aumentar os mesmos 5%, você ficará muito preocupado, pois ela passará para R$ 903,00. 4 Estatística Aplicada à Educação Universidade Santa Cecília - Educação a Distância Veja: O mesmo aumento percentual de 5% para o café equivale a R$0,10 e para seu plano de saúde equivale a R$43,00. Porque isso? Porque no café o aumento de 5% foi aplicado à R$2,00 e no plano de saúde foi aplicado à R$860,00. 1.3. Estudo do aumento percentual No item anterior, calculamos quando foi o aumento percentual entre dois valores, mas é também comum que se deseje saber, como ficará um determinado valor, por exemplo o preço da gasolina, o preço de um alimento, se ele sofrer um aumento de um determinado percentual. Para elaborar estes cálculos, você deve multiplicar o valor conhecido por 1 + x, onde x é o aumento esperado dividido por 100; Veja alguns exemplos: 1.4. Estudo do desconto percentual Pode acontecer também, que um determinado produto, esteja com um “desconto percentual”. Neste caso, o valor final, que será o valor com desconto, é calculado multiplicando-se o valor inicial por 100 – desconto e dividindo o resultado por 100. 5 Estatística Aplicada à Educação Universidade Santa Cecília - Educação a Distância Veja alguns exemplos: 1.5. Arredondamento Você conferiu os cálculos das telas anteriores? Se realmente conferiu, talvez tenha ficado com algumas dúvidas, ou deve ter pensado que alguns números foram modificados para melhorar os resultados. De antemão, quero deixar bem claro, que nada foi manipulado erradamente, apenas em alguns momentos os números foram arredondados para manter uniforme o número de casas decimais. O que são casas decimais? São os números apresentados depois da vírgula. Por exemplo o número 3,57 possui duas casas após a vírgula, portanto duas casas decimais. E o que é arredondamento? Para entender o que é arredondamento lembre-se do cálculo (29-28).100/28 (variação de seu prato preferido, apresentado entre os meses de março e abril). O resultado desta conta foi 3,571428... (e o número continua...). Como para todos os demais cálculos de aumentos percentuais, estávamos utilizando somente uma casa após a vírgula (uma casa decimal), quando mostrei o resultado da conta, mantive o mesmo critério e apresentei este número somente com uma casa após a vírgula 3,6. 6 Estatística Aplicada à Educação Universidade Santa Cecília - Educação a Distância Por que 3,6 e não 3,5? Porque o valor apresentado foi arredondado antes de ser apresentado. Para arredondar, foi utilizado a seguinte regra, que é mostrada aos valores: 6,1287 ≈ 6,13 e 6,1247 ≈ 6,12. a) Determinar com quantas casas decimais deseja-se apresentar o número (Vamos fazer dois exemplos onde os números fornecidos devem ser apresentados com duas casas decimais). b) Observar o primeiro número a partir do qual se deseja desprezar. c) Se o número a ser desprezado for maior ou igual a 5 (8 é maior que 5), ao último número que fica é aumentado uma unidade (2 passa para 3). O valor 6,1287 passa a ser apresentado como 6,13. d) Se o número a ser desprezado for igual ou menor que 5 (4 é menor que 5), o último número que fica não é alterado (mantido o valor 2). O valor 6,1247 passa a ser apresentado como 6,12. 1.6. Ordem de grandeza Imagine que houve um desvio de dinheiro e o valor foi de R$ 1.500.000.000,00. Olhando somente para o número, fica difícil imaginar o valor, mas se você ler o número como 1 Bilhão e meio de reais, já fica mais fácil visualizar a quantia. Por outro lado, se alguém lhe falar que o tamanho de uma molécula de DNA é 0,0024 m você talvez tenha dificuldades de assimilar, mas se falarem que é 2,4 mm provavelmente seja mais fácil de imaginar otamanho da molécula. Na verdade, os números após o 1 do valor monetário mostrado, assim como os zeros antes do 2 do tamanho da molécula de DNA dão ao número o que se convenciona chamar de “Ordem de grandeza” e os valores 1,5 (no caso do valor monetário) ou 2,4 (no caso do tamanho do DNA) são os valores. Para facilitar a escrita e a leitura de números grandes ou pequenos, muitas vezes utiliza-se o que se convencionou chamar prefixos. 7 Estatística Aplicada à Educação Universidade Santa Cecília - Educação a Distância A tabela da tela a seguir, apresenta alguns prefixos: Veja alguns detalhes desta tabela: • Quilo (k = 103), que equivale a mil, é um prefixo muito utilizado no nosso dia a dia: Quilograma (1000 gramas), Quilometro (1000 m). • Mega (M = 106), que equivale a Milhão, também é muito utilizado: Moeda (R$ 1 milhão de reais), Velocidade de conexão internet (10 Mbps - Megabits por segundo) Palavras como microcomputador, microprocessador de alimentos são modos figurativos para indicar coisas pequenas, como pequenos computadores (microcomputador), microprocessador de alimentos (aparelhos que cortam alimentos em tamanhos muito pequenos). 8 Estatística Aplicada à Educação Universidade Santa Cecília - Educação a Distância 2. NOÇÕES DE ESTATÍSTICA - COLETA DE DADOS – VARIÁVEIS 2.1. Estatística Sem dúvida, existem diversas definições para Estatística. Uma das que melhor se enquadra aos objetivos de nosso curso é a seguinte: Estatística é uma metodologia de análise de números dando a eles significados. Com a estatística, você dará sentido a conjuntos de dados. Muitas vezes você observa diversos valores, mas não consegue estabelecer uma relação entre eles ou até, sem uma análise mais detalhada, pode julgar erroneamente a variação destes valores. 2.2. Estatística Descritiva x Indutiva Estatística descritiva é empregada para caracterizar a amostra evidenciando as principais características e propriedades. Estatística indutiva, também chamada de inferencial, são métodos e técnicas utilizados para estudar uma população baseando-se em amostras destas populações. Resumindo, podemos dizer que a estatística descritiva descreve dados e a indutiva toma decisões a partir de estudos em amostras. 2.3. Dados São informações obtidas a partir de medições de grandezas, resultados de pesquisas, respostas a questionários ou contagens em geral. 2.4. População estatística São todos os elementos que possuem as características que desejamos estudar. 2.5. Amostra É um subconjunto finito de uma população, em outras palavras, uma parte da população, escolhida através de uma técnica de amostragem. 9 Estatística Aplicada à Educação Universidade Santa Cecília - Educação a Distância 2.6. Amostra significativa Uma amostra significativa, deve representar em escala reduzida, todas as características qualitativas e quantitativas do universo que se pretende reproduzir. 2.7. Amostragem Técnica utilizada para recolher amostras que garantem, tanto quanto possível, o acaso na escolha. Para que uma amostragem seja correta, cada elemento da população deve ter a chance de ser escolhido, e com isto, a amostra assume o caráter de representatividade, de maneira que as conclusões sobre a amostra possam realmente representar a população. População são todos os elementos, amostra são elementos da população, mas para que a amostra seja significativa estes elementos precisam ter as características da população e amostragem são técnicas que garantem que a amostra seja significativa, ou seja represente a população. 2.8. Coleta de dados São maneiras escolhidas para adquirir informações, que pode ser feita através de registros como nascimentos; casamentos; etc., ou através de questionários coletados pelo pesquisador. 2.9. Crítica de dados São considerações sobre os dados que devem ser feitas para evitar erros grosseiros 2.10. Variáveis É o conjunto de resultado de um possível fenômeno. Como exemplo podemos citar o Fenômeno sexo, que possui dois resultados possíveis, masculino ou feminino. 10 Estatística Aplicada à Educação Universidade Santa Cecília - Educação a Distância 2.11. Variáveis qualitativas São informações não numéricas, normalmente atributos classificados em categorias: Exemplos: Tipos sanguíneos (A, B, AB ou O) Cor dos olhos (azuis, verdes, castanhos, etc.) 2.11.1. Variáveis qualitativas nominais Quando os valores são classificados em categorias ou classes, não ordenadas. Caso se deseje em uma pesquisa rotular homes e mulheres, podemos colocar o “Rotulo 1” para homens e o “Rótulo 2” para mulheres ou vice-versa. Observe que as duas tabelas abaixo estão corretas: 2.11.1. Variáveis qualitativas ordinais Quando os valores são ordenados, tais como notas, idades. Como exemplo observe que nota 10 é superior a nota 9, que por sua vez é superior a nota 8, e assim sucessivamente. Em um outro exemplo, podemos citar que alunos com 15 anos são mais velos que os com 14 anos que por sua vez são mais velhos que os com 13 anos e assim sucessivamente. 2.12. Variáveis quantitativas São informações que assumem valores numéricos, obtidas a partir de medições ou constatações. 2.12.1. Variáveis quantitativas contínuas Podem assumir valores entre dois limites, podem ser números inteiros, mas isto não é obrigatório. Exemplos: Pesos, estaturas, renda, distância, comprimento, etc. 2.12.2. Variáveis quantitativas discretas Só podem assumir valores pertencentes a um conjunto específico. Exemplos: Alunos em uma sala, filhos de uma família, bolsas em um estoque, etc. 11 Estatística Aplicada à Educação Universidade Santa Cecília - Educação a Distância 3. DISTRIBUIÇÃO DE FREQUÊNCIA 3.1. Organização de dados 3.1.1. Dados Brutos Quando você obtém dados, eles normalmente não veem organizados, estão misturados, não apresentam uma ordem ou sequência, motivo pelo qual fica muito difícil a visualização assim como tirar conclusões. Estes dados são classificados como dados brutos. Se estes dados forem coletados em tabelas, estas são chamadas de tabelas primitivas. 3.1.2. Rol Para que você possa analisar os dados eles precisam ser ordenados, esta ordenação irá gerar uma tabela que recebe o nome de Rol. 3.2. Classes e Amplitude de Classes Para analisar dados vamos utilizar a técnica de Distribuição de Frequência, que consiste em organizar dados de maneira que eles possam ser agrupados em intervalos chamados de Classe. 3.2.1. Número de Classe Para determinar o número de classes em uma distribuição utiliza-se a equação: 𝑖 = √𝑛 2 Onde: 𝑖 é o número de classes em um Rol 𝑛 é a quantidade de dados da amostra 3.2.2. Amplitude do intervalo de classe É obtido pela equação: ℎ = 𝐿𝑚á𝑥 − 𝐿𝑚𝑖𝑛 𝑖 12 Estatística Aplicada à Educação Universidade Santa Cecília - Educação a Distância Onde: ℎ é a amplitude do intervalo de classe 𝐿𝑚á𝑥é o maior valor do Rol 𝐿𝑚𝑖𝑛 é o menor valor do Rol 𝑖 é o intervalo de classe 3.2.3. Frequência de classe É o número de ocorrência de cada valor em um intervalo de classe. É representada por Fi 3.2.4. Ponto médio da classe É a média entre o valor máximo e o valor mínimo de um intervalo de classe 𝑥𝑖 = 𝐿𝑖 + 𝐿𝑠 2 Onde: 𝑥𝑖 é o ponto médio da classe 𝐿𝑖 é o limite inferior da classe 𝐿𝑠 é o limite superior da classe 3.2.5. Frequência acumulada É o total acumulado, na verdade a soma de todas as classes anteriores até a classe atual. 3.2.6. Frequência relativa É o quociente entre a frequência absoluta da classe em estudo e a soma das frequências acumuladas: 𝐹𝑟 = 𝐹𝑖 ∑ 𝐹𝑖 Onde: 𝐹𝑟 é a frequência acumulada 𝐹𝑖 é a frequência da classe em estudo ∑ 𝐹𝑖é a somatória de todas as frequências 3.2.7. Frequência relativa acumulada É a soma da frequência relativa da classe em estudo com as frequências acumuladas das classes anteriores. Esta frequência pode também ser representada em percentagem, bastando para isto multiplicar o valor por 100. 13 Estatística Aplicada à Educação Universidade Santa Cecília - Educação a Distância 3.3. Exemplo 01 Vamos supor que você, como professor precisa formar uma opinião sobre as notas obtidas por seus alunos em uma prova. Os valores obtidos são fornecidos na tabela primitiva abaixo: 30 5 80 8 2 23 50 44 9 95 20 15 86 5 23 44 57 49 23 83 72 44 92 63 27 25 92 83 86 77 89 50 9 97 95 29 77 7 5 7 98 57 10 49 46 47 68 25 9 9 Para analisar os dados em primeiro lugar você deverá criar uma Rol, colocando as notas em ordem crescente. Com isto obterá a tabela a seguir: 2 7 9 23 29 46 50 72 83 92 5 8 10 23 30 47 57 77 86 95 5 9 15 25 44 49 57 77 86 95 5 9 20 25 44 49 63 80 89 97 7 9 23 27 44 50 68 83 92 98 Como existem muitos valores, você irá tratar esta variável como uma variável contínua que varia de 2 a 98. O número de classes será: 𝑖 = √𝑛 2 𝑖 = √50 2 𝑖 = 7,07 𝑖 ≅ 7 14 Estatística Aplicada à Educação Universidade Santa Cecília - Educação a Distância O intervalo de classe será: ℎ = 𝐿𝑚á𝑥 − 𝐿𝑚𝑖𝑛 𝑖 ℎ = 98 − 2 7 ℎ = 13,71 ℎ ≅ 14 A tabela de distribuição de frequências ficará conforme a seguir 3.4. Exemplo 02 De posse da tabela do exemplo anterior responda as seguintes questões: Nota: Lembre-se que sempre se deve escolher os resultados observando o ponto médio da classe xi. a) Quantos alunos obtiveram nota acima de 50 no questionário? b) Quantos alunos obtiveram nota abaixo de 60 no questionário? c) Qual a percentagem de alunos que obtiveram nota abaixo de 20 no questionário? d) Qual a percentagem de alunos que obtiveram nota acima de 50 no questionário. Solução: a) Quantos alunos obtiveram nota acima de 50 no questionário? O ponto médio de classe mais próximo e 50 é 51 referente à classe 4 então obtiveram notas acima, os pertencentes às classes, 4, 5, 6 e 7. 11 + 2 + 6 + 9 = 28 alunos. 15 Estatística Aplicada à Educação Universidade Santa Cecília - Educação a Distância b) Quantos alunos obtiveram nota abaixo de 60 no questionário? Como é abaixo vamos considerar somente até a classe inferior que é a classe 4, então: 13 + 8 + 1 + 11 = 33 alunos. c) Qual a percentagem de alunos que obtiveram nota abaixo de 20 no questionário? Como é abaixo vamos utilizar o mesmo critério do item anterior, somente os valores abaixo, então seriam 13 alunos, mas o percentual é 26%. d) Qual a percentagem de alunos que obtiveram nota acima de 50 no questionário. Como á acima vamos utilizar o critério de incluir a classe com ponto médio próximo à 50, então: 22% + 4% + 12% + 18% = 56% 16 Estatística Aplicada à Educação Universidade Santa Cecília - Educação a Distância 4. GRÁFICO ESTATÍSTICO Objetivo Esta aula apresenta os principais gráficos utilizados não só em estatística como no dia a dia tanto de escolas, como de empresas. Aprender a ler, construir e utilizar gráficos como uma forma de interpretação de dados, é de fundamental importância para todos os ramos de atividade. Nesta aula, você verá que dependendo do que se quer visualizar e de como os dados foram obtidos, existem diferentes tipos de gráficos e a utilização do gráfico correto é uma das mais importantes decisões que devem ser tomadas pelo elaborador de um material. 4.1. O que é um gráfico estatístico É uma forma de apresentar dados estatísticos, que tem dentre os seus objetivos visualizações alternativas para pesquisadores e para o público em geral. Muitas vezes, a utilização de gráficos apresenta-se como uma excelente alternativa a tabelas, ou mesmo à simples visualização de dados, por este motivo, sempre que possível, deve-se prever a construção de gráficos alternativamente à tabela tanto em relatórios como em arquivo de dados. 4.2. Algumas regras gerais 4.2.1. Normas IBGE Segundo a nova revisão das normas IBGE, tabelas e gráficos devem ser formatados conforme o texto “Normas Editoriais e de Formatação de Trabalhos”, que podem ser obtidas em http://www.ibge.gov.br/confest_e_confege/normas.htm (acessado em 23/08/2016), transcrito abaixo. Tabelas e Gráficos devem ser inseridos no texto como figura e com a seguinte formatação: Centralizados na página; A fonte de letra na tabela deve ser no mínimo de tamanho 10 pt e no máximo de 12 pt; divida a tabela em duas ou mais, se não couber na página; Para títulos, utilize o estilo: Tabela # seguida do título da tabela/gráfico (centralizado e negrito); A fonte dos dados deve ser indicada, alinhando o texto descritivo com a margem esquerda da Tabela/Gráfico; Procure evitar grades laterais nas células das tabelas. http://www.ibge.gov.br/confest_e_confege/normas.htm 17 Estatística Aplicada à Educação Universidade Santa Cecília - Educação a Distância No exemplo mostrado neste link o título está acima. Esta é uma modificação com relação à Vídeo aula da Aula 04, portanto, o título, tanto do gráfico como da tabela devem ser acima. 4.3. Normas ABNT Estas normas também indicam que o título deve estar acima enquanto a fonte e outras citações devem ficar abaixo. 4.4. Tipos de gráficos mais comuns Muitos tipos de gráficos podem ser utilizados para representar os mais diversos conjuntos de dados e principalmente, com o advento de softwares como o Microsoft Excel, a diversidade destes gráficos é imensa. Neste item serão apresentados os principais e mais utilizado, portanto, os que devem ser escolhidos na grande maioria das utilizações. Entretanto, o mais importante das explicações a seguir está no fato de utilizar o gráfico correto para representar o fenômeno que pretendemos apresentar, portanto, veja atentamente como escolher o gráfico em cada condição de maneira que seu leitor possa aproveitar da melhor maneira possível o gráfico que foi fruto de seu trabalho. Os gráficos que serão apresentados são: • Gráfico de linhas. • Gráfico de colunas. 18 Estatística Aplicada à Educação Universidade Santa Cecília - Educação a Distância • Gráfico de barras. • Gráfico de setores. • Histograma 4.5. Gráfico de linha ou em curva São compostos de dois eixos, um eixo vertical (convencionalmente nomeado de y), também chamado de eixo dos valores e um eixo horizontal (convencionalmente nomeado de x), também chamado de eixo das categorias. Em aplicativos como o Excel, o eixo das categorias apresenta sempre um incremento constante, portanto, gráficos que cujos valores do eixo x não sofrem sempre o mesmo incremento, não devem ser construídos no Excel utilizando a opção de “Gráficos de linha”. Não será assunto deste curso, mas, caso se deseje construir gráficos cujos valores do eixo x não tem um acréscimo uniforme, tais como gráficos de equações matemáticas, deve utilizar no Excel os “Gráficos de dispersão”. 19 Estatística Aplicada à Educação Universidade Santa Cecília - Educação a Distância Os gráficos de linha, são normalmente utilizados para apresentar valores que variam a longo do tempo, tais como dias da semana, meses do ano, anos, etc. Podem ser utilizados também para apresentar variações de valores entre estágios subsequentes como representados nas figuras a seguir: 4.5.1. Exemplo Representar em um gráfico de linhas as estaturas de alunos em uma sala de aula, com distribuição de frequências conforme tabela: Lançando os valores de Fi no eixo y e os valores do ponto médio das classes no eixo x, teremos a gráfico abaixo.20 Estatística Aplicada à Educação Universidade Santa Cecília - Educação a Distância 4.6. Gráfico de colunas São montados com eixos da mesma maneira que explicados nos gráficos de linha do item anterior. A diferença está somente na construção do conteúdo, que ao invés de ser uma linha contínua ligando os pontos, são colunas traçadas verticalmente desde o eixo x até os valores máximos determinados. Sua utilização também é semelhante ao dos gráficos de linha, portanto muito propícios para representar variações ao longo do tempo ou variações de valores entre estágios subsequentes, como representados a seguir. 4.6.1. Exemplo Representar em um gráfico de colunas a frequência de alunos em um curso de acordo com os dias da semana: 21 Estatística Aplicada à Educação Universidade Santa Cecília - Educação a Distância Lançando os valores de Fi no eixo y e os dias da semana no eixo x, teremos a gráfico abaixo. 4.7. Gráfico de barras São compostos de dois eixos, um eixo horizontal (convencionalmente nomeado de x), também chamado de eixo dos valores e um eixo vertical (convencionalmente nomeado de y), também chamado de eixo das categorias. Observe que, as construções dos gráficos de barras são semelhantes às dos gráficos de colunas, entretanto os eixos x e y tem funções invertidas, ou seja, no gráfico de barras o eixo que recebe os valores é o eixo x e o eixo que recebe as categorias é o eixo y. Então, este tipo de gráfico deve receber no eixo y propriedades de elementos, enquanto que os valores destas propriedades serão lançados no eixo x. 22 Estatística Aplicada à Educação Universidade Santa Cecília - Educação a Distância É importante que este tipo de gráfico não seja utilizado para representar variações ao longo do tempo. Em aplicativos como o Excel, o eixo das categorias apresenta sempre um incremento constante, portanto, gráficos que cujos valores do eixo y não sofrem sempre o mesmo incremento, não devem ser construídos no Excel utilizando a opção de “Gráficos de barras”. Os dois exemplos a seguir são gráficos que mostram times de futebol ou graus de instruções no eixo y, enquanto que seus valores estão no eixo x. 4.7.1. Exemplo Representar em um gráfico de barras a distribuição de frequências da escolaridade de funcionários de uma instituição. Lançando os valores de Fi no eixo x e os graus de instrução no eixo y, teremos a gráfico abaixo. 23 Estatística Aplicada à Educação Universidade Santa Cecília - Educação a Distância 4.8. Gráfico de setores São utilizados para representar partes de um todo, ou seja, quando você tem um todo, por exemplo uma população e sabe que parte dela é formada por crianças, outra parte por jovens, outra por adultos e uma última por pessoas da terceira idade você pode utilizar um gráfico de setores para mostrar qual a parcela de cada uma destas categorias no total da população. Devido ao seu aspecto, muitos chamam estes gráficos de setores de gráficos de pizza. Os dois exemplos a seguir são excelentes para representar gráficos de setores. 4.8.1. Exemplo O mesmo exemplo anterior, no caso graus de instruções de uma instituição pode muito vem ser representado por um gráfico de setores, conforme mostrado neste exemplo. 24 Estatística Aplicada à Educação Universidade Santa Cecília - Educação a Distância 4.9. Histograma Um histograma, tem o mesmo formato e modo de construção que um gráfico de colunas, a única diferença é que as colunas ficam justapostas. Diferentemente dos gráficos anteriormente citados, que são gráficos utilizados para representar diversos tipos de dados, inclusive dados estatísticos, os histogramas são utilizados para representar dados estatísticos. Existem diversos tipos de histograma, tais como “histogramas de frequências”, “histogramas de frequências acumuladas” entre outros. Nestes tipos de gráficos os valores do eixo horizontal (eixo x), são os pontos médios das classes. O gráfico abaixo representa um histograma de frequências de alturas de pessoas. 25 Estatística Aplicada à Educação Universidade Santa Cecília - Educação a Distância 4.9.1. Exemplo Representar em um histograma as estaturas de alunos em uma sala de aula com distribuição de frequências conforme a seguir. Colocando no eixo x (eixo horizontal) os pontos médios das classes de estatura e no eixo y (eixo vertical) a frequência de alunos com cada uma das faixas de altura teremos o gráfico da figura a seguir, que é o mesmo representado anteriormente. 26 Estatística Aplicada à Educação Universidade Santa Cecília - Educação a Distância 5. EXEMPLO COMPLETO COM VARIÁVEL CONTÍNUA Em uma aula de educação física, o professor registrou a velocidade média de 40 alunos em uma corrida na quadra. Os valores em km/h foram os seguintes: a) Elabore a tabela de distribuição de frequências. b) Construa um gráfico de colunas. c) Construa um histograma. 5.1. Solução O primeiro passo é construir ordenar os valores das velocidades, construindo a hol, conforme abaixo: Para a construção da tabela de distribuição de frequências deve ser calculado o número de classes e o intervalo de classes 5.1.1. Número de classes: 27 Estatística Aplicada à Educação Universidade Santa Cecília - Educação a Distância 5.1.2. Intervalo de classe: Calcular todos os pontos mínimos e máximos das classes. Classe Limite mínimo Limite máximo 1 Primeiro valor = 10 10 + 4 = 14 2 Valor máximo da classe anterior = 14 14 + 4 = 18 3 Valor máximo da classe anterior = 18 18 + 4 = 22 4 Valor máximo da classe anterior = 22 22 + 4 = 26 5 Valor máximo da classe anterior = 26 26 + 4 = 30 6 Valor máximo da classe anterior = 30 30 + 4 = 34 Observar a frequência que as alturas aparecem em cada uma das classes e montar a tabela de “Distribuição de frequências”. 28 Estatística Aplicada à Educação Universidade Santa Cecília - Educação a Distância Calcular o ponto médio de todas as classes: Primeira classe: Demais classes: Classe Ponto médio (xi) 2 = (14 +18)/2 = 16 3 = (18 + 22)/2 = 20 4 = (22 + 26)/2 = 24 5 = (26 + 30)/2 = 28 6 = (30 + 34)/2 = 32 Calcular a frequência acumulada: Primeira classe: Segunda classe: 29 Estatística Aplicada à Educação Universidade Santa Cecília - Educação a Distância Demais classes: Classe Frequência acumulada (Fa) 3 = 10 + 13 = 23 4 = 5 + 23 = 28 5 = 5 + 28 = 33 6 = 7 + 33 = 40 Calcular a frequência relativa: Primeira classe: Demais classes: Classe Frequência relativa (Fr) 2 = 7/40 = 0,175 3 = 10/40 = 0,250 4 = 5/40 = 0,125 5 = 5/40 = 0,125 6 = 7/40 = 0,175 Calcular a frequência relativa acumulada: Primeira classe: 30 Estatística Aplicada à Educação Universidade Santa Cecília - Educação a Distância Segunda classe: Demais classes: Classe Frequência relativa acumulada (Fra) 3 = 0,250 + 0,325 = 0,575 4 = 0,125 + 0,575 = 0,700 5 = 0,125 + 0,700 = 0,825 6 = 0,175 + 0,825 = 1,000 Calcular a frequência relativa acumulada percentual: Primeira classe: Demais classes: Classe Frequência Relativa acumulada percentual (Fra%) 2 = 100.0,175 = 17,5 3 = 100.0,250 = 25,0 4 = 100.0,125 = 12,5 5 = 100.0,125 = 12,5 6 = 100.0,175 = 17,5 31 Estatística Aplicada à Educação Universidade Santa Cecília - Educaçãoa Distância Construção do gráfico de colunas Colocar no eixo vertical (eixo y) os valores das frequências (Fi) e no eixo horizontal (eixo x), os valores dos pontos médios das classes O gráfico ficará conforme a seguir: Construção do histograma de frequência É o mesmo gráfico do item anterior, porém com as colunas encostadas 32 Estatística Aplicada à Educação Universidade Santa Cecília - Educação a Distância 6. EXEMPLO COMPLETO COM VARIÁVEL DISCRETA Ao final do período letivo em uma escola foram levantados os dados a seguir sobre a performance dos alunos: a) Elabore a tabela de distribuição de frequências com a frequência de cada conjunto de alunos. b) Construa um gráfico de barras. c) Construa um gráfico de setores 6.1. Solução Como a variável é discreta o número de classes é a própria quantidade de eventos, no caso 5, portanto, não existe intervalo de classe e não existe necessidade de ordenar os dados para criar a Rol. 6.1.1. Tabela de distribuição de frequências: A tabela de distribuição de frequências é a própria tabela fornecida, conforme a seguir: 33 Estatística Aplicada à Educação Universidade Santa Cecília - Educação a Distância 6.1.2. Construção do gráfico de barras Colocar no eixo horizontal (eixo x) os valores das frequências (Fi) e no eixo vertical (eixo y), os eventos a serem estudadas. O gráfico ficará conforme a seguir: 6.1.3. Construção do gráfico de setores Basta seccionar um círculo com setores proporcionais à quantidade de alunos em cada uma das condições, montando um gráfico conforme figura abaixo: 34 Estatística Aplicada à Educação Universidade Santa Cecília - Educação a Distância 7. MÉDIA ARITMÉTICA E DESVIO Objetivo Nesta aula será apresentada a média aritmética e o desvio de valores em relação à média. Média aritmética é a primeira medida de tendência central que será apresentada. 7.1. Definição de Média Aritmética É o quociente da divisão entre a soma dos valores das variáreis de uma distribuição, pelo número de variáveis que compõe esta distribuição. A média aritmética é considerada uma medida de tendência central, visto que, focaliza valores centrais entre conjuntos de valores. A média aritmética é obtida pela equação: Onde: A média aritmética é a medida de posição que possui maior estabilidade, deve ser utilizada quando houver necessidade de um tratamento algébrico ulterior. 7.1.1. Exemplo Sabemos que as idades de 7 alunos que no momento estão brincando no pátio são: 10, 14, 13, 15, 18 e 12 anos. Qual a idade média destes alunos? �̅� = ∑ 𝑥𝑖 𝑛 �̅� = ∑ 𝑥 𝑖 𝑛 35 Estatística Aplicada à Educação Universidade Santa Cecília - Educação a Distância 7.2. Desvio em relação à média É a diferença entre cada um dos elementos de um conjunto e o valor da média. Onde: Como todos os desvios referem-se à média, a soma dos desvios será sempre nula. Conferir se a soma dos desvios resulta em zero, é um modo fácil de confirmar se os cálculos estão corretos. 7.2.1. Exemplo Calcular o desvio de cada uma das idades dos alunos do exemplo anterior: 10, 14, 13, 15, 16, 18 e 12 anos. �̅� = 10+14+13+15+16+18+12 7 �̅� = 98 7 �̅� = 14 𝑑𝑛 = 𝑥𝑖 − �̅� 36 Estatística Aplicada à Educação Universidade Santa Cecília - Educação a Distância Confirmando a soma dos desvios deve ser igual à zero: 7.3. Média aritmética de dados agrupados Quando os dados são agrupados, as frequências de classe são indicadores de intensidade, ou seja, elas indicam a quantidade de vezes que cada um dos valores da distribuição acontece, portanto, elas funcionam como fatores de ponderação, então, a média aritmética é obtida pela equação: Onde: Se os dados estiverem agrupados em intervalos de classe, para somatória dos valores, utiliza-se a somatória dos pontos médios das classes. 7.3.1. Exemplo de dados agrupados sem intervalo de classe Um professor construiu a tabela abaixo com a distribuição de frequência dos meninos em grupos de alunos para um trabalho. Qual a média de meninos por grupo? ∑ di 7 1 = (-4)+0+(-1)+1+2+4+(-2) ∑ 𝑑𝑖 7 1 = 0 37 Estatística Aplicada à Educação Universidade Santa Cecília - Educação a Distância 7.3.2. Exemplo de dados agrupados com intervalo de classe O professor de Educação física mediu a estatura de seus alunos e montou a tabela abaixo. Qual a estatura média dos alunos desta classe? Observe que foi utilizado para xi o ponto médio de cada intervalo de classe dos valores das alturas dos alunos. Observando a tabela temos: Observando a tabela temos A resposta é 2 meninos por grupo 38 Estatística Aplicada à Educação Universidade Santa Cecília - Educação a Distância 8. MODA E MEDIANA Objetivo Nesta aula serão apresentadas mais duas medidas de tendência central que auxiliam na interpretação de dados estatísticos. 8.1. Definição de Moda Moda é o valor que ocorre com maior frequência em uma série de valores. Se tomarmos como exemplo notas de uma prova ou de uma disciplina, a moda será a nota obtida pela maioria dos alunos. Podem existir grupos de valores nos quais nenhum valor aparece mais de uma vez, então, podemos afirmar que esta série de valores é amodal, assim como, podem existir grupos com mais de um valor sendo repetido o mesmo número de vezes, estas distribuições são chamadas de bimodais (duas modas), trimodais (3 modas) e assim por diante. 8.1.1. Exemplo Em um jogo de basquete, o professor de educação física anotou o número de cestas que cada aluno acertou em três turmas. Quais as modas de acertos dos alunos em cada uma das turmas. Turma A: 7, 8, 9, 10, 10, 10, 11, 12, 12, 15. Turma B: 3, 5, 8, 10, 12, 13, 15. Turma C: 2, 4, 4, 4, 5, 6, 7, 7, 7, 8, 9. Respostas: Turma A: 7, 8, 9, 10, 10, 10, 11, 12, 12, 15 => Moda da Turma A: 10. Turma B: 3, 5, 8, 10, 12, 13, 15. => Turma B não tem moda é amodal. Turma C: 2, 4, 4, 4, 5, 6, 7, 7, 7, 8, 9. => Turma C é Bimodal: 4 e 7. 8.1.2. Moda de dados agrupados Quando os dados estão agrupados a moda, corresponde ao valor de maior frequência. Caos os dados estejam agrupados com intervalo de classe, a moda será o ponto médio da classe de maior frequência. 39 Estatística Aplicada à Educação Universidade Santa Cecília - Educação a Distância 8.1.3. Exemplo: moda com dados agrupados sem intervalo de classe Utilizando o mesmo exemplo do professor que construiu uma tabela com a distribuição de frequência dos meninos em grupos de alunos para um trabalho. Qual a moda de meninos por grupo? Solução: Conforme definição, a moda é o valor da classe de maior frequência. Como a maior frequência é 12, a moda será 3. 8.1.4. Exemplo: moda com dados agrupados com intervalo de classe No mesmo exemplo anterior, no qual o professor de educação física montou a tabela com a estatura média dos alunos de sua classe, calcular a moda. Solução: Conforme definição, a moda será o ponto médio da classe com maior frequência. Como a classe com maior frequência é a classe 3 (frequência 11), podemos afirmar que a moda será o ponto central da classe 3 que é: 8.2. Mediana Em um conjunto de valores ordenados, a mediana é o valor situado de tal forma que os subconjuntos antes e depois do valor da mediana são iguais. Caso a quantidade de valores do conjunto seja um número ímpar, a moda será a média entre os dois valores centrais. 8.2.1. Exemplo com número ímpar de valores Determine a mediana do seguinteconjunto de valores: 2, 5, 6, 9,10,13,15,16,18. 40 Estatística Aplicada à Educação Universidade Santa Cecília - Educação a Distância Solução: Como existem 9 valores, portanto um número ímpar de valores, basta separar 4 valores de cada lado e a mediana será o valor central. A mediana será 10. 8.2.3. Exemplo com número par de valores Determine a mediana do seguinte conjunto de valores: 2, 6, 7, 10, 12, 13, 18, 19. Solução: Como existem 8 valores, portanto um número par de valores, basta separar 3 valores de cada lado e a mediana será a média dos dois valores centrais. A mediana será a média entre 10 e 12, portanto: 8.2.4. Mediana de dados agrupados sem intervalo de classe Quando os dados são agrupados sem intervalo de classe, o cálculo é feito da seguinte maneira: a) Calcula-se a frequência acumulada da distribuição: = ∑ 𝑓𝑖 b) Divide-se o número total de elementos da distribuição por 2: = ∑ 𝑓𝑖 2 c) Procura-se a menor frequência acumulada que supera o valor obtido anteriormente. d) A mediana será o valor desta classe: 8.2.5. Exemplo: mediana com dados agrupados sem intervalo de classe Utilizando o mesmo exemplo do professor que construiu uma tabela com a distribuição de frequência dos meninos em grupos de alunos para um trabalho. Qual a mediana de meninos por grupo? 41 Estatística Aplicada à Educação Universidade Santa Cecília - Educação a Distância Solução: Incluir na tabela a coluna de frequência acumulada. Dividir o número total de elementos por 2 Procurar o menor valor de frequência acumulada que supera 17, que é o valor 18. A mediana será o valor da classe de frequência acumulada 18 que é 2. 8.2.6. Mediana de dados agrupados com intervalo de classe Quando os dados são agrupados com intervalo de classe, o cálculo é feito de maneira semelhante ao do item anterior, porém, o valor da mediana é obtido através de uma equação e não por simples observação de valor. O procedimento é o seguinte: a) Calcula-se a frequência acumulada da distribuição: = ∑ 𝑓𝑖 b) Divide-se o número total de elementos da distribuição por 2: = ∑ 𝑓𝑖 2 c) Procura-se a menor frequência acumulada que supera o valor obtido anteriormente. d) Calcular a mediana pela equação: 42 Estatística Aplicada à Educação Universidade Santa Cecília - Educação a Distância 8.2.7. Exemplo: mediana com dados agrupados com intervalo de classe No mesmo exemplo anterior, no qual o professor de educação física montou a tabela com a estatura média dos alunos de sua classe, calcular a mediana. Solução: Incluir na tabela a coluna de frequência acumulada. Dividir o número total de elementos por 2 Procurar o menor valor de frequência acumulada que supera 20, que é o valor 24 Calcular a mediana utilizando a equação: 43 Estatística Aplicada à Educação Universidade Santa Cecília - Educação a Distância Onde: Li = Limite inferior da classe mediana =158 Fi = Frequência da classe mediana =11 Fa(ant) = Frequência acumulada anterior à mediana =13 h= Intervalo de classe da classe mediana = 4 Somatória de Fi dividido por 2 (já calculado) = 20 44 Estatística Aplicada à Educação Universidade Santa Cecília - Educação a Distância 9. EXEMPLOS ADICIONAIS 9.1. Exemplo com dados não agrupados As notas da prova de ciências são fornecidas na tabela abaixo. Determine: a) A nota média. b) A nota mais comum (moda). c) A mediana das notas. Solução: Ordenando os valores teremos: Observando a frequência de cada uma das notas temos: Nota 3: f = 2 Nota 4: f = 2 Nota 5: f = 3 Nota 6: f = 5 Nota 7: f = 3 Nota 8: f = 7 Nota 9: f = 6 Nota 10: f = 2 Média: Com a frequência de cada valor, para calcular a média: Moda: É a nota que aconteceu mais vezes, aquela que tem maior frequência: 𝑴𝒐𝒅𝒂 = 𝟖 (7 alunos obtiveram 8) Mediana: Como o número de notas (30) é par a mediana será a média dos dois valores centrais: 7 6 5 4 8 9 5 8 8 8 8 10 3 6 9 8 7 9 9 9 10 3 6 5 8 7 6 9 4 6 3 3 4 4 5 5 5 6 6 6 6 6 7 7 7 8 8 8 8 8 8 8 9 9 9 9 9 9 10 10 45 Estatística Aplicada à Educação Universidade Santa Cecília - Educação a Distância 9.2. Exemplo com dados agrupados Para obter mais informações sobre seus alunos e poder participar uma reunião sobre assiduidade em suas aulas em uma determinada classe de sua escola. Você preparou a tabela abaixo. Baseado nesta tabela, calcule: a) A média de faltas. b) A moda das faltas. c) A mediana das faltas. Solução Incluir na tabela a coluna com os produtos Xi.fi e a coluna de frequências acumuladas. Média: A média das faltas é obtida pela equação: Moda: É o valor de classe (número de faltas) correspondente ao valor de maior frequência. O valor maior valor de frequência, Fi é 8, portanto, a moda será 4; Mediana: Para obter a mediana devemos primeiro dividir a soma de Fi por 2 O menor valor de Fa que supera 15 é 19, portanto, a mediana das faltas é 3. 46 Estatística Aplicada à Educação Universidade Santa Cecília - Educação a Distância Observe que em sua reunião, você poderá falar que embora a média de faltas da classe seja 2,3, um número relativamente baixo, a moda (o mais comum) foi de 4 faltas, ou seja, muitos alunos estão com 4 faltas, isto se dá porque alguns alunos são muito assíduos e, ou não faltaram ou tiveram apenas 1 ou duas faltas, mas o número de alunos com 4 faltas é o que talvez prejudique o rendimento da turma.