Prévia do material em texto
AULA 4 - MEDIDAS DE TENDÊNCIA CENTRAL (POSIÇÃO) • Reconhecer as medidas de tendência central (Posição). CONTEXTUALIZANDO A APRENDIZAGEM Prezado(a) Aluno(a), o estudo que fizemos sobre distribuições de frequência, até agora, permite-nos descrever, de modo geral, os grupos dos valores que uma variável pode assumir. Como vimos anteriormente, para fazermos uma pesquisa estatística, é preciso coletar e organizar dados de uma população ou de uma amostra significativa do tema analisado. Considerando, que em geral, é obtida uma grande quantidade de dados, para apresentar o resultado da pesquisa pode ser necessário escolher uma medida que resuma os dados levantados. Dessa forma, podemos localizar a maior concentração de valores de uma dada distribuição, isto é, se ela se localiza no início, no meio ou no final, ou, ainda, se há uma distribuição por igual. Para ressaltar, porém, as tendências características de cada distribuição, isoladamente, ou em confronto com outras, necessitamos introduzir conceitos que se expressem através de números e que nos permitam traduzir essas tendências. Nesta Aula, você vai conhecer as principais e mais importantes medidas de posição, entre elas, a média, mediana e moda, tanto para dados organizados em intervalos de classes como para dados organizados em distribuição de frequências. Ao final da Aula, você conseguirá responder aos seguintes questionamentos: Como as fórmulas retratam as medidas de posição? Como realizar os seus cálculos para encontrar os valores procurados? Mais do que esses questionamentos, você saberá compreender e interpretar esses valores. Então, vamos começar nossos estudos? Prossiga. Mapa mental panorâmico Para contextualizar e ajudá-lo(a) a obter uma visão panorâmica dos conteúdos que você estudará na Aula 4, bem como entender a inter- relação entre eles, é importante que se atente para o Mapa Mental, apresentado a seguir: MEDIDAS DE TENDÊNCIA CENTRAL (POSIÇÃO) 1 MEDIDAS DE TENDÊNCIA CENTRAL 1.1 A MÉDIA ARITMÉTICA 1.1.1 DESVIO EM RELAÇÃO À MÉDIA 1.1.2 PROPRIEDADES DA MÉDIA 1.2 MEDIANA 2 MEDIDAS DE TENDÊNCIA CENTRAL PARA DADOS AGRUPADOS 2.1 SEM INTERVALOS DE CLASSE 2.1.1 MODA 2.1.2 MEDIANA 2.1.3 MÉDIA ARITMÉTICA PARA DADOS AGRUPADOS OU PONDERADA 2.2 COM INTERVALO DE CLASSE 2.2.1 MÉDIA 2.2.2 MEDIANA 2.2.3 MODA 3 AS SEPARATRIZES MEDIDAS DE TENDÊNCIA CENTRAL (POSIÇÃO) 1 MEDIDAS DE TENDÊNCIA CENTRAL As medidas de tendência central são também chamadas de medidas de posição e estabelecem o valor em torno do qual os dados se distribuem. Podem ser utilizadas em conjunto para auxiliar a análise dos dados, ou, em determinadas situações, uma pode ser mais conveniente do que a outra. Quando falamos de medidas de tendência central fazemos conexão com os estudos relacionados a área da Educação. Isso porque, pesquisadores de muitos campos têm usado o termo média para fazer perguntas como: Quais são as rendas médias obtidas por pessoas com diploma no ensino médio e diploma universitário? Qual é a nota média do estudante universitário do sexo feminino? Em média, quantos acidentes de automóveis acontecem como resultado direto do uso de álcool e drogas? Uma maneira útil de descrever um grupo como um todo é encontrar um único número que represente a média ou algo típico daquele conjunto de dados. Na pesquisa, tal valor é conhecido como medida de tendência central. As medidas de tendência central são: média, moda e mediana. Estudaremos detalhadamente cada uma, mostrando a importância dessas medidas em uma distribuição de dados. 1.1 A MÉDIA ARITMÉTICA A média aritmética representa o ponto de concentração dos valores de um conjunto de dados ou uma sequência numérica. Entre as medidas, a tendência central é a mais utilizada para descrever resumidamente uma distribuição de frequência. A média de um conjunto de dados é a soma dos valores e dos dados dividida pelo número de observações. Quando desejamos conhecer a média dos dados não agrupados, determinamos a média aritmética simples. Para encontrá-la, temos duas fórmulas: ou Antes de prosseguir com seus estudos, é aconselhável que você tenha uma calculadora para acompanhar os cálculos que forem realizados. A letra grega minúscula (pronuncia-se mi) representa a média populacional e (lê-se “x” barra) representa a média amostral. Note que N representa o número de observações em uma população e n representa o número de observações em uma amostra. Lembre-se de que a letra maiúscula sigma ( ) indica a soma de valores. Nesse primeiro exemplo, os pesos (em Kg) de uma amostra de adultos antes de iniciarem um estudo sobre perda de peso estão listados: - Dados da amostra (kg): 85, 95, 102, 98, 112, 90, 78, 64 Agora eu pergunto: Qual é o peso médio dos adultos? Vamos aos cálculos: A soma dos pesos é: Há 8 adultos na amostra, logo, para encontrar o peso médio, dividimos a soma dos pesos pelo número de adultos na amostra. Então, o peso médio dos adultos é 90,5 kg. Bem simples, não é mesmo? Muito bem, em outro exemplo, agora na 20ª rodada do Campeonato Brasileiro de Futebol foram realizados 10 jogos, cuja quantidade de gols por partida está apresentada na Tabela 1: Tabela 1: 20ª Rodada do Campeonato Brasileiro de Futebol 20ª Rodada do Campeonato Brasileiro de Futebol Partida 1ª 2ª 3ª 4ª 5ª 6ª 7ª 8ª 9ª 10ª Número de gols 2 6 1 3 2 3 1 0 1 2 Fonte: Elaborado pela Autora. Qual a média de gols da rodada? Para calcular a média, basta somar o número de gols de cada partida e dividir o total obtido pelo número de pesquisa. A soma do número de gols é: Foram realizados 10 jogos, logo, para encontrar a média de gols, basta dividir a soma dos gols pelo número de jogos da rodada: Sendo assim, a média de gols da rodada é de 2,1. Bem tranquilo, não é mesmo? Lembre-se desses exemplos, iremos trabalhá-los ao longo da Aula. 1.1.1 DESVIO EM RELAÇÃO À MÉDIA Denominamos desvio em relação à média a diferença entre cada elemento de um conjunto de valores e a média aritmética. Para isso, usamos a fórmula: Calculando os desvios em relação à média do exemplo do peso médio do adulto, visto anteriormente, temos: 1.1.2 PROPRIEDADES DA MÉDIA A média possui algumas propriedades que merecem ser estudadas. Saiba que essas propriedades nos ajudam a resolver questões de estatísticas. Que tal conhecê-las? Vamos lá! · 1ª propriedade: Na primeira propriedade, a soma algébrica dos desvios tomados em relação à média é nula. Para o cálculo, usamos a fórmula: Aplicando os desvios em relação à média que calculamos anteriormente sobre o exemplo do peso médio do adulto, temos: · 2ª propriedade: Na segunda propriedade, ao somar (ou dividir) todos os valores de uma variável por uma constante (c), a média do conjunto fica multiplicada (ou dividida) por essa constante. A fórmula usada é a seguinte: Somando 2 a cada um dos valores da variável do exemplo dos pesos, temos: - Dados da amostra (kg): 85, 95, 102, 98, 112, 90, 78, 64. - Dados acrescidos de 2 (Kg): 87, 97, 104, 100, 114, 92, 80, 66. Calculando a média para os novos dados, temos: Aplicando a propriedade, temos: · 3ª propriedade: E na terceira propriedade, ao multiplicar (ou dividir) todos os valores de uma variável por uma constante (c), a média do conjunto fica multiplicada (ou dividida) por essa constante. Veja a fórmula usada: Vamos multiplicar por 3, os dados da amostra (kg) do exemplo. Em seguida, vamos verificar a 3ª propriedade. Veja os cálculos: - Dados da amostra: (kg): 85, 95, 102, 98, 112, 90, 78, 64. Multiplicando os valores da amostra por 3, obtemos: 255, 285, 306, 294, 336, 270, 234, 192. Calculando a média dos novos números, encontramos: 1.2 MEDIANA A mediana de um conjunto de dados é um valor que está no meio dos dados quando o conjunto está ordenado. Essa medida, indica o centro de um conjunto de dados ordenado, dividindo-o em duas partes com quantidades iguais de valores. Quando um conjunto de dados tem um númeroímpar de observações, a mediana é o elemento do meio. Se o conjunto de dados tem um número par de observações, a mediana será a média dos dois elementos que ocupam as posições centrais. Resumindo, temos: Nesse primeiro exemplo, o número de dias de viagem de férias de onze funcionários de uma empresa está relacionado a: 8, 7, 12, 9, 6, 11, 5, 7, 8, 9, 15. Qual é o número mediano de dias de viagem? Vamos aos cálculos: Primeiro vamos ordenar os valores: 5, 6, 7, 7, 8, 8, 9, 9, 11, 12, 15. Como o número de dados é ímpar, a mediana é igual à 6ª, como temos 11 termos fazemos 11/2 = 5,5, logo arredondamos para o inteiro mais próximo 6, ou seja, o sexto termo. Podemos, também, encontrar a mediana por meio de uma fórmula. Como temos um número ímpar de termos, para encontrarmos a posição da mediana usamos a fórmula: Ou seja, = 6. Já nesse outro exemplo, foi realizado uma pesquisa no site Trivago para verificar os preços de hotéis em Florianópolis na temporada de janeiro/2019. Muito bem, veja na Tabela 2 os preços de 14 hotéis. Sendo assim, esses são os dados da cotação da diária de hotéis em Florianópolis-SC, referente ao mês de janeiro / 2019. Tabela 2: Cotação de valores diárias / Hotéis Florianópolis Hotel Valor da diária (R$) Cecomtur Executive 216 Palace 1 398 São Sebastião 411 Águas do santinho 952 Blue Tree Premium 578 Ibis 242 Porta da Ilha 414 Costa Norte Ingleses 700 Morro das pedras 341 Cambirela Hotel 264 Encantos Lexus 438 Faial Prime 350 Maria do mar 318 Mercure 416 Fonte: Elaborada pela Autora com base nas informações do site da Trivago. Fonte disponível em: https://www.trivago.com.br/. Acesso em: 21 de jan. 2019. Vamos calcular a mediana dos preços em reais, das diárias? Vejamos os cálculos: Temos uma amostra de preços de 14 hotéis, então (quantidade par). Inicialmente vamos colocar os preços em ordem crescente (ou decrescente). Você pode usar a planilha Excel para ordenar os dados. Veja: https://www.trivago.com.br/ Figura 1: Ordenando os dados no excel Fonte: Arquivo pessoal da Autora. Aplicando a fórmula, temos: Para conferir a resposta você pode usar o excel. Basta, em uma célula qualquer que esteja em branco, digitar “=med” e abrirá uma caixa de opções. Em seguida, deve selecionar MED e a célula retorna com a mediana, como podemos ver na Figura 2. Figura 2: Mediana no Excel Fonte: Arquivo pessoal da Autora. 1.3 MODA A moda de um conjunto de dados é o valor que ocorre com maior frequência. Um conjunto de dados pode ter uma moda, mais de uma moda, ou não ter moda. Em relação ao número de modas um conjunto de dados pode ser: Unimodal quando o conjunto tem uma única moda. Bimodal quando o conjunto tem duas modas. Multimodal quando o conjunto tem três ou mais modas. Amodal quando o conjunto não tem moda (nesse caso, todas as observações aparecem uma única vez na amostra). No primeiro exemplo, vamos encontrar a moda dos pesos listados na distribuição da Tabela 3: Tabela 3: Distribuição dos pesos 68 86 56 82 95 72 86 Fonte: Elaborada pela Autora. A partir dos dados ordenados, podemos ver que o valor 86 ocorre duas vezes, enquanto os demais ocorrem somente uma vez. Então, a moda dos pesos é 86 kg. Já o segundo exemplo, está relacionado a um debate político no Brasil onde pede-se uma amostra dos membros da plateia que indique o partido político ao qual pertencem. Suas respostas são mostradas na Tabela 4. Tabela 4: Frequência dos membros segundo partido em um debate político Partido político Frequência Movimento Democrático Brasileiro – MDB 38 Partido Trabalhista Brasileiro – PTB 49 Partido Democrático Trabalhista – PDT 18 Partido dos Trabalhadores - PT 23 Partido da Social Democracia Brasileira – PSD 21 Partido Social Liberal - PSL 15 Partido Novo - NOVO 24 Progressistas - PP 16 Fonte: Elaborada pela Autora. Agora eu pergunto: Qual é a moda das respostas? Veja que a resposta que ocorre com maior frequência é o Partido Trabalhista Brasileiro. Então, a moda é PTB. Embora a média, a mediana e a moda descrevem, cada uma, um valor típico de um conjunto de dados, há vantagens e desvantagens em seus usos. Segundo LARSON (2008), a média é uma medida mais usual e confiável, pois leva em conta cada elemento de um conjunto de dados. Contudo, a média pode ser muito afetada quando o conjunto de dados contém valores discrepantes (outliers). Segundo Reis e Reis (2001), os outliers podem ser valores corretos que, por alguma razão, são muito diferentes dos demais valores. Nesse caso, a análise desses dados deve ser cuidadosa, pois algumas estatísticas descritivas, como a média e o desvio-padrão, são influenciadas por valores extremos. O fato de a média aritmética ser a medida de tendência central mais utilizada não quer dizer que ela seja sempre a melhor escolha, mesmo sendo a que possui maior estabilidade. Para saber se os valores discrepantes estão afetando a média, você pode levar em conta outras medidas, como a mediana e a moda da distribuição. Antes de decidir o que deverá ser feito às observações outliers é conveniente ter conhecimento das causas que levam ao seu aparecimento. Em muitos casos as razões que levam ao aparecimento de outliers são: erros de medição, erros de execução e variabilidade inerente dos elementos da população. Podemos aplicar os outliers em estudos de: · detecção de fraudes; · comportamento de gastos de consumidores; · análises médicas em resultados não esperados de tratamentos; · pesquisa farmacêutica; · marketing. Assim a identificação é feita, geralmente, por análise gráfica ou, no caso de um número de dados ser pequeno, por observação direta. Como dissemos aqui, a calculadora é uma grande aliada na hora dos cálculos. Mas pelo que vimos, fica bem difícil realizar esses cálculos em calculadoras simples. Você sabia que existe calculadoras específicas para estatísticas? Saiba que muitas estão disponíveis online, de forma gratuita. A calculadora de estatística permite calcular um número de propriedades estatísticas de uma amostra. Umas das calculadoras disponíveis é “Numberempire”, basta inserir os dados, clicar em média e pedir para calcular. Que tal refazer os cálculos que vimos até aqui, mas agora na calculadora online? Então, clique aqui e exercite! -| Acesso disponível em: 06 de mai. 2019. E aí, conseguiu realizar os cálculos? Então, nos próximos exemplos, utilize a calculadora de estatística para conferir os cálculos. 2 MEDIDAS DE TENDÊNCIA CENTRAL PARA DADOS AGRUPADOS Também chamados de centro da distribuição, as medidas de tendência central informam o valor em torno do qual os dados se distribuem, ou seja, os valores centrais. Tem por objetivo representar os dados de uma forma mais condensada que uma tabela, localizando a maior concentração de valores em torno de uma distribuição. Conheça a seguir, as medidas de tendência central para dados agrupados. 2.1 SEM INTERVALOS DE CLASSE Quando realizamos uma pesquisa, podemos obter um conjunto de dados muito grande. Para analisá-los melhor, nós os agrupamos por frequência, mas não os colocamos em intervalos de classe. Uma empresa do setor alimentício fez uma pesquisa com um grupo de pessoas sobre o novo produto que gostariam de lançar no mercado. As pessoas tinham de dar notas para esse produto, ou seja, 0 se não gostou do produto, 1 se achou bom, 2 se achou muito bom e 3 se adorou o produto. Com os dados, obteve-se a seguinte Tabela de distribuição de frequência: Tabela 5: Apreciação de um produto alimentício Notas dadas ao produto Frequência absoluta 0 3 1 7 2 4 3 1 Total 15 https://pt.numberempire.com/statisticscalculator.php Fonte: Elaborado pela autora. Com apenas essa informação, a empresa não consegue fazer uma boa análise da pesquisa, não é mesmo? Para isso, é preciso calcular algumas medidas. E como calcular a moda, mediana e a média desses dados agrupados? Veja os cálculos, a seguir. 2.1.1 MODA Para calcular a moda em dados agrupados sem intervalo de classe é bem simples, bastaverificar a variável com maior frequência. Observando a coluna de frequência da Tabela 5, notamos que a maior frequência foi 7. A variável correspondente à frequência 7 é 1, logo a moda é igual a 1 e representamos por Mo = 1. 2.1.2 MEDIANA Uma maneira de chegar à mediana de dados agrupados sem intervalos de classe é trabalhar com a coluna de frequências acumuladas de sua tabela. A frequência acumulada é dada pela soma das frequências dos valores menores ou iguais ao valor considerado. Assim, você consegue observar que frequência acumulada absoluta é igual ou superior à metade das ocorrências da distribuição. Para calcular a mediana de dados agrupados sem intervalos de classe, usamos a seguinte fórmula: Vamos acrescentar mais uma coluna à Tabela 5 e obter a frequência acumulada: Tabela 6: Distribuição de frequência acumulada Notas dadas ao produto Frequência absoluta Frequência absoluta acumulada 0 3 3 1 7 10 2 4 14 3 1 15 Total 15 Em seguida, vamos utilizar a fórmula para o cálculo da mediana: Observe que na linha 1 da frequência acumulada estão os números que ocupam as posições 1ª, 2ª e 3ª. Na linha 2, temos os elementos que ocupam as posições 4ª, 5ª, 6ª, 7º, 8ª, 9ª e 10ª e assim por diante. Então, o resultado pertence à linha 2 que corresponde ao valor de variável 1. Logo, Md = 1. Em outro exemplo, o de uma empresa de Engenharia, foi feita uma pesquisa sobre o salário dos trabalhadores. Os dados recolhidos estão expressos na Tabela 7: Tabela 7: Remuneração mensal Distribuição da remuneração mensal Salário (R$) Número de trabalhadores 1200 25 2800 15 3500 5 4400 3 5900 2 Total 50 Qual o salário mediano? Vamos aplicar a fórmula: Note que a mediana é a média aritmética entre os termos 25ª e 26º. Acrescentando a coluna da frequência acumulada à Tabela, temos: Tabela 8: Calculando a mediana da remuneração mensal Distribuição da remuneração mensal Salário (R$) Número de trabalhadores Frequência absoluta acumulada 1200 25 25 2800 15 40 3500 5 45 4400 3 48 5900 2 50 Total 50 Fonte: Elaborada pela Autora. Observe que o 25º termo pertence à primeira linha e o 26º termo pertence à segunda linha. Então a mediana é: 2.1.3 MÉDIA ARITMÉTICA PARA DADOS AGRUPADOS OU PONDERADA Em uma tabela de distribuição, as frequências indicam a intensidade de cada valor da variável, por isso funcionam como fatores de ponderação. Então, para calcular a média dos dados que são agrupados, mas não em classes, vamos multiplicar o valor da variável por sua frequência . Em seguida, vamos somar esses produtos e dividi-los pelo total de ocorrências. Matematicamente, expressamos essa média pela seguinte fórmula: Nesse caso: é a média ponderada. é a soma do produto entre o valor da variável e sua frequência absoluta. é a soma das frequências absolutas, ou seja, o total das ocorrências. Para facilitar o cálculo da média ponderada em agrupamentos sem intervalo de classe, acrescentamos à tabela mais uma coluna para multiplicar o valor da variável pela frequência absoluta . Denotamos essa operação na tabela por , para depois somar esses produtos . Vamos calcular a média ponderada dos salários dos trabalhadores da empresa de engenharia. Tabela 9: Média ponderada da remuneração mensal - I Distribuição da remuneração mensal Salário (R$) Número de trabalhadores 1200 25 2800 15 3500 5 4400 3 5900 2 Total 50 Fonte: Elaborada pela Autora. Para começar os cálculos, vamos acrescentar à tabela os valores correspondentes ao . Tabela 10: A média ponderada da remuneração mensal – II Fonte: Elaborada pela Autora. Aplicando a fórmula da média, temos: Assim, a nota média dos salários é igual a R$ 2.290,00. 2.2 COM INTERVALO DE CLASSE Podemos calcular medidas de tendência central trabalhando diretamente com todos os dados coletados, ou seja, usando os dados brutos. Porém, em diversas pesquisas, os dados que levantamos sobre um assunto ou um fenômeno precisam ser agrupados em tabelas com intervalos de classe. Esse agrupamento procura resumir conjuntos grandes de dados, simplificando a sua exploração. Dessa forma, você só tem à mão dados organizados em distribuição de frequência agrupados em classe. Os valores brutos ficam inacessíveis e não podem ser usados nos cálculos. Nos casos em que não podemos trabalhar com os valores reais da distribuição, pois estão organizados em intervalos de classe, podemos calcular a média, moda e mediana convencionando que todos os valores que pertencem a determinado intervalo de classe coincidem com o seu ponto médio (Pmi), que é dado pela soma do limite superior com o limite inferior do intervalo dividido por 2. A partir daí, devemos seguir o mesmo procedimento usado para dados não agrupados, considerando xi = Pmi. O fato de usarmos nos cálculos os pontos médios das classes e não os valores encontrados, faz dos seus resultados meras aproximações da realidade. Mas, na maioria dos casos, essa aproximação, baseada em uma distribuição de frequência de grupo, produz resultados bastante razoáveis. Reis e Reis (2001), orientam que quando fazemos levantamentos que envolvem questões como idade e a renda do entrevistado, costumamos organizar dados em classes de idades e classes de renda. Assim, eles não precisam revelar a idade ou a renda exata, aumentando a chance de responderem à pergunta. 2.2.1 MÉDIA Calculamos a média de uma distribuição de frequência agrupada em intervalo de classe adaptando a fórmula que usamos no cálculo da média da distribuição de frequência em agrupamento sem intervalo de classe. Nesse caso, é o ponto médio do intervalo. Assim, temos: Sendo que: é a média ponderada. é a soma do produto entre o ponto médio do intervalo e sua frequência absoluta do intervalo. é a soma das frequências absolutas, ou seja, o total das ocorrências. Para mostrar o cálculo da média, vamos tomar como exemplo, as notas dos alunos de engenharia que fizeram prova final na disciplina de estatística. O valor total da prova é de 10 pontos. Os dados já foram tabulados e representados em intervalos de classe. Tabela 11: Notas na prova final de estatística - 1 Fonte: Elaborada pela Autora Observando a Tabela 11, temos 16 alunos que tiraram nota entre 4 e 6 pontos. Essas notas podem ser 4, maiores que 4 e menores que 6. Inicialmente, vamos calcular o ponto médio de cada intervalo, como mostra a Tabela 12: Tabela 12: Calculando o ponto médio das notas na prova final Fonte: Elaborada pela Autora. Note que o número 1 está no meio de 0 e 2, o número 3 está no meio de 2 e 4, por isso é o ponto médio do intervalo. Para facilitar os cálculos, vamos acrescentar a tabela mais uma coluna para descobrirmos o produto entre a frequência absoluta e o ponto médio que denotamos por . A Tabela 13 mostra esse cálculo. Tabela 13: Cálculo da média ponderada Fonte: Elaborada pela Autora. Aplicando a fórmula, temos: Então, a média das notas na prova final de estatística é de 5,05 pontos. Note que esse valor pertence ao intervalo de classe Conseguiu acompanhar a resolução? Para não restar dúvida, a seguir, veja outro exemplo. Nesse segundo exemplo, vamos calcular a média dos dados da Tabela 14: Tabela 14: Dados de uma amostra Fonte: Elaborada pela Autora. Veja que vamos agrupar os dados em intervalos de classes, acompanhando os seguintes passos: • 1º passo: Organizar o rol. Tabela 15: Dados de uma amostra em rol Fonte: Elaborada pela Autora. • 2º passo: Usando a fórmula de Sturges, encontramos: k = 1 + 3,3.log50 k= 1 + 3,3log1,7 k = 1 + 6,61 k = 6,61 Portanto, determinamos que a distribuição será composta de 7 classes (h). • 3º passo: Determinar o intervalo de classe (h). Lembrando que AT = amplitude total, ou seja, é a diferença entre o maior e o menor valor observado da variável em estudo: Então, a amplitude total do exemplo é: Aqui, vamos considerar h = 0,015. • 4º passo: Escolher o valor inicial do intervalo, representar na tabela e registrar a frequência dosdados que pertencem a cada intervalo. Não podemos esquecer de utilizar o símbolo para considerar intervalo fechado à esquerda e aberto à esquerda. Indicando que vamos incluir o número à esquerda e excluir o número à esquerda. Tabela 16: Dados organizados em intervalos de classe Fonte: Elaborada pela autora. Lembrando que devemos somar todas as frequências para conferir a contagem dos dados. • 5º passo: Construir as colunas de ponto médio e de produto do ponto médio pela frequência. Tabela 17: Cálculo da média de uma amostra em intervalo de classes Fonte: Elaborada pela Autora. Pronto! Encontramos o ponto médio. Mas uma outra opção para encontrar o ponto médio é acrescentar ao primeiro valor encontrado o valor da amplitude de classe e assim por diante, encontrando os demais. Encontramos 0,0075 para o primeiro ponto médio. Se o intervalo de classe é 0,015, então, o próximo ponto médio será: • 6º passo: Calcular a média. Portanto a média dos dados é Você pode conferir o resultado selecionando a tabela dos dados (ctrl+c + ctrl+v) na planilha do excel e, em uma célula sem dados, inserir à fórmula “=média” e selecione os dados. Daí o programa retorna o valor da média dos dados brutos, como vemos na Figura 3. Figura 3: Cálculo da média na planilha Excel Fonte: Arquivo pessoal. O valor encontrado é 0,056, porque calculamos diretamente com os dados brutos. No caso da não abrangência de todos os elementos do rol, devemos aumentar a amplitude do intervalo de classes (h) ou o número de classes. Mesmo em meio às ideias principais e algumas regras que acabamos de apresentar, saiba que, às vezes, ainda é preciso algo mais. Como por exemplo: “agir com bom senso” “ou levar em conta a experiência pessoal no assunto”. Caso contrário, só as expressões e as regras podem não nos levar a uma decisão final mais sensata. 2.2.2 MEDIANA Quando os dados estão agrupados em intervalos de classe, temos de achar a mediana dentro de um dos intervalos. Para tanto, é necessário determinar a classe do intervalo que contém a mediana. Daí, empregamos a fórmula: Onde que na fórmula: • é a mediana. • é o número de elementos da distribuição. • é o limite inferir da classe da mediana. • é a frequência acumulada da classe anterior à classe da mediana. • é frequência simples da classe da mediana. • é a amplitude do intervalo da classe da mediana. Vamos considerar a pesquisa sobre as notas dos alunos da engenharia na prova final de estatística. Tabela 18: Notas das provas finais de estatística - 2 Fonte: Elaborada pela Autora Para encontrarmos a classe da medida vamos construir, além da coluna do ponto médio, a coluna de frequência acumulada. Tabela 19: Calculando o ponto médio e frequência acumulada Fonte: Elaborada pela Autora. Agora, para obter a mediana, temos que observar qual frequência acumulada é igual ou superior à metade das ocorrências da distribuição. Nesse caso, a metade da distribuição é 20. Então, a menor frequência acumulada que supera esse valor é 28, que corresponde ao intervalo de classe mediano e seu ponto médio é 5. Tabela 20: Calculando a mediana Fonte: Elaborada pela autora. Substituindo na fórmula, temos: Onde: • é o limite inferir da classe da mediana . Aplicando os dados na fórmula, temos: Então, a mediana dos dados é 5 pontos. 2.2.3 MODA A classe que apresenta a maior frequência é denominada classe modal. Pela definição, podemos afirmar que a moda, nesse caso, é o valor dominante que está compreendido entre os limites da classe modal. Em muitas situações quando analisamos dados contínuos a moda amostral pode não representar adequadamente os dados, especialmente quando o conjunto for bimodal ou multimodal. Nessas situações, a distribuição teórica, a qual buscamos identificar pelo histograma, pode não ser bem representada pela amostra devido a diversas razões: poucas observações; grande variabilidade; formado da distribuição. Nesses casos, pode-se indicar não uma moda, mas uma classe modal, dada pela classe na distribuição com a maior frequência. Uma alternativa, entretanto, é utilizar a moda de Czuber, que leva em conta a classe modal e as frequências das classes imediatamente anteriores e posteriores à classe modal. A moda de Czuber é calculada pela seguinte expressão: Em que: Vamos aplicar a fórmula da moda de Czuber, para calcular a moda, da seguinte distribuição: Tabela 21: Notas na prova final de estatística - 3 Fonte: Elaborada pela Autora. Para isso, vamos construir a coluna dos valores do ponto médio e do produto do ponto médio pela frequência. Tabela 22: Calculando a moda Fonte: Elaborada pela Autora. Observando a Tabela, podemos dizer que: Aplicando esses dados à fórmula de Czuber, temos: Logo, 3 AS SEPARATRIZES As medidas (quartis, os decis e os percentis) são, juntamente com a mediana, conhecidas pelo nome genérico de separatrizes. Enquanto a mediana separa a distribuição em duas partes iguais, as outras separatrizes dividem a distribuição em três partes. A classificação e nomenclatura das separatrizes dão-se com base no número de divisões feitas: Quartis dividem a distribuição em quatro partes iguais. Decis dividem em dez partes iguais. Percentis dividem em cem partes iguais. A mediana é uma das separatrizes, visto que separa um conjunto de dados em duas partes com exatamente a mesma quantidade de dados. E aí? Como foi o aprendizado dessa Aula. Caso tenha dúvidas, consulte seu Tutor(a)! Prezado(a) Aluno (a), após essa Aula, você consegue reconhecer, diferenciar e calcular a média, a moda e a mediana com dados não agrupados e com dados agrupados em um conjuntos de dados? Consegue resolver situações problemas que envolvam medidas de tendência central (média, moda e mediana? Caso você tenha conseguido responder a essa questão, parabéns! Você atingiu os objetivos específicos da Aula 4. Caso tenha dificuldades para responder a algumas delas, aproveite para reler o conteúdo desta Aula; e acesse o UNIARAXÁ Virtual e interaja com seus Colegas, Tutor(a) e Professor(a). Você não está sozinho(a) nessa caminhada. Conte conosco! Chegou o momento de complementar seu conhecimento. Vá até seu Ambiente Virtual de Aprendizagem e acesse esta aula para assistir a Video Aula RECAPITULANDO Nesta Aula, conhecemos as medidas de posição ou centralidade. Aprendemos a calcular a média, a moda e a mediana para dados não agrupados, agrupados sem intervalos de classe e agrupados com intervalos de classe. Vimos como é importante entender como as fórmulas retratam as medidas de posição e saber realizar os seus cálculos para encontrar os valores procurados. Mais do que isso, entendemos como é importante compreender e interpretar esses valores. E por fim, vimos, além das medidas de posição, as medidas separatrizes. Muito bem, na próxima Aula, você conhecerá as medidas de variabilidade e a necessidade de aplicá-las em algumas situações. Dada a importância desse assunto, é melhor começarmos logo, não é mesmo? Então, nos encontramos na Aula 5. Até lá! REFERÊNCIAS BARBETTA, P. A. Estatística para cursos de engenharia e informática. 2. ed. São Paulo: Atlas, 2009. CRESPO, Antônio Arnot. Estatística Fácil. 17. ed. São Paulo: Saraiva, 2002. FONSECA, J. S. Estatística aplicada. 2. ed. São Paulo: Atlas, 2013. LARSON, R. Estatística aplicada. 4. ed. São Paulo: Pearson Prentice Hall, 2008.