Prévia do material em texto
19/04/2023, 17:19 UNINTER https://univirtus.uninter.com/ava/web/roa/ 1/24 ESTATÍSTICA APLICADA À QUALIDADE AULA 1 19/04/2023, 17:19 UNINTER https://univirtus.uninter.com/ava/web/roa/ 2/24 Prof. Ricardo Alexandre Deckmann Zanardini CONVERSA INICIAL Seja bem-vindo à nossa aula. Estudaremos aqui os principais elementos da estatística para que possamos aplicar esses conhecimentos em situações reais. Iniciaremos nossos estudos tratando de conceitos fundamentais da estatística. Aprenderemos técnicas de coleta, organização, representação e interpretação de dados. Nesta aula, vamos tratar da importância da estatística em nossas vidas, de como realizar um estudo estatístico e de como podemos organizar os dados coletados. Desde já, sucesso nos estudos! TEMA 1 – CONCEITOS INICIAIS Estamos constantemente em contato com informações relacionadas à estatística, tais como o crescimento da produção industrial em um determinado período, a variação de preços de materiais escolares, a taxa de mortalidade infantil, o número de assaltos em determinada região, as intenções de votos em uma eleição e muitas outras situações relacionadas a pesquisas, coleta e apresentação de dados, descrição de fenômenos, representação de informações por meio de gráficos e muito mais. A base da estatística está na coleta de dados que são informações provenientes de medições, contagens, respostas ou observações. Há registros que comprovam que, desde a antiga Babilônia, localizada no Egito, dados referentes a nascimentos e óbitos eram coletados pelo Estado. Acredita-se que a origem da palavra estatística está na palavra “status”, que significa estado. Com o passar do tempo, a estatística foi ficando cada vez mais importante e mais utilizada. No caso do controle da qualidade, por exemplo, a estatística exerce um papel fundamental. Com o aumento da produção, a etapa referente à verificação da qualidade do que era produzido ficou mais 19/04/2023, 17:19 UNINTER https://univirtus.uninter.com/ava/web/roa/ 3/24 complexa e a estatística passou a ser utilizada para a obtenção de informações importantes referente à conformidade ou não dos produtos com padrões exigidos. Quando pensamos em estatística, definimos como uma área da matemática que tem como objetivo coletar, organizar, analisar e interpretar dados. Quando lidamos com esses dados, temos dois tipos de conjuntos, um denominado população e outro que chamamos de amostra. A população consiste em todos os dados relacionados a um fenômeno enquanto que a amostra é uma parte da população. Podemos dizer, então, que a amostra é um subconjunto da população. Mas, na prática, qual é a diferença e a importância da população e da amostra? Temos inúmeros exemplos, mas vamos pensar em uma indústria que produz lâmpadas de LED para iluminação residencial. Após a fabricação, cada lâmpada é testada. Como temos os dados referentes a todas as lâmpadas, estamos tratando de uma população. Agora, vamos pensar em uma indústria que fabrica palitos de fósforo. Não podemos testar todos os palitos para ver se acendem corretamente, mas podemos realizar os testes com uma parte desses palitos, ou seja, consideramos uma amostra da produção. Um outro exemplo muito comum está relacionado às pesquisas realizadas em época de eleição. Se considerarmos que em uma certa cidade que possui 15.323 eleitores e 1.214 foram entrevistados, a população são as respostas de 15.323 eleitores e a amostra são as respostas de 1.214 eleitores. Como 1.214 eleitores foram entrevistados, não conhecemos todas as respostas, mas apenas uma parte delas. 19/04/2023, 17:19 UNINTER https://univirtus.uninter.com/ava/web/roa/ 4/24 Muitas vezes, dados obtidos a partir de uma amostra são utilizados para que possamos obter conclusões relacionadas a uma população. Para que esse processo tenha consistência, precisamos utilizar técnicas apropriadas para isso, tais como uma amostra significativa e aleatória em relação à população. É comum alguns estudos estatísticos não terem valor por problemas na coleta de dados, tais como uma amostra insuficiente ou uma amostra tendenciosa. A estatística é dividida em dois ramos, a descritiva que consiste em coletar, organizar resumir e apresentar dados, e a inferencial que utiliza dados da amostra para fazer considerações a respeito da população. No que se refere aos dados, temos dois tipos. Os dados qualitativos se referem a atributos não numéricos e os dados quantitativos se referem a contagens ou medidas numéricas. Por exemplo, nomes ou cores são dados qualitativos e preços ou tamanhos são dados quantitativos. Um dado qualitativo pode ser ordinal quando possui uma ordem natural de intensidade, por exemplo, uma estatura baixa, média ou alta ou pode ser nominal quando não possui uma ordem natural como olhos castanhos, azuis ou verdes. Quando tratamos de dados qualitativos, não realizamos cálculos matemáticos. Exemplo: em uma pesquisa realizada em uma empresa, identificaram-se os seguintes indicadores: i. idade; ii. renda; iii. estado civil; iv. número de filhos; v. setor de trabalho; vi. tempo de empresa; e vii. nota obtida na última avaliação de produtividade. A partir dessas informações, determine as variáveis qualitativas e as variáveis quantitativas. Resolução: variáveis qualitativas – estado civil, setor de trabalho; variáveis quantitativas – idade, renda, número de filhos, tempo de empresa, nota obtida na última avaliação de produtividade. 19/04/2023, 17:19 UNINTER https://univirtus.uninter.com/ava/web/roa/ 5/24 Agora que já sabemos o que é estatística, população, amostra e dados, podemos pensar em como é feito um estudo estatístico. TEMA 2 – ESTUDO ESTATÍSTICO Um estudo estatístico tem como objetivo coletar dados e, a partir desses dados, ter recursos para realizar a tomada de decisões. Assim, o primeiro passo é definir um objetivo e quais são as variáveis associadas a esse objetivo. Também é importante identificar a população referente ao estudo. Feito isso, é preciso definir um plano para a coleta de dados. Caso seja utilizada uma amostra, é preciso ter certeza de que a amostra é capaz de representar satisfatoriamente a população. Após a coleta dos dados, é preciso organizar, descrever os dados e verificar se há erros no processo. Finalmente, podemos interpretar os dados para tomarmos as decisões necessárias. No decorrer dos nossos estudos, aprenderemos a utilizar técnicas de estatística para a realização das etapas de um estudo estatístico descritivo. Ao realizarmos um estudo estatístico, há importantes técnicas relacionadas às formas de realizarmos esse estudo e coletarmos os dados. Vamos acompanhar as explicações referentes a quatro maneiras diferentes de fazermos isso. Estudo observacional: nesse estudo, são observados os aspectos de interesse, mas as condições não são modificadas, ou seja, não há alteração e nem tratamento no processo de obtenção dos dados. Podemos citar, por exemplo, a observação da capacidade de um grupo de pessoas montar determinadas peças. Experimento: nessa modalidade, é aplicado um tratamento em uma amostra e, a partir disso, as respostas são observadas. Esse grupo recebe o nome de grupo experimental. É comum que outra amostra, chamada de grupo de controle, não receba qualquer tipo de tratamento para que as respostas obtidas a partir desses dois grupos sejam comparadas. É comum que experimentos sejam realizados em uma determinada fase dos estudos de um novo medicamento. 19/04/2023, 17:19 UNINTER https://univirtus.uninter.com/ava/web/roa/ 6/24 Simulação: a simulação é uma forma muito comum de estudo de fenômenos que ainda não podem ser realizados fisicamente ou de fenômenos que exigem um grande esforço ou que possuem grandes riscos ao serem realizados. Para fazer uma simulação, um modelo físico ou matemático é criado e as condições do problema são reproduzidas e observadas. Um exemplo é a utilização da simulaçãopara o estudo da possibilidade de ocorrência ou não de acidentes aéreos a partir de alterações em determinadas aeronaves. Pesquisa de mercado: nessas pesquisas, determinadas características são investigadas por meio de questionários feitos com pessoas. As pessoas são entrevistadas pessoalmente, por telefone, por e-mail, ou por alguma outra forma física ou eletrônica, tais como formulários que são respondidos e depois analisados. É comum, por exemplo, que uma pesquisa assim seja realizada para medir o nível de satisfação dos clientes de uma concessionária em relação aos respectivos veículos adquiridos. Agora que sabemos quais são os métodos de coleta de dados, vamos falar um pouco a respeito de técnicas de amostragem. Uma amostragem é uma técnica muito utilizada na estatística. Na amostragem, a contagem ou medição é feita com uma parte da população enquanto que um censo é um estudo realizado com todos os membros da população. Ao realizarmos uma amostragem, é preciso considerar uma amostra significativa para que o estudo seja confiável. Como não estamos considerando a população, mesmo que a amostra seja confiável, é comum que exista um erro entre os dados da amostra em relação aos dados da população. Na estatística inferencial, há técnicas de controle desses erros. Uma amostra é chamada de amostra aleatória simples quando toda a amostra possível de mesmo tamanho tem as mesmas chances de ser selecionada. Uma forma de obtermos uma amostra aleatória simples é atribuirmos um número diferente para cada elemento da população e a partir da geração de números aleatórios, selecionar os elementos que irão compor a amostra. É como se fosse um sorteio. Os números aleatórios podem ser obtidos a partir de tabelas ou de aplicativos destinados a essa tarefa. Um exemplo é pensar em realizar um estudo relacionado ao controle de qualidade de peças produzidas por uma indústria. Cada peça recebe um número diferente e, de forma aleatória, são selecionadas as peças que formarão a amostra desse estudo. Também é possível escolher os elementos que irão compor a amostra seguindo técnicas, tais como amostra estratificada, amostra por agrupamento ou amostra sistemática. 19/04/2023, 17:19 UNINTER https://univirtus.uninter.com/ava/web/roa/ 7/24 Uma amostra estratificada é utilizada quando precisamos de elementos de diferentes segmentos da população. A população é dividida em grupos denominados de estratos e as amostras são obtidas aleatoriamente a partir de cada estrato. Assim, é possível garantir que cada um desses grupos terá uma amostra significativa relacionada. Por exemplo, em uma indústria que produz parafusos, podemos separar a produção em grupos de acordo com características relevantes, tais como parafusos franceses, sextavados, para madeira e autoatarraxantes e, a partir de cada um desses estratos, selecionar de forma aleatória as respectivas amostras. No que se refere à amostra por agrupamento, a população naturalmente está dividida em grupos distribuídos geograficamente, cada um deles contendo características similares. Para obter uma amostra por agrupamento, a população é dividida em grupos e todos os membros de um ou de mais grupos são selecionados. É importante cuidar para que não sejam selecionados os membros de todos esses grupos. Também é importante verificar se todos os grupos possuem característica similares. Podemos imaginar como exemplo que uma rede de supermercados possui diferentes filiais. Podemos considerar que os funcionários de cada filial formam os grupos nos quais a população corresponde a todos os funcionários da rede. Considerando agora uma amostra sistemática, temos números associados a todos os membros da população que são ordenados seguindo um determinado critério. A partir desses números, escolhe-se um valor inicial e os membros são selecionados a partir de intervalos regulares. É uma amostragem fácil de ser utilizada. Podemos, por exemplo, atribuir números diferentes para cada funcionário de uma empresa e selecionar os números que são múltiplos de 10. Uma amostra que existe, mas que não é recomendada por gerar dados tendenciosos é a amostra de conveniência que utiliza apenas os elementos disponíveis de uma população. Uma amostra precisa ser diversificada para que contemple aspectos distintos da população. Imagine que um pesquisador vai até um estádio de futebol e faz uma entrevista com torcedores para saber quantos gostam de futebol. Se o objetivo da pesquisa é saber quantos torcedores gostam de futebol, é aceitável a escolha da amostra, mas se o objetivo é identificar a porcentagem de habitantes de uma cidade que gostam de futebol, a amostra escolhida não é suficientemente diversificada e os resultados obtidos são tendenciosos. Considerando o controle de qualidade de uma indústria, por mais que a busca por uma gestão cada vez mais organizada, otimizada e sustentável ocorra, ainda é preciso acompanhar as etapas dos 19/04/2023, 17:19 UNINTER https://univirtus.uninter.com/ava/web/roa/ 8/24 processos e a estatística está presente de uma forma muito próxima. É possível inspecionar etapas da produção por amostragem e utilizar ferramentas estatísticas para o acompanhamento do processo produtivo. Sendo assim, a coleta de dados exerce também um importante papel nesse cenário. Agora que já sabemos como coletar dados, é importante aprendermos maneiras de organizá-los. TEMA 3 – DADOS NÃO AGRUPADOS A forma mais simples de organização dos dados é quando eles não estão agrupados, ou seja, são apresentados um a um. Quando os dados são coletados, mas não passaram por qualquer tipo de tratamento, eles são chamados de dados brutos. No entanto, podemos organizar os dados em uma ordem. No caso de dados numéricos, podemos colocar esses dados em uma ordem crescente. Os dados ordenados recebem o nome de rol. Exemplo 1: a seguir, temos os comprimentos em centímetros de onze árvores natalinas naturais que foram comercializadas na primeira semana do mês de dezembro, em uma loja especializada: 201, 223, 198, 187, 213, 209, 207, 202, 201, 214, 215 Organize esses dados em uma ordem crescente. Resolução: como são poucos dados, podemos ordená-los manualmente ou por meio do Excel. Caso não seja possível utilizar o Excel, uma alternativa similar é o uso de uma planilha Google. No caso do Excel, o primeiro passo é abrir uma planilha e inserir os dados do problema: 19/04/2023, 17:19 UNINTER https://univirtus.uninter.com/ava/web/roa/ 9/24 Em seguida, selecionamos estes valores e, na aba “Página Inicial”, clicamos em “Classificar e Filtrar” e selecionamos a opção “Classificar do Menor para o Maior”: Assim, temos o seguinte resultado: 19/04/2023, 17:19 UNINTER https://univirtus.uninter.com/ava/web/roa/ 10/24 O rol, ou seja, os dados em ordem crescente, é: 187, 198, 201, 201, 202, 207, 209, 213, 214, 215, 223. A partir desses dados, podemos começar a pensar em como podemos descrever as informações que temos. Como temos uma quantidade pequena de informações, fica fácil de identificarmos, por exemplo, que o menor comprimento corresponde a 187 centímetros e o maior corresponde a 223 centímetros: 187, 198, 201, 201, 202, 207, 209, 213, 214, 215, 223 Também é possível observar que o tamanho mediano, ou seja, o elemento que está na posição central do rol é 207 centímetros: 187, 198, 201, 201, 202, 207, 209, 213, 214, 215, 223 Não realizamos cálculos, mas podemos saber que os comprimentos variam de 187 a 223 centímetros e que 207 centímetros é a altura mediana das árvores comercializadas. Agora, com um cálculo simples, podemos saber a amplitude total, ou seja, qual é a variabilidade dos dados. Para isso, basta fazermos a diferença entre o maior e o menor valor: 19/04/2023, 17:19 UNINTER https://univirtus.uninter.com/ava/web/roa/ 11/24 223 – 187 = 36 Assim, dizemos que a amplitude do intervalo é igual a 36 centímetros. Essas características (centro e amplitude) são importantes quando estamos organizando e descrevendo os dados.Exemplo 2: a seguir temos as quantidades de erros de impressão em cartões de visita feitos em uma gráfica durante os 21 dias úteis de um determinado mês. 10 5 7 8 2 12 6 4 6 7 3 9 11 10 9 3 7 8 6 5 9 Organize os dados, determine o menor valor, o maior valor e a amplitude total. Resolução: os dados ordenados, manualmente ou por meio do Excel, são: 2 3 3 4 5 5 6 6 6 7 7 7 8 8 9 9 9 10 10 11 12 Menor valor: 2 Maior valor: 12 Amplitude total: 12 – 2 = 10 Futuramente, aprenderemos ainda a representarmos graficamente os dados, a calcularmos medidas de posição (média, moda e mediana), medidas de dispersão (variância e desvio padrão) e muito mais. Para poucos dados, podemos ter a representação de cada um deles, mas quando o número de dados aumenta, muitas vezes precisamos de formas eficientes de agrupamento dos dados. Estudaremos a distribuição de frequência e a distribuição de frequência por classe. 19/04/2023, 17:19 UNINTER https://univirtus.uninter.com/ava/web/roa/ 12/24 TEMA 4 – DISTRIBUIÇÃO DE FREQUÊNCIA Quando estamos trabalhando com dados e há repetição de valores, podemos organizar esses dados em uma tabela contendo o valor de cada dado e o respectivo número de repetições. Essa forma de organizar os dados é denominada de distribuição de frequência. É bastante utilizada, pois, além de facilitar a visualização das informações, apresenta esses dados de forma resumida. Vamos acompanhar alguns exemplos que ajudarão a entender melhor como construímos uma tabela de distribuição de frequência e como essas tabelas podem ser úteis. Exemplo 1: em uma grande concessionária de automóveis há uma pesquisa de satisfação que é realizada após cada atendimento realizado. A pesquisa é bem simples e o cliente precisa apenas atribuir uma nota de 1 a 5, em que 1 indica que o atendimento foi ruim e a nota 5 indica que o atendimento foi excelente. No final de um certo dia, as notas recebidas, já em ordem crescente, foram: 1, 1, 2, 2, 2, 3, 4, 4, 4, 4, 4, 4, 4, 5, 5, 5, 5 Dessa forma, construa uma tabela contendo as notas e quantos atendimentos receberam cada uma dessas notas. Resolução: como temos dois atendimentos que receberam nota 1, três atendimentos que receberam nota 2, um atendimento que recebeu nota 3, 7 atendimentos que receberam nota 4 e quatro atendimentos que receberam nota 5, a tabela de distribuição de frequência é dada por: Nota (xi) Número de atendimentos (fi) 1 2 2 3 3 1 4 7 5 4 19/04/2023, 17:19 UNINTER https://univirtus.uninter.com/ava/web/roa/ 13/24 A tabela anterior facilita a organização e a visualização dos dados. Na primeira coluna temos as notas recebidas que são representadas por xi e na segunda coluna as respectivas quantidades de atendimentos que receberam cada uma dessas notas. Esses números são chamados de frequências e representados por fi. Assim, para cada dado xi, temos uma frequência correspondente fi. A partir da tabela, fica fácil de identificar o menor valor (1) e o maior valor (5). Também podemos calcular a amplitude total fazendo 5 – 1 = 4. Mas como podemos identificar qual é o elemento que está no centro desses dados? Se olharmos para os dados não agrupados, fica fácil identificar que a posição central é ocupada pelo número 4, ou seja, dos 17 elementos, temos oito valores à esquerda de 4 e oito valores à direita de 4: 1, 1, 2, 2, 2, 3, 4, 4, 4, 4, 4, 4, 4, 5, 5, 5, 5 Mas em relação à tabela de distribuição de frequência, como é que nós podemos identificar qual é esse elemento? Precisamos de uma forma de relacionar os elementos da tabela com as respectivas posições que esses elementos ocupam no rol. Assim, precisamos de uma nova coluna para adicionarmos a frequência acumulada, ou seja, a frequência de cada elemento em relação à posição que eles estão no rol. Nota (xi) Número de atendimentos (fi) Frequência acumulada (fa) 1 2 2 3 3 1 4 7 5 4 Mas como podemos obter e qual é o significado da frequência acumulada? 19/04/2023, 17:19 UNINTER https://univirtus.uninter.com/ava/web/roa/ 14/24 Se observarmos o rol, o número 1 ocupa as duas primeiras posições: 1, 1, 2, 2, 2, 3, 4, 4, 4, 4, 4, 4, 4, 5, 5, 5, 5 O número 2 começa na terceira posição e vai até a quinta posição: 1, 1, 2, 2, 2, 3, 4, 4, 4, 4, 4, 4, 4, 5, 5, 5, 5 O 3 ocupa a sexta posição: 1, 1, 2, 2, 2, 3, 4, 4, 4, 4, 4, 4, 4, 5, 5, 5, 5 O número 4 começa na sétima posição e vai até a décima terceira posição: 1, 1, 2, 2, 2, 3, 4, 4, 4, 4, 4, 4, 4, 5, 5, 5, 5 O número 5 vai da décima quarta até a décima sétima posição: 1, 1, 2, 2, 2, 3, 4, 4, 4, 4, 4, 4, 4, 5, 5, 5, 5 Assim, basta somarmos a frequência com as frequências anteriores para obtermos a frequência acumulada e conseguirmos indicar onde os dados estão localizados no rol. Vamos fazer de forma detalhada. A primeira frequência acumulada se refere ao número 1 e é igual a 2. Assim, basta repetirmos esse valor na coluna da frequência acumulada: Nota (xi) Número de atendimentos (fi) Frequência acumulada (fa) 1 2 2 2 3 3 1 4 7 5 4 Vamos agora somar o valor da coluna da frequência acumulada com a próxima frequência, ou seja, vamos fazer 2 + 3 = 5: 19/04/2023, 17:19 UNINTER https://univirtus.uninter.com/ava/web/roa/ 15/24 Nota (xi) Número de atendimentos (fi) Frequência acumulada (fa) 1 2 2 2 3 5 3 1 4 7 5 4 Isso significa que o número 1 ocupa as duas primeiras posições e que o número 2 vai da posição seguinte, ou seja, da terceira posição até a posição de número 5. Vamos agora somar a frequência acumulada do momento com a próxima frequência. Fazendo 5 + 1 = 6, temos que o número 3 está na sexta posição: Nota (xi) Número de atendimentos (fi) Frequência acumulada (fa) 1 2 2 2 3 5 3 1 6 4 7 5 4 Precisamos agora somar a nova frequência acumulada com a próxima frequência, ou seja, precisamos fazer 6 + 7 = 13: Nota (xi) Número de atendimentos (fi) Frequência acumulada (fa) 1 2 2 2 3 5 3 1 6 4 7 13 19/04/2023, 17:19 UNINTER https://univirtus.uninter.com/ava/web/roa/ 16/24 5 4 E, finalmente, vamos somar 13 com 4, o que resulta em 17: Nota (xi) Número de atendimentos (fi) Frequência acumulada (fa) 1 2 2 2 3 5 3 1 6 4 7 13 5 4 17 Para sabermos, a partir da tabela, qual é o elemento que ocupa a posição central, basta dividirmos o total de elementos ao meio, ou seja, 17 / 2 = 8,5 e arredondarmos para o próximo inteiro que é o número 9. O elemento que está na posição central ocupa a nona posição. Mas e na tabela, como identificar qual é o dado que está nessa posição? Basta verificarmos na coluna da frequência acumulada onde está a nona posição. Como o 9 está entre o 6 e o 13, precisamos olhar na linha do número 13, qual é o respectivo dado. Observe que é o número 4. Nota (xi) Número de atendimentos (fi) Frequência acumulada (fa) 1 2 2 2 3 5 3 1 6 4 7 13 5 4 17 Assim, o 4 é o valor que ocupa a posição central. Futuramente, estudaremos essa abordagem novamente quando formos tratar de mediana, que é o nome dado ao valor que está na posição central do rol. 19/04/2023, 17:19 UNINTER https://univirtus.uninter.com/ava/web/roa/ 17/24 Além da frequência acumulada, temos a frequência relativa que indica a porcentagem de cada frequência em relação ao total de dados. Para obtermos cada uma das frequências relativas, vamos dividir as frequências pelo total de elementos e em seguida vamos multiplicar o resultado por 100 para termos a respectiva porcentagem. Para a primeira frequência relativa, basta fazermos 2 / 17 = 0,1176 e multiplicando por 100, temos 11,76%. A segunda frequência relativa é dada por 3 / 17 = 0,1765 = 17,65%. As demais frequências relativas são: 1 / 17 = 0,0588 = 5,88%, 7 / 17 = 0,4118 = 41,18% e 4 / 17 = 0,2353 = 23,53%. Acrescentando mais uma coluna na tabela e inserindo esses valores, temos: Nota (xi) Número de atendimentos (fi) Frequência acumulada (fa) Frequência relativa (fr) 1 2 2 11,76% 2 3 5 17,65% 3 1 6 5,88% 4 7 13 41,18% 5 4 17 23,53%Podemos utilizar uma distribuição de frequência para criarmos uma folha de verificação, uma tabela destinada à coleta de informações referentes a não conformidades de um produto ou de um serviço. A seguir, temos um exemplo de uma folha de verificação referente a uma indústria de produtos alimentícios: Processo analisado: produção de cookies americanos Produção diária: 5.000 unidades Amostra verificada: 200 unidades Porcentagem verificada: 4% Defeito Frequência Pouco chocolate 10 Parte de baixo queimada 15 19/04/2023, 17:19 UNINTER https://univirtus.uninter.com/ava/web/roa/ 18/24 Tamanho reduzido 8 Uma folha de verificação é muito útil para o processo do controle de qualidade. TEMA 5 – DISTRIBUIÇÃO DE FREQUÊNCIA POR CLASSE Vamos agora aprender a organizar dados em uma distribuição de frequência por classe. Utilizamos essa forma de agrupamento de dados quando temos muitos valores relativamente próximos e não necessitamos de muita precisão, pois não vamos trabalhar com os dados exatos, mas sim com valores desconhecidos, mas que estão em determinados intervalos. Uma distribuição assim denominada de distribuição de frequência por classe, é bastante utilizada. Um exemplo muito comum é a faixa salarial. Em muitas pesquisas, pede-se para que seja informada a renda mensal. O princípio é dizer em qual das faixas salariais apresentadas está a renda da pessoa que está fornecendo a informação. Por exemplo, se na pesquisa são apresentadas as faixas “de R$ 1.000,00 a R$ 2.000,00”, “de R$ 2.000,00 a R$ 3.000,00”, “de R$ 3.000,00 a R$ 4.000,00”, e assim por diante, e o salário mensal corresponde a R$ 1.812,36, a pessoa vai assinalar a opção “de R$ 1.000,00 a R$ 2.000,00”. Note que o valor exato do salário não é informado, mas se sabe que é um valor entre R$ 1.000,00 e R$ 2.000,00. Essa forma de organização e agrupamento dos dados é bastante comum e possui algumas características importantes. Os intervalos não precisam ter os mesmos tamanhos, mas o ideal é fazer com que todos os intervalos tenham o mesmo tamanho. Cada classe terá um limite inferior e um limite superior e a amplitude do intervalo é a diferença entre esses limites. Também teremos um ponto muito útil pertencente ao intervalo que é o ponto médio. Esse ponto é dado a partir da média aritmética dos limites da classe: em que Li é o limite inferior da classe, Ls é o limite superior da classe e pm é o ponto médio do intervalo. Por exemplo, no intervalo de R$ 3.000,00 a R$ 4.000,00, temos Li = 3.000,00, Ls = 4.000,00 e pm = 3.500,00. O número de classes depende do problema e das características dos dados. O ideal é que tenhamos no mínimo cinco classes e no máximo 20 classes para que seja possível identificar de maneira mais consistente os possíveis padrões existentes. 19/04/2023, 17:19 UNINTER https://univirtus.uninter.com/ava/web/roa/ 19/24 Após definirmos quantas classes serão utilizadas, precisamos definir o tamanho de cada intervalo. Para isso, primeiro precisamos da amplitude dos dados, ou seja, a diferença entre o maior valor e o menor valor. Em seguida, vamos dividir a amplitude total pelo número de classes e arredondar para o próximo inteiro, mesmo que o resultado seja inteiro. Por exemplo, se essa divisão resultar em 7,31, arredondamos para 8 e mesmo que o resultado obtido fosse 7, por exemplo, teríamos que arredondar para 8 para garantir que tenhamos um tamanho suficiente para cada intervalo. Para a primeira classe, o limite inferior pode ser o menor valor ou um número conveniente abaixo desse valor mínimo dos dados. Não é obrigatório que seja feito sempre assim, mas é uma sugestão bastante interessante para a construção da tabela da distribuição de frequência por classe. Vamos exemplificar os passos sugeridos para a construção de uma tabela de distribuição de frequência por classe. Exemplo 1: em uma empresa de tecnologia, há 60 funcionários. As idades deles são apresentadas a seguir: 32 45 43 26 28 30 31 32 44 32 54 46 41 20 26 44 38 26 37 47 33 35 38 47 46 32 49 35 25 27 28 43 22 29 42 30 35 41 39 34 43 26 25 25 43 26 26 38 31 27 33 28 39 32 27 43 29 38 44 42 Construa uma tabela de distribuição de frequência por classe contendo seis classes. Resolução: inicialmente, vamos ordenar os dados, manualmente ou por meio do Excel. 20 22 25 25 25 26 26 26 26 26 26 27 27 27 28 28 28 29 29 30 30 31 31 32 32 32 32 32 33 33 34 35 35 35 37 38 38 38 38 39 19/04/2023, 17:19 UNINTER https://univirtus.uninter.com/ava/web/roa/ 20/24 39 41 41 42 42 43 43 43 43 43 44 44 44 45 46 46 47 47 49 54 Agora que temos os dados ordenados, precisamos saber a amplitude total. Basta fazermos 54 menos 20, o que corresponde a 34. Como precisamos de seis classes, para sabermos o tamanho de cada classe, vamos dividir 34 por 6, o que resulta em 5,666667. Podemos arredondar esse número para 6. Assim, teremos seis classes, cada uma com uma amplitude igual a 6. Podemos considerar o menor valor dos dados como sendo o limite inferior da primeira classe. Logo, a tabela com os intervalos é dada por Intervalo Frequência 20 ⊢ 26 26 ⊢ 32 32 ⊢ 38 38 ⊢ 44 44 ⊢ 50 50 ⊢ 56 O símbolo ⊢ indica que o limite inferior pertence ao intervalo e que o limite superior não pertence ao intervalo, pois a barra vertical à esquerda corresponde a um intervalo fechado, ou seja, o número pertence ao intervalo e a ausência da barra vertical à direita indica um intervalo aberto, ou seja, o número não pertence ao intervalo. Precisamos agora adicionar as frequências referentes a cada um dos intervalos. Considerando os dados ordenados, manualmente ou por meio do Excel, 20 22 25 25 25 26 26 26 26 26 26 27 27 27 28 28 28 29 29 30 30 31 31 32 32 32 32 32 33 33 34 35 35 35 37 38 38 38 38 39 39 41 41 42 42 43 43 43 43 43 19/04/2023, 17:19 UNINTER https://univirtus.uninter.com/ava/web/roa/ 21/24 44 44 44 45 46 46 47 47 49 54 temos 5 elementos a serem adicionados na primeira classe: 20, 22, 25, 25, 25. Note que o intervalo vai de 20 a 26, mas o símbolo ⊢ indica que o 20 pertence ao intervalo, mas o 26 não, pois não temos uma barra vertical na direita do símbolo, mas apenas na esquerda. Assim, os dados iguais a 26 serão considerados como pertencentes ao segundo intervalo. Como o intervalo é dado por 26 ⊢ 32, temos que colocar nessa classe os valores que vão de 26 a 32, exceto os valores iguais a 32. Como estamos trabalhando com números inteiros, adicionamos nessa classe os valores que vão de 26 a 31, mas se os dados fossem números reais, colocaríamos valores de 26 a 31,99999999999..., ou seja, de 26 até todos os valores que estão muito próximos de 32, mas que não são iguais a 32. Assim, no segundo intervalo de classe temos 18 valores (26, 26, 26, 26, 26, 26, 27, 27, 27, 28, 28, 28, 29, 29, 30, 30, 31, 31). Na terceira classe temos 12 valores (32, 32, 32, 32, 32, 33, 33, 34, 35, 35, 35, 37). Na quarta classe, 15 valores (38, 38, 38, 38, 39, 39, 41, 41, 42, 42, 43, 43, 43, 43, 43), na quinta classe, 9 valores (44, 44, 44, 45, 46, 46, 47, 47, 49) e na sexta classe, 1 valor (54). Assim, a tabela de distribuição de frequência por classe corresponde a Intervalo Frequência 20 ⊢ 26 5 26 ⊢ 32 18 32 ⊢ 38 12 38 ⊢ 44 15 44 ⊢ 50 9 50 ⊢ 56 1 Nesse exemplo, temos os dados não agrupados e, a partir deles, por opção, construímos a tabela de distribuição de frequência por classe. Dessa maneira, se for preciso, podemos ter resultados exatos em um estudo utilizando os dados originais. No entanto, se os dados são obtidos já em intervalos de classe, não temos acesso aos dados exatos. Como a distribuição de frequência por classe utilizando intervalos e não os dados exatos, os resultados obtidos são aproximados. Por esse motivo, antes de coletar os dados, é preciso levar em consideração a precisão desejada para os resultados. 19/04/2023, 17:19 UNINTER https://univirtus.uninter.com/ava/web/roa/ 22/24 Agora que temos a tabela de distribuição de frequência por classe, sabemos qual é a frequência referentea cada classe e os limites das classes, mas não sabemos os valores dos dados contidos em cada classe. Sendo assim, precisamos de um número que represente esses dados e para isso vamos escolher o ponto médio de cada intervalo de classe. Vimos que os pontos médios são obtidos a partir da fórmula em que Li é o limite inferior da classe, Ls é o limite superior da classe e pm é o ponto médio do intervalo. Para a tabela que acabamos de obter, os respectivos pontos médios são apresentados a seguir. Intervalo Frequência Ponto Médio 20 ⊢ 26 5 23 26 ⊢ 32 18 29 32 ⊢ 38 12 35 38 ⊢ 44 15 41 44 ⊢ 50 9 47 50 ⊢ 56 1 53 Da mesma forma feita em uma distribuição de frequência, na distribuição de frequência por classe podemos obter a frequência acumulada somando as frequências de cada classe: Intervalo Frequência Frequência Acumulada 20 ⊢ 26 5 5 26 ⊢ 32 18 23 32 ⊢ 38 12 35 38 ⊢ 44 15 50 44 ⊢ 50 9 59 50 ⊢ 56 1 60 19/04/2023, 17:19 UNINTER https://univirtus.uninter.com/ava/web/roa/ 23/24 Também é possível obtermos as frequências relativas dividindo cada frequência pela frequência total e multiplicando o resultado por 100 para obtermos a respectiva porcentagem: Intervalo Frequência Frequência Acumulada Frequência Relativa 20 ⊢ 26 5 5 8,33% 26 ⊢ 32 18 23 30% 32 ⊢ 38 12 35 20% 38 ⊢ 44 15 50 25% 44 ⊢ 50 9 59 15% 50 ⊢ 56 1 60 1,67% FINALIZANDO Nesta aula, estudamos os elementos fundamentais da estatística, tais como população e amostra. Vimos importantes técnicas relacionadas a um estudo estatístico e como podemos organizar os dados de uma forma em que eles não estão agrupados, mas também em dois tipos de agrupamentos, o primeiro que é a distribuição de frequência e o segundo que é a distribuição de frequência por classe. REFERÊNCIAS CASTANHEIRA, N. P. Estatística aplicada a todos os níveis. Curitiba: Intersaberes, 2012. 19/04/2023, 17:19 UNINTER https://univirtus.uninter.com/ava/web/roa/ 24/24