Prévia do material em texto
Inserir Título Aqui Inserir Título Aqui • Conceitos Fundamentais de Estatística • Tabelas e Gráficos Conceitos Fundamentais de Estatística Estatística É uma parte da Matemática Aplicada que fornece métodos para coleta, organização, descrição, análise e interpretação de dados para tomada de decisões. Dados Análise Decisões Estatística descritiva e indutiva · Estatística Descritiva: é a parte da Estatística que tem por objetivo descrever os dados observados. · Estatística Indutiva: é a parte da Estatística que tem por objetivo obter e generalizar conclusões para a população a partir de uma amostra, por meio do cálculo de probabilidade. O cálculo de probabilidade é que viabiliza a inferência estatística. Termos essenciais de estatística • População: Toda pesquisa estatística precisa atender a um público alvo, pois é com base nesse conjunto de pessoas que os dados são coletados e analisados de acordo com o princípio da pesquisa. Esse público alvo recebe o nome de população e constitui um conjunto de pessoas que apresentam características próprias, por exemplo: os usuários de um plano de saúde, os membros de uma equipe de futebol, os funcionários de uma empresa, os eleitores de um município, estado ou país, os alunos de uma escola, os associados de um sindicato, os integrantes de uma casa e várias situações que envolvem um grupo geral de elementos. A população também pode ser relacionada a um conjunto de objetos ou informações. Na estatística, a população é classificada como finita e infinita. • População finita: nesses casos o número de elementos de um grupo não é muito grande, a entrevista e a análise das informações devem abordar a todos do grupo. Por exemplo: As condições das escolas particulares na cidade de Goiânia. Se observarmos o grupo chegaremos à conclusão de que o número de escolas particulares em Goiânia é considerado finito. • População infinita: o número de elementos nesse caso é muito elevado, sendo considerado infinito. Por exemplo: A população da cidade de São Paulo. Amostra Considerando-se a impossibilidade, na maioria das vezes, do tratamento de todos os elementos da população, retira-se uma amostra. A amostra deve apresentar as mesmas características que havia na população. Exemplo Quando ouvimos falar no noticiário “[...] em São Paulo, uma manifestação parou a Avenida Paulista, havia mais de 700 pessoas na Avenida [...]”. Observamos ou tentamos entender como podem fazer esse cálculo com um número significativo de pessoas aglomeradas. Vamos entender o cálculo Imaginamos um desenho no chão de uma figura quadrada em que seus lados tenham 1 (um) metro e que alocamos dentro desse espaço, da figura desenhada no chão, cinco pessoas. Logo, podemos entender que estamos coletando uma amostra de 1m² contendo cinco pessoas. Então, só resta saber a área total desta manifestação. Observe o desenho: Sabemos que cada 1m² comporta cinco pessoas. Vamos calcular o total de pessoas para uma área de 140 m². Verificamos que, por uma amostragem de cinco pessoas por 1m², descobrimos uma população total de 700 pessoas na manifestação. 5 pessoas x 140 m² = 700 pessoas Dados Brutos É uma sequência de dados não organizados obtidos por meio de coleta de dados. Observe que os dados estão fora de sequência, portanto, chamamos de Dados Brutos Exemplo: 4 8 7 5 6 feminino masculino feminino feminino masculino Rol É o nome que se dá aos dados brutos quando já estão ordenados,de alguma forma. Observe que organizamos os dados brutos, agora eles passam a ser chamados de Rol. Exemplo: 4 5 6 7 8 feminino feminino feminino masculino masculino Variável Variáveis são objetos de estudo de interesse do(a) pesquisador(a) que são definidas por ele(a) mesmo(a), de acordo com a pesquisa que irá realizar. Por exemplo, para traçar o perfil dos alunos de uma escola de Ensino Médio, foram definidos seis objetos de estudo: “sexo”, “idade”, “área da carreira universitária pretendida”, “número de irmãos”, “disciplina favorita” e “renda familiar mensal”. Cada um desses objetos de interesse dos pesquisadores é o que chamamos de variável. As variáveis podem ser qualitativas ou quantitativas. Variáveis atributos de qualidade números Qualitativa Quantitativa atributos de qualidade contagem e enumerações faixa de valores Discreta Contínua exemplo exemplo exemplo cor dos olhos sexo número de irmãos idade número de eletrodomésticos número de �lhos etc. renda familiar mensal peso altura Variáveis Qualitativas Quando seus valores são expressos por atributos ou dão uma qualidade à população ou amostra em estudo, por exemplo, sexo, cor da pele etc. Variáveis Quantitativas Quando os dados são de caráter nitidamente quantitativo e o conjunto dos resultados possui uma estrutura numérica. Dividem-se em Discretas e Contínuas. Variáveis Quantitativas Discretas São dados provenientes de contagens ou enumerações Por exemplo: número de irmãos, idade das pessoas, número de eletrodomésticos que há em casa, número de filhos etc. Variáveis Quantitativas Contínuas São dados que assumem quaisquer valores dentro de dois limites. Por exemplo: renda familiar mensal, peso, altura etc. Técnicas de Amostragem Existem algumas técnicas para escolher amostras que garantem, tanto quanto possível, o acaso na escolha de uma amostra. Cada elemento da população passa a ter a mesma chance de ser escolhido, o que garante à amostra o caráter de representatividade. Isso é muito importante, pois as conclusões relativas à população vão estar baseadas nos resultados obtidos por meio desses dados. Amostragem Casual ou Aleatória Simples Este tipo de amostragem é equivalente a um sorteio lotérico. Por exemplo: 1º Numeramos os alunos de uma classe de 1 até ...; Seleção da amostra 2º Escrevemos os números de 1 até ... em pedaços de papel iguais; 3º Colocamos todos os pedaços em uma caixa e agitamos; 4º Retiramos, por exemplo, 10% dos alunos; 5º De acordo com os números selecionados, identificamos quem são os alunos que irão fazer parte da amostra representativa da classe. Observação: quando o número de elementos da população é muito grande, podemos utilizar programas de computador para fazer o sorteio. Amostragem Proporcional Estratifi cada Utilizada quando a população se divide em subpopulações chamadas de estratos. É provável que a variável em estudo apresente comportamentos distintos dentro de cada estrato. Sendo assim, os elementos da amostra devem levar em consideração tais estratos. A amostragem estratificada obtém os elementos da amostra proporcional ao número de elementos de cada estrato. Por exemplo: 70% 10% 20% 70% 10% 20% População Amostra Alunos Colaboradores Professores Suponha que uma classe seja composta de 54 homens e 36 mulheres perfazendo um total de 90 pessoas. Vamos obter a amostra proporcional estratificada. Nesse caso, temos dois estratos (sexo masculino e sexo feminino) e queremos uma amostra de 10% da população. Logo, temos: Para calcular os 10% de cada estrato, vamos fazer uma regra de três simples: Para o estrato masculino, temos: Total do estrato – 100% Parte do estrato – 10% 54 – 100% x – 10% Efetuando a operação 100 X = 54x10 100 X = 540 X = 540/100 X = 5,4 5,4 corresponde, arredondando, a 5 pessoas Para o estrato feminino, temos: 36 – 100% x – 10% Efetuando a operação 100 X = 36x10 100 X = 360 X = 360/100 X = 3,6 3,6 corresponde, arredondando, a 4 pessoas. Arredondamento Vamos relembrar, rapidamente, como é feito o arredondamento. Vejamos: 10,3 Parte inteira do número Parte decimal do número Exemplo 1: 5,0 5,1 5,2 5,3 5,4 – arredondado vira 5 Exemplo 2 20,5 20,6 20,7 20,8 20,9 – arreddondado vira 21 O que deve ser levado em consideração no arredondamento é a parte que aparece após a vírgula. Se após a vírgula houver: 0, 1, 2, 3 ou 4, mantém-se a parte inteira do número; Se após a virgula houver: 5, 6, 7, 8 ou 9, acrescenta-se 1 à parte inteira do número.Organizando em uma tabela, temos: Sexo População 10% Amostra M 54 10 54 100 5 4 x = , 5 F 36 10 36 100 3 6 x = , 4 Total 90 10 90 100 9 0 x = , 9 Feitos os cálculos, verificamos que 9 alunos devem fazer parte da amostra. Destes, 5 deverão ser homens e 4 mulheres. Basta fazer o sorteio na classe a aplicar os questionários. Amostragem Sistemática Esta técnica deve ser utilizada quando a população já se encontra ordenada. Por exemplo: casas de uma rua, prontuários de funcionários, linhas de produção, estrada de rodagem etc. Por exemplo: a) Uma avenida de 2500m encontra-se em péssimo estado de conservação e os técnicos querem fazer uma checagem em 5 pontos diferentes para verificar os danos. Podemos usar o seguinte procedimento: periodicidade total parte m� � � 2500 5 500 A checagem será feita a cada 500m, vez que se escolheu aleatoriamente o 1º ponto. Exemplo de um plano de amostragem sistemática ao longo de uma distância: 0 500 1000 1500 2000 2500 1º ponto de checagem 2º ponto de checagem 3º ponto de checagem 4º ponto de checagem 5º ponto de checagem b) Em uma empresa existem 900 funcionários. Seus dados cadastrais estão organizados em prontuários numerado de 1 a 900. Deseja-se obter uma amostra Sistemática de 50 desses funcionários para que, posteriormente, sejam aplicados questionários para conhecermos suas opiniões a respeito da qualidade do refeitório. Podemos usar o seguinte procedimento: periodicidade total parte prontuários� � � 900 50 18 Escolhemos por sorteio casual um prontuário numerado entre 1 e 18, que será o primeiro elemento que fará parte da amostra, os demais elementos seriam periodicamente considerados de 18 em 18 prontuários. Dessa forma, se a primeira ficha sorteada para a amostra fosse a de número 4, a próxima seria a de número 22, a de número 40 e assim por diante, até completar as 50 fichas que farão parte da amostra. Agora é só verificar quais foram os sorteados e aplicar os questionários. Conceito de Distribuição ou Tabela de Frequências Quando se estuda uma variável, o maior interesse do pesquisador é conhecer o comportamento dessa variável, analisando a ocorrência de suas possíveis realizações. É na Distribuição ou Tabela de Frequência que será apresentado o cálculo da pesquisa para o fechamento e tomada de decisão. Podem ser chamadas de discretas ou contínuas. Exemplo 1. Tabela de Frequência com uma variável “discreta” (sem faixas de valores). Distribuição ou tabela de frequência Discreta Contínua dados agrupados sem faixas dados agrupados com faixas de valores Frequências e porcentagens dos 2.000 empregados da Empresa XY, segundo o Grau de Instrução. Exemplo 2. Tabela de Frequência com uma variável “contínua” (com faixas de valores). Grau de instrução (xi) Frequência Abosluta ( fi) Frequência Relativa (fri) Porcentagem (fr%) Fundamental 650 0,325 32,50 Médio 1020 0,510 51,00 Superior 330 0,165 16,50 Total 2000 1,0 100,00 Frequências e porcentagens dos 36 empregados da Seção de Orçamentos da Cia XY, por faixa de salário. Classe de salários Frequência Abosluta ( fi)i Frequência Relativa (fri) Porcentagem fri 500,00 |__ 1.000,00 10 0,2778 27,78 1.000,00 |__ 1.500,00 12 0,3333 33,33 1.500,00 |__ 2.000,00 8 0,2222 22,22 2.000,00 |__ 2.500,00 5 0,1389 13,89 2.500,00 |__ 3.000,00 1 0,0278 2,78 Total 36 1,0 100,00 Observação: Na próxima Unidade, mostraremos como construir essas Tabelas de Distribuição de Frequência. O Método Estatístico O Método Estatístico é um processo para se obter, apresentar e analisar características ou valores numéricos para uma melhor tomada de decisão em situações de incerteza. Toda pesquisa, nas mais variadas áreas, utiliza, de modo geral, cinco fases quando se emprega o Método Estatístico: Fases do Método Estatístico De�nição do Problema Planejamento Coleta de Dados Apuração e Apresentação dos Dados Análise e Interpretação dos Dados Fase 1 Fase 2 Fase 3 Fase 4 Fase 5 Fase 1 – Definição do Problema Para usar o Método Estatístico, devo me perguntar: Qual o problema que quero resolver? Quais são meus objetivos? Resultados numéricos resolvem meu problema e dão conta de meus objetivos? Se sua resposta for afirmativa, o Método se aplica; caso contrário, use outra Metodologia. Fase 2 – Planejamento Na fase do planejamento, devo fazer as seguintes perguntas: Vou usar uma População ou uma amostra? Se for utilizar uma amostra, que técnicas de amostragem irei empregar? Quais serão as variáveis que quero estudar? Serão Qualitativas ou Quantitativas? Usarei questionário ou planilha? Quem coletará os dados em campo? Fase 3 – Coleta de Dados Nesta fase, será elaborado o instrumento de pesquisa que irei usar para fazer a coleta dos dados e será feita a aplicação do instrumento em campo. Devo fazer perguntas do tipo: Como será o layout do instrumento de pesquisa? Se for questionário: Como serão as perguntas, fechadas ou abertas? O instrumento de pesquisa deve estar de acordo com o problema, os objetivos e as variáveis que forem selecionadas. Fase 4 – Apuração e Apresentação dos Dados Apurar os dados é resumi-los de modo que se transformem em informação significativa. O resultado da apuração é apresentado na forma de Tabelas e Gráficos. Cada uma das variáveis que se estudou irá se transformar em uma Distribuição de Frequência e, posteriormente, em um Gráfico. Fase 5 – Análise e Interpretação dos Dados Nesta fase, espera-se que os objetivos tenham sido atingidos, de modo que seja possível uma tomada de decisão em relação ao problema e os objetivos que motivaram a pesquisa. Pesquisa de Mercado e de Opinião Na prática, podemos empregar o método estatístico para fazer uma Pesquisa de Mercado ou uma Pesquisa de Opinião. A Pesquisa de Mercado é um estudo que tem como objetivo determinar as perspectivas de venda de um produto no mercado e indicar a maneira de se obter os melhores resultados. Também permite analisar os mercados que oferecem melhores perspectivas, os padrões de qualidade exigidos pelo mercado e o tempo necessário para se alcançar o nível ideal de vendas. A Pesquisa de Mercado é um investimento necessário que pode economizar dinheiro e fornecer elementos essenciais para a aproximação com o mercado consumidor. Os principais objetivos da Pesquisa de Mercado são: selecionar mercados para a venda do produto; identifi car tendências e expectativas; reconhecer a concorrência e conhecer e avaliar oportunidades e ameaças. A Pesquisa de Opinião tem como objetivo investigar e retratar as atitudes e opiniões dos indivíduos, possibilitando à sociedade conhecer com precisão as tendências e posições dos diferentes segmentos sociais. Ela faz parte do cotidiano da população e tem grande visibilidade na mídia. É muito comum abrir jornais e revistas e encontrar levantamentos sobre o que pensam as pessoas a respeito dos mais diversos temas, como, por exemplo, pesquisas de intenção eleitoral ou sobre a expectativa em relação ao futuro do país. Geralmente, as Pesquisas de Opinião são feitas por amostragem. Ou seja, para saber a opinião dos moradores de uma cidade sobre um determinado assunto, não se entrevistam todos eles. Por meio de técnicas estatísticas, um grupo representativo de todos os habitantes do município é selecionado e entrevistado. A opinião desse grupo tende a refletir o que toda a comunidade pensa. Construção de Questionários e Planilhas para Coleta de Dados Para se realizar uma Pesquisa de Mercado ou de Opinião, é preciso usar instrumentos para coleta desses dados. Podemos utilizar Questionários ou Planilha de Coleta de Dados. Os questionários e as planilhas são instrumentos que utilizamos para recolher informações relativas a fatos, ideias, comportamentos, preferências, sentimentos, expectativas, atitudes e conhecimentos. Os questionários são compostos de perguntas que podem ser fechadas ou abertas. Questões fechadas são aquelas em que o respondente assinala a opção desejadade uma lista de repostas que lhe é facultada. Questões abertas são aquelas que o respondente fornece sua resposta espontaneamente. Quando empregamos o método estatístico, as questões fechadas têm grande vantagem sobre as questões abertas, pois fornecem respostas que facilmente podem ser mensuradas, o que não acontece com as questões abertas. Quando usamos questões abertas antes de serem mensuradas, elas precisam ser categorizadas, o que muitas vezes dá muito trabalho e demanda muito tempo. O investigador deve certificar-se de que as suas questões são bem compreendidas e que permitem recolher a informação que deseja, usando frases curtas, claras, compreensíveis e que exprimam uma só ideia. O questionário não deve ser demasiado longo, nem deve provocar irritação nos entrevistados. A planilha também pode ser utilizada para a coleta de dados. É uma Tabela na qual cada uma das colunas faz a coleta de uma variável específica. Por exemplo: Tabela 1. Planilha de Coleta de Dados para traçar perfil dos compradores de uma marca de automóvel Identificação Sexo Idade Estado Civil Renda Mensal (R$) Profissão 1 2 3 4 ... Tabelas e Gráfi cos Tabela É um quadro que resume um conjunto de dados “tabulados” dispostos segundo linhas e colunas de maneira sistemática. Toda tabela tem: Título (OBRIGATÓRIO) Valores da Variável (xi) Frequência Absoluta (fi) ∑ fi = Célula Corpo Símbolo matemático chamado “Somatório” Referência da pesquisa, se houver.Fonte Tabelas ou Distribuições de Frequência As Tabelas ou Distribuições de Frequência são usadas para sintetizar valores obtidos por meio de coleta de dados. Podemos construir Distribuições de Frequência para variáveis quantitativas ou qualitativas. Uma Distribuição de Frequência é chamada de Distribuição de Frequência variável discreta quando estamos trabalhando com variáveis qualitativas ou quantitativas discretas. Uma Distribuição de Frequência é chamada de Distribuição de Frequência variável contínua quando estamos trabalhando com quantitativas contínuas ou discretas e agrupamos os dados por faixas de valores. Construção da Distribuição de Frequência – Variável discreta Uma tabela ou Distribuição de Frequência variável discreta deve conter 4 colu- nas distribuídas da seguinte forma: Variável (xi) Frequência Absoluta (fi) Frequência Relativa (fri) Porcentagem (fri%) Devem ser colocados todos os valores assumidos pela variável em estudo Obtida da contagem direta dos valores ou realizações da variável fr f ni i= fi = frequência absoluta ∑ fi ou n = nº total de elementos da sequência em estudo fri%= fri x 100 Totais ∑ fi ou n 1,0 100 Linha dos totais Sempre soma 1 Sempre soma 100 Vejamos um exemplo de como construir uma Distribuição de Frequência variá- vel discreta. A sequência a seguir representa as notas de 30 alunos em uma prova de Estatística. Obtenha a Distribuição de Frequência variável discreta. Dados brutos: Notas de Estatística 3 5 4 4 4 5 3 4 4 5 2 1 4 3 2 4 2 4 3 4 3 3 1 4 4 3 4 4 5 3 Solução 1) Primeiro vamos transformar os dados brutos em rol e vamos pintar cada uma das notas com cores diferentes para facilitar a contagem das frequências absolutas. Rol: Notas de Estatística 1 1 2 2 2 3 3 3 3 3 3 3 3 4 4 4 4 4 4 4 4 4 4 4 4 4 5 5 5 5 2) Vamos montar agora a Tabela de Frequência variável discreta. Distribuição de Frequência variável discreta – Notas de Estatística Notas (xi) Frequência Absoluta (fi) Frequência Relativa (fri) Porcentagem (fr%i) 1 2 fri fi n = = = 2 30 0 0667, fri% = fri x 100 0,0667 x 100 = 6,67 2 3 fri fi n = = = 3 30 0 10, 0,10 x 100 = 10 3 8 fri fi n = = = 8 30 0 2667, 0,2667 x 100 = 26,67 4 13 fri fi n = = = 13 30 0 4333, 0,4333 x 100 = 43,33 5 4 fri fi n = = = 4 30 0 1333, 0,1333 x 100 = 13,33 Totais 30 1,0 100 Obtida na contagem direta no rol Obtida na contagem direta no rol Arredondamento Vamos relembrar rapidamente como é feito o arredondamento: Parte inteira do número 10,3 Parte decimal do número Tabelas e Gráficos Exemplo 1 5,0 5,1 5,2 5,3 5,4 – arredondado vira 5. Exemplo 2 20,5 20,6 20,7 20,8 20,9 – arredondado vira 21. O que deve ser levado em consideração no arredondamento é a parte que aparece após a vírgula. Se após a virgula houver: 0, 1, 2, 3 ou 4, mantém-se a parte inteira do número. Se após a virgula houver: 5, 6, 7, 8 ou 9 acrescenta-se 1 à parte inteira do número. Resposta Após o resumo das notas na Tabela de Frequência variável discreta, conseguiremos verificar que a nota de Estatística mais frequente foi a nota 4 com 43,33%, seguida da nota 3, que aparece com uma porcentagem de 26,67%. Como a nota máxima era 5, podemos dizer que o desempenho da sala nesta Disciplina foi muito bom. Construção da Distribuição de Frequência variável contínua Uma Tabela ou Distribuição de Frequência variável contínua é utilizada quando, na sequência numérica em estudo, há um grande número de elementos distintos. Nesse caso, uma Distribuição de Frequência variável discreta não seria aconselhável, pois não faria a redução conveniente dos dados. Nesta situação, é conveniente agrupar os dados por faixas de valores, o que chamamos de Distribuição de Frequência variável contínua. Uma Tabela ou Distribuição de Frequência variável contínua deve conter 4 colunas distribuídas da seguinte forma: Variável (xi) Frequência Absoluta (fi) Frequência Relativa (fri) Porcentagem (fri%) Colocar os valores assumidos pela variável em estudo agrupados por faixa de valores Obtida da contagem direta dos valores presentes em cada faixa de valores fr f ni i= fi = frequência absoluta ∑ fi ou n = nº total de elementos da sequência em estudo fri%= fri x 100 Totais ∑ fi ou n 1,0 100 10 Para a construção dessa distribuição, devemos ter conhecimento de alguns conceitos. Para isso, vamos usar um exemplo para podermos indicar adequadamente cada um dos conceitos que iremos definir. Peso de mulheres Intervalo de Peso (Kg) Frequência (fi) Frequência Relativa (fri) Porcentagem (fri%) 51 | - 55 12 0,30 30 55 | - 59 18 0,45 45 59 | - 63 10 0,25 25 Totais 40 1,0 100 Amplitude total de uma sequência (AT) É a diferença entre o maior valor da sequência (Xmáx) e o menor valor da sequência (Xmin). AT = Xmax – Xmin AT = 63 – 51 = 12 Xmáx = 63 Xmin = 51 Número de classes (K) É o número de linhas que uma Distribuição de Frequência deve ter. No nosso exemplo, a tabela dos pesos é composta de 3 linhas, portanto K = 3. Cálculo da amplitude do intervalo de classe (H) A primeira classe ou linha é composta por essa faixa de valores que representam os pesos de mulheres de 51 |- 55. Note que essa escrita é uma escrita matemática de intervalo numérico, quer dizer que nessa linha podemos colocar pesos entre 51 e 54,9 Kg. Temos o intervalo fechado à esquerda e aberto à direita, o que significa que inclui o número que está à esquerda e exclui o número que está à direita. Na segunda linha, temos a faixa de pesos 55 |- 59, o que significa que só podem ser colocados pesos entre 55 e 58,9 Kg. Na terceira linha, temos a faixa de pesos 59 |- 63, o que significa que só podem ser colocados pesos entre 59 e 62,9 Kg. Para calcularmos H, em cada linha fazemos: H = valor máximo da faixa – Valor mínimo da faixa Faixa Cálculo do H 51 |- 55 H = 55 - 51 = 4 55 |- 59 H = 59 - 55 = 4 59 |- 63 H = 63 - 59 = 4 Limite de classe Quando a variável é agrupada em faixas, cada intervalo de classe fica caracterizado por dois números reais. O menor é chamado de limite inferior (l) da classe e o maior de limite superior da classe (L). Nessa primeira faixa 51 |- 55, temos: l = 51 e L = 55. Nessa segunda faixa 55 |- 59, temos: l = 55 e L = 59. Nessa terceira faixa 59 |- 63, temos: l = 59 e L = 63. Vamos agora efetivamente construir a Distribuição de Frequência variável contínua usando para isso um exemplo. A sequência a seguir representa as notas de 20 alunos em Matemática. Obtenha a Distribuição de Frequênciavariável contínua. Dados brutos: Notas de Matemática 3 4 2,5 3,5 5 6 8,5 5,5 9 7 7,5 2 5 4,5 4 8 6,5 7,5 6 9,5 Solução 1) Vamos construir a Distribuição de Frequência variável contínua, pois essas notas assumem valores bem distintos que variam entre 2 e 9,5. Uma Distribuição de Frequência variável discreta não faria adequadamente o resumo dos dados. 2) Para facilitar, vamos transformar os dados brutos em rol. Rol: Notas de Matemática 2 2,5 3 3,5 4 4 4,5 5 5 5,5 6 6 6,5 7 7,5 7,5 8 8,5 9 9,5 3) Como o valor mínimo das notas Xmin = 2 e o valor máximo das notas Xmáx = 9,5, vamos construir as faixas para agrupar esse valores de 2 em 2, ou seja, H = 2, pois, dessa forma, conseguiremos faixas para colocar todas as notas. Distribuição de Frequência variável contínua para as notas de Matemática Explicação Notas de Matemática Frequência (fi) Frequência Relativa (fri) Porcentagem (fri%) Cabem notas de 2 a 3,9 2 |- 4 4 fr f ni i= = = 4 20 0 20, fri%= fri x 100 0,20x100 = 20 Cabem notas de 4 a 5,9 4 |- 6 6 fr f ni i= = = 6 20 0 30, 0,30 x 100 = 30 Cabem notas de 6 a 7,9 6 |- 8 6 fr f ni i= = = 6 20 0 30, 0,30 x 100 = 30 Cabem notas de 8 a 9,9 8 |- 10 4 fr f ni i= = = 4 20 0 20, 0,20 x 100 = 20 Totais 20 1,0 100 Resposta Ao agrupar os dados na Tabela de Frequência variável contínua, conseguimos perceber que as faixas de notas mais frequentes são as de 4 |- 6 e de 6 |- 8, cada uma delas com 30% das notas que os alunos tiraram em Matemática. Importante! Observe que se olharmos somente para a Tabela de Frequência, dentro de cada uma das faixas de notas, não dá pra saber, por exemplo, na faixa 2 |- 4, quantas notas 2; 2,5; 3; e 3,5 tínhamos exatamente nos dados brutos. Esse tipo de distribuição dá uma ideia do comportamento da variável; porém, não é tão precisa como na variável discreta. Importante! Gráficos São representações visuais dos dados estatísticos. Eles servem na interpretação de dados para tomadas de decisão. Gráfico de Informação São gráficos destinados, principalmente, ao público em geral, objetivando proporcionar visualização rápida e clara. São gráficos tipicamente expositivos, dispensando comentários explicati- vos adicionais. As legendas podem ser omitidas, desde que as informações desejadas este- jam presentes. Gráfico de Análise São Gráficos que se prestam melhor ao trabalho estatístico, fornecendo elementos úteis à fase de análise dos dados, sem deixar de ser também informativos. Os Gráficos de Análise frequentemente vêm acompanhados de uma Tabela Estatística. Muitas vezes, inclui-se um texto explicativo, chamando a atenção do leitor para os pontos principais revelados pelo Gráfico. Contudo, os elementos simplicidade, clareza e veracidade devem ser considerados quando da elaboração de um Gráfico. 5 10 15 20 25 30 35 22% 62% 14% 2% Fundamental Médio Superior Pós graduação Ensino Fundamental Médio Superior Pós-graduação Total F Fr 11 31 7 1 50 22% 62% 14% 2% 100% Análise Grá�ca: Em relação ao grau de instrução veri�camos que a maioria das pessoas entrevistadas possui o Ensino Médio Classificação dos Gráficos Os Gráficos usados na representação de dados estatísticos podem ser classificados de diversas formas, como veremos a seguir. Gráfico em Barras Horizontais É semelhante ao Gráfico em Colunas; porém, os retângulos são dispostos horizontalmente. Gráfico em Barras Verticais (Colunas) Quando as legendas não são breves, usam-se de preferência os Gráficos em Barras Horizontais. Nesses Gráficos, os retângulos têm a mesma base e as alturas são proporcionais aos respectivos dados. Gráfico em Linhas ou Lineares São frequentemente usados para representação de dados ou séries cronológicas que têm um grande número de períodos de tempo. As linhas são mais eficientes do que as colunas, quando existem intensas flutuações nas séries ou quando há necessidade de se representarem várias séries em um mesmo gráfico. Quando representamos, em um mesmo sistema de coordenadas, a variação de dois fenômenos, a parte interna da figura formada pelos gráficos desses fenômenos é denominada área de excesso. Gráfico em Setores Este Gráfico é construído com base em um círculo e é empregado sempre que desejamos ressaltar a participação do dado no total. O total é representado pelo círculo, que fica dividido em tantos setores quantas são as partes. Os setores são tais que suas áreas são respectivamente proporcionais às frequências relativas da série em estudo. O gráfico em setores só deve ser empregado quando há, no máximo, 7 (sete) dados. 40% 30% 15% 10% 5% Futebol Vôlei Basquete Natação Outros 360º Pictogramas São construídos a partir de figuras representativas da intensidade do fenômeno. Esse tipo de gráfico tem a vantagem de despertar a atenção do público leigo, pois sua forma é atraente e sugestiva. Os símbolos devem ser autoexplicativos. A desvantagem dos pictogramas é que apenas mostram uma visão geral do fenômeno, e não detalhes minuciosos. Número de Grati�cações Departamentos En ge nh ar ia 8 4 17 5 5 25 4 Re cu rso s Hu m an os Fin an ce iro Ge stã o de R isc o M ar ke tin g Pr od ut ivi da de Co nt ab ili da de Veja o exemplo a seguir. Cartogramas São ilustrações relativas a Cartas Geográficas (Mapas). O objetivo desse gráfico é o de figurar os dados estatísticos diretamente relacionados com áreas geográficas ou políticas. Histograma É formado por um conjunto de retângulos justapostos, cujas bases se localizam sobre o eixo horizontal, de tal modo que seus pontos médios coincidam com os pontos médios dos intervalos de classe. A área de um Histograma é proporcional à soma das frequências simples ou absolutas. É utilizado para Distribuições de Frequência variável contínua. 18 Histograma - Grá�co 25 32 39 46 53 60 67 12% 16% 12% 10% 4% 20% 26% Construçao de Gráficos Vamos aprender a construir Gráfico de Barras, de Setores e Histograma, por serem os mais utilizados em Estatística. Cada Distribuição de Frequência gera um Gráfico. Gráfico de Barras É utilizado para representar Distribuições de Frequência variável discreta. Ele é representado por um conjunto de hastes (retângulos) verticais separados entre si, em um sistema de coordenadas cartesianas que tem por base os valores ou realizações da variável em estudo e por altura as porcentagens correspondentes. Vejamos um exemplo. Dada a Distribuição de Frequência variável discreta que representa as notas de uma turma em Estatística, construa o gráfico de barras. Distribuição de Frequência variável discreta – Notas de Estatística Notas (xi) Frequência Absoluta (fi) Frequência Relativa (fri) Porcentagem (fri%) 1 2 0,0667 6,67 2 3 0,10 10 3 8 0,2667 26,67 4 13 0,4333 43,33 5 4 0,1333 13,33 Totais 30 1,0 100 Solução Para construir o Gráfico, usamos a coluna da variável (notas) e a coluna das porcentagens. Vamos construir o eixo xy (plano cartesiano). Sobre o eixo x, iremos representar cada uma das notas e sobre o eixo y cada uma das porcentagens referente a cada nota. O Excel resolve facilmente esse problema. Se tiver dificuldades, consulte um instrutor no espaço Webclass ou nos Laboratórios de Informática. 6,67% 10,00% 26,67% 43,33% 13,33% 0,00% 5,00% 10,00% 15,00% 20,00% 25,00% 30,00% 35,00% 40,00% 45,00% 50,00% Nota 1 Nota 2 Nota 3 Nota 4 Nota 5 Notas de Estatística Nota 1 Nota 2 Nota 3 Nota 4 Nota 5 Resposta Ao observar o Gráfico, concluímos que a nota mais frequente nessa turma foi a nota 4, seguida da nota 3. Podemos dizer que a turma está de parabéns, pois a maioria dos alunos (70%) teve notas boas, vez que a prova valia 5. Gráfico de Setores É utilizado para representar Distribuições de Frequência variável discreta. O gráfico de setores é construído sobre uma circunferência. Cada setor ou parte em que essa circunferência fica dividida é proporcional às frequências relativas da variável em estudo. Cálculo do setor circular:setor = fri x 360º Vejamos um exemplo. Dada a Distribuição de Frequência variável discreta que representa o gênero dos funcionários de uma empresa, construa o Gráfico de Setores. Distribuição de Frequência variável discreta – Gênero dos funcionários Sexo Frequência Absoluta (fi) Frequência Relativa (fri) Porcentagem (fri%) M 63 0,63 63 F 37 0,37 37 Totais 100 1,0 100 Solução Para construir o gráfico, devemos primeiramente calcular cada setor circular: O somatório tem de ser sempre igual a 360º Valores arredondados Setor = fri x 360º Valor do setor Setor masculino = 0,63x360 = 227 227º Setor feminino = 0,37x360 = 133 133º Somatório 360º Sabemos que o setor referente a masculino será maior que o setor referente a feminino. Vamos construir o Gráfico, usando o Excel. Lembre-se: se tiver dúvida, vá a um Laboratório de Informática e converse com os técnicos, ok?! 37% 63% Masculino Feminino Genêro dos Funcionários de uma empresa Resposta Observando o Gráfico, podemos concluir que nessa empresa há mais homens do que mulheres. Histograma É utilizado para representar a Distribuição de Frequência variável contínua. O Histograma é um conjunto de retângulos verticais e justapostos (colados), representado em um sistema de coordenadas cartesianas. As bases são os intervalos de classe da variável em estudo e as alturas as porcentagens correspondentes. Vejamos um exemplo. A distribuição a seguir representa o peso de 40 mulheres. Construa o respectivo Histograma e tire suas conclusões. Distribuição de Frequência variável contínua do peso de mulheres Peso (Kg) Frequência (fi) Frequência relativa (fri) Porcentagem (fri%) 51 |- 55 12 0,30 30 55 |- 59 18 0,45 45 59 |- 63 10 0,25 25 Totais 40 1,0 100 Solução Vamos pegar os valores das variáveis e das porcentagens para construir o gráfico. O Excel resolve esse problema facilmente. 0% 10% 20% 30% 40% 50% 30% 45% Peso (kg) Peso de Mulheres em Quilos 25% 51 |- 55 55 |- 59 59 |- 63 Conclusão Ao observar o gráfico, concluímos que 45% das mulheres investigadas tem peso entre 55 |- 59 quilos, 30% das mulheres tem peso entre 51 |- 55 e 25% das mulheres tem peso entre 59 |- 63 Kg.