Prévia do material em texto
ESTATÍSTICA BÁSICA ADAUTO JOSÉ VALENTIM NETO e DAYANNA COSTA U N I D A D E 2 Nesta unidade estudaremos como é feita a organização dos dados após sua coleta, por meio da distribuição das frequências, bem como os tipos de frequências que podem compor uma tabela, e a representação gráfica desses dados por meio do histograma e do polígono de frequência. Assim, sua principal responsabilidade é compreender os aspectos básicos e introdutórios da estatística. UNIDADE 2 | INTRODUÇÃO 1.Compreender a distribuição de frequências; 2.Conhecer elementos da distribuição de frequências; 3.Identificar tipos de distribuição de frequência; 4.Compreender os gráficos de distribuição de frequência. UNIDADE 2 | OBJETIVOS Para entendermos como ocorre a distribuição de frequência, é relevante sabermos que a distribuição contém um número adequado de classes. Nesse sentido, a perda dos detalhes pode acontecer, e caso o número de classes seja menor, acarretará possível perda de informação, a qual será extraída da tabela. Compreender a distribuição de frequências • Precisamos entender que dependemos do volume de dados. Nessa perspectiva, a compreensão de que é difícil ou impraticável a conclusão advinda do comportamento das variáveis e, em particular, de variáveis quantitativas, deve partir da pessoa que analisar os dados. • Para Larson e Betsy (2015, p. 37), uma distribuição de frequência é uma tabela que mostra classes ou intervalos dos valores com a contagem do número de ocorrências em cada classe ou intervalo. A frequência f de uma classe é o número de ocorrências de dados. • Existem muitas maneiras de se organizar e descrever conjuntos de dados. Algumas características importantes que devem ser consideradas ao se organizar e descrever um conjunto de dados são: seu centro, sua variabilidade (ou dispersão) e sua forma. Quando o conjunto de dados tem muitos valores, o padrão pode ser difícil de observar. Para elaborarmos uma tabela de distribuição de frequência, calculamos a amplitude das classes, bem como os limites inferiores e superiores, fazemos as contagens dos dados e identificamos a frequência. Passo a passo para elaboração da distribuição de frequência • Por fim, determinamos o somatório das frequências de forma que se iguala ao número de dados anteriormente coletados. • Com isso, compreendemos como a estatística pode ser importante em nosso cotidiano e como ela pode nos auxiliar, oferecendo-nos informações relevantes. Classe é o intervalo de variável ou entre variáveis. As classes são representadas simbolicamente por i, em que i = 1, 2 [...] K, e k é o número total de classes. O número total de valores é representado por n. Por exemplo, podemos supor que exista uma variável que assume 50 valores. Dessa forma n = 50, e as classes serão definidas a partir dos intervalos e das amplitudes que serão calculadas a partir dos dados. Com isso, podemos definir que a primeira classe será i = 1, a segunda será: i = 2, a terceira será: i = 4 e assim por diante, até o limite de classe definido de sua amostra. Elementos da distribuição de frequências As extremidades de cada uma das classes em uma distribuição de frequência são denominadas limites de classe. Nesse sentido, já que a classe é representada por i, o limite considerado inferior é representado por li, já o limite superior é representado por Li. Limites de classe • Os limites das classes (i) são representados dessa forma: • li Limite inferior da classe. • Li Limite superior da classe. • O cálculo do limite inferior se dá por meio da identificação da amplitude da classe. Logo, o limite inferior da primeira classe é o menor número identificado nos dados coletados, e a partir da segunda classe, o limite inferior é calculado: • Limite inferior: limite inferior da primeira classe (i=1) + amplitude da classe; limite inferior da terceira classe (i=3): limite inferior da segunda classe (i=2) + amplitude da classe; e assim sucessivamente, até o número de classes definido em sua pesquisa. • Para o cálculo do limite superior, pegamos o valor do limite inferior da classe seguinte e deduzimos um: limite superior da primeira classe (i=1): limite inferior (i=2) – 1; limite superior da segunda classe (i=2): limite inferior (i=3) – 1; e assim sucessivamente, até a última classe, em que o limite superior será o maior valor dos dados analisados. • O intervalo de classe ou a amplitude de um intervalo de classe consiste no tamanho do intervalo que definirá a classe. Nesse sentido, o intervalo da classe será simbolizado por (hi), que será obtido a partir da diferença entre os seus limites, ou seja: • hi = Limite superior (Li) – Limite inferior (li). • Para o elemento de uma distribuição de frequência, temos o ponto médio de uma classe, que consiste em identificar o ponto que divide a classe ao meio. • Larson e Betsy (2015) definem que o ponto médio de uma classe é o somatório dos limites inferior e superior da classe dividido por dois. Assim, o ponto médio, por algumas vezes, pode ser denominado marca da classe ou representante da classe. Desse modo, podemos formular que o ponto médio será: Ponto médio = limite inferior da classe (li) + limite superior da classe (Li) / 2. Sabemos que toda pesquisa envolve uma coleta de dados que será organizada e analisada pelo pesquisador. Nesse sentido, quando determinamos o número de vezes que o valor de uma variável acontece, estamos demonstrando a sua frequência simples ou absoluta. Tipos de Distribuição de frequências • Uma frequência simples ou absoluta pode ser considerada como o número de vezes que um valor assume em uma determinada variável. • Assim, as frequências simples e absoluta são representadas pelo símbolo do (fi) e representam valores ou número de dados de cada classe de forma direta. • Assim, a frequência simples ou absoluta consiste na soma de todas as ocorrências em cada classe, igual ao número total de dados, como: � 𝑖𝑖=1 𝑘𝑘 𝑛𝑛 • Dessa forma, sabemos que o símbolo do sigma Σ é a soma de todos os valores da frequência analisada. Dessa forma, para darmos significados aos dados coletados, devemos utilizar a frequência relativa (fri), que, por sua vez, pode ser representada por meio de dados percentuais (%). Larson e Betsy (2015) defedem que a frequência relativa de uma classe consiste na fração ou proporção dos dados que compõem uma classe. Nesse sentido, determinamos a frequência relativa de uma classe dividindo a frequência (f) pelo tamanho (n) da amostra. Contudo, para transformarmos esses valores em percentagem (%), basta multiplicarmos o resultado encontrado por 100. Assim, a fórmula da frequência relativa será: fri = 𝑓𝑓 (frequência da classe) n (tamanho da amostra) Frequência relativa Ademais, as frequências relativas (fri) ainda podem ser consideradas, de forma alternativa, como resultado das razões entre as frequências simples (fi) e a frequência total (n), dessa forma, temos: 𝑓𝑓𝑓𝑓𝑓𝑓 = 𝑓𝑓𝑖𝑖 ∑ 𝑓𝑓𝑖𝑖 =𝑓𝑓𝑖𝑖 𝑛𝑛 Assim, podemos tirar várias conclusões a partir das análises de uma frequência relativa. Ela pode mostrar que uma classe contém uma parcela que aquela classe representa da amostra. Nessa mesma linha de raciocínio, podemos definir que a frequência acumulada de uma classe consiste na soma das frequências dessa classe com todas as outras classes anteriores. Dessa forma, a frequência acumulada da última classe será sempre igual ao tamanho (n) da amostra estudada (LARSON; BETSY, 2015). A frequência acumulada será representada pelo símbolo (Fj), que consiste na soma das frequências simples (fi) de todas as classes com intervalos inferiores a uma determinada classe. Assim, será representada matematicamente por: 𝐹𝐹𝐹𝐹 = ∑𝑖𝑖=1 𝑗𝑗 𝑓𝑓𝑖𝑖=𝑓𝑓1+𝑓𝑓2+...+𝑓𝑓𝑗𝑗. Ferrari (2004) destaca que todo gráfico deve ser simples, claro e verdadeiro, finalizado com as informações geradas. Para que isso aconteça, os gráficos devem ser elaborados com muito cuidado, zelo e muito trabalho. Existem alguns tipos de representaçõesgráficas que expressam uma distribuição de frequência, mas os principais são: histograma; e polígono de frequência. O histograma consiste em uma representação gráfica que destaca as tendências dos dados, as informações incidentes, os valores mínimos e máximos e, ainda, a magnitude dos fenômenos que são observados. Para Larson e Betsy (2015), o histograma que representa as frequências é um gráfico composto por barras que demonstra as frequências e sua distribuição por meio do conjunto de dados. Compreendendo os gráficos de distribuição de frequência Outra forma de demonstrar graficamente os dados de uma pesquisa em uma distribuição de frequência é usar um gráfico denominado polígono de frequência. Esse recurso visual em forma gráfica tem o objetivo de demonstrar, por meio de linhas, as mudanças que ocorreram de forma contínua nas frequências. Polígono de Frequência 10 8 6 4 2 • • • • • • • • • Preço Assim como no histograma, no polígono de frequência serão utilizadas linhas verticais e horizontais, mas em vez de barras, serão utilizadas linhas. Larson e Betsy (2015) aconselham que o histograma e o polígono de frequência sejam construídos juntos. Os autores orientam que, em primeiro lugar, deve-se construir o polígono de frequência, em que serão definidas as linhas verticais e horizontais apropriadas. No eixo horizontal, como estudamos, devem estar os pontos médios de cada classe, já no eixo vertical devem ser destacados os valores de frequência contidos na tabela em análise. A partir de então, serão assinalados os pontos que representam o ponto médio e a frequência de cada classe. Após conectá- los por meio de linhas, conclua o trabalho construindo um gráfico de barras, denominando-o histograma. OBRIGADA! Número do slide 1 Número do slide 2 Número do slide 3 Número do slide 4 Número do slide 5 Número do slide 6 Número do slide 7 Número do slide 8 Número do slide 9 Número do slide 10 Número do slide 11 Número do slide 12 Número do slide 13 Número do slide 14 Número do slide 15 Número do slide 16 Número do slide 17 Número do slide 18 Número do slide 19 Número do slide 20 Número do slide 21