Logo Passei Direto
Buscar
Material
páginas com resultados encontrados.
páginas com resultados encontrados.
left-side-bubbles-backgroundright-side-bubbles-background

Crie sua conta grátis para liberar esse material. 🤩

Já tem uma conta?

Ao continuar, você aceita os Termos de Uso e Política de Privacidade

left-side-bubbles-backgroundright-side-bubbles-background

Crie sua conta grátis para liberar esse material. 🤩

Já tem uma conta?

Ao continuar, você aceita os Termos de Uso e Política de Privacidade

left-side-bubbles-backgroundright-side-bubbles-background

Crie sua conta grátis para liberar esse material. 🤩

Já tem uma conta?

Ao continuar, você aceita os Termos de Uso e Política de Privacidade

left-side-bubbles-backgroundright-side-bubbles-background

Crie sua conta grátis para liberar esse material. 🤩

Já tem uma conta?

Ao continuar, você aceita os Termos de Uso e Política de Privacidade

left-side-bubbles-backgroundright-side-bubbles-background

Crie sua conta grátis para liberar esse material. 🤩

Já tem uma conta?

Ao continuar, você aceita os Termos de Uso e Política de Privacidade

left-side-bubbles-backgroundright-side-bubbles-background

Crie sua conta grátis para liberar esse material. 🤩

Já tem uma conta?

Ao continuar, você aceita os Termos de Uso e Política de Privacidade

left-side-bubbles-backgroundright-side-bubbles-background

Crie sua conta grátis para liberar esse material. 🤩

Já tem uma conta?

Ao continuar, você aceita os Termos de Uso e Política de Privacidade

left-side-bubbles-backgroundright-side-bubbles-background

Crie sua conta grátis para liberar esse material. 🤩

Já tem uma conta?

Ao continuar, você aceita os Termos de Uso e Política de Privacidade

left-side-bubbles-backgroundright-side-bubbles-background

Crie sua conta grátis para liberar esse material. 🤩

Já tem uma conta?

Ao continuar, você aceita os Termos de Uso e Política de Privacidade

left-side-bubbles-backgroundright-side-bubbles-background

Crie sua conta grátis para liberar esse material. 🤩

Já tem uma conta?

Ao continuar, você aceita os Termos de Uso e Política de Privacidade

Prévia do material em texto

<p>Fernanda Silva Brandão</p><p>Estatística [e-Book]. / Fernanda Silva Brandão. – São</p><p>Luís: UEMA; UEMAnet, 2021.</p><p>68 p.</p><p>ISBN: 978-65-89787-25-9</p><p>1.Estatística. 2.Probabilidades. 3.Metodos</p><p>estatísticos. I.Título.</p><p>CDU: 519.2</p><p>Reitor</p><p>Gustavo Pereira da Costa</p><p>Vice-Reitor</p><p>Walter Canales Sant´ana</p><p>Pró-Reitora de Graduação</p><p>Zafira da Silva de Almeida</p><p>Núcleo de Tecnologias para Educação</p><p>Ilka Márcia Ribeiro S. Serra - Coordenadora Geral</p><p>Sistema Universidade Aberta do Brasil</p><p>Ilka Márcia R. S. Serra - Coord. Geral</p><p>Maria das Graças Neri Ferreira - Coord. Adjunta | Coord.</p><p>de Curso</p><p>Coordenação do Setor Design Educacional</p><p>Cristiane Peixoto - Coord. Administrativa</p><p>Danielle Martins Leite Fernandes Lima - Coord. Pedagógica</p><p>Professora Conteudista</p><p>Fernanda Silva Brandão</p><p>Revisão de Linguagem</p><p>Lucirene Ferreira Lopes</p><p>Designer de Linguagem</p><p>Lucirene Ferreira Lopes</p><p>Designer Pedagógica</p><p>Erica Costa Sousa</p><p>Projeto Gráfico e Diagramação</p><p>Tonho Lemos Martins</p><p>Capa</p><p>Yuri Almeida</p><p>UNIVERSIDADE ESTADUAL DO MARANHÃO - UEMA</p><p>Os matériais produzidos para os cursos ofertados pelo UEMAnet/UEMA para o Sistema Universidade Aberta do Brasil -</p><p>UAB são licenciados nos termos da Licença Creative Commons – Atribuição – Não Comercial – Compartilhada, podendo</p><p>a obra ser remixada, adaptada e servir para criação de obras derivadas, desde que com fins não comerciais, que seja</p><p>atribuído crédito ao autor e que as obras derivadas sejam licenciadas sob a mesma licença.</p><p>3Estatística</p><p>SUMÁRIO</p><p>UNIDADE TEMÁTICA 1 – INTRODUÇÃO À ESTATÍSTICA: conceitos e planejamentos</p><p>intrínsecos à Coleta de Dados.............................................................................. 5</p><p>1.1 Etimologia da palavra Estatística............................................................. 5</p><p>1.2 Conceitos fundamentais da Estatística.................................................... 5</p><p>1.3 Definição de Estatística............................................................................. 6</p><p>1.4 Divisão da Estatística................................................................................. 7</p><p>1.5 Fase do método estatístico....................................................................... 7</p><p>Resumo....................................................................................................... 10</p><p>Referências................................................................................................. 11</p><p>UNIDADE 2 – CONCEITOS E MÉTODOS APLICADOS À ESTATÍSTICA</p><p>DESCRITIVA......................................................................................................... 12</p><p>2.1 População ou Universo............................................................................. 12</p><p>2.2 Amostra....................................................................................................... 13</p><p>2.3 Variável e atributo....................................................................................... 14</p><p>2.4 Escala.......................................................................................................... 16</p><p>2.5 Dados........................................................................................................... 17</p><p>2.6 Planejamento para coleta de dados......................................................... 18</p><p>2.7 A coleta de dados....................................................................................... 20</p><p>2.8 Crítica dos Dados....................................................................................... 21</p><p>2.9 Apuração dos Dados.................................................................................. 21</p><p>2.10 Exposição ou Apresentação dos Dados.................................................. 21</p><p>2.11 Análise dos resultados.............................................................................. 21</p><p>2.12 Série Estatística.......................................................................................... 22</p><p>2.13 Apresentação dos Dados.......................................................................... 23</p><p>2.14 Tabelas de Frequências para Variáveis Qualitativas e Quantitativas.... 25</p><p>2.15 Construção de uma distribuição de frequência...................................... 31</p><p>2.16 Representações gráficas para diferentes tipos de variáveis................. 39</p><p>2.17 Organizar e analisar os Dados com a utilização do Programa Excel.... 43</p><p>Resumo....................................................................................................... 50</p><p>Referências................................................................................................. 51</p><p>UNIDADE 3 - CARACTERIZAÇÃO DOS DADOS ESTATÍSTICOS..................... 52</p><p>3.1 Medidas-Resumo........................................................................................ 52</p><p>3.2 Médias de localização ou tendência central............................................ 52</p><p>3.3 Medidas de posição................................................................................... 59</p><p>3.4 Medidas de Dispersão............................................................................... 61</p><p>Resumo....................................................................................................... 67</p><p>Referências................................................................................................. 68</p><p>4Estatística</p><p>APRESENTAÇÃO</p><p>Prezado (a) estudante,</p><p>A Estatística é uma ciência aplicada a numerosas áreas do conhecimento,</p><p>e que se utiliza de modelos Matemáticos para versar sobre a coleta,</p><p>tabulação, análise e interpretação dos Dados coletados. São múltiplas</p><p>as razões pelas quais o indivíduo deve se empenhar para desenvolver</p><p>esta habilidade, principalmente quando há o interesse em aprofundar este</p><p>conhecimento para não somente desenvolver investigações, mas também para</p><p>compreender a divulgação dos resultados das pesquisas acadêmicas, científicas,</p><p>políticas, sociais e econômicas.</p><p>Entender os conceitos da Estatística e da Probabilidade promove ao</p><p>indivíduo maior capacidade de discernimento e proporciona a capacidade de</p><p>exercer a sua cidadania de maneira mais plena e consciente.</p><p>O objetivo deste e-Book é contemplar o/a estudante com um conteúdo</p><p>compilado de fácil assimilação, que agregado às aulas expositivas, e ao seu</p><p>empenho particular, possa trazer luz à compreensão da estatística, e desmistificar</p><p>o juízo de que se trata de uma disciplina com um alto grau de complexidade, e</p><p>trazer luz à sua importância, e à sua aplicação produtiva no quotidiano profissional,</p><p>acadêmico e social.</p><p>Desejo a todos (as) muito sucesso nesta trajetória.</p><p>Professora Fernanda Silva Brandão</p><p>5Estatística</p><p>Compreender o conceito de estatística;</p><p>Desenvolver habilidades para planejar uma investigação;</p><p>Definir os objetivos investigativos;</p><p>Descrever os resultados da investigação de forma clara, objetiva e precisa.</p><p>INTRODUÇÃO À ESTATÍSTICA: conceitos e</p><p>planejamentos intrínsecos à coleta de dados</p><p>Objetivos:</p><p>UNIDADE</p><p>1</p><p>1.1 Etimologia da palavra Estatística</p><p>E timologicamente, o termo “estatística” surge da expressão em latim statisticum</p><p>collegium, conferência sobre os assuntos que dizem respeito ao Estado,</p><p>de onde surgiu a palavra italiana statista, que significa “homem de estado”,</p><p>“estadista” ou “político”. E também da locução alemã Statistik, qualificando a análise</p><p>de dados relativos aos assuntos de Estado. A palavra foi proposta pela primeira vez</p><p>no século XVII, em latim, pelo acadêmico húngaro Martin Schmeitzel (1679-1747)</p><p>da universidade alemã Friedrich Schiller situada na cidade de Jena, na Turíngia, e</p><p>seu aluno Gottfried Achenwall (1719-1772) professor da Universidade de Göttingen,</p><p>situada na cidade alemã de Gotinga, que nomeou de “estatística” seu ramo de</p><p>ensino. Além disso, incentivou, no meio acadêmico, o uso da estatística descritiva</p><p>em outras áreas do conhecimento e a importância dela na administração pública.</p><p>1.2 Conceitos fundamentais da Estatística</p><p>O ser humano tem a necessidade de fazer contagens</p><p>A. Estatística Básica. 8.ed. São</p><p>Paulo: Saraiva, 2013. 484 p.</p><p>CRESWELL, John W. CLARK, Vicki L. Plano. Pesquisa de métodos mistos.</p><p>2.ed. Porto Alegre: Penso, 2013. 288p.</p><p>CUNHA, Gilda; MARTINS, M.ª do Rosário; SOUSA, Ricardo; OLIVEIRA, Felipa</p><p>Ferraz de. Estatística aplicada às ciências sociais. Lisboa: Lidel, 2007. 179p.</p><p>MELLO, Francisco Mercês de. Dicionário de estatística. 1.ed. Lisboa: Sílabo,</p><p>2014. 311 p.</p><p>HILL, Manuela Magalhães; HILL, Andrew. Investigação por questionário. 2.ed.</p><p>rev., e corr. Lisboa: Silabo, 2012. 377 p.</p><p>REIS, Elizabeth; MELO, Paulo; ANDRADE, Rosa; CALAPEZ, Teresa.</p><p>Estatística aplicada. 4.ed. rev. Lisboa: Sílabo, 2008. 322 p.2v.</p><p>REIS, Elizabeth; MELO, Paulo; ANDRADE, Rosa; CALAPEZ, Teresa.</p><p>Exercícios: Estatística aplicada. 1.ed. Lisboa: Sílabo, 2008. 275 p.2v.</p><p>VIEIRA, Sonia. Estatística básica. 1.ed. São Paulo: Cengage Learning, 2015.</p><p>176 p.</p><p>52Estatística</p><p>Identificar as diversas medidas de posição;</p><p>Calcular a média, mediana e moda para uma amostra;</p><p>Distinguir as diversas medidas de dispersão;</p><p>Calcular a variância, o desvio-padrão e coeficiente de variação para uma</p><p>amostra.</p><p>CARACTERIZAÇÃO DOS DADOS</p><p>ESTATÍSTICOS</p><p>Objetivos:</p><p>UNIDADE</p><p>3</p><p>Esta Unidade aborda as medidas descritivas que permitem caracterizar</p><p>conjuntos de dados.</p><p>3.1 Medidas-Resumo</p><p>O resumo de dados por meio de tabelas de frequências oferece muito</p><p>mais informações sobre o comportamento de uma variável do que a</p><p>própria tabela original de dados. Entretanto, muitas vezes importa</p><p>resumir ainda mais estes dados, apresentando um ou alguns valores que sejam</p><p>representativos da série toda.</p><p>3.2 Medidas de localização ou tendência central</p><p>Apresentam-se algumas das mais utilizadas medidas de localização</p><p>referindo à forma de cálculo e seu significado no contexto do conjunto de dados:</p><p>média, mediana ou moda.</p><p>53Estatística</p><p>3.2.1 Média Aritmética</p><p>A medida de tendência central mais utilizada e de mais fácil interpretação</p><p>é a média aritmética simples, que é o ponto de equilíbrio das observações e, por</p><p>conseguinte, a localização central mais precisa.</p><p>Portanto, considera-se uma amostra constituída pelos valores {x</p><p>1</p><p>, x</p><p>2</p><p>, …,</p><p>xn}. A média aritmética, x, é a soma de todos os valores observados da</p><p>variável x dividida pelo número de observação.</p><p>	Média aritmética simples</p><p>Para formalizar os conceitos introduzidos acima. Se x1, x2, …, xn são</p><p>os n valores (distintos ou não) da variável X, a média aritmética, ou simplesmente</p><p>média, de X pode ser escrita:</p><p>51</p><p>Portanto, considera-se uma amostra constituída pelos valores {x1, x2, …, xn}. A</p><p>média aritmética, 𝒳𝒳, é a soma de todos os valores observados da variável x</p><p>dividida pelo número de observação.</p><p> Média aritmética simples</p><p>Para formalizar os conceitos introduzidos acima. Se x1, x2, …, xn são os n</p><p>valores (distintos ou não) da variável X, a média aritmética, ou simplesmente</p><p>média, de X pode ser escrita:</p><p>onde:</p><p>xi – Valores observados;</p><p>n – Dimensão da amostra.</p><p>No cálculo da média aritmética (simples) todas as observações têm igual peso.</p><p>No entanto, caso existam observações repetidas, pode-se atribuir a cada</p><p>observação um peso correspondente à frequência absoluta ou frequência</p><p>relativa da referida observação. Neste caso a média é usualmente designada</p><p>por média aritmética ponderada e o seu cálculo far-se-á através das</p><p>expressões que a seguir se apresentam.</p><p> Média aritmética ponderada</p><p>𝒳𝒳 = ∑ 𝑛𝑛𝑛𝑛𝑛𝑛𝑛𝑛𝑘𝑘</p><p>𝑖𝑖=1</p><p>𝓃𝓃 ou 𝒳𝒳 = ∑ 𝑥𝑥𝑥𝑥𝑥𝑥𝑥𝑥𝑘𝑘</p><p>𝑛𝑛=1</p><p>Onde:</p><p>𝑥𝑥𝑥𝑥 = 𝑛𝑛𝑛𝑛</p><p>𝑛𝑛 - Frequência relativa;</p><p>n - Dimensão da amostra;</p><p>ni - Frequência absoluta;</p><p>k – Número de observações distintas na amostra.</p><p> Média Aritmética de dados classificados</p><p>Quando os dados estão agrupados em classes pressupõe-se que todas as</p><p>observações dentro de cada classe se distribuem uniformemente na mesma e,</p><p>por conseguinte, admite-se que todas as observações de determinada classe</p><p>coincidem com o seu ponto médio ci. Nesta situação a média é determinada a</p><p>partir da seguinte expressão:</p><p>𝒳𝒳 = ∑ 𝑐𝑐𝑛𝑛 𝑛𝑛𝑛𝑛𝑛𝑛</p><p>𝑖𝑖=1</p><p>𝑛𝑛 = ∑ 𝑐𝑐𝑥𝑥𝑥𝑥𝑥𝑥𝑘𝑘</p><p>𝑛𝑛=1</p><p>𝒳𝒳 = 𝒳𝒳𝑛𝑛+⋯+ 𝒳𝒳𝑛𝑛 𝓃𝓃 = ∑ 𝑛𝑛𝑛𝑛𝑛𝑛</p><p>𝑖𝑖=1</p><p>𝑛𝑛 = 1</p><p>𝑛𝑛 ∑ 𝑥𝑥𝑥𝑥𝑛𝑛</p><p>𝑛𝑛=1</p><p>onde:</p><p>xi – Valores observados;</p><p>n – Dimensão da amostra.</p><p>No cálculo da média aritmética (simples) todas as observações têm igual</p><p>peso. No entanto, caso existam observações repetidas, pode-se atribuir a cada</p><p>observação um peso correspondente à frequência absoluta ou frequência relativa</p><p>da referida observação. Neste caso, a média é usualmente designada por média</p><p>aritmética ponderada e o seu cálculo far-se-á através das expressões que a</p><p>seguir se apresentam.</p><p>	Média aritmética ponderada</p><p>51</p><p>Portanto, considera-se uma amostra constituída pelos valores {x1, x2, …, xn}. A</p><p>média aritmética, 𝒳𝒳, é a soma de todos os valores observados da variável x</p><p>dividida pelo número de observação.</p><p> Média aritmética simples</p><p>Para formalizar os conceitos introduzidos acima. Se x1, x2, …, xn são os n</p><p>valores (distintos ou não) da variável X, a média aritmética, ou simplesmente</p><p>média, de X pode ser escrita:</p><p>onde:</p><p>xi – Valores observados;</p><p>n – Dimensão da amostra.</p><p>No cálculo da média aritmética (simples) todas as observações têm igual peso.</p><p>No entanto, caso existam observações repetidas, pode-se atribuir a cada</p><p>observação um peso correspondente à frequência absoluta ou frequência</p><p>relativa da referida observação. Neste caso a média é usualmente designada</p><p>por média aritmética ponderada e o seu cálculo far-se-á através das</p><p>expressões que a seguir se apresentam.</p><p> Média aritmética ponderada</p><p>𝒳𝒳 = ∑ 𝑛𝑛𝑛𝑛𝑛𝑛𝑛𝑛𝑘𝑘</p><p>𝑖𝑖=1</p><p>𝓃𝓃 ou 𝒳𝒳 = ∑ 𝑥𝑥𝑥𝑥𝑥𝑥𝑥𝑥𝑘𝑘</p><p>𝑛𝑛=1</p><p>Onde:</p><p>𝑥𝑥𝑥𝑥 = 𝑛𝑛𝑛𝑛</p><p>𝑛𝑛 - Frequência relativa;</p><p>n - Dimensão da amostra;</p><p>ni - Frequência absoluta;</p><p>k – Número de observações distintas na amostra.</p><p> Média Aritmética de dados classificados</p><p>Quando os dados estão agrupados em classes pressupõe-se que todas as</p><p>observações dentro de cada classe se distribuem uniformemente na mesma e,</p><p>por conseguinte, admite-se que todas as observações de determinada classe</p><p>coincidem com o seu ponto médio ci. Nesta situação a média é determinada a</p><p>partir da seguinte expressão:</p><p>𝒳𝒳 = ∑ 𝑐𝑐𝑛𝑛 𝑛𝑛𝑛𝑛𝑛𝑛</p><p>𝑖𝑖=1</p><p>𝑛𝑛 = ∑ 𝑐𝑐𝑥𝑥𝑥𝑥𝑥𝑥𝑘𝑘</p><p>𝑛𝑛=1</p><p>𝒳𝒳 = 𝒳𝒳𝑛𝑛+⋯+ 𝒳𝒳𝑛𝑛 𝓃𝓃 = ∑ 𝑛𝑛𝑛𝑛𝑛𝑛</p><p>𝑖𝑖=1</p><p>𝑛𝑛 = 1</p><p>𝑛𝑛 ∑ 𝑥𝑥𝑥𝑥𝑛𝑛</p><p>𝑛𝑛=1</p><p>Onde:</p><p>51</p><p>Portanto, considera-se uma amostra constituída pelos valores {x1, x2, …, xn}. A</p><p>média aritmética, 𝒳𝒳, é a soma de todos os valores observados da variável x</p><p>dividida pelo número de observação.</p><p> Média aritmética simples</p><p>Para formalizar os conceitos introduzidos acima. Se x1, x2, …, xn são os n</p><p>valores (distintos ou não) da variável X, a média aritmética, ou simplesmente</p><p>média, de X pode ser escrita:</p><p>onde:</p><p>xi – Valores observados;</p><p>n – Dimensão da amostra.</p><p>No cálculo da média aritmética (simples) todas as observações têm igual peso.</p><p>No entanto, caso existam observações repetidas, pode-se atribuir a cada</p><p>observação um peso correspondente à frequência absoluta ou frequência</p><p>relativa da referida observação. Neste caso a média é usualmente designada</p><p>por média aritmética ponderada e o seu cálculo far-se-á através das</p><p>expressões que a seguir se apresentam.</p><p> Média aritmética ponderada</p><p>𝒳𝒳 = ∑ 𝑛𝑛𝑛𝑛𝑛𝑛𝑛𝑛𝑘𝑘</p><p>𝑖𝑖=1</p><p>𝓃𝓃 ou 𝒳𝒳 = ∑ 𝑥𝑥𝑥𝑥𝑥𝑥𝑥𝑥𝑘𝑘</p><p>𝑛𝑛=1</p><p>Onde:</p><p>𝑥𝑥𝑥𝑥 = 𝑛𝑛𝑛𝑛</p><p>𝑛𝑛 - Frequência relativa;</p><p>n - Dimensão da amostra;</p><p>ni - Frequência absoluta;</p><p>k – Número de observações distintas na amostra.</p><p> Média Aritmética de dados classificados</p><p>Quando os dados estão agrupados em classes pressupõe-se que todas as</p><p>observações dentro de cada classe se distribuem uniformemente na mesma e,</p><p>por conseguinte, admite-se que todas as observações de determinada classe</p><p>coincidem com o seu ponto médio ci. Nesta</p><p>situação a média é determinada a</p><p>partir da seguinte expressão:</p><p>𝒳𝒳 = ∑ 𝑐𝑐𝑛𝑛 𝑛𝑛𝑛𝑛𝑛𝑛</p><p>𝑖𝑖=1</p><p>𝑛𝑛 = ∑ 𝑐𝑐𝑥𝑥𝑥𝑥𝑥𝑥𝑘𝑘</p><p>𝑛𝑛=1</p><p>𝒳𝒳 = 𝒳𝒳𝑛𝑛+⋯+ 𝒳𝒳𝑛𝑛 𝓃𝓃 = ∑ 𝑛𝑛𝑛𝑛𝑛𝑛</p><p>𝑖𝑖=1</p><p>𝑛𝑛 = 1</p><p>𝑛𝑛 ∑ 𝑥𝑥𝑥𝑥𝑛𝑛</p><p>𝑛𝑛=1</p><p>Frequência relativa;</p><p>n - Dimensão da amostra; ni - Frequência absoluta;</p><p>k – Número de observações distintas na amostra.</p><p>54Estatística</p><p>	Média Aritmética de dados classificados</p><p>Quando os dados estão agrupados em classes pressupõe-se que todas</p><p>as observações dentro de cada classe se distribuem uniformemente na mesma</p><p>e, por conseguinte, admite-se que todas as observações de determinada classe</p><p>coincidem com o seu ponto médio ci. Nesta situação, a média é determinada a</p><p>partir da seguinte expressão:</p><p>51</p><p>Portanto, considera-se uma amostra constituída pelos valores {x1, x2, …, xn}. A</p><p>média aritmética, 𝒳𝒳, é a soma de todos os valores observados da variável x</p><p>dividida pelo número de observação.</p><p> Média aritmética simples</p><p>Para formalizar os conceitos introduzidos acima. Se x1, x2, …, xn são os n</p><p>valores (distintos ou não) da variável X, a média aritmética, ou simplesmente</p><p>média, de X pode ser escrita:</p><p>onde:</p><p>xi – Valores observados;</p><p>n – Dimensão da amostra.</p><p>No cálculo da média aritmética (simples) todas as observações têm igual peso.</p><p>No entanto, caso existam observações repetidas, pode-se atribuir a cada</p><p>observação um peso correspondente à frequência absoluta ou frequência</p><p>relativa da referida observação. Neste caso a média é usualmente designada</p><p>por média aritmética ponderada e o seu cálculo far-se-á através das</p><p>expressões que a seguir se apresentam.</p><p> Média aritmética ponderada</p><p>𝒳𝒳 = ∑ 𝑛𝑛𝑛𝑛𝑛𝑛𝑛𝑛𝑘𝑘</p><p>𝑖𝑖=1</p><p>𝓃𝓃 ou 𝒳𝒳 = ∑ 𝑥𝑥𝑥𝑥𝑥𝑥𝑥𝑥𝑘𝑘</p><p>𝑛𝑛=1</p><p>Onde:</p><p>𝑥𝑥𝑥𝑥 = 𝑛𝑛𝑛𝑛</p><p>𝑛𝑛 - Frequência relativa;</p><p>n - Dimensão da amostra;</p><p>ni - Frequência absoluta;</p><p>k – Número de observações distintas na amostra.</p><p> Média Aritmética de dados classificados</p><p>Quando os dados estão agrupados em classes pressupõe-se que todas as</p><p>observações dentro de cada classe se distribuem uniformemente na mesma e,</p><p>por conseguinte, admite-se que todas as observações de determinada classe</p><p>coincidem com o seu ponto médio ci. Nesta situação a média é determinada a</p><p>partir da seguinte expressão:</p><p>𝒳𝒳 = ∑ 𝑐𝑐𝑛𝑛 𝑛𝑛𝑛𝑛𝑛𝑛</p><p>𝑖𝑖=1</p><p>𝑛𝑛 = ∑ 𝑐𝑐𝑥𝑥𝑥𝑥𝑥𝑥𝑘𝑘</p><p>𝑛𝑛=1</p><p>𝒳𝒳 = 𝒳𝒳𝑛𝑛+⋯+ 𝒳𝒳𝑛𝑛 𝓃𝓃 = ∑ 𝑛𝑛𝑛𝑛𝑛𝑛</p><p>𝑖𝑖=1</p><p>𝑛𝑛 = 1</p><p>𝑛𝑛 ∑ 𝑥𝑥𝑥𝑥𝑛𝑛</p><p>𝑛𝑛=1</p><p>Onde:</p><p>K – Número de classes;</p><p>ci – Ponto médio ou valor central da classe.</p><p>A expressão para o cálculo da média para dados classificados é idêntica</p><p>à expressão da média ponderada com a substituição de xi por ci.</p><p>Nesta situação se obtém um valor um valor aproximado da verdadeira</p><p>média, uma vez que se substituiu as observações de cada classe pelo seu</p><p>ponto médio ou valor central.</p><p>Exemplo 3.1: Registrou-se o tempo de duração, em meses e dias, de 5</p><p>amostras de lotes de lâmpadas fabricadas pela Indústria LUX Ltda., obtendo-se</p><p>os seguintes resultados: 8,5; 9,2; 7,3; 6,8; 10,1</p><p>a) Pretende-se identificar e classificar a variável em estudo.</p><p>Resposta: A variável estatística é o tempo de sobrevivência (em me-</p><p>ses) de 5 amostras de lotes de lâmpadas. A variável é quantitativa,</p><p>contínua e está medida numa escala de razão.</p><p>b) Determine o valor da média aritmética.</p><p>Resposta: O tempo médio de duração é dado por:</p><p>52</p><p>Onde:</p><p>K – Número de classes;</p><p>ci – Ponto médio ou valor central da classe.</p><p>A expressão para o cálculo da média para dados classificados é</p><p>idêntica à expressão da média ponderada com a substituição de xi por ci.</p><p>Nesta situação se obtém um valor um valor aproximado da verdadeira média,</p><p>uma vez que se substituiu as observações de cada classe pelo seu ponto</p><p>médio ou valor central.</p><p>Exemplo 3.1: Registrou-se o tempo de duração, em meses e dias, de 5</p><p>amostras de lotes de lâmpadas fabricadas pela Indústria LUX Ltda., obtendo-se</p><p>os seguintes resultados: 8,5; 9,2; 7,3; 6,8; 10,1</p><p>a) Pretende-se identificar e classificar a variável em estudo.</p><p>Resposta: A variável estatística é o tempo de sobrevivência (em meses) de 5</p><p>amostras de lotes de lâmpadas. A variável é quantitativa, contínua e está</p><p>medida numa escala de razão.</p><p>b) Determine o valor da média aritmética.</p><p>Resposta: O tempo médio de duração é dado por:</p><p>𝒳𝒳 = 𝒳𝒳𝑖𝑖+⋯+ 𝒳𝒳𝑛𝑛 𝓃𝓃 = 8,5+9,2+7,3+6,8+10,1</p><p>5 = 8,38</p><p>Portanto, em média as lâmpadas têm uma durabilidade de 8,38</p><p>Considerando-se um exemplo onde os dados estão agrupados em classes:</p><p>Exemplo 3.2: Considerando os seguintes dados relativos à variação dos</p><p>valores de aceleração em uma competição automobilística, numa amostra de</p><p>112 carros. Pretende-se que seja identificada e classificada a variável</p><p>estatística e que seja determinado o valor da média aritmética.</p><p>Portanto, em média as lâmpadas têm uma durabilidade de 8,38</p><p>Considerando-se um exemplo onde os dados estão agrupados em classes:</p><p>55Estatística</p><p>Exemplo 3.2: Considerando os seguintes dados relativos à variação dos</p><p>valores de aceleração em uma competição automobilística, numa amostra</p><p>de 112 carros. Pretende-se que seja identificada e classificada a variável</p><p>estatística e que seja determinado o valor da média aritmética.</p><p>Tabela 9 – Distribuição de frequência da variável variação de velocidade</p><p>Variação dos valores de</p><p>aceleração</p><p>Nº de carros</p><p>𝒏𝒊</p><p>Centro de classes</p><p>𝒄𝒊</p><p>[-0,4;</p><p>-0,21[ 2 -0,3</p><p>[-0,2; 0,0[ 8 -0,1</p><p>[0,0; 0,2[ 25 0,1</p><p>[0,2; 0,4[ 28 0,3</p><p>[0,4; 0,6[ 30 0,5</p><p>[0,6; 0,8[ 16 0,7</p><p>[0,8; 1,0] 3 0,9</p><p>Fonte: Elaborada pela autora (2021).</p><p>a) Pretende-se identificar e classificar a variável em estudo.</p><p>Resposta: A variável estatística é a variação dos valores de</p><p>aceleração em uma competição automobilística. A variável é</p><p>quantitativa, contínua, medida numa escala de razão.</p><p>b) Determine o valor da média.</p><p>Resposta: O cálculo da média faz-se substituindo os valores das</p><p>variáveis pelos pontos médios de cada classe, e é dado por:</p><p>53</p><p>Tabela 9 – Distribuição de frequência da variável variação de velocidade</p><p>Variação dos valores de</p><p>aceleração</p><p>Nº de carros</p><p>𝒏𝒏𝒊𝒊</p><p>Centro de classes</p><p>𝒄𝒄𝒊𝒊</p><p>[-0,4; -0,21[ 2 -0,3</p><p>[-0,2; 0,0[ 8 -0,1</p><p>[0,0; 0,2[ 25 0,1</p><p>[0,2; 0,4[ 28 0,3</p><p>[0,4; 0,6[ 30 0,5</p><p>[0,6; 0,8[ 16 0,7</p><p>[0,8; 1,0] 3 0,9</p><p>Fonte: Elaborada pela autora (2021).</p><p>a) Pretende-se identificar e classificar a variável em estudo.</p><p>Resposta: A variável estatística é a variação dos valores de aceleração em</p><p>uma competição automobilística. A variável é quantitativa, contínua, medida</p><p>numa escala de razão.</p><p>b) Determine o valor da média.</p><p>Resposta: O cálculo da média faz-se substituindo os valores das variáveis</p><p>pelos pontos médios de cada classe, e é dado por:</p><p>𝒳𝒳 = ∑ 𝑐𝑐𝑐𝑐 𝑛𝑛𝑐𝑐𝑛𝑛</p><p>𝑖𝑖=1</p><p>𝑛𝑛 = ∑ 𝑐𝑐𝑐𝑐𝑐𝑐𝑐𝑐𝑘𝑘</p><p>𝑐𝑐=1</p><p>𝒳𝒳 = (−0,3x2)+(−1x8)+(0,1x25)+(0,3x28)+(0,5x30)+(0,7x16)+(0,9x3)</p><p>112 = 0,34</p><p>Com base no resultado, pode-se afirmar que, em média a aceleração varia em</p><p>0,34 unidades aleatórias.</p><p>Propriedades da Média Aritmética:</p><p>a) A soma dos desvios dos valores observados em relação à média é nula;</p><p>b) Ao se adicionar uma constante não nula a todas as observações, a</p><p>média vem adicionada da mesma constante;</p><p>c) Ao se multiplicar todas as observações por uma constante não nula, a</p><p>média vem multiplicada por essa constante.</p><p>d) A soma dos quadrados dos desvios das observações relativamente a</p><p>uma constante 𝑐𝑐 é mínima quando 𝑐𝑐 = �̅�𝒳.</p><p>Com base no resultado, pode-se afirmar que, em média a aceleração</p><p>varia em 0,34 unidades aleatórias.</p><p>56Estatística</p><p>Propriedades da Média Aritmética:</p><p>a) A soma dos desvios dos valores observados em relação à média é</p><p>nula;</p><p>b) Ao se adicionar uma constante não nula a todas as observações,</p><p>a média vem adicionada da mesma constante;</p><p>c) Ao se multiplicar todas as observações por uma constante não nula,</p><p>a média vem multiplicada por essa constante;</p><p>d) A soma dos quadrados</p><p>dos desvios das observações relativamente</p><p>a uma constante c é mínima quando c = x.</p><p>e) Supondo que se dispõe de uma amostra de n observações que se</p><p>encontram divididas em k grupos ou subamostras. Nestas circunstâncias a média</p><p>global das observações é a média global das observações é a média ponderada</p><p>das médias dos grupos, ou seja:</p><p>54</p><p>e) Supondo que se dispõe de uma amostra de 𝑛𝑛 observações que se</p><p>encontram divididas em 𝑘𝑘 grupos ou subamostras. Nestas circunstâncias</p><p>a média global das observações é a média global das observações é a</p><p>média ponderada das médias dos grupos, ou seja:</p><p>𝒳𝒳 = 𝑛𝑛1𝒳𝒳+𝑛𝑛2𝒳𝒳+⋯+𝑛𝑛𝑛𝑛𝒳𝒳</p><p>𝑛𝑛1+𝑛𝑛2+⋯+𝑛𝑛𝑛𝑛 = 1</p><p>𝑛𝑛 ∑ 𝑛𝑛𝑛𝑛𝒳𝒳𝒳𝒳̅̅̅̅𝑛𝑛</p><p>𝑖𝑖=1</p><p>Onde: 𝒳𝒳 e 𝑛𝑛𝑛𝑛 representam respectivamente a média e a dimensão do 𝑛𝑛-esimo</p><p>grupo, e 𝑛𝑛 = ∑ 𝑛𝑛𝑛𝑛𝑛𝑛</p><p>𝑖𝑖=1</p><p>3.2.2 Moda</p><p>A moda é outra medida de localização ou tendência central que</p><p>corresponde ao valor de frequência máxima do conjunto de valores</p><p>observados, ou seja, é o valor que ocorreu um maior número de vezes. Nem</p><p>todo conjunto de dados possui um valor modal, e também quando possui, este</p><p>valor pode não der único.</p><p>Exemplo 3.3. Considera-se a variável Y o número de filhos de cada</p><p>empregado na Companhia Lux Ltda, por departameto., resumida na Tabela 10.</p><p>Tabela 10 - Número de filhos de cada empregado por departamento na</p><p>Companhia Fiax Ltda</p><p>Departamento Departamento</p><p>de Pessoal</p><p>Departamento</p><p>Jurídico</p><p>Departamento</p><p>Financeiro</p><p>Departamento</p><p>Manutenção</p><p>Departamento</p><p>Informática</p><p>Nº de filhos 1 2 3 4 5</p><p>Frequência 2 3 2 1 1</p><p>Fonte: Elaborada pela Autora (2021).</p><p>Variáveis ordenadas 1 1 2 2 2 3 3 4 5</p><p> O valor da moda corresponde ao valor da variável que se repete mais</p><p>vezes na amostra, neste caso a moda é correspondente à realização</p><p>com maior frequência. Neste caso o valor que mais se repete é o 2,</p><p>portanto é o valor modal, significa que no departamento Jurídico, 3</p><p>funcionários têm 2 filhos.</p><p> Em alguns casos, pode haver mais de uma moda, ou seja, a distribuição</p><p>dos valores pode ser bimodal, quando existe duas modas, trimodal,</p><p>Onde:</p><p>54</p><p>e) Supondo que se dispõe de uma amostra de 𝑛𝑛 observações que se</p><p>encontram divididas em 𝑘𝑘 grupos ou subamostras. Nestas circunstâncias</p><p>a média global das observações é a média global das observações é a</p><p>média ponderada das médias dos grupos, ou seja:</p><p>𝒳𝒳 = 𝑛𝑛1𝒳𝒳+𝑛𝑛2𝒳𝒳+⋯+𝑛𝑛𝑛𝑛𝒳𝒳</p><p>𝑛𝑛1+𝑛𝑛2+⋯+𝑛𝑛𝑛𝑛 = 1</p><p>𝑛𝑛 ∑ 𝑛𝑛𝑛𝑛𝒳𝒳𝒳𝒳̅̅̅̅𝑛𝑛</p><p>𝑖𝑖=1</p><p>Onde: 𝒳𝒳 e 𝑛𝑛𝑛𝑛 representam respectivamente a média e a dimensão do 𝑛𝑛-esimo</p><p>grupo, e 𝑛𝑛 = ∑ 𝑛𝑛𝑛𝑛𝑛𝑛</p><p>𝑖𝑖=1</p><p>3.2.2 Moda</p><p>A moda é outra medida de localização ou tendência central que</p><p>corresponde ao valor de frequência máxima do conjunto de valores</p><p>observados, ou seja, é o valor que ocorreu um maior número de vezes. Nem</p><p>todo conjunto de dados possui um valor modal, e também quando possui, este</p><p>valor pode não der único.</p><p>Exemplo 3.3. Considera-se a variável Y o número de filhos de cada</p><p>empregado na Companhia Lux Ltda, por departameto., resumida na Tabela 10.</p><p>Tabela 10 - Número de filhos de cada empregado por departamento na</p><p>Companhia Fiax Ltda</p><p>Departamento Departamento</p><p>de Pessoal</p><p>Departamento</p><p>Jurídico</p><p>Departamento</p><p>Financeiro</p><p>Departamento</p><p>Manutenção</p><p>Departamento</p><p>Informática</p><p>Nº de filhos 1 2 3 4 5</p><p>Frequência 2 3 2 1 1</p><p>Fonte: Elaborada pela Autora (2021).</p><p>Variáveis ordenadas 1 1 2 2 2 3 3 4 5</p><p> O valor da moda corresponde ao valor da variável que se repete mais</p><p>vezes na amostra, neste caso a moda é correspondente à realização</p><p>com maior frequência. Neste caso o valor que mais se repete é o 2,</p><p>portanto é o valor modal, significa que no departamento Jurídico, 3</p><p>funcionários têm 2 filhos.</p><p> Em alguns casos, pode haver mais de uma moda, ou seja, a distribuição</p><p>dos valores pode ser bimodal, quando existe duas modas, trimodal,</p><p>e ni representam respectivamente a média e a dimensão do</p><p>i-esimo grupo, e</p><p>54</p><p>e) Supondo que se dispõe de uma amostra de 𝑛𝑛 observações que se</p><p>encontram divididas em 𝑘𝑘 grupos ou subamostras. Nestas circunstâncias</p><p>a média global das observações é a média global das observações é a</p><p>média ponderada das médias dos grupos, ou seja:</p><p>𝒳𝒳 = 𝑛𝑛1𝒳𝒳+𝑛𝑛2𝒳𝒳+⋯+𝑛𝑛𝑛𝑛𝒳𝒳</p><p>𝑛𝑛1+𝑛𝑛2+⋯+𝑛𝑛𝑛𝑛 = 1</p><p>𝑛𝑛 ∑ 𝑛𝑛𝑛𝑛𝒳𝒳𝒳𝒳̅̅̅̅𝑛𝑛</p><p>𝑖𝑖=1</p><p>Onde: 𝒳𝒳 e 𝑛𝑛𝑛𝑛 representam respectivamente a média e a dimensão do 𝑛𝑛-esimo</p><p>grupo, e 𝑛𝑛 = ∑ 𝑛𝑛𝑛𝑛𝑛𝑛</p><p>𝑖𝑖=1</p><p>3.2.2 Moda</p><p>A moda é outra medida de localização ou tendência central que</p><p>corresponde ao valor de frequência máxima do conjunto de valores</p><p>observados, ou seja, é o valor que ocorreu um maior número de vezes. Nem</p><p>todo conjunto de dados possui um valor modal, e também quando possui, este</p><p>valor pode não der único.</p><p>Exemplo 3.3. Considera-se a variável Y o número de filhos de cada</p><p>empregado na Companhia Lux Ltda, por departameto., resumida na Tabela 10.</p><p>Tabela 10 - Número de filhos de cada empregado por departamento na</p><p>Companhia Fiax Ltda</p><p>Departamento Departamento</p><p>de Pessoal</p><p>Departamento</p><p>Jurídico</p><p>Departamento</p><p>Financeiro</p><p>Departamento</p><p>Manutenção</p><p>Departamento</p><p>Informática</p><p>Nº de filhos 1 2 3 4 5</p><p>Frequência 2 3 2 1 1</p><p>Fonte: Elaborada pela Autora (2021).</p><p>Variáveis ordenadas 1 1 2 2 2 3 3 4 5</p><p> O valor da moda corresponde ao valor da variável que se repete mais</p><p>vezes na amostra, neste caso a moda é correspondente à realização</p><p>com maior frequência. Neste caso o valor que mais se repete é o 2,</p><p>portanto é o valor modal, significa que no departamento Jurídico, 3</p><p>funcionários têm 2 filhos.</p><p> Em alguns casos, pode haver mais de uma moda, ou seja, a distribuição</p><p>dos valores pode ser bimodal, quando existe duas modas, trimodal,</p><p>3.2.2 Moda</p><p>A moda é outra medida de localização ou tendência central que</p><p>corresponde ao valor de frequência máxima do conjunto de valores observados,</p><p>ou seja, é o valor que ocorreu um maior número de vezes. Nem todo conjunto</p><p>de dados possui um valor modal, e também quando possui, este valor pode</p><p>não der único.</p><p>Exemplo 3.3. Considera-se a variável Y o número de filhos de cada</p><p>empregado na Companhia Lux Ltda, por departameto., resumida na Tabela 10.</p><p>𝑖=1</p><p>57Estatística</p><p>Tabela 10 - Número de filhos de cada empregado por departamento na</p><p>Companhia Fiax Ltda</p><p>Departamento Departamento de</p><p>Pessoal</p><p>Departamento</p><p>Jurídico</p><p>Departamento</p><p>Financeiro</p><p>Departamento</p><p>Manutenção</p><p>Departamento</p><p>Informática</p><p>Nº de filhos 1 2 3 4 5</p><p>Frequência 2 3 2 1 1</p><p>Fonte: Elaborada pela Autora (2021).</p><p>Variáveis ordenadas 1 1 2 2 2 3 3 4 5</p><p>	 O valor da moda corresponde ao valor da variável que se repete mais</p><p>vezes na amostra, neste caso a moda é correspondente à realização</p><p>com maior frequência. Neste caso o valor que mais se repete é o 2,</p><p>portanto é o valor modal, significa que no departamento Jurídico, 3</p><p>funcionários têm 2 filhos.</p><p>	 Em alguns casos, pode haver mais de uma moda, ou seja, a distribuição</p><p>dos valores pode ser bimodal, quando existe duas modas, trimodal,</p><p>quando existe três modas ou polimodal ou multimodal quando</p><p>existe mais de três modas.</p><p>	 Um conjunto de dados pode não ter moda, portanto ser amodal.</p><p>Exemplo 3.4: Não tem moda o conjunto de dados: 0, 1, 4, 6, 9, 10, 11, 15</p><p>3.2.3 Mediana (</p><p>54</p><p>e) Supondo que se dispõe de uma amostra de 𝑛𝑛 observações que se</p><p>encontram divididas em 𝑘𝑘 grupos ou subamostras. Nestas circunstâncias</p><p>a média global das observações é a média global das observações é a</p><p>média ponderada das médias dos grupos, ou seja:</p><p>𝒳𝒳 = 𝑛𝑛1𝒳𝒳+𝑛𝑛2𝒳𝒳+⋯+𝑛𝑛𝑛𝑛𝒳𝒳</p><p>𝑛𝑛1+𝑛𝑛2+⋯+𝑛𝑛𝑛𝑛 = 1</p><p>𝑛𝑛 ∑ 𝑛𝑛𝑛𝑛𝒳𝒳𝒳𝒳̅̅̅̅𝑛𝑛</p><p>𝑖𝑖=1</p><p>Onde: 𝒳𝒳 e 𝑛𝑛𝑛𝑛 representam respectivamente a média e a dimensão do 𝑛𝑛-esimo</p><p>grupo, e 𝑛𝑛 = ∑ 𝑛𝑛𝑛𝑛𝑛𝑛</p><p>𝑖𝑖=1</p><p>3.2.2 Moda</p><p>A moda é outra medida de localização ou tendência central que</p><p>corresponde ao valor de frequência</p><p>máxima do conjunto de valores</p><p>observados, ou seja, é o valor que ocorreu um maior número de vezes. Nem</p><p>todo conjunto de dados possui um valor modal, e também quando possui, este</p><p>valor pode não der único.</p><p>Exemplo 3.3. Considera-se a variável Y o número de filhos de cada</p><p>empregado na Companhia Lux Ltda, por departameto., resumida na Tabela 10.</p><p>Tabela 10 - Número de filhos de cada empregado por departamento na</p><p>Companhia Fiax Ltda</p><p>Departamento Departamento</p><p>de Pessoal</p><p>Departamento</p><p>Jurídico</p><p>Departamento</p><p>Financeiro</p><p>Departamento</p><p>Manutenção</p><p>Departamento</p><p>Informática</p><p>Nº de filhos 1 2 3 4 5</p><p>Frequência 2 3 2 1 1</p><p>Fonte: Elaborada pela Autora (2021).</p><p>Variáveis ordenadas 1 1 2 2 2 3 3 4 5</p><p> O valor da moda corresponde ao valor da variável que se repete mais</p><p>vezes na amostra, neste caso a moda é correspondente à realização</p><p>com maior frequência. Neste caso o valor que mais se repete é o 2,</p><p>portanto é o valor modal, significa que no departamento Jurídico, 3</p><p>funcionários têm 2 filhos.</p><p> Em alguns casos, pode haver mais de uma moda, ou seja, a distribuição</p><p>dos valores pode ser bimodal, quando existe duas modas, trimodal,</p><p>̃)</p><p>Com os dados ordenados, a mediana é a terceira medida de tendência</p><p>central e pode ser definida como o valor que divide um conjunto de valores</p><p>em dua partes iguais. É o valor da variável que ocupa a posição central na</p><p>sucessão de observações ou na distribuição de frequência. Assim, o número</p><p>de observações, quando que lhes são inferiores deverá ser igual ao número de</p><p>informações que lhes são superiores.</p><p>Semelhante à moda, o processo de cálculo da mediana depende da forma</p><p>como os dados se apresentam, isto é, se os dados estão ou não classificados.</p><p>58Estatística</p><p>	Dados não classificados</p><p>O cálculo da mediana (</p><p>54</p><p>e) Supondo que se dispõe de uma amostra de 𝑛𝑛 observações que se</p><p>encontram divididas em 𝑘𝑘 grupos ou subamostras. Nestas circunstâncias</p><p>a média global das observações é a média global das observações é a</p><p>média ponderada das médias dos grupos, ou seja:</p><p>𝒳𝒳 = 𝑛𝑛1𝒳𝒳+𝑛𝑛2𝒳𝒳+⋯+𝑛𝑛𝑛𝑛𝒳𝒳</p><p>𝑛𝑛1+𝑛𝑛2+⋯+𝑛𝑛𝑛𝑛 = 1</p><p>𝑛𝑛 ∑ 𝑛𝑛𝑛𝑛𝒳𝒳𝒳𝒳̅̅̅̅𝑛𝑛</p><p>𝑖𝑖=1</p><p>Onde: 𝒳𝒳 e 𝑛𝑛𝑛𝑛 representam respectivamente a média e a dimensão do 𝑛𝑛-esimo</p><p>grupo, e 𝑛𝑛 = ∑ 𝑛𝑛𝑛𝑛𝑛𝑛</p><p>𝑖𝑖=1</p><p>3.2.2 Moda</p><p>A moda é outra medida de localização ou tendência central que</p><p>corresponde ao valor de frequência máxima do conjunto de valores</p><p>observados, ou seja, é o valor que ocorreu um maior número de vezes. Nem</p><p>todo conjunto de dados possui um valor modal, e também quando possui, este</p><p>valor pode não der único.</p><p>Exemplo 3.3. Considera-se a variável Y o número de filhos de cada</p><p>empregado na Companhia Lux Ltda, por departameto., resumida na Tabela 10.</p><p>Tabela 10 - Número de filhos de cada empregado por departamento na</p><p>Companhia Fiax Ltda</p><p>Departamento Departamento</p><p>de Pessoal</p><p>Departamento</p><p>Jurídico</p><p>Departamento</p><p>Financeiro</p><p>Departamento</p><p>Manutenção</p><p>Departamento</p><p>Informática</p><p>Nº de filhos 1 2 3 4 5</p><p>Frequência 2 3 2 1 1</p><p>Fonte: Elaborada pela Autora (2021).</p><p>Variáveis ordenadas 1 1 2 2 2 3 3 4 5</p><p> O valor da moda corresponde ao valor da variável que se repete mais</p><p>vezes na amostra, neste caso a moda é correspondente à realização</p><p>com maior frequência. Neste caso o valor que mais se repete é o 2,</p><p>portanto é o valor modal, significa que no departamento Jurídico, 3</p><p>funcionários têm 2 filhos.</p><p> Em alguns casos, pode haver mais de uma moda, ou seja, a distribuição</p><p>dos valores pode ser bimodal, quando existe duas modas, trimodal,</p><p>̃) de um conjunto de informações</p><p>55</p><p>quando existe três modas ou polimodal ou multimodal quando existe</p><p>mais de três modas.</p><p> Um conjunto de dados pode não ter moda, portanto ser amodal.</p><p>Exemplo 3.4: Não tem moda o conjunto de dados: 0, 1, 4, 6, 9, 10, 11, 15</p><p>3.2.3 Mediana (�̃�𝑥)</p><p>Com os dados ordenados, a mediana é a terceira medida de</p><p>tendência central e pode ser definida como o valor que divide um conjunto de</p><p>valores em dua partes iguais. É o valor da variável que ocupa a posição central</p><p>na sucessão de observações ou na distribuição de frequência. Assim o</p><p>número de observações, quando que lhes são inferiores deverá ser igual ao</p><p>número de informações que lhes são superiores.</p><p>Semelhante à moda, o processo de cálculo da mediana depende da</p><p>forma como os dados se apresentam, isto é, se os dados estão ou não</p><p>classificados.</p><p> Dados não classificados</p><p>O cálculo da mediana ( �̃�𝑥 ) de um conjunto de informações (𝑥𝑥1, 𝑥𝑥3, … , 𝑥𝑥𝑛𝑛 )</p><p>requer a ordenação prévia das mesmas. A ordenação é feita colocando os</p><p>valores da amostra por ordem crescente, obtendo-se 𝑥𝑥(1), 𝑥𝑥(2), … , 𝑥𝑥(𝑛𝑛) onde</p><p>se tem 𝑥𝑥(1) ≤ 𝑥𝑥(2) ≤ … ≤ 𝑥𝑥(𝑛𝑛) e 𝑥𝑥1 (𝑖𝑖 = 1, 2, …, n) é denominada</p><p>estatística de ordem 𝑖𝑖 ou 𝑖𝑖-esima estatística de ordem. Como caso particulares</p><p>de estatística de ordem tem o mínimo da amostra ou estatística de ordem 1</p><p>(𝑥𝑥(1)) e o máximo da amostra e estatística de ordem n (𝑥𝑥(𝑛𝑛)). A determinação</p><p>da mediana depende do número de observações da amostra. Se a amostra for</p><p>construída por um número ímpar de observações, a mediana coincide com o</p><p>valor central do conjunto de dados ordenados. Se a amostra for constituída por</p><p>um número ímpar de observações, a mediana é a média dos dois valores</p><p>centrais.</p><p>Pode-se considerar a seguinte definição da mediana.</p><p>requer a ordenação prévia das mesmas. A ordenação é feita colocando os</p><p>valores da amostra por ordem crescente, obtendo-se</p><p>55</p><p>quando existe três modas ou polimodal ou multimodal quando existe</p><p>mais de três modas.</p><p> Um conjunto de dados pode não ter moda, portanto ser amodal.</p><p>Exemplo 3.4: Não tem moda o conjunto de dados: 0, 1, 4, 6, 9, 10, 11, 15</p><p>3.2.3 Mediana (�̃�𝑥)</p><p>Com os dados ordenados, a mediana é a terceira medida de</p><p>tendência central e pode ser definida como o valor que divide um conjunto de</p><p>valores em dua partes iguais. É o valor da variável que ocupa a posição central</p><p>na sucessão de observações ou na distribuição de frequência. Assim o</p><p>número de observações, quando que lhes são inferiores deverá ser igual ao</p><p>número de informações que lhes são superiores.</p><p>Semelhante à moda, o processo de cálculo da mediana depende da</p><p>forma como os dados se apresentam, isto é, se os dados estão ou não</p><p>classificados.</p><p> Dados não classificados</p><p>O cálculo da mediana ( �̃�𝑥 ) de um conjunto de informações (𝑥𝑥1, 𝑥𝑥3, … , 𝑥𝑥𝑛𝑛 )</p><p>requer a ordenação prévia das mesmas. A ordenação é feita colocando os</p><p>valores da amostra por ordem crescente, obtendo-se 𝑥𝑥(1), 𝑥𝑥(2), … , 𝑥𝑥(𝑛𝑛) onde</p><p>se tem 𝑥𝑥(1) ≤ 𝑥𝑥(2) ≤ … ≤ 𝑥𝑥(𝑛𝑛) e 𝑥𝑥1 (𝑖𝑖 = 1, 2, …, n) é denominada</p><p>estatística de ordem 𝑖𝑖 ou 𝑖𝑖-esima estatística de ordem. Como caso particulares</p><p>de estatística de ordem tem o mínimo da amostra ou estatística de ordem 1</p><p>(𝑥𝑥(1)) e o máximo da amostra e estatística de ordem n (𝑥𝑥(𝑛𝑛)). A determinação</p><p>da mediana depende do número de observações da amostra. Se a amostra for</p><p>construída por um número ímpar de observações, a mediana coincide com o</p><p>valor central do conjunto de dados ordenados. Se a amostra for constituída por</p><p>um número ímpar de observações, a mediana é a média dos dois valores</p><p>centrais.</p><p>Pode-se considerar a seguinte definição da mediana.</p><p>onde se</p><p>tem</p><p>55</p><p>quando existe três modas ou polimodal ou multimodal quando existe</p><p>mais de três modas.</p><p> Um conjunto de dados pode não ter moda, portanto ser amodal.</p><p>Exemplo 3.4: Não tem moda o conjunto de dados: 0, 1, 4, 6, 9, 10, 11, 15</p><p>3.2.3 Mediana (�̃�𝑥)</p><p>Com os dados ordenados, a mediana é a terceira medida de</p><p>tendência central e pode ser definida como o valor que divide um conjunto de</p><p>valores em dua partes iguais. É o valor da variável que ocupa a posição central</p><p>na sucessão de observações ou na distribuição de frequência. Assim</p><p>o</p><p>número de observações, quando que lhes são inferiores deverá ser igual ao</p><p>número de informações que lhes são superiores.</p><p>Semelhante à moda, o processo de cálculo da mediana depende da</p><p>forma como os dados se apresentam, isto é, se os dados estão ou não</p><p>classificados.</p><p> Dados não classificados</p><p>O cálculo da mediana ( �̃�𝑥 ) de um conjunto de informações (𝑥𝑥1, 𝑥𝑥3, … , 𝑥𝑥𝑛𝑛 )</p><p>requer a ordenação prévia das mesmas. A ordenação é feita colocando os</p><p>valores da amostra por ordem crescente, obtendo-se 𝑥𝑥(1), 𝑥𝑥(2), … , 𝑥𝑥(𝑛𝑛) onde</p><p>se tem 𝑥𝑥(1) ≤ 𝑥𝑥(2) ≤ … ≤ 𝑥𝑥(𝑛𝑛) e 𝑥𝑥1 (𝑖𝑖 = 1, 2, …, n) é denominada</p><p>estatística de ordem 𝑖𝑖 ou 𝑖𝑖-esima estatística de ordem. Como caso particulares</p><p>de estatística de ordem tem o mínimo da amostra ou estatística de ordem 1</p><p>(𝑥𝑥(1)) e o máximo da amostra e estatística de ordem n (𝑥𝑥(𝑛𝑛)). A determinação</p><p>da mediana depende do número de observações da amostra. Se a amostra for</p><p>construída por um número ímpar de observações, a mediana coincide com o</p><p>valor central do conjunto de dados ordenados. Se a amostra for constituída por</p><p>um número ímpar de observações, a mediana é a média dos dois valores</p><p>centrais.</p><p>Pode-se considerar a seguinte definição da mediana.</p><p>é denominada estatística de</p><p>ordem i ou i-esima estatística de ordem. Como caso particulares de estatística</p><p>de ordem tem o mínimo da amostra ou estatística de ordem 1</p><p>55</p><p>quando existe três modas ou polimodal ou multimodal quando existe</p><p>mais de três modas.</p><p> Um conjunto de dados pode não ter moda, portanto ser amodal.</p><p>Exemplo 3.4: Não tem moda o conjunto de dados: 0, 1, 4, 6, 9, 10, 11, 15</p><p>3.2.3 Mediana (�̃�𝑥)</p><p>Com os dados ordenados, a mediana é a terceira medida de</p><p>tendência central e pode ser definida como o valor que divide um conjunto de</p><p>valores em dua partes iguais. É o valor da variável que ocupa a posição central</p><p>na sucessão de observações ou na distribuição de frequência. Assim o</p><p>número de observações, quando que lhes são inferiores deverá ser igual ao</p><p>número de informações que lhes são superiores.</p><p>Semelhante à moda, o processo de cálculo da mediana depende da</p><p>forma como os dados se apresentam, isto é, se os dados estão ou não</p><p>classificados.</p><p> Dados não classificados</p><p>O cálculo da mediana ( �̃�𝑥 ) de um conjunto de informações (𝑥𝑥1, 𝑥𝑥3, … , 𝑥𝑥𝑛𝑛 )</p><p>requer a ordenação prévia das mesmas. A ordenação é feita colocando os</p><p>valores da amostra por ordem crescente, obtendo-se 𝑥𝑥(1), 𝑥𝑥(2), … , 𝑥𝑥(𝑛𝑛) onde</p><p>se tem 𝑥𝑥(1) ≤ 𝑥𝑥(2) ≤ … ≤ 𝑥𝑥(𝑛𝑛) e 𝑥𝑥1 (𝑖𝑖 = 1, 2, …, n) é denominada</p><p>estatística de ordem 𝑖𝑖 ou 𝑖𝑖-esima estatística de ordem. Como caso particulares</p><p>de estatística de ordem tem o mínimo da amostra ou estatística de ordem 1</p><p>(𝑥𝑥(1)) e o máximo da amostra e estatística de ordem n (𝑥𝑥(𝑛𝑛)). A determinação</p><p>da mediana depende do número de observações da amostra. Se a amostra for</p><p>construída por um número ímpar de observações, a mediana coincide com o</p><p>valor central do conjunto de dados ordenados. Se a amostra for constituída por</p><p>um número ímpar de observações, a mediana é a média dos dois valores</p><p>centrais.</p><p>Pode-se considerar a seguinte definição da mediana.</p><p>e o máximo</p><p>da amostra e estatística de ordem n</p><p>55</p><p>quando existe três modas ou polimodal ou multimodal quando existe</p><p>mais de três modas.</p><p> Um conjunto de dados pode não ter moda, portanto ser amodal.</p><p>Exemplo 3.4: Não tem moda o conjunto de dados: 0, 1, 4, 6, 9, 10, 11, 15</p><p>3.2.3 Mediana (�̃�𝑥)</p><p>Com os dados ordenados, a mediana é a terceira medida de</p><p>tendência central e pode ser definida como o valor que divide um conjunto de</p><p>valores em dua partes iguais. É o valor da variável que ocupa a posição central</p><p>na sucessão de observações ou na distribuição de frequência. Assim o</p><p>número de observações, quando que lhes são inferiores deverá ser igual ao</p><p>número de informações que lhes são superiores.</p><p>Semelhante à moda, o processo de cálculo da mediana depende da</p><p>forma como os dados se apresentam, isto é, se os dados estão ou não</p><p>classificados.</p><p> Dados não classificados</p><p>O cálculo da mediana ( �̃�𝑥 ) de um conjunto de informações (𝑥𝑥1, 𝑥𝑥3, … , 𝑥𝑥𝑛𝑛 )</p><p>requer a ordenação prévia das mesmas. A ordenação é feita colocando os</p><p>valores da amostra por ordem crescente, obtendo-se 𝑥𝑥(1), 𝑥𝑥(2), … , 𝑥𝑥(𝑛𝑛) onde</p><p>se tem 𝑥𝑥(1) ≤ 𝑥𝑥(2) ≤ … ≤ 𝑥𝑥(𝑛𝑛) e 𝑥𝑥1 (𝑖𝑖 = 1, 2, …, n) é denominada</p><p>estatística de ordem 𝑖𝑖 ou 𝑖𝑖-esima estatística de ordem. Como caso particulares</p><p>de estatística de ordem tem o mínimo da amostra ou estatística de ordem 1</p><p>(𝑥𝑥(1)) e o máximo da amostra e estatística de ordem n (𝑥𝑥(𝑛𝑛)). A determinação</p><p>da mediana depende do número de observações da amostra. Se a amostra for</p><p>construída por um número ímpar de observações, a mediana coincide com o</p><p>valor central do conjunto de dados ordenados. Se a amostra for constituída por</p><p>um número ímpar de observações, a mediana é a média dos dois valores</p><p>centrais.</p><p>Pode-se considerar a seguinte definição da mediana.</p><p>. A determinação da mediana depende</p><p>do número de observações da amostra. Se a amostra for construída por um</p><p>número ímpar de observações, a mediana coincide com o valor central do</p><p>conjunto de dados ordenados. Se a amostra for constituída por um número</p><p>ímpar de observações, a mediana é a média dos dois valores centrais.</p><p>Pode-se considerar a seguinte definição da mediana.</p><p>Dado um conjunto de dados de n observações, a mediana é dada por:</p><p>56</p><p>Dado um conjunto de dados de 𝑛𝑛 observações, a mediana é dada por:</p><p>�̃�𝑥 = 𝑥𝑥(𝑛𝑛+1</p><p>2 ) se 𝑛𝑛 ímpar</p><p>�̃�𝑥 =</p><p>𝑥𝑥(𝑛𝑛</p><p>2) +𝑥𝑥(𝑛𝑛</p><p>2+1)</p><p>2 se 𝑛𝑛 par</p><p> Dados Classificados</p><p>Caso se disponha de dados classificados e, por conseguinte, não se</p><p>tem acesso às observações originais, não é possível determinar o valor da</p><p>mediana da mesma forma que para dados não classificados. Portanto, a</p><p>mediana é, neste caso, definida com o valor �̃�𝑥 tal que 𝑁𝑁(�̃�𝑥) = 𝑛𝑛</p><p>2 ou 𝐹𝐹(�̃�𝑥) =</p><p>0,5, onde 𝑁𝑁(𝑥𝑥) representa a frequência absoluta acumulada e 𝐹𝐹(𝑥𝑥)</p><p>representa a frequência relativa acumulada. Dado que os dados estão</p><p>agrupados em classes não se conhecem os valores de 𝑁𝑁(𝑥𝑥) e 𝐹𝐹(𝑥𝑥) para</p><p>todos os valores de 𝑥𝑥 de determinada classe. Assim, identificada a classe a</p><p>que pertence a mediana, pode-se obter um valor aproximado da mediana por</p><p>interpolação linear.</p><p>Portanto, a determinação da mediana quando os dados estão</p><p>classificados pode ser resumido em duas etapas:</p><p>a) Determinar a classe a que pertence à mediana. Para tal basta</p><p>identificar a classe onde 𝑁𝑁(𝑥𝑥) ≥ 𝑛𝑛</p><p>2 ou 𝐹𝐹(�̃�𝑥) ≥ 0,5.</p><p>b) Calcular o valor da mediana através de uma das expressões:</p><p> Caso se disponha dos valores das frequências absolutas e</p><p>absolutas acumuladas:</p><p>�̃�𝑥 = 𝑙𝑙𝑖𝑖 +</p><p>𝑛𝑛</p><p>2 − 𝑁𝑁𝑖𝑖−1</p><p>𝑛𝑛𝑖𝑖</p><p>𝑥𝑥 𝑎𝑎𝑖𝑖</p><p> Caso se disponha dos valores das frequências relativas e</p><p>relativas acumuladas:</p><p>�̃�𝑥 = 𝑙𝑙𝑖𝑖 + 0,5 − 𝐹𝐹𝑖𝑖−1</p><p>𝑓𝑓𝑖𝑖</p><p>𝑥𝑥 𝑎𝑎𝑖𝑖</p><p>Onde:</p><p>	Dados Classificados</p><p>Caso se disponha de dados classificados e, por conseguinte, não se tem</p><p>acesso às observações originais, não é possível determinar o valor da mediana</p><p>da mesma forma que para dados não classificados. Portanto, a mediana é,</p><p>neste caso, definida com o valor</p><p>56</p><p>Dado um conjunto de dados de 𝑛𝑛 observações, a mediana é dada por:</p><p>�̃�𝑥 = 𝑥𝑥(𝑛𝑛+1</p><p>2 ) se 𝑛𝑛 ímpar</p><p>�̃�𝑥 =</p><p>𝑥𝑥(𝑛𝑛</p><p>2) +𝑥𝑥(𝑛𝑛</p><p>2+1)</p><p>2 se 𝑛𝑛 par</p><p> Dados Classificados</p><p>Caso se disponha de dados classificados e, por conseguinte, não se</p><p>tem acesso às observações originais, não é possível determinar o valor da</p><p>mediana da mesma forma que para dados não classificados. Portanto, a</p><p>mediana é, neste caso, definida com o valor �̃�𝑥</p><p>tal que 𝑁𝑁(�̃�𝑥) = 𝑛𝑛</p><p>2 ou 𝐹𝐹(�̃�𝑥) =</p><p>0,5, onde 𝑁𝑁(𝑥𝑥) representa a frequência absoluta acumulada e 𝐹𝐹(𝑥𝑥)</p><p>representa a frequência relativa acumulada. Dado que os dados estão</p><p>agrupados em classes não se conhecem os valores de 𝑁𝑁(𝑥𝑥) e 𝐹𝐹(𝑥𝑥) para</p><p>todos os valores de 𝑥𝑥 de determinada classe. Assim, identificada a classe a</p><p>que pertence a mediana, pode-se obter um valor aproximado da mediana por</p><p>interpolação linear.</p><p>Portanto, a determinação da mediana quando os dados estão</p><p>classificados pode ser resumido em duas etapas:</p><p>a) Determinar a classe a que pertence à mediana. Para tal basta</p><p>identificar a classe onde 𝑁𝑁(𝑥𝑥) ≥ 𝑛𝑛</p><p>2 ou 𝐹𝐹(�̃�𝑥) ≥ 0,5.</p><p>b) Calcular o valor da mediana através de uma das expressões:</p><p> Caso se disponha dos valores das frequências absolutas e</p><p>absolutas acumuladas:</p><p>�̃�𝑥 = 𝑙𝑙𝑖𝑖 +</p><p>𝑛𝑛</p><p>2 − 𝑁𝑁𝑖𝑖−1</p><p>𝑛𝑛𝑖𝑖</p><p>𝑥𝑥 𝑎𝑎𝑖𝑖</p><p> Caso se disponha dos valores das frequências relativas e</p><p>relativas acumuladas:</p><p>�̃�𝑥 = 𝑙𝑙𝑖𝑖 + 0,5 − 𝐹𝐹𝑖𝑖−1</p><p>𝑓𝑓𝑖𝑖</p><p>𝑥𝑥 𝑎𝑎𝑖𝑖</p><p>Onde:</p><p>0,5, onde N(x)</p><p>representa a frequência absoluta acumulada e F(x) representa a frequência</p><p>relativa acumulada. Dado que os dados estão agrupados em classes não se</p><p>conhecem os valores de N(x) e F(x) para todos os valores de x de determinada</p><p>classe. Assim, identificada a classe a que pertence a mediana, pode-se obter</p><p>um valor aproximado da mediana por interpolação linear.</p><p>Portanto, a determinação da mediana quando os dados estão classificados</p><p>pode ser resumido em duas etapas:</p><p>a) Determinar a classe a que pertence à mediana. Para tal basta</p><p>identificar a classe onde</p><p>56</p><p>Dado um conjunto de dados de 𝑛𝑛 observações, a mediana é dada por:</p><p>�̃�𝑥 = 𝑥𝑥(𝑛𝑛+1</p><p>2 ) se 𝑛𝑛 ímpar</p><p>�̃�𝑥 =</p><p>𝑥𝑥(𝑛𝑛</p><p>2) +𝑥𝑥(𝑛𝑛</p><p>2+1)</p><p>2 se 𝑛𝑛 par</p><p> Dados Classificados</p><p>Caso se disponha de dados classificados e, por conseguinte, não se</p><p>tem acesso às observações originais, não é possível determinar o valor da</p><p>mediana da mesma forma que para dados não classificados. Portanto, a</p><p>mediana é, neste caso, definida com o valor �̃�𝑥 tal que 𝑁𝑁(�̃�𝑥) = 𝑛𝑛</p><p>2 ou 𝐹𝐹(�̃�𝑥) =</p><p>0,5, onde 𝑁𝑁(𝑥𝑥) representa a frequência absoluta acumulada e 𝐹𝐹(𝑥𝑥)</p><p>representa a frequência relativa acumulada. Dado que os dados estão</p><p>agrupados em classes não se conhecem os valores de 𝑁𝑁(𝑥𝑥) e 𝐹𝐹(𝑥𝑥) para</p><p>todos os valores de 𝑥𝑥 de determinada classe. Assim, identificada a classe a</p><p>que pertence a mediana, pode-se obter um valor aproximado da mediana por</p><p>interpolação linear.</p><p>Portanto, a determinação da mediana quando os dados estão</p><p>classificados pode ser resumido em duas etapas:</p><p>a) Determinar a classe a que pertence à mediana. Para tal basta</p><p>identificar a classe onde 𝑁𝑁(𝑥𝑥) ≥ 𝑛𝑛</p><p>2 ou 𝐹𝐹(�̃�𝑥) ≥ 0,5.</p><p>b) Calcular o valor da mediana através de uma das expressões:</p><p> Caso se disponha dos valores das frequências absolutas e</p><p>absolutas acumuladas:</p><p>�̃�𝑥 = 𝑙𝑙𝑖𝑖 +</p><p>𝑛𝑛</p><p>2 − 𝑁𝑁𝑖𝑖−1</p><p>𝑛𝑛𝑖𝑖</p><p>𝑥𝑥 𝑎𝑎𝑖𝑖</p><p> Caso se disponha dos valores das frequências relativas e</p><p>relativas acumuladas:</p><p>�̃�𝑥 = 𝑙𝑙𝑖𝑖 + 0,5 − 𝐹𝐹𝑖𝑖−1</p><p>𝑓𝑓𝑖𝑖</p><p>𝑥𝑥 𝑎𝑎𝑖𝑖</p><p>Onde:</p><p>59Estatística</p><p>b) Calcular o valor da mediana através de uma das expressões:</p><p>	Caso se disponha dos valores das frequências absolutas e absolutas</p><p>acumuladas:</p><p>56</p><p>Dado um conjunto de dados de 𝑛𝑛 observações, a mediana é dada por:</p><p>�̃�𝑥 = 𝑥𝑥(𝑛𝑛+1</p><p>2 ) se 𝑛𝑛 ímpar</p><p>�̃�𝑥 =</p><p>𝑥𝑥(𝑛𝑛</p><p>2) +𝑥𝑥(𝑛𝑛</p><p>2+1)</p><p>2 se 𝑛𝑛 par</p><p> Dados Classificados</p><p>Caso se disponha de dados classificados e, por conseguinte, não se</p><p>tem acesso às observações originais, não é possível determinar o valor da</p><p>mediana da mesma forma que para dados não classificados. Portanto, a</p><p>mediana é, neste caso, definida com o valor �̃�𝑥 tal que 𝑁𝑁(�̃�𝑥) = 𝑛𝑛</p><p>2 ou 𝐹𝐹(�̃�𝑥) =</p><p>0,5, onde 𝑁𝑁(𝑥𝑥) representa a frequência absoluta acumulada e 𝐹𝐹(𝑥𝑥)</p><p>representa a frequência relativa acumulada. Dado que os dados estão</p><p>agrupados em classes não se conhecem os valores de 𝑁𝑁(𝑥𝑥) e 𝐹𝐹(𝑥𝑥) para</p><p>todos os valores de 𝑥𝑥 de determinada classe. Assim, identificada a classe a</p><p>que pertence a mediana, pode-se obter um valor aproximado da mediana por</p><p>interpolação linear.</p><p>Portanto, a determinação da mediana quando os dados estão</p><p>classificados pode ser resumido em duas etapas:</p><p>a) Determinar a classe a que pertence à mediana. Para tal basta</p><p>identificar a classe onde 𝑁𝑁(𝑥𝑥) ≥ 𝑛𝑛</p><p>2 ou 𝐹𝐹(�̃�𝑥) ≥ 0,5.</p><p>b) Calcular o valor da mediana através de uma das expressões:</p><p> Caso se disponha dos valores das frequências absolutas e</p><p>absolutas acumuladas:</p><p>�̃�𝑥 = 𝑙𝑙𝑖𝑖 +</p><p>𝑛𝑛</p><p>2 − 𝑁𝑁𝑖𝑖−1</p><p>𝑛𝑛𝑖𝑖</p><p>𝑥𝑥 𝑎𝑎𝑖𝑖</p><p> Caso se disponha dos valores das frequências relativas e</p><p>relativas acumuladas:</p><p>�̃�𝑥 = 𝑙𝑙𝑖𝑖 + 0,5 − 𝐹𝐹𝑖𝑖−1</p><p>𝑓𝑓𝑖𝑖</p><p>𝑥𝑥 𝑎𝑎𝑖𝑖</p><p>Onde:</p><p>	Caso se disponha dos valores das frequências relativas e relativas</p><p>acumuladas:</p><p>Onde:</p><p>li – Limite inferior da classe mediana;</p><p>Ni−1- Frequência absoluta acumulada da classe anterior à classe mediana;</p><p>ai – Amplitude da classe mediana;</p><p>ni – Frequência absoluta da classe mediana;</p><p>Fi−1 – Frequência relativa acumulada da classe anterior à classe da mediana;</p><p>fi – Frequência relativa da classe da mediana.</p><p>3.3 Medidas de posição</p><p>3.3.1 Quantis (Qi)</p><p>Quantis são estatísticas que nos permitem caracterizar conjuntos de dados</p><p>dividindo-os em partes iguais. Os quantis mais utilizados são os percentis, os</p><p>decis e os quartis. Os percentis dividem um conjunto de dados em 100 partes</p><p>iguais, os decis em 10 partes, e os quartis em quatro.</p><p>O quantil de ordem p (0</p><p>à sua esquerda.</p><p>A mediana é um dos quantis e corresponde ao percentil 50, ao decil</p><p>5 e ao quartil 2.</p><p>	 Dados não classificados</p><p>Quando se dispõe de dados não classificados é frequente utilizar o cálculo</p><p>do quantil de ordem p x(p), que pode ser resumido da seguinte forma:</p><p>1º passo: Ordenam-se as observações por ordem crescente obtendo-</p><p>se as estatísticas de ordem x(1), x(2), … , x(n) .</p><p>2º passo: Calcula-se o valor de 0 = (n + 1)p</p><p>58</p><p>2º passo: Calcula-se o valor de 𝑜𝑜 = (𝑛𝑛 + 1)𝑝𝑝</p><p> Se 𝑜𝑜 = (𝑛𝑛 + 1)𝑝𝑝 = 𝑘𝑘 for um número inteiro o quantil é a estatística</p><p>de ordem 𝑘𝑘 = 𝑥𝑥(𝑘𝑘).</p><p> Se 𝑜𝑜 = (𝑛𝑛 + 1)𝑝𝑝 = 𝑘𝑘 não for um número inteiro, então (𝑛𝑛 + 1)𝑝𝑝 =</p><p>𝑘𝑘 + 𝛿𝛿 ( 𝛿𝛿 lê-se Delta), onde 𝑘𝑘 é a parte inteira, e 𝛿𝛿 a parte fracionária.</p><p>Considera-se que o quantil é a média ponderada das estatísticas de</p><p>ordem 𝑘𝑘 e de ordem 𝑘𝑘 + 1, tendo a primeira tem um peso igual a 1 − 𝛿𝛿, e</p><p>a segunda um peso igual a 𝛿𝛿, ou seja:</p><p>𝑥𝑥(𝑝𝑝) = (𝑛𝑛 − 𝛿𝛿)𝑥𝑥(𝑘𝑘) + 𝛿𝛿 𝑥𝑥(𝑘𝑘+1)</p><p>⟺ 𝑥𝑥(𝑝𝑝) = 𝑥𝑥(𝑘𝑘) + 𝛿𝛿 ( 𝑥𝑥(𝑘𝑘+1) − 𝑥𝑥(𝑘𝑘))</p><p>Considera-se o seguinte exemplo ilustrativo do modo de cálculo da mediana.</p><p>Quadro 4 – Considerem-se os seguintes valores referentes aos números de</p><p>reprovações em 7 turmas na disciplina de Física da Escola Secundária Marie</p><p>Curie. Pretende-se determinar o valor da mediana relativa à variável número de</p><p>reprovações.</p><p>Turma Turma A Turma B Turma C Turma D Turma E Turma F Turma G</p><p>Nº reprovações 2 4 3 1 0 6 5</p><p>Fonte: Elaborado pela Autora (2021).</p><p>A determinação da posição resulta de 𝑜𝑜 = (𝑛𝑛 + 1)𝑝𝑝 = (7 + 1) x 0,5 = 4, então a</p><p>mediana corresponde ao valor da variável na posição quatro da amostra,</p><p>ordenada por ordem crescente.</p><p>Turma Turma E Turma D Turma A Turma C Turma B Turma G Turma F</p><p>Nº reprovações 0 1 2 3 4 5 6</p><p>A posição quatro corresponde à turma C, pelo que a mediana �̃�𝑥 = 3. Desta</p><p>forma pode-se afirmar que 50% das turmas têm no máximo 3 alunos</p><p>reprovados.</p><p>O quadro 4, também exibe dados não classificados, mas com o número par de</p><p>observações</p><p>Quadro 5 – Considerem-se os números de chamadas para Samu entre 1:00h e</p><p>as 2:00h da madrugada, durante 6 dias consecutivos</p><p>Nº de chamadas 0 1 2 3 4 5</p><p>Fonte: Elaborado pela Autora (2021).</p><p>Considera-se o seguinte exemplo ilustrativo do modo de cálculo da</p><p>mediana.</p><p>Quadro 4 – Considerem-se os seguintes valores referentes aos números</p><p>de reprovações em 7 turmas na disciplina de Física da Escola Secundária Marie</p><p>Curie. Pretende-se determinar o valor da mediana relativa à variável número de</p><p>reprovações</p><p>Turma Turma</p><p>A</p><p>Turma</p><p>B</p><p>Turma</p><p>C</p><p>Turma</p><p>D</p><p>Turma</p><p>E</p><p>Turma</p><p>F</p><p>Turma</p><p>G</p><p>Nº reprova-</p><p>ções</p><p>2 4 3 1 0 6 5</p><p>Fonte: Elaborado pela Autora (2021).</p><p>61Estatística</p><p>A determinação da posição resulta de 0 = (n + 1)p = (7 + 1) x 0,5 = 4, então</p><p>a mediana corresponde ao valor da variável na posição quatro da amostra,</p><p>ordenada por ordem crescente.</p><p>Turma Turma</p><p>E</p><p>Turma</p><p>D</p><p>Turma</p><p>A</p><p>Turma</p><p>C</p><p>Turma</p><p>B</p><p>Turma</p><p>G</p><p>Turma</p><p>F</p><p>Nº reprova-</p><p>ções</p><p>0 1 2 3 4 5 6</p><p>A posição quatro corresponde à turma C, pelo que a mediana</p><p>51</p><p>Portanto, considera-se uma amostra constituída pelos valores {x1, x2, …, xn}. A</p><p>média aritmética, 𝒳𝒳, é a soma de todos os valores observados da variável x</p><p>dividida pelo número de observação.</p><p> Média aritmética simples</p><p>Para formalizar os conceitos introduzidos acima. Se x1, x2, …, xn são os n</p><p>valores (distintos ou não) da variável X, a média aritmética, ou simplesmente</p><p>média, de X pode ser escrita:</p><p>onde:</p><p>xi – Valores observados;</p><p>n – Dimensão da amostra.</p><p>No cálculo da média aritmética (simples) todas as observações têm igual peso.</p><p>No entanto, caso existam observações repetidas, pode-se atribuir a cada</p><p>observação um peso correspondente à frequência absoluta ou frequência</p><p>relativa da referida observação. Neste caso a média é usualmente designada</p><p>por média aritmética ponderada e o seu cálculo far-se-á através das</p><p>expressões que a seguir se apresentam.</p><p> Média aritmética ponderada</p><p>𝒳𝒳 = ∑ 𝑛𝑛𝑛𝑛𝑛𝑛𝑛𝑛𝑘𝑘</p><p>𝑖𝑖=1</p><p>𝓃𝓃 ou 𝒳𝒳 = ∑ 𝑥𝑥𝑥𝑥𝑥𝑥𝑥𝑥𝑘𝑘</p><p>𝑛𝑛=1</p><p>Onde:</p><p>𝑥𝑥𝑥𝑥 = 𝑛𝑛𝑛𝑛</p><p>𝑛𝑛 - Frequência relativa;</p><p>n - Dimensão da amostra;</p><p>ni - Frequência absoluta;</p><p>k – Número de observações distintas na amostra.</p><p> Média Aritmética de dados classificados</p><p>Quando os dados estão agrupados em classes pressupõe-se que todas as</p><p>observações dentro de cada classe se distribuem uniformemente na mesma e,</p><p>por conseguinte, admite-se que todas as observações de determinada classe</p><p>coincidem com o seu ponto médio ci. Nesta situação a média é determinada a</p><p>partir da seguinte expressão:</p><p>𝒳𝒳 = ∑ 𝑐𝑐𝑛𝑛 𝑛𝑛𝑛𝑛𝑛𝑛</p><p>𝑖𝑖=1</p><p>𝑛𝑛 = ∑ 𝑐𝑐𝑥𝑥𝑥𝑥𝑥𝑥𝑘𝑘</p><p>𝑛𝑛=1</p><p>𝒳𝒳 = 𝒳𝒳𝑛𝑛+⋯+ 𝒳𝒳𝑛𝑛 𝓃𝓃 = ∑ 𝑛𝑛𝑛𝑛𝑛𝑛</p><p>𝑖𝑖=1</p><p>𝑛𝑛 = 1</p><p>𝑛𝑛 ∑ 𝑥𝑥𝑥𝑥𝑛𝑛</p><p>𝑛𝑛=1</p><p>= 3.</p><p>Desta forma, pode-se afirmar que 50% das turmas têm no máximo 3 alunos</p><p>reprovados.</p><p>O quadro 4, também exibe dados não classificados, mas com o número</p><p>par de observações.</p><p>Quadro 5 – Considerem-se os números de chamadas para Samu entre</p><p>1:00h e as 2:00h da madrugada, durante 6 dias consecutivos</p><p>Nº de chama-</p><p>das</p><p>0 1 2 3 4 5</p><p>Fonte: Elaborado pela Autora (2021).</p><p>0 = (n + 1)p = (6 + 1) x 0,5 = 3,5</p><p>A mediana corresponde ao valor da variável que se encontra na posição</p><p>3,5. Como 3,5 não é um número inteiro, tem-se:</p><p>59</p><p>𝑜𝑜 = (𝑛𝑛 + 1)𝑝𝑝 = (6 + 1) x 0,5 = 3,5</p><p>A mediana corresponde ao valor da variável que se encontra na posição 3,5.</p><p>Como 3,5 não é um número inteiro, tem-se:</p><p>�̃�𝑥 = 𝑥𝑥3 + 0,5 𝑥𝑥 (𝑥𝑥(4) − 𝑥𝑥(3)) = 2 + 0,5 𝑥𝑥 (3 − 2) = 2 + 0,5 = 2,5</p><p>Pode-se afirmar que, em 50% dos dias, o número máximo de chamadas</p><p>ocorridas entre 1h e às 2h foi de 2,5.</p><p>3.4 Medidas de Dispersão</p><p>São medidas que servem para verificar a representatividade das</p><p>medidas de localização; basta pensar, por exemplo, em variáveis que embora</p><p>tenham a mesma média, contêm valores muito diferentes. O resumo de um</p><p>conjunto de dados por uma única medida representativa de posição central</p><p>esconde toda a informação sobre a variabilidade do conjunto de observações.</p><p>Percebe-se a conveniência de serem criadas medidas que sintetize</p><p>a variabilidade de um conjunto de observações, e que possibilite aferir</p><p>conjuntos diferentes de valores, consoantes parâmetros prévios.</p><p>Quando se descrevem coleções de dados ou distribuições de</p><p>frequências importa conhecer a variabilidade dos dados, ou seja, a sua</p><p>dispersão significa o contrário de concentração, indicando a forma como os</p><p>dados estão mais ou menos afastados de um parâmetro de tendência central.</p><p>Entre as diferentes medidas de dispersão citam-se: intervalo de</p><p>variação ou amplitude total, intervalos interquartis, desvio absoluto</p><p>médio, variância, desvio padrão e coeficiente de variação.</p><p>3.4.1 Desvio médio absoluto (𝐷𝐷𝐷𝐷)</p><p>Considerando a média como ponto de referência, a dispersão de um</p><p>conjunto de observações será tanto maior quanto maiores forem os desvios</p><p>(𝑑𝑑𝑖𝑖 = 𝑥𝑥𝑖𝑖 − �̃�𝑥) de cada observação em relação à média. A média dos desvios</p><p>em relação à média seria uma medida para quantificar a dispersão se não</p><p>Pode-se afirmar que, em 50% dos dias, o número máximo de chamadas</p><p>ocorridas entre 1h e às 2h foi de 2,5.</p><p>3.4 Medidas de Dispersão</p><p>São medidas que servem para verificar a representatividade das medidas</p><p>de localização; basta pensar, por exemplo, em variáveis que embora tenham a</p><p>mesma média, contêm valores muito diferentes. O resumo de um conjunto de</p><p>dados por uma única medida representativa de posição central esconde toda a</p><p>informação sobre a variabilidade do conjunto de observações.</p><p>62Estatística</p><p>Percebe-se a conveniência de serem criadas medidas que sintetize a</p><p>variabilidade de um conjunto de observações, e que possibilite aferir conjuntos</p><p>diferentes de valores, consoantes parâmetros prévios.</p><p>Quando se descrevem coleções de dados ou distribuições de frequências</p><p>importa conhecer a variabilidade dos dados, ou seja, a sua dispersão significa</p><p>o contrário de concentração, indicando a forma como os dados estão mais ou</p><p>menos afastados de um parâmetro de tendência central.</p><p>Entre as diferentes medidas de dispersão citam-se: intervalo de variação</p><p>ou amplitude total, intervalos interquartis, desvio absoluto médio, variância,</p><p>desvio padrão e coeficiente de variação.</p><p>3.4.1 Desvio médio absoluto (DM)</p><p>Considerando a média como ponto de referência, a dispersão de um</p><p>conjunto de observações será tanto maior quanto maiores forem os desvios</p><p>(di = xi −</p><p>51</p><p>Portanto, considera-se uma amostra constituída pelos valores {x1, x2, …, xn}. A</p><p>média aritmética, 𝒳𝒳, é a soma de todos os valores observados da variável x</p><p>dividida pelo número de observação.</p><p> Média aritmética simples</p><p>Para formalizar os conceitos introduzidos acima. Se x1, x2, …, xn são os n</p><p>valores (distintos ou não) da variável X, a média aritmética, ou simplesmente</p><p>média, de X pode ser escrita:</p><p>onde:</p><p>xi – Valores observados;</p><p>n – Dimensão da amostra.</p><p>No cálculo da média aritmética (simples) todas as observações têm igual peso.</p><p>No entanto, caso existam observações repetidas, pode-se atribuir a cada</p><p>observação um peso correspondente à frequência absoluta ou frequência</p><p>relativa da referida observação. Neste caso a média é usualmente designada</p><p>por média aritmética ponderada e o seu cálculo far-se-á através das</p><p>expressões que a seguir se apresentam.</p><p> Média aritmética ponderada</p><p>𝒳𝒳 = ∑ 𝑛𝑛𝑛𝑛𝑛𝑛𝑛𝑛𝑘𝑘</p><p>𝑖𝑖=1</p><p>𝓃𝓃 ou 𝒳𝒳 = ∑ 𝑥𝑥𝑥𝑥𝑥𝑥𝑥𝑥𝑘𝑘</p><p>𝑛𝑛=1</p><p>Onde:</p><p>𝑥𝑥𝑥𝑥 = 𝑛𝑛𝑛𝑛</p><p>𝑛𝑛 - Frequência relativa;</p><p>n - Dimensão da amostra;</p><p>ni - Frequência absoluta;</p><p>k – Número de observações distintas na amostra.</p><p> Média Aritmética de dados classificados</p><p>Quando os dados estão agrupados em classes pressupõe-se que todas as</p><p>observações dentro de cada classe se distribuem uniformemente na mesma e,</p><p>por conseguinte, admite-se que todas as observações de determinada classe</p><p>coincidem com o seu ponto médio ci. Nesta situação a média é determinada a</p><p>partir da seguinte expressão:</p><p>𝒳𝒳 = ∑ 𝑐𝑐𝑛𝑛 𝑛𝑛𝑛𝑛𝑛𝑛</p><p>𝑖𝑖=1</p><p>𝑛𝑛 = ∑ 𝑐𝑐𝑥𝑥𝑥𝑥𝑥𝑥𝑘𝑘</p><p>𝑛𝑛=1</p><p>𝒳𝒳 = 𝒳𝒳𝑛𝑛+⋯+ 𝒳𝒳𝑛𝑛 𝓃𝓃 = ∑ 𝑛𝑛𝑛𝑛𝑛𝑛</p><p>𝑖𝑖=1</p><p>𝑛𝑛 = 1</p><p>𝑛𝑛 ∑ 𝑥𝑥𝑥𝑥𝑛𝑛</p><p>𝑛𝑛=1</p><p>) de cada observação em relação à média. A média dos desvios</p><p>em relação à média seria uma medida para quantificar a dispersão se não</p><p>fosse o fato de que a soma dos desvios em relação à média ser nula, isto</p><p>é</p><p>60</p><p>fosse o fato de que a soma dos desvios em relação à média ser nula, isto é</p><p>∑ (𝑥𝑥𝑖𝑖 − �̃�𝑥) = 0 𝑛𝑛</p><p>𝑖𝑖=1 . Uma forma de ultrapassar esta dificuldade consiste em</p><p>considerar os desvios em valor absoluto. A correspondente medida de</p><p>dispersão designa-se por desvio médio absoluto e é definido por:</p><p>𝐷𝐷𝐷𝐷 = 1</p><p>𝑛𝑛 ∑|𝑑𝑑𝑖𝑖| = 1</p><p>𝑛𝑛 ∑|𝑥𝑥1 − �̃�𝑥|</p><p>𝑛𝑛</p><p>𝑖𝑖=1</p><p>𝑛𝑛</p><p>𝑖𝑖=1</p><p>Esta medida não tem grande utilização dado que a presença de</p><p>valores absolutos levanta dificuldades, quer do ponto de vista computacional,</p><p>quer do ponto de vista matemático.</p><p>As próximas medidas apresentadas são as medidas de dispersão</p><p>mais utilizadas na estatística.</p><p>3.4.2 Variância (𝑠𝑠2)</p><p>Uma das maneiras de superar os impedimentos causados pelo fato</p><p>de o somatório dos desvios em relação à média ser nulo, é considerar o</p><p>quadrado deles.</p><p>Portanto, define-se a variância a média dos quadrados dos desvios</p><p>em relação à média.</p><p> Cálculo da variância para dados não agrupados, ou não</p><p>classificados:</p><p>𝑠𝑠2 = 1</p><p>𝑛𝑛 ∑(𝑥𝑥𝑖𝑖 − �̃�𝑥)2</p><p>𝑛𝑛</p><p>𝑖𝑖=1</p><p>Ou de forma mais simplificada:</p><p>𝑠𝑠2 = 1</p><p>𝑛𝑛 ∑ 𝑥𝑥𝑖𝑖</p><p>2 − �̅�𝑥2</p><p>𝑛𝑛</p><p>𝑖𝑖=1</p><p>A variância é expressa no quadrado da unidade dos dados, e por</p><p>este motivo, é comum que essa medida de dispersão perca o significado</p><p>concreto, sendo necessário recorrer de outra medida de dispersão, o desvio</p><p>padrão, o qual será versado mais à frente.</p><p>Uma forma de ultrapassar esta dificuldade consiste</p><p>em considerar os desvios em valor absoluto. A correspondente medida de</p><p>dispersão designa-se por desvio médio absoluto e é definido por:</p><p>60</p><p>fosse o fato de que a soma dos desvios em relação à média ser nula, isto é</p><p>∑ (𝑥𝑥𝑖𝑖 − �̃�𝑥) = 0 𝑛𝑛</p><p>𝑖𝑖=1 . Uma forma de ultrapassar esta dificuldade consiste em</p><p>considerar os desvios em valor absoluto. A correspondente medida de</p><p>dispersão designa-se por desvio médio absoluto e é definido por:</p><p>𝐷𝐷𝐷𝐷 = 1</p><p>𝑛𝑛 ∑|𝑑𝑑𝑖𝑖| = 1</p><p>𝑛𝑛 ∑|𝑥𝑥1 − �̃�𝑥|</p><p>𝑛𝑛</p><p>𝑖𝑖=1</p><p>𝑛𝑛</p><p>𝑖𝑖=1</p><p>Esta medida não tem grande utilização dado que a presença de</p><p>valores absolutos levanta dificuldades, quer do ponto de vista computacional,</p><p>quer do ponto de vista matemático.</p><p>As próximas medidas apresentadas são as medidas de dispersão</p><p>mais utilizadas na estatística.</p><p>3.4.2 Variância (𝑠𝑠2)</p><p>Uma das maneiras de superar os impedimentos causados pelo fato</p><p>de o somatório dos desvios em relação à média ser nulo, é considerar o</p><p>quadrado deles.</p><p>Portanto, define-se a variância a média dos quadrados dos desvios</p><p>em relação à média.</p><p> Cálculo da variância para dados não agrupados, ou não</p><p>classificados:</p><p>𝑠𝑠2 = 1</p><p>𝑛𝑛 ∑(𝑥𝑥𝑖𝑖 − �̃�𝑥)2</p><p>𝑛𝑛</p><p>𝑖𝑖=1</p><p>Ou de forma mais simplificada:</p><p>𝑠𝑠2 = 1</p><p>𝑛𝑛 ∑ 𝑥𝑥𝑖𝑖</p><p>2 − �̅�𝑥2</p><p>𝑛𝑛</p><p>𝑖𝑖=1</p><p>A variância é expressa no quadrado da unidade dos dados, e por</p><p>este motivo, é comum que essa medida de dispersão perca o significado</p><p>concreto, sendo necessário recorrer de outra medida de dispersão, o desvio</p><p>padrão, o qual será versado mais à frente.</p><p>Esta medida não tem grande utilização dado que a presença de valores</p><p>absolutos levanta dificuldades, quer do ponto de vista computacional, quer do</p><p>ponto de vista matemático.</p><p>As próximas medidas apresentadas são as medidas de dispersão mais</p><p>utilizadas na estatística.</p><p>63Estatística</p><p>3.4.2 Variância (s2)</p><p>Uma das maneiras de superar os impedimentos causados pelo fato de o</p><p>somatório dos desvios em relação à média ser nulo, é considerar o quadrado</p><p>deles.</p><p>Portanto, define-se a variância a média dos quadrados dos desvios em</p><p>relação à média.</p><p>	 Cálculo da variância para dados não agrupados, ou não classificados:</p><p>60</p><p>fosse o fato de que a soma dos desvios em relação à média ser nula, isto é</p><p>∑ (𝑥𝑥𝑖𝑖 − �̃�𝑥) = 0 𝑛𝑛</p><p>𝑖𝑖=1 . Uma forma de ultrapassar esta dificuldade consiste em</p><p>considerar os desvios em valor absoluto. A correspondente medida de</p><p>dispersão designa-se por desvio médio absoluto e é definido por:</p><p>𝐷𝐷𝐷𝐷 = 1</p><p>𝑛𝑛 ∑|𝑑𝑑𝑖𝑖| = 1</p><p>𝑛𝑛 ∑|𝑥𝑥1 − �̃�𝑥|</p><p>𝑛𝑛</p><p>𝑖𝑖=1</p><p>𝑛𝑛</p><p>𝑖𝑖=1</p><p>Esta medida não tem grande utilização dado que a presença de</p><p>valores absolutos levanta dificuldades, quer do ponto de vista computacional,</p><p>quer do ponto de vista matemático.</p><p>As próximas medidas apresentadas são as medidas de dispersão</p><p>mais utilizadas na estatística.</p><p>3.4.2 Variância (𝑠𝑠2)</p><p>Uma das maneiras de superar os impedimentos causados pelo fato</p><p>de o somatório dos desvios em relação à média ser nulo, é considerar o</p><p>quadrado deles.</p><p>Portanto, define-se a variância a média dos quadrados dos desvios</p><p>em relação à média.</p><p> Cálculo da variância para dados não agrupados, ou não</p><p>classificados:</p><p>𝑠𝑠2 = 1</p><p>𝑛𝑛 ∑(𝑥𝑥𝑖𝑖 − �̃�𝑥)2</p><p>𝑛𝑛</p><p>𝑖𝑖=1</p><p>Ou de forma mais simplificada:</p><p>𝑠𝑠2 = 1</p><p>𝑛𝑛 ∑ 𝑥𝑥𝑖𝑖</p><p>2 − �̅�𝑥2</p><p>𝑛𝑛</p><p>𝑖𝑖=1</p><p>A variância é expressa no quadrado da unidade dos dados, e por</p><p>este motivo, é comum que essa medida de dispersão perca o significado</p><p>concreto, sendo necessário recorrer de outra medida de dispersão, o desvio</p><p>padrão, o qual será versado mais à frente.</p><p>Ou de forma mais simplificada:</p><p>60</p><p>fosse o fato de que a soma dos desvios em relação à média ser nula, isto é</p><p>∑ (𝑥𝑥𝑖𝑖 − �̃�𝑥) = 0 𝑛𝑛</p><p>𝑖𝑖=1 . Uma forma de ultrapassar esta dificuldade consiste em</p><p>considerar os desvios em valor absoluto. A correspondente medida de</p><p>dispersão designa-se por desvio médio absoluto</p><p>e é definido por:</p><p>𝐷𝐷𝐷𝐷 = 1</p><p>𝑛𝑛 ∑|𝑑𝑑𝑖𝑖| = 1</p><p>𝑛𝑛 ∑|𝑥𝑥1 − �̃�𝑥|</p><p>𝑛𝑛</p><p>𝑖𝑖=1</p><p>𝑛𝑛</p><p>𝑖𝑖=1</p><p>Esta medida não tem grande utilização dado que a presença de</p><p>valores absolutos levanta dificuldades, quer do ponto de vista computacional,</p><p>quer do ponto de vista matemático.</p><p>As próximas medidas apresentadas são as medidas de dispersão</p><p>mais utilizadas na estatística.</p><p>3.4.2 Variância (𝑠𝑠2)</p><p>Uma das maneiras de superar os impedimentos causados pelo fato</p><p>de o somatório dos desvios em relação à média ser nulo, é considerar o</p><p>quadrado deles.</p><p>Portanto, define-se a variância a média dos quadrados dos desvios</p><p>em relação à média.</p><p> Cálculo da variância para dados não agrupados, ou não</p><p>classificados:</p><p>𝑠𝑠2 = 1</p><p>𝑛𝑛 ∑(𝑥𝑥𝑖𝑖 − �̃�𝑥)2</p><p>𝑛𝑛</p><p>𝑖𝑖=1</p><p>Ou de forma mais simplificada:</p><p>𝑠𝑠2 = 1</p><p>𝑛𝑛 ∑ 𝑥𝑥𝑖𝑖</p><p>2 − �̅�𝑥2</p><p>𝑛𝑛</p><p>𝑖𝑖=1</p><p>A variância é expressa no quadrado da unidade dos dados, e por</p><p>este motivo, é comum que essa medida de dispersão perca o significado</p><p>concreto, sendo necessário recorrer de outra medida de dispersão, o desvio</p><p>padrão, o qual será versado mais à frente.</p><p>A variância é expressa no quadrado da unidade dos dados, e por este</p><p>motivo, é comum que essa medida de dispersão perca o significado concreto,</p><p>sendo necessário recorrer de outra medida de dispersão, o desvio padrão, o</p><p>qual será versado mais à frente.</p><p>	 Cálculo da variância para dados agrupados ou classificados:</p><p>Para dados agrupados em classes, a variância empírica, s2, é dada por</p><p>uma das seguintes expressões:</p><p>61</p><p> Cálculo da variância para dados agrupados ou classificados:</p><p>Para dados agrupados em classes, a variância empírica, 𝒔𝒔𝟐𝟐, é dada por uma</p><p>das seguintes expressões:</p><p>𝑠𝑠2 = 1</p><p>𝑛𝑛 ∑ (𝑐𝑐𝑖𝑖 − �̅�𝑥)2 𝑘𝑘</p><p>𝑖𝑖=1 = 1</p><p>𝑛𝑛 ∑ 𝑛𝑛𝑖𝑖</p><p>𝑘𝑘</p><p>𝑖𝑖=1 𝑐𝑐𝑖𝑖</p><p>2 − �̅�𝑥2</p><p>Ou, utilizando as frequências relativas:</p><p>𝑠𝑠2 = 1</p><p>𝑛𝑛 ∑ 𝑓𝑓𝑖𝑖(𝑐𝑐𝑖𝑖 − �̅�𝑥)2𝑘𝑘</p><p>𝑖𝑖=1 = 1</p><p>𝑛𝑛 ∑ 𝑓𝑓𝑖𝑖</p><p>𝑘𝑘</p><p>𝑖𝑖=1 𝑐𝑐𝑖𝑖</p><p>2 − �̅�𝑥2</p><p>Variância amostral corrigida (𝒔𝒔′𝟐𝟐)</p><p>A variância amostral definida anteriormente subestima a variância</p><p>populacional, ou seja, conduz, em média, os valores inferiores aos da variância</p><p>populacional, para corrigir esse enviesamento, basta redefinir a variância</p><p>dividindo a soma de quadrado dos desvios por 𝑛𝑛 − 1 , obtendo-se a</p><p>denominada variância amostral corrigida. Definida por:</p><p>𝑠𝑠′2 = 1</p><p>𝑛𝑛 − 1 ∑(𝑥𝑥1 − 𝑥𝑥 ̅)2</p><p>𝑛𝑛</p><p>𝑖𝑖=1</p><p>Ou</p><p>𝑠𝑠′2 = 1</p><p>𝑛𝑛 − 1 ∑ 𝑛𝑛𝑖𝑖 (𝑥𝑥𝑖𝑖</p><p>𝑘𝑘</p><p>𝑖𝑖=1</p><p>− �̅�𝑥)2</p><p>Quando os dados estiverem agrupados ou classificados, substitui-se 𝑥𝑥𝑖𝑖</p><p>por 𝑐𝑐𝑖𝑖.</p><p>3.4.3 Desvio padrão (𝑠𝑠) ou (𝑑𝑑𝑑𝑑)</p><p>É a medida de dispersão mais aplicada em análise estatística, e se</p><p>define como a raiz quadrada positiva da variância.</p><p>𝑠𝑠 = +√𝑠𝑠22</p><p>Ou, utilizando as frequências relativas:</p><p>61</p><p> Cálculo da variância para dados agrupados ou classificados:</p><p>Para dados agrupados em classes, a variância empírica, 𝒔𝒔𝟐𝟐, é dada por uma</p><p>das seguintes expressões:</p><p>𝑠𝑠2 = 1</p><p>𝑛𝑛 ∑ (𝑐𝑐𝑖𝑖 − �̅�𝑥)2 𝑘𝑘</p><p>𝑖𝑖=1 = 1</p><p>𝑛𝑛 ∑ 𝑛𝑛𝑖𝑖</p><p>𝑘𝑘</p><p>𝑖𝑖=1 𝑐𝑐𝑖𝑖</p><p>2 − �̅�𝑥2</p><p>Ou, utilizando as frequências relativas:</p><p>𝑠𝑠2 = 1</p><p>𝑛𝑛 ∑ 𝑓𝑓𝑖𝑖(𝑐𝑐𝑖𝑖 − �̅�𝑥)2𝑘𝑘</p><p>𝑖𝑖=1 = 1</p><p>𝑛𝑛 ∑ 𝑓𝑓𝑖𝑖</p><p>𝑘𝑘</p><p>𝑖𝑖=1 𝑐𝑐𝑖𝑖</p><p>2 − �̅�𝑥2</p><p>Variância amostral corrigida (𝒔𝒔′𝟐𝟐)</p><p>A variância amostral definida anteriormente subestima a variância</p><p>populacional, ou seja, conduz, em média, os valores inferiores aos da variância</p><p>populacional, para corrigir esse enviesamento, basta redefinir a variância</p><p>dividindo a soma de quadrado dos desvios por 𝑛𝑛 − 1 , obtendo-se a</p><p>denominada variância amostral corrigida. Definida por:</p><p>𝑠𝑠′2 = 1</p><p>𝑛𝑛 − 1 ∑(𝑥𝑥1 − 𝑥𝑥 ̅)2</p><p>𝑛𝑛</p><p>𝑖𝑖=1</p><p>Ou</p><p>𝑠𝑠′2 = 1</p><p>𝑛𝑛 − 1 ∑ 𝑛𝑛𝑖𝑖 (𝑥𝑥𝑖𝑖</p><p>𝑘𝑘</p><p>𝑖𝑖=1</p><p>− �̅�𝑥)2</p><p>Quando os dados estiverem agrupados ou classificados, substitui-se 𝑥𝑥𝑖𝑖</p><p>por 𝑐𝑐𝑖𝑖.</p><p>3.4.3 Desvio padrão (𝑠𝑠) ou (𝑑𝑑𝑑𝑑)</p><p>É a medida de dispersão mais aplicada em análise estatística, e se</p><p>define como a raiz quadrada positiva da variância.</p><p>𝑠𝑠 = +√𝑠𝑠22</p><p>64Estatística</p><p>Variância amostral corrigida (s′2)</p><p>A variância amostral definida anteriormente subestima a variância</p><p>populacional, ou seja, conduz, em média, os valores inferiores aos da variância</p><p>populacional, para corrigir esse enviesamento, basta redefinir a variância</p><p>dividindo a soma de quadrado dos desvios por n − 1, obtendo-se a denominada</p><p>variância amostral corrigida. Definida por:</p><p>61</p><p> Cálculo da variância para dados agrupados ou classificados:</p><p>Para dados agrupados em classes, a variância empírica, 𝒔𝒔𝟐𝟐, é dada por uma</p><p>das seguintes expressões:</p><p>𝑠𝑠2 = 1</p><p>𝑛𝑛 ∑ (𝑐𝑐𝑖𝑖 − �̅�𝑥)2 𝑘𝑘</p><p>𝑖𝑖=1 = 1</p><p>𝑛𝑛 ∑ 𝑛𝑛𝑖𝑖</p><p>𝑘𝑘</p><p>𝑖𝑖=1 𝑐𝑐𝑖𝑖</p><p>2 − �̅�𝑥2</p><p>Ou, utilizando as frequências relativas:</p><p>𝑠𝑠2 = 1</p><p>𝑛𝑛 ∑ 𝑓𝑓𝑖𝑖(𝑐𝑐𝑖𝑖 − �̅�𝑥)2𝑘𝑘</p><p>𝑖𝑖=1 = 1</p><p>𝑛𝑛 ∑ 𝑓𝑓𝑖𝑖</p><p>𝑘𝑘</p><p>𝑖𝑖=1 𝑐𝑐𝑖𝑖</p><p>2 − �̅�𝑥2</p><p>Variância amostral corrigida (𝒔𝒔′𝟐𝟐)</p><p>A variância amostral definida anteriormente subestima a variância</p><p>populacional, ou seja, conduz, em média, os valores inferiores aos da variância</p><p>populacional, para corrigir esse enviesamento, basta redefinir a variância</p><p>dividindo a soma de quadrado dos desvios por 𝑛𝑛 − 1 , obtendo-se a</p><p>denominada variância amostral corrigida. Definida por:</p><p>𝑠𝑠′2 = 1</p><p>𝑛𝑛 − 1 ∑(𝑥𝑥1 − 𝑥𝑥 ̅)2</p><p>𝑛𝑛</p><p>𝑖𝑖=1</p><p>Ou</p><p>𝑠𝑠′2 = 1</p><p>𝑛𝑛 − 1 ∑ 𝑛𝑛𝑖𝑖 (𝑥𝑥𝑖𝑖</p><p>𝑘𝑘</p><p>𝑖𝑖=1</p><p>− �̅�𝑥)2</p><p>Quando os dados estiverem agrupados ou classificados, substitui-se 𝑥𝑥𝑖𝑖</p><p>por 𝑐𝑐𝑖𝑖.</p><p>3.4.3 Desvio padrão (𝑠𝑠) ou (𝑑𝑑𝑑𝑑)</p><p>É a medida de dispersão mais aplicada em análise estatística, e se</p><p>define como a raiz quadrada positiva da variância.</p><p>𝑠𝑠 = +√𝑠𝑠22</p><p>Ou</p><p>61</p><p> Cálculo da variância para dados agrupados ou classificados:</p><p>Para dados agrupados em classes, a variância empírica, 𝒔𝒔𝟐𝟐, é dada por uma</p><p>das seguintes expressões:</p><p>𝑠𝑠2 = 1</p><p>𝑛𝑛 ∑ (𝑐𝑐𝑖𝑖 − �̅�𝑥)2 𝑘𝑘</p><p>𝑖𝑖=1 = 1</p><p>𝑛𝑛 ∑ 𝑛𝑛𝑖𝑖</p><p>𝑘𝑘</p><p>𝑖𝑖=1 𝑐𝑐𝑖𝑖</p><p>2 − �̅�𝑥2</p><p>Ou, utilizando as frequências relativas:</p><p>𝑠𝑠2 = 1</p><p>𝑛𝑛 ∑ 𝑓𝑓𝑖𝑖(𝑐𝑐𝑖𝑖 − �̅�𝑥)2𝑘𝑘</p><p>𝑖𝑖=1 = 1</p><p>𝑛𝑛 ∑ 𝑓𝑓𝑖𝑖</p><p>𝑘𝑘</p><p>𝑖𝑖=1 𝑐𝑐𝑖𝑖</p><p>2 − �̅�𝑥2</p><p>Variância amostral corrigida (𝒔𝒔′𝟐𝟐)</p><p>A variância amostral definida anteriormente subestima a variância</p><p>populacional, ou seja, conduz, em média, os valores inferiores aos da variância</p><p>populacional, para corrigir esse enviesamento, basta redefinir a variância</p><p>dividindo a soma de quadrado dos desvios por 𝑛𝑛 − 1 , obtendo-se a</p><p>denominada variância amostral corrigida. Definida por:</p><p>𝑠𝑠′2 = 1</p><p>𝑛𝑛 − 1 ∑(𝑥𝑥1 − 𝑥𝑥 ̅)2</p><p>𝑛𝑛</p><p>𝑖𝑖=1</p><p>Ou</p><p>𝑠𝑠′2 = 1</p><p>𝑛𝑛 − 1 ∑ 𝑛𝑛𝑖𝑖 (𝑥𝑥𝑖𝑖</p><p>𝑘𝑘</p><p>𝑖𝑖=1</p><p>− �̅�𝑥)2</p><p>Quando os dados estiverem agrupados ou classificados, substitui-se 𝑥𝑥𝑖𝑖</p><p>por 𝑐𝑐𝑖𝑖.</p><p>3.4.3 Desvio padrão (𝑠𝑠) ou (𝑑𝑑𝑑𝑑)</p><p>É a medida de dispersão mais aplicada em análise estatística, e se</p><p>define como a raiz quadrada positiva da variância.</p><p>𝑠𝑠 = +√𝑠𝑠22</p><p>Quando os dados estiverem agrupados ou classificados, substitui-se xi</p><p>por ci.</p><p>3.4.3 Desvio padrão (s) ou (dp)</p><p>É a medida de dispersão mais aplicada em análise estatística, e se</p><p>define como a raiz quadrada positiva da variância.</p><p>61</p><p> Cálculo da variância para dados agrupados ou classificados:</p><p>Para dados agrupados em classes, a variância empírica, 𝒔𝒔𝟐𝟐, é dada por uma</p><p>das seguintes expressões:</p><p>𝑠𝑠2 = 1</p><p>𝑛𝑛 ∑ (𝑐𝑐𝑖𝑖 − �̅�𝑥)2 𝑘𝑘</p><p>𝑖𝑖=1 = 1</p><p>𝑛𝑛 ∑ 𝑛𝑛𝑖𝑖</p><p>𝑘𝑘</p><p>𝑖𝑖=1 𝑐𝑐𝑖𝑖</p><p>2 − �̅�𝑥2</p><p>Ou, utilizando as frequências relativas:</p><p>𝑠𝑠2 = 1</p><p>𝑛𝑛 ∑ 𝑓𝑓𝑖𝑖(𝑐𝑐𝑖𝑖 − �̅�𝑥)2𝑘𝑘</p><p>𝑖𝑖=1 = 1</p><p>𝑛𝑛 ∑ 𝑓𝑓𝑖𝑖</p><p>𝑘𝑘</p><p>𝑖𝑖=1 𝑐𝑐𝑖𝑖</p><p>2 − �̅�𝑥2</p><p>Variância amostral corrigida (𝒔𝒔′𝟐𝟐)</p><p>A variância amostral definida anteriormente subestima a variância</p><p>populacional, ou seja, conduz, em média, os valores inferiores aos da variância</p><p>populacional, para corrigir esse enviesamento, basta redefinir</p><p>a variância</p><p>dividindo a soma de quadrado dos desvios por 𝑛𝑛 − 1 , obtendo-se a</p><p>denominada variância amostral corrigida. Definida por:</p><p>𝑠𝑠′2 = 1</p><p>𝑛𝑛 − 1 ∑(𝑥𝑥1 − 𝑥𝑥 ̅)2</p><p>𝑛𝑛</p><p>𝑖𝑖=1</p><p>Ou</p><p>𝑠𝑠′2 = 1</p><p>𝑛𝑛 − 1 ∑ 𝑛𝑛𝑖𝑖 (𝑥𝑥𝑖𝑖</p><p>𝑘𝑘</p><p>𝑖𝑖=1</p><p>− �̅�𝑥)2</p><p>Quando os dados estiverem agrupados ou classificados, substitui-se 𝑥𝑥𝑖𝑖</p><p>por 𝑐𝑐𝑖𝑖.</p><p>3.4.3 Desvio padrão (𝑠𝑠) ou (𝑑𝑑𝑑𝑑)</p><p>É a medida de dispersão mais aplicada em análise estatística, e se</p><p>define como a raiz quadrada positiva da variância.</p><p>𝑠𝑠 = +√𝑠𝑠22</p><p>O desvio padrão quantifica a dispersão das observações em relação à</p><p>média e, comparado com a variância, apresenta algumas vantagens, abaixo</p><p>descritas:</p><p>	 Assume valores menores;</p><p>	 É expresso na mesma unidade da variável;</p><p>	 É mais simples para interpretar.</p><p>65Estatística</p><p>Exemplo 3.7: Considere a medida de volume, em mililitros, da coleta de</p><p>água, de um laboratório de análise microbiológica de água, que faz o controle</p><p>de qualidade e potabilidade da água, coletou 8 amostras de água, de indústrias</p><p>de envase de água, que ficavam acondicionadas em recipientes de garrafas pet,</p><p>segundo o tempo vencimento do prazo de validade do recipiente.</p><p>Tabela 11 - Volume de água analisado acondicionadas em recipientes de</p><p>garrafas pet, segundo o tempo vencimento do prazo de validade do recipiente</p><p>Número do</p><p>recipiente</p><p>Tempo de acondicionamento após a validade do recipiente em dias</p><p>30 34 38 42 46</p><p>1 76,2 95,5 99,2 122,7 134,6</p><p>2 81,5 90,0 101,2 125,9 136,2</p><p>3 50,0 60,0 62,3 72,2 85,3</p><p>4 47,5 50,0 57,5 72,3 84,0</p><p>5 63,5 79,2 82,1 94,7 110,0</p><p>6 65,1 75,7 79,3 88,5 98,7</p><p>7 63,2 74,8 79,0 88,1 100,0</p><p>8 64,5 74,1 92,6 96,0 98,3</p><p>Fonte: Elaborada pela Autora (2021).</p><p>a) Pede-se identificar e classificar a variável em estudo.</p><p>A variável estatística é o volume, em mililitros, de água acondicionada</p><p>em recipientes de garrafas pet. A variável é quantitativa, e medida</p><p>numa escala de razão.</p><p>b) Definir para o tempo de 30 dias o valor da variância e do desvio padrão.</p><p>	O primeiro procedimento é calcular o valor da média conforme</p><p>aplicação da fórmula:</p><p>62</p><p>O desvio padrão quantifica a dispersão das observações em relação</p><p>à média e, comparado com a variância, apresenta algumas vantagens, abaixo</p><p>descritas:</p><p> Assume valores menores;</p><p> É expresso na mesma unidade da variável;</p><p> É mais simples para interpretar.</p><p>Exemplo 3.7: Considere a medida de volume, em mililitros, da coleta de água,</p><p>de um laboratório de análise microbiológica de água, que faz o controle de</p><p>qualidade e potabilidade da água, coletou 8 amostras de água, de indústrias de</p><p>envase de água, que ficavam acondicionadas em recipientes de garrafas pet,</p><p>segundo o tempo vencimento do prazo de validade do recipiente.</p><p>Tabela 11 - Volume de água analisado acondicionadas em recipientes de</p><p>garrafas pet, segundo o tempo vencimento do prazo de validade do recipiente</p><p>Número do</p><p>recipiente</p><p>Tempo de acondicionamento após a validade do recipiente em dias</p><p>30 34 38 42 46</p><p>1 76,2 95,5 99,2 122,7 134,6</p><p>2 81,5 90,0 101,2 125,9 136,2</p><p>3 50,0 60,0 62,3 72,2 85,3</p><p>4 47,5 50,0 57,5 72,3 84,0</p><p>5 63,5 79,2 82,1 94,7 110,0</p><p>6 65,1 75,7 79,3 88,5 98,7</p><p>7 63,2 74,8 79,0 88,1 100,0</p><p>8 64,5 74,1 92,6 96,0 98,3</p><p>Fonte: Elaborada pela Autora (2021).</p><p>a) Pede-se identificar e classificar a variável em estudo.</p><p>A variável estatística é o volume, em mililitros, de água acondicionada em</p><p>recipientes de garrafas pet. A variável é quantitativa, e medida numa escala de</p><p>razão.</p><p>b) Definir para o tempo de 30 dias o valor da variância e do desvio</p><p>padrão.</p><p> O primeiro procedimento é calcular o valor da média conforme</p><p>aplicação da fórmula:</p><p>�̅�𝑥 = 1</p><p>𝑛𝑛 ∑ 𝑥𝑥𝑥𝑥𝑛𝑛</p><p>𝑖𝑖=1 =</p><p>76,2+81,5+50,0+47,5+63,5+65,1+63,2+64,5</p><p>8 = 511</p><p>8 = 63,94</p><p>O segundo procedimento, para simplificar a elaboração dos cálculos,</p><p>deve-se construir uma tabela com os dados indispensáveis para determinar a</p><p>variância e o desvio padrão.</p><p>66Estatística</p><p>Tabela 12 – Cálculos auxiliares para a determinação das medidas de</p><p>recipiente</p><p>Número do recipiente</p><p>Tempo</p><p>(𝑥𝑖− 𝑥̅) (𝑥𝑖 − 𝑥̅)230 dias</p><p>1 76,2 76,2 - 63,94 = 12,26 (12,26)2=150,31</p><p>2 81,5 81,5 - 63,94 = 17,56 (17,56)2=308,35</p><p>3 50,0 50,0 – 63,94 = -13,94 (− 13,94)2=194,32</p><p>4 47,5 47,5 – 63,94 = -16,44 (− 16,44)2=270,27</p><p>5 63,5 63,5 – 63,94 = -0,44 (− 0,44)2=0,19</p><p>6 65,1 65,1 – 63,94 = 1,16 (1,16)2=1,34</p><p>7 63,2 63,2 – 63,94 = -0,74 (− 0,74)2=0,55</p><p>8 64,5 64,5 – 63,94 = 0,56 (0,56)2=o,31</p><p>- - - ∑ = 925,64</p><p>Fonte: Elaborada pela Autora (2021).</p><p>Com base nos valores da tabela 3.5, calcula-se a variância corrigida:</p><p>63</p><p> O segundo procedimento, para simplificar a elaboração dos</p><p>cálculos, deve-se construir uma tabela com os dados</p><p>indispensáveis para determinar a variância e o desvio padrão.</p><p>Tabela 12 – Cálculos auxiliares para a determinação das medidas de recipiente</p><p>Número do</p><p>recipiente</p><p>Tempo</p><p>(𝑥𝑥𝑖𝑖− �̅�𝑥)</p><p>(𝑥𝑥𝑖𝑖 − �̅�𝑥)2 30 dias</p><p>1 76,2 76,2 - 63,94 = 12,26 (12,26)2=150,31</p><p>2 81,5 81,5 - 63,94 = 17,56 (17,56)2=308,35</p><p>3 50,0 50,0 – 63,94 = -13,94 (−13,94)2=194,32</p><p>4 47,5 47,5 – 63,94 = -16,44 (−16,44)2=270,27</p><p>5 63,5 63,5 – 63,94 = -0,44 (−0,44)2=0,19</p><p>6 65,1 65,1 – 63,94 = 1,16 (1,16)2=1,34</p><p>7 63,2 63,2 – 63,94 = -0,74 (−0,74)2=0,55</p><p>8 64,5 64,5 – 63,94 = 0,56 (0,56)2=o,31</p><p>- - - ∑ = 925,64</p><p>Fonte: Elaborada pela Autora (2021).</p><p>Com base nos valores da tabela 3.5, calcula-se a variância corrigida:</p><p>𝑠𝑠′2 = 1</p><p>𝑛𝑛−1 ∑ (𝑥𝑥1 − 𝑥𝑥 ̅)2𝑛𝑛</p><p>𝑖𝑖=1 = 1</p><p>8−1 x 925,64 = 925,64</p><p>7 = 132,23</p><p>Para calcular o desvio padrão, deve-se extrair a raiz quadrada</p><p>positiva da variância. Os valores do desvio padrão, para os diferentes valores</p><p>de tempo de acondicionamento, são apresentados na Tabela a seguir.</p><p>Tabela 13 – Valores da variância e do desvio padrão, segundo o tempo de</p><p>acondicionamento da água</p><p>Tempo de</p><p>acondicionamento</p><p>Variância</p><p>𝑠𝑠′2</p><p>Desvio padrão</p><p>𝑠𝑠</p><p>30 132,23 √132,23 = 11,50</p><p>34 216,31 √216,31 = 14,71</p><p>38 254,36 √254,36 =15,95</p><p>42 406.88 √406,88 = 20,17</p><p>46 401,00 √401,00 = 20,02</p><p>Fonte: Elaborada pela Autora (2021).</p><p>Para calcular o desvio padrão, deve-se extrair a raiz quadrada positiva da</p><p>variância. Os valores do desvio padrão, para os diferentes valores de tempo de</p><p>acondicionamento, são apresentados na Tabela a seguir.</p><p>Tabela 13 – Valores da variância e do desvio padrão, segundo o tempo</p><p>de acondicionamento da água</p><p>Tempo de</p><p>acondicionamento</p><p>Variância</p><p>𝑠′2</p><p>Desvio padrão</p><p>𝑠</p><p>30 132,23 √132,23 = 11,50</p><p>34 216,31 √216,31 = 14,71</p><p>38 254,36 √254,36 =15,95</p><p>42 406.88 √406,88 = 20,17</p><p>46 401,00 √401,00 = 20,02</p><p>Fonte: Elaborada pela Autora (2021).</p><p>67Estatística</p><p>3.4.4 Coeficiente de variação (CV)</p><p>O coeficiente de variação é uma medida de dispersão relativa, que é dada</p><p>pela relação, em termos de percentuais, entre o desvio padrão (s) e a média da</p><p>variável (</p><p>62</p><p>O desvio padrão quantifica a dispersão das observações em relação</p><p>à média e, comparado com a variância, apresenta algumas vantagens, abaixo</p><p>descritas:</p><p> Assume valores menores;</p><p> É expresso na mesma unidade da variável;</p><p> É mais simples para interpretar.</p><p>Exemplo 3.7: Considere a medida de volume, em mililitros, da coleta de água,</p><p>de um laboratório de análise microbiológica de água, que faz o controle de</p><p>qualidade e potabilidade da água, coletou 8 amostras de água, de indústrias de</p><p>envase de água, que ficavam acondicionadas em recipientes de garrafas pet,</p><p>segundo o tempo vencimento do prazo de validade do recipiente.</p><p>Tabela 11 - Volume de água analisado acondicionadas em recipientes de</p><p>garrafas pet, segundo o tempo vencimento do prazo de validade do recipiente</p><p>Número do</p><p>recipiente</p><p>Tempo de acondicionamento após a validade do recipiente em dias</p><p>30 34 38 42 46</p><p>1 76,2 95,5 99,2 122,7 134,6</p><p>2 81,5 90,0 101,2 125,9 136,2</p><p>3 50,0 60,0 62,3 72,2 85,3</p><p>4 47,5 50,0 57,5 72,3 84,0</p><p>5 63,5 79,2 82,1 94,7 110,0</p><p>6 65,1 75,7 79,3 88,5 98,7</p><p>7 63,2 74,8 79,0 88,1 100,0</p><p>8 64,5 74,1 92,6 96,0 98,3</p><p>Fonte:</p><p>e classificações</p><p>sobre os dados que manipula. Deste modo, primeiro o indivíduo reúne informação</p><p>a partir de uma observação, para depois ordenar sistematicamente de forma</p><p>6Estatística</p><p>a conhecer o comportamento do conjunto dos elementos levantados. Este</p><p>tratamento é executado através de ferramentas específicas, oferecidas pelos</p><p>métodos estatísticos.</p><p>A Ciência Estatística utiliza-se de uma linguagem numérica, na qual faz</p><p>inferências a partir das uma parte (amostra), para o todo (população), a partir</p><p>do levantamento e do estudo do comportamento de dados relevantes, para</p><p>conhecer o comportamento de determinado fenômeno, e/ou planejar uma ação</p><p>ou estratégia.</p><p>1.3 Definição de Estatística</p><p>Diversas definições foram formuladas para as Ciências Estatísticas por</p><p>inúmeros autores. Contudo, o mais relevante, para a assimilação do argumento</p><p>usado, é identificar os aspectos comuns a grande parte destas definições.</p><p>Estatística é a Ciência que se ocupa da recolha e classificação de dados,</p><p>com a finalidade de, conhecer ou prever a evolução de determinado fenômeno</p><p>de massa ou coletivo, para a partir deste conhecimento, inferir possíveis novos</p><p>resultados. Neste contexto, pode-se afirmar que estatística é a ciência que se</p><p>ocupa de decisões num contexto de variabilidade e incerteza.</p><p>O estudo Estatístico pode ser feito de dois modos:</p><p>a) Investigando todos os elementos do conjunto de dados, que é a</p><p>População. A este método, dá-se o nome de Censo;</p><p>b) Investigando um subconjunto do conjunto de dados, ou da População,</p><p>ao qual denominamos conjunto amostral. A este método dá-se o nome</p><p>de pesquisa por Amostragem.</p><p>A Estatística pode ser compreendida como Ciência, e também como um</p><p>método de estudo exploratório. Há duas concepções para a palavra Estatística:</p><p>a) Estatísticas, grafada no plural, significa qualquer coleção consistente de</p><p>dados numéricos, agrupados com o propósito de fornecer informações</p><p>acerca de uma atividade qualquer. A título de exemplo, as estatísticas</p><p>demográficas referem-se aos dados numéricos sobre o Censo</p><p>Demográfico. Neste caso, refere-se aos resultados;</p><p>7Estatística</p><p>b) Estatística grafada no singular refere-se à metodologia aplicada na coleta,</p><p>tabulação, análise, apresentação e interpretação dos dados coletados,</p><p>para conhecer determinado fenômeno, para obter melhor compreensão</p><p>das situações que representam, e auxiliar nas tomadas de decisões.</p><p>Atualmente, a estatística é amplamente adotada nas ciências exatas e da</p><p>terra, ciências humanas, ciências biológicas e médicas, e nas engenharias,</p><p>bem como na administração pública e privada.</p><p>1.4 Divisão da Estatística</p><p>A Estatística é dividida em dois grupos: Estatística Descritiva e Estatística</p><p>Indutiva.</p><p>1.4.1 Estatística Descritiva</p><p>A estatística descritiva visa resumir e apresentar os dados observados,</p><p>através de quadros, gráficos ou índices numéricos que possibilitem a sua</p><p>interpretação.</p><p>Portanto, para que as informações sejam reduzidas ao nível da capacidade</p><p>de interpretação compreensível, estatística descritiva vai agrupar as informações</p><p>coletadas através do uso das medidas-resumo, que proporcional à interpretação</p><p>dos resultados.</p><p>No sentido mais amplo, suas funções são: coleta de dados; organização e</p><p>classificação destes dados; apresentação através de gráficos e tabelas; cálculo de</p><p>coeficientes (estatísticos), que permitem descrever resumidamente os fenômenos.</p><p>1.5 Fase do método estatístico</p><p>Para se proceder à realização de um trabalho estatístico, ter-se-á de</p><p>considerar as seguintes etapas:</p><p>8Estatística</p><p>Podemos distinguir no método estatístico as seguintes fases:</p><p>Diagrama 1 - Fases do método estatístico</p><p>Fonte: Elaborado pela Autora (2021).</p><p>1.5.1 Definição do problema e o público-alvo da pesquisa</p><p>Algumas questões devem ser levantadas para nortear a recolha de</p><p>dados:</p><p>a) O que se deseja saber?</p><p>b) Quais informações são necessárias para alcançar os objetivos da</p><p>investigação?</p><p>c) Quais inquirições mais apropriadas que viabilize respostas</p><p>pertinentes?</p><p>d) Quais os objetivos para cada questionamento?</p><p>e) A quem eu devo perguntar e como eu devo perguntar?</p><p>Este delineamento prévio é determinante para responder o problema de</p><p>pesquisa, e também é imprescindível delimitar o público-alvo da pesquisa.</p><p>9Estatística</p><p>1.5.2 Planejamento da pesquisa</p><p>Uma investigação empírica (pura ou aplicada) inicia-se a partir da revisão</p><p>da literatura existente sobre a temática de interesse. Somente após conhecer o</p><p>que diz a literatura, ou as publicações sobre a temática, é que se pode estabelecer</p><p>uma hipótese, para, a partir de então, operacionalizar e selecionar os métodos</p><p>de investigação, para posteriormente passar para as etapas seguintes, que é a</p><p>recolha, ordenação, análise dos dados, e a apresentação dos resultados.</p><p>1.5.3 Método de recolha de dados</p><p>Na primeira etapa, a recolha dos dados, é fundamental em qualquer trabalho</p><p>investigativo, que se for feita de maneira inadequada, pode comprometer toda a</p><p>evolução do trabalho prejudicando assim o resultado.</p><p>O método de recolha é decidido de acordo com o tipo de estudo que se</p><p>pretende desenvolver:</p><p>a) Para os estudos experimentais, a recolha é feita a partir da observação</p><p>e registro dos dados resultantes da realização de uma experiência;</p><p>b) Para o estudo observacional, a recolha pode ser feita de diversas</p><p>formas: observação de registros existentes (publicações científicas,</p><p>registros documentais, registos em sites governamentais) ou através</p><p>de aplicação de inquéritos, que pode assumir diversos modelos</p><p>(questionário autoadministrado e entrevistas), sendo estes os meios</p><p>mais praticados na coleta de dados em Ciências Sociais e Humanas,</p><p>e também na área da Educação e da Saúde.</p><p>1.5.4 Apresentação, caracterização e Análise dos Resultados</p><p>Com o tratamento estatístico pretende-se evidenciar as principais</p><p>características das variáveis de interesse. Portanto, uma apresentação</p><p>que possibilite uma leitura e interpretação rápida e inequívoca das principais</p><p>características é fundamental.</p><p>10Estatística</p><p>Os dados são usualmente apresentados sob a forma gráfica ou tabular.</p><p>A representação gráfica permite uma leitura mais rápida ainda que global. A</p><p>apresentação dos dados feita através de tabelas de frequências possibilita uma</p><p>leitura mais pormenorizada ainda que mais demorada. É nesta fase que poderão</p><p>ser detectados valores anormais correspondendo aos erros no processo de</p><p>recolha ou de registro. A detecção destes erros é fundamental, pois eles poderão</p><p>afetar profundamente a análise posterior.</p><p>A existência de valores em falta ou omissos é frequente em muitos</p><p>estudos. Estes valores poderão pôr em causa a representatividade da amostra,</p><p>comprometendo a possibilidade de inferir para a população, tornando muito</p><p>importante a realização de estudos de distinção dos valores omissos.</p><p>A opção pelas diferentes técnicas estatísticas, para a apresentação e</p><p>caracterização dos dados, está naturalmente associada, quer aos objetivos do</p><p>estudo, quer à natureza das variáveis.</p><p>1.5.5 Elaboração do Relatório de Estudo</p><p>A fase final consiste na redação de um relatório no qual se apresentam</p><p>os objetivos do estudo, a metodologia e as principais conclusões. Devem ser</p><p>mencionadas as limitações e insuficiências detectadas, como também as</p><p>recomendações para contorná-las em futuros estudos sobre o problema em</p><p>análise. E finalmente, deve-se apresentar possíveis propostas de prosseguir</p><p>com o trabalho desenvolvido.</p><p>Resumo</p><p>Um dos aspectos importantes na pesquisa estatística refere-se à habilidade</p><p>de coletar, tabular e interpretar os dados estatísticos. Nesta primeira Unidade,</p><p>buscou-se que se compreendesse a relevância do planejamento, a natureza</p><p>e a metodologia envolvida em uma investigação estatística, implementando</p><p>argumentos que conduzisse ao modelo de um plano para a coleta de dados.</p><p>Isso inclui em primeiro plano, conhecer os primeiros conceitos, e familiarizar-se</p><p>11Estatística</p><p>com as fases do planejamento estatístico. O que compreende desenvolver um</p><p>Elaborada pela Autora (2021).</p><p>a) Pede-se identificar e classificar a variável em estudo.</p><p>A variável estatística é o volume, em mililitros, de água acondicionada em</p><p>recipientes de garrafas pet. A variável é quantitativa, e medida numa escala de</p><p>razão.</p><p>b) Definir para o tempo de 30 dias o valor da variância e do desvio</p><p>padrão.</p><p> O primeiro procedimento é calcular o valor da média conforme</p><p>aplicação da fórmula:</p><p>�̅�𝑥 = 1</p><p>𝑛𝑛 ∑ 𝑥𝑥𝑥𝑥𝑛𝑛</p><p>𝑖𝑖=1 =</p><p>76,2+81,5+50,0+47,5+63,5+65,1+63,2+64,5</p><p>8 = 511</p><p>8 = 63,94 ).</p><p>64</p><p>3.4.4 Coeficiente de variação (𝐶𝐶𝐶𝐶)</p><p>O coeficiente de variação é uma medida de dispersão relativa, que é</p><p>dada pela relação, em termos de percentuais, entre o desvio padrão (𝑠𝑠) e a</p><p>média da variável (�̅�𝑥).</p><p>𝐶𝐶𝐶𝐶 = 𝑠𝑠</p><p>�̅�𝑥 x 100%</p><p>Resumo</p><p>A Unidade abordou as medidas estatísticas adequadas à descrição de</p><p>conjuntos de dados. Designadas por parâmetros ou por estatísticas, consoante</p><p>se refiram à população ou à amostra. Respectivamente, tais medidas estão</p><p>dispostas em quatro grupos distintos: medidas de localização, ou tendência</p><p>central: média aritmética, mediana e moda; medidas de dispersão absoluta:</p><p>amplitude do intervalo de variação e amplitude interquartis, desvio médio</p><p>absoluto, variância, desvio padrão e coeficiente de variação; medidas de</p><p>assimetria, medidas de achatamento ou curtose. No entanto, nem todas as</p><p>medidas estatísticas são adequadas à descrição de conjuntos de dados. Elas</p><p>devem ser escolhidas em função da natureza das variáveis, da sua escala de</p><p>medida e dos objetivos do estudo.</p><p>Resumo</p><p>A Unidade abordou as medidas estatísticas adequadas à descrição de conjuntos</p><p>de dados. Designadas por parâmetros ou por estatísticas, consoante se refiram</p><p>à população ou à amostra. Respectivamente, tais medidas estão dispostas em</p><p>quatro grupos distintos: medidas de localização, ou tendência central: média</p><p>aritmética, mediana e moda; medidas de dispersão absoluta: amplitude do</p><p>intervalo de variação e amplitude interquartis, desvio médio absoluto, variância,</p><p>desvio padrão e coeficiente de variação; medidas de assimetria, medidas de</p><p>achatamento ou curtose. No entanto, nem todas as medidas estatísticas são</p><p>adequadas à descrição de conjuntos de dados. Elas devem ser escolhidas em</p><p>função da natureza das variáveis, da sua escala de medida e dos objetivos do</p><p>estudo.</p><p>68Estatística</p><p>Referências</p><p>BUSSAB, Wilton de O; MORETTIN, Pedro A. Estatística Básica. 8.ed. São</p><p>Paulo: Saraiva, 2013. 484 p.</p><p>CRESWELL, John W. CLARK, Vicki L. Plano. Pesquisa de métodos mistos.</p><p>2.ed. Porto Alegre: Penso, 2013. 288p.</p><p>CUNHA, Gilda; MARTINS, M.ª do Rosário; SOUSA, Ricardo; OLIVEIRA, Felipa</p><p>Ferraz de. Estatística aplicada às ciências sociais. Lisboa: Lidel, 2007. 179p.</p><p>MELLO, Francisco Mercês de. Dicionário de estatística. 1.ed. Lisboa: Sílabo,</p><p>2014. 311 p.</p><p>HILL, Manuela Magalhães; HILL, Andrew. Investigação por questionário.</p><p>2.ed. rev., e corr. Lisboa: Silabo, 2012. 377 p.</p><p>REIS, Elizabeth; MELO, Paulo; ANDRADE, Rosa; CALAPEZ, Teresa.</p><p>Estatística aplicada. 4.ed. rev. Lisboa: Sílabo, 2008. 322 p.2v.</p><p>REIS, Elizabeth; MELO, Paulo; ANDRADE, Rosa; CALAPEZ, Teresa. Exercícios:</p><p>Estatística aplicada.1. ed. Lisboa: Sílabo, 2008. 275 p.2v.</p><p>VIEIRA, Sonia. Estatística básica. 1.ed. São Paulo: Cengage Learning, 2015.</p><p>176 p.</p><p>questionamento ao qual se deseja uma resposta efetiva, planejar o método de</p><p>recolha da informação, organizar e analisar os dados coletados, para posterior</p><p>interpretação, discussão e publicação dos resultados.</p><p>Referências</p><p>CUNHA, Gilda; MARTINS, M.ª do Rosário; SOUSA, Ricardo; OLIVEIRA, Felipa</p><p>Ferraz de. Estatística aplicada às ciências sociais. Lisboa: Lidel, 2007. 179p.</p><p>CRESWELL, John W; CLARK, Vicki L. Plano. Pesquisa de métodos mistos.</p><p>2.ed. Porto Alegre: Penso, 2013. 288 p.</p><p>HILL, Manuela Magalhães; HILL, Andrew. Investigação por questionário. 2.ed.</p><p>rev., e corr. Lisboa: Silabo, 2012. 377 p.</p><p>MELLO, Francisco Mercês de. Dicionário de estatística. 1.ed. Lisboa: Sílabo,</p><p>2014. 311 p.</p><p>12Estatística</p><p>Identificar a diferença entre os conceitos de amostra e população;</p><p>Diferenciar os métodos estatísticos para a identificação e qualificação das</p><p>variáveis;</p><p>Demonstrar o resultado da investigação estatística através da elaboração</p><p>de tabelas e gráficos.</p><p>CONCEITOS E MÉTODOS APLICADOS À</p><p>ESTATÍSTICA DESCRITIVA</p><p>Objetivos:</p><p>UNIDADE</p><p>2</p><p>2.1 População ou Universo</p><p>P opulação ou Universo é qualquer conjunto de elementos, não</p><p>necessariamente de pessoas, que constituem todo o universo de</p><p>informações de que se necessita, cujos atributos, que são as características</p><p>da população, são objetos de um determinado estudo estatístico. Ou ainda,</p><p>População ou Universo é o conjunto que pode ser finito ou infinito, de indivíduos</p><p>ou objetos, que exibem particularidades comuns (atributos), cujo comportamento</p><p>é de interesse do pesquisador, com o propósito de explorar e fazer inferências</p><p>sobre o fenômeno estudado, a partir dos dados analisados.</p><p>Exemplo 2.1: um biólogo que desenvolve um estudo sobre uma espécie</p><p>de bromélia endêmica da Amazônia, a População corresponde a todas as</p><p>bromélias desta espécie, que nascem nesta região.</p><p>Exemplo 2.2: uma fábrica deseja saber o número de peças defeituosas</p><p>em determinado lote, a população corresponde a todas as peças fabricadas</p><p>deste lote.</p><p>Note que o conceito de população depende do objetivo do estudo.</p><p>13Estatística</p><p>2.2 Amostra</p><p>A amostra é um subconjunto extraído da População, e desta, representativa</p><p>nas características em estudo.</p><p>Exemplo 2.3: se em uma indústria de lâmpadas deseja conhecer o tempo</p><p>de durabilidade do seu produto, não é conveniente que se teste todos os lotes</p><p>fabricados, pois as lâmpadas seriam testadas até queimarem, portanto colhe-</p><p>se uma amostra da produção e testa-se, a fim de inferir o resultado para toda a</p><p>produção (População).</p><p>Por conseguinte, busca-se uma amostra dessa população, significa coletar</p><p>a amostra somente peças do lote produzido.</p><p>Quando se faz um levantamento amostral, existem algumas características</p><p>de interesse (variáveis de interesse) na População de onde a amostra é coletada.</p><p>Exemplo 2.4: deseja-se estudar o índice de massa corporal (IMC) de</p><p>pacientes de uma clínica médica, toma-se uma amostra dessa população, e</p><p>mede-se a altura e o peso de cada paciente, já que o IMC é calculado como</p><p>uma razão entre o peso e o quadrado da altura do indivíduo.</p><p>Nesse caso, o peso e a altura desses alunos são as variáveis de interesse.</p><p>Diagrama 2 - Coleta amostral a partir do conjunto populacional</p><p>Fonte: Elaborado pela Autora (2021).</p><p>ELEMENTOS</p><p>POPULACIONAIS</p><p>POPULAÇÃO AMOSTRA</p><p>ELEMENTOS</p><p>AMOSTRAIS</p><p>14Estatística</p><p>2.3 Variável e atributo</p><p>2.3.1 Atributo</p><p>Atributo é uma característica de uma população. Pode ser quantitativo,</p><p>quando é mensurável, e qualitativa se não mensurável, isto é, não pode ser</p><p>expressa através de números. Sempre que a resposta for binária, têm-se um</p><p>resultado atributivo.</p><p>Exemplo 2.5: quente-frio; cheio-vazio; sim-não; pouco-muito; alto-baixo;</p><p>claro- escuro.</p><p>Se o resultado for numérico, o resultado é variável, se for binário, o</p><p>resultado é atributivo.</p><p>2.3.2 Variável</p><p>Variável é qualquer característica de interesse de estudo, que apresenta</p><p>valores não constantes, e é medida em cada elemento da amostra ou população,</p><p>podendo ter valores numéricos ou não numéricos.</p><p>Diagrama 3 - Classificação das variáveis</p><p>Fonte: Elaborado pela Autora (2021).</p><p>QUANTITATIVAS</p><p>DISCRETAS</p><p>VARIÁVEIS QUANTITATIVAS</p><p>CONTÍNUAS</p><p>DISCRETAS</p><p>15Estatística</p><p>De acordo com os valores que uma variável pode assumir, ela pode ser</p><p>classificada como quantitativa ou qualitativa.</p><p>2.3.3 Variável quantitativa</p><p>Uma variável se diz quantitativa, quando os valores que pode assumir são</p><p>valores numéricos.</p><p>Dentro das variáveis quantitativas, podemos ainda realizar uma subdivisão</p><p>em dois grupos, qualificando as variáveis quantitativas em quantitativa discreta</p><p>ou quantitativa contínua.</p><p>	 Uma variável quantitativa contínua é uma variável que assume</p><p>todos os números infinitos não numeráveis de valores, pois tomam</p><p>todos os valores num certo intervalo, ou numa união de intervalos.</p><p>Exemplo 2.6: precipitação atmosférica; temperatura; peso; altura;</p><p>velocidade; deslocamento de um corpo.</p><p>	 Uma variável quantitativa discreta expressa o valor de uma contagem.</p><p>Uma variável aleatória diz-se discreta, se o número de valores possíveis</p><p>para esta variável for finito, ou infinito numerável.</p><p>Exemplo 2.7: número de peças com defeito em uma linha de produção;</p><p>número de faces voltadas para cima em quatro lançamentos de uma moeda;</p><p>quantidade alunos que compareceram para realizar o exame do ENEM; número</p><p>de habitantes de uma cidade.</p><p>2.3.4 Variável qualitativa</p><p>Uma variável diz-se qualitativa, se os seus valores descritos correspondem</p><p>a classes de nomes. São as variáveis que medem a qualidade do indivíduo, e</p><p>pode ser separada por categorias de nomes.</p><p>16Estatística</p><p>Exemplo 2.8: sexo - masculino ou feminino; nível de escolaridade - nível</p><p>fundamental, médio ou superior; grau de satisfação - baixa, média, alta.</p><p>Quanto às variáveis qualitativas podemos considerar a classe das</p><p>variáveis qualitativas nominais e das variáveis qualitativas ordinais. Observe:</p><p>	 A variável qualitativa ordinal é aquela que separa os indivíduos</p><p>em classes com uma determinada ordem, por exemplo, nível</p><p>de escolaridade: fundamental, médio e superior. Percebe-se um</p><p>encadeamento de ordem nessas classes;</p><p>	 A variável qualitativa nominal, é a discrimina os indivíduos em classes,</p><p>porém não é possível estabelecer uma ordem, por exemplo, sexo</p><p>(masculino e feminino) e nacionalidade (brasileira, argentina, chilena…).</p><p>Para se proceder a uma classificação adequada das variáveis, é</p><p>fundamental a escolha sobre a forma como se pretende relacionar as variáveis,</p><p>ou seja, é importante escolher a escala de medição para cada variável a tratar.</p><p>2.4 Escala</p><p>Do latim scada, traduz uma relação entre objetos. A compreensão mais</p><p>profunda sobre esta abordagem é facilitada através da verificação dos quatro</p><p>tipos de escalas de medição: nominal, ordinal, intervalo e razão.</p><p>As diversas escalas de medidas diferem muito no que diz respeito às</p><p>operações matemáticas que, com elas, são possíveis realizar. Este fator torna</p><p>a escolha mais exigente e criteriosa, sendo necessário ter presente a utilidade</p><p>de cada escala face ao objetivo da análise e ponderando as suas principais</p><p>limitações.</p><p>17Estatística</p><p>Figura 1 - Tipos de Escalas de Medição</p><p>Fonte: Elaborada pela Autora (2021).</p><p>Figura 2 - Exemplos de Aplicações</p><p>Fonte: Elaborada pela Autora (2021).</p><p>2.5 Dados</p><p>Quem pretende tomar decisões ou efetuar estudos, começa normalmente</p><p>por recolher os elementos que lhes parecem relevantes. Portanto, a obtenção,</p><p>reunião e registro sistemático deste elemento, com um propósito fixo, e com</p><p>a escolha da fonte de obtenção destas informações, que está diretamente</p><p>relacionado ao tipo do problema, escala de execução e disponibilidade de tempo</p><p>e recursos. Estes elementos recolhidos depois de compilados e passam a ser</p><p>nomeados dados.</p><p>Escala</p><p>nominal</p><p>Escala</p><p>ordinal</p><p>Escala</p><p>intervalar</p><p>Escala</p><p>de razão</p><p>É uma escala categórica, o que significa que uma</p><p>variável medida nesta escala, só poderá assumir valores</p><p>que correspondem a categorias de nomes.</p><p>É uma variável que assume igualmente</p><p>categorias</p><p>de nomes, no entanto, entre elas se estabelece uma</p><p>ordenação.</p><p>Com as mesmas características das escalas nominal e</p><p>ordinal, esta acrescenta a possibilidade de se determinar</p><p>a distância os diferentes pontos da escala.</p><p>Difere das demais na medida em que acrescenta às</p><p>suas características, o zero absoluto. Nesta escala, o</p><p>zero corresponde ausência da característica a medir.</p><p>Escala</p><p>nominal</p><p>Escala</p><p>intervalar</p><p>Escala</p><p>ordinal Escala de</p><p>razão</p><p>Gênero:</p><p>masculino</p><p>feminino</p><p>Resultado</p><p>de um teste:</p><p>aprovado</p><p>Nível de</p><p>pluviosidade:</p><p>baixo normal</p><p>elevado</p><p>Pressão</p><p>atmosférica</p><p>Temperatur</p><p>a: escala</p><p>Celsius</p><p>escala</p><p>Fahrenheit</p><p>Escala de Likert: onde as</p><p>respostas são definidas</p><p>pelos</p><p>Razão entre peso e</p><p>altura para medir o</p><p>índice de massa corporal</p><p>Peso de dois</p><p>indivíduos</p><p>18Estatística</p><p>2.5.1 Classificação dos dados</p><p>	 Dados agrupados ou classificados: quando o número de elementos é</p><p>elevado, o estabelecimento da distribuição de frequências de variáveis</p><p>contínuas implica a definição de classes para a variável em estudo</p><p>cada classe caracteriza-se pelos seus limites, pela sua amplitude e</p><p>pelo centro da classe ou ponto médio.</p><p>	 Dados discretos: são dados quantitativos que podem tomar um</p><p>número finito ou infinito numerável de valores.</p><p>	 Dados numéricos: Designação referente a dados de natureza</p><p>quantitativa.</p><p>	 Dados temporais ou cronológicos: são dados de observações que</p><p>se referem a uma mesma entidade para vários momentos ou período.</p><p>	 Dados contínuos: são dados quantitativos que podem tomar um</p><p>número infinito não numerável de valores.</p><p>	 Dados censurados: são dados que ocorrem quando, por exemplo,</p><p>se procuram determinar valores laboratoriais com métodos que só</p><p>detenham níveis acima de determinado valor. Podem ser censurados</p><p>à direita ou à esquerda.</p><p>	 Dados seccionais: são dados de observações que dizem respeito a</p><p>determinadas entidades em certo momento ou período.</p><p>	 Dados de painel: são que se referem a várias entidades e a vários</p><p>momentos ou período temporal.</p><p>2.6 Planejamento para coleta de dados</p><p>A amostra para ser representativa da população, deverá ser coletada</p><p>depois de um prévio planejamento, evitando assim, erros que possam provocar</p><p>prejuízos à investigação. Portanto, faz-se necessário o levantamento de algumas</p><p>questões objetivas:</p><p>19Estatística</p><p>a) Qual o questionamento a ser respondido?</p><p>b) Qual a melhor forma de comunicar a resposta obtida?</p><p>c) Qual ferramenta de análise utilizar, que seja mais apropriada na análise</p><p>do dado?</p><p>d) Como levantar os dados com o mínimo de esforço e erro?</p><p>e) Como e onde levantar os dados?</p><p>f) Quem pode fornecer as informações desejadas?</p><p>g) Qual o período temporal em que os dados serão coletados?</p><p>Após responder a todos estes questionamentos, o pesquisador deverá:</p><p>a) Construir uma metodologia que assegure que todas as questões</p><p>estão definidas;</p><p>b) Coletar os dados de forma consistente e honesta;</p><p>c) Certificar-se de que existe tempo hábil para a coleta de dados;</p><p>d) Definir quais informações adicionais serão necessárias para estudos</p><p>futuros, referências ou reconhecimento.</p><p>Portanto, neste processo há uma retroalimentação de informações, e todas</p><p>as pesquisas descortinam horizontes para novas investigações:</p><p>Diagrama 4 - Planejamento investigativo</p><p>Fonte: Elaborado pela Autora (2021).</p><p>HIPÓTESES DADOS</p><p>ANÁLISESCOMUNICAÇÃO</p><p>Levantamento de Hipótese</p><p>Descrição do problema;</p><p>Pergunta e hipótese levantada.</p><p>Planejamento e coleta de</p><p>dados</p><p>Coleta qualificada de dados</p><p>relevantes para testar a</p><p>hipótese</p><p>Resultados obtidos</p><p>Exposição e avaliação dos</p><p>resultados</p><p>Análise de dados</p><p>Descrição e análise de dados</p><p>coletados</p><p>.</p><p>..</p><p>20Estatística</p><p>2.7 A coleta de dados</p><p>Coleta de dados busca reunir dados após o planejamento do trabalho</p><p>pretendido, bem como definição da periodicidade da coleta: contínua, periódica,</p><p>ocasional ou indireta.</p><p>A coleta de dados numéricos pode ser direta ou indireta.</p><p>2.7.1 Coleta direta de dados</p><p>É feita sobre elementos informativos de registro obrigatório: nascimentos</p><p>e óbitos, censos demográficos e escolares, ou ainda, quando os dados são</p><p>coletados, utilizando como instrumento de recolha, inquéritos e questionários.</p><p>A coleta direta de dados pode ser classificada relativamente ao fator</p><p>tempo em:</p><p>a) contínua (registro) – quando feita continuamente, tal como a de</p><p>nascimentos e óbitos e registro de presença dos funcionários de uma</p><p>empresa;</p><p>b) periódica – quando feita em intervalos constantes de tempo, como os</p><p>censos que acontece a cada 10 anos, e as avaliações periódicas dos</p><p>discentes;</p><p>c) ocasional – quando feita eventualmente, a fim de atender a uma</p><p>conjuntura, uma emergência social, como no caso das epidemias.</p><p>2.7.2 Coleta indireta de dados</p><p>A coleta se diz indireta quando é auferida de fontes secundárias de</p><p>informações, quando os dados já foram coletados e apresentados por alguma</p><p>instituição fidedigna, já coletadas e publicadas, ou do prévio conhecimento de</p><p>fenômenos vinculados ao fenômeno estudado. Como exemplo, como exemplo</p><p>21Estatística</p><p>pode-se elencar o índice de violência urbana, pesquisas que se utilize de dados</p><p>socioeconômicos, que se utilizam os sites oficiais governamentais.</p><p>2.8 Crítica dos Dados</p><p>Coletados os dados, os mesmos devem ser diligentemente criticados, à</p><p>procura de inconsistências, para evitar erros que possam afetar os resultados.</p><p>2.9 Apuração dos Dados</p><p>A apuração dos dados é a soma e o processamento dos dados colhidos,</p><p>e sua ordenação mediante seus parâmetros de classificação, que pode ser</p><p>executado manualmente, ou com recursos tecnológicos.</p><p>2.10 Exposição ou Apresentação dos Dados</p><p>Mesmo que o objetivo seja diverso, os dados devem ser apresentados</p><p>de acordo com a sua pertinência técnica, por meio de tabelas ou gráficos,</p><p>proporcionando clareza e facilidade de compreensão dos resultados das medidas</p><p>estatísticas auferidas.</p><p>2.11 Análise dos resultados</p><p>A finalidade do levantamento estatístico é apurar informações que possi-</p><p>bilite alcançar elucidações sobre uma determinada população, com base no seu</p><p>estudo amostral. Deste modo, ao proceder com todas as etapas metodológicas</p><p>de recolha e tabulação dos dados, executa-se a análise dos resultados obtidos,</p><p>por meio dos métodos da estatística indutiva ou inferencial, que tem por base a</p><p>conclusão lógica ou dedução, para a partir da amostra, formular conclusões ou</p><p>previsões para a população.</p><p>22Estatística</p><p>2.12 Série Estatística</p><p>Série estatística é toda tabela que apresenta a distribuição de um conjunto</p><p>de dados quantitativos em função do tempo, do lugar, ou da categoria (fenômeno).</p><p>Podem identificadas como séries históricas ou cronológicas, geográficas,</p><p>específicas ou categóricas. Observe:</p><p>	 Séries específicas ou categóricas: os valores da variável, em</p><p>determinado tempo e local, são classificados segundo especificações</p><p>ou categorias;</p><p>	 Série temporal ou cronológica, sucessão cronológica ou de</p><p>marca: caracterizam os valores do estudo da variável em determinado</p><p>espaço, época, agrupados segundo os intervalos de tempos variáveis.</p><p>Dado que a palavra série se refere à soma dos termos de uma sucessão</p><p>infinita, optou-se por expressão sucessão cronológica, de maior rigor matemático.</p><p>É um conjunto dados (x1, x2, … , xn), observados em momentos ou períodos</p><p>sucessivos (t1, t2, … , tn), durante um certo intervalo.</p><p>Exemplo 2.9: A sucessão de valores do índice de preços ao consumidor</p><p>(IPCA), a evolução do Produto Interno Bruto (PIB), os valores mensais de</p><p>precipitação, a temperatura média diária durante um dado mês.</p><p>	 Série Geográfica: apresenta como elemento variável o elemento</p><p>geográfico. O tempo e a categoria são variáveis fixas. Também é</p><p>chamada de espacial, territorial ou de localização. Descrevem os valores</p><p>de variáveis que acontecem em local, região e tempo específicos,</p><p>discriminados segundo regiões.</p><p>	 Série Específica: o caráter variável é a ocorrência ou categoria.</p><p>Também é chamada de série categórica.</p><p>Exemplo 2.10: exportação do agronegócio por tipo de produto;</p><p>grupo de</p><p>público por campanha de imunização governamental; público dos estádios por</p><p>séries do campeonato brasileiro.</p><p>23Estatística</p><p>Nas séries específicas, os registros das ocorrências não consideram as</p><p>variações de espaço e tempo.</p><p>	 Série Conjugada: é a apresentação de duas ou mais séries de modo</p><p>conjugado, existindo duas ordens de classificação: uma horizontal e</p><p>outra vertical. Séries conjugadas ou tabela de dupla entrada é uma</p><p>conjugação de duas ou mais séries, valores de mais de uma variável.</p><p>Observa-se que há uma combinação entre a série geográfica e a série</p><p>histórica, que deriva a série geográfico-histórica ou geográfico-temporal. Ainda</p><p>é possível, mesmo que raro, pela complexidade de representação, séries</p><p>compostas de três ou mais entradas.</p><p>2.13 Apresentação dos Dados</p><p>A apresentação dos dados consiste em uma técnica de sintetizar os dados</p><p>através da sua descrição ou agrupamento. A sistemática compreende resumir e</p><p>tabular os dados, que no primeiro momento, o de recolha, é coletado de forma</p><p>desordenado. A apresentação dos dados tem o objetivo de consubstanciar o</p><p>conjunto de informações auferido, viabilizando o discernimento comportamental</p><p>do fenômeno na sua totalidade.</p><p>Os dados podem ser apresentados em forma de tabelas, apresentação</p><p>gráficas e diagramas.</p><p>2.13.1 Apresentação Tabular</p><p>A apresentação tabular facilita a compreensão do fenômeno em estudo,</p><p>uma vez que apresenta os dados de modo resumido, disponibilizando o cenário</p><p>global do comportamento dos mesmos. O método diz respeito às demonstrações</p><p>numéricas dos dados, que consiste em dispor os dados em linhas e colunas</p><p>distribuídos ordenadamente, seguindo regras específicas adotadas pela</p><p>Associação Brasileira de Normas e Técnicas (ABNT).</p><p>Uma tabela possui elementos essenciais e complementares. Os elementos</p><p>essenciais são:</p><p>24Estatística</p><p>a) Título - posicionado no alto da tabela, descreve a natureza e a dimensão</p><p>geográfica e temporal dos dados numéricos. As informações inclusas</p><p>devem ser precisa e integral, respondendo às indagações: o que?,</p><p>quando?, e onde?, além de conter a palavra “Tabela” e sua respectiva</p><p>numeração;</p><p>b) Corpo da Tabela: é o conjunto de linhas e colunas que contém</p><p>informações sobre a variável em estudo, onde: na parte superior da</p><p>tabela tem-se o cabeçalho da coluna, que específica o conteúdo das</p><p>colunas verticalmente, têm-se as colunas (indicadora e numérica),</p><p>onde a coluna indicadora é aquela que específica o conteúdo das</p><p>linhas e na coluna numérica os valores numéricos destas linhas;</p><p>c) Rodapé: posicionado logo abaixo da tabela, inclui detalhes sobre a</p><p>fonte de informação, podendo também conter notas informativas</p><p>acerca do conteúdo da tabela, e, por fim, a chamada, que é um símbolo</p><p>remissível atribuído a algum elemento da tabela que necessite de</p><p>esclarecimento.</p><p>Os elementos complementares são:</p><p>a) Espaço do cabeçalho: localizado na parte superior do centro de uma</p><p>tabela, reservado para designar o conteúdo das colunas;</p><p>b) Coluna: espaço vertical do centro de uma tabela destinado aos dados</p><p>numéricos (coluna de dados numéricos) ou aos indicadores de linha</p><p>(colunas indicadoras);</p><p>c) Linha: espaço horizontal do centro de uma tabela destinado aos dados</p><p>numéricos;</p><p>d) Célula: espaço mínimo do centro de uma tabela, resultante do</p><p>cruzamento de uma linha com uma coluna. Destinado ao dado numérico</p><p>ou ao sinal convencional;</p><p>e) Moldura: não deve ter traços verticais que a delimitem à esquerda e</p><p>à direita, indicando que a tabela pode ser acrescida de mais colunas</p><p>informativas;</p><p>f) Número: o número deve estar localizado no seu topo, com a finalidade</p><p>de identificação, e permitir a sua localização.</p><p>25Estatística</p><p>2.13.2 Quadro</p><p>Os quadros seguem as mesmas particularidades das Tabelas (título, fon-</p><p>te, legenda, nota(s) e outras informações necessárias, mas suas laterais são</p><p>fechadas).</p><p>2.14 Tabelas de Frequências para Variáveis Qualitativas e</p><p>Quantitativas</p><p>A distribuição de frequências constitui o método de organização de</p><p>informação mais utilizado em estatística. Com efeito, as tabelas que descrevem</p><p>a distribuição de frequências permitem agregar e sintetizar grandes quantidades</p><p>de informação sem perda das suas características fundamentais.</p><p>No caso de variáveis qualitativas, a construção da tabela de frequência é</p><p>quase imediata. Identificam-se os valores que a variável assume que neste caso</p><p>são categorias de nomes, e procede-se à contagem do número de repetições</p><p>que ocorre em cada categoria.</p><p>Após este processo, organiza-se uma tabela com as informações</p><p>correspondentes aos valores da variável, registrada para cada categoria:</p><p>frequência absoluta, frequência relativa, e a frequência absoluta e relativa</p><p>acumuladas.</p><p>Considera-se uma amostra, de dimensão n, constituída por indivíduos que</p><p>apresentam uma determinada característica, com k modalidades observadas x1,</p><p>x2, x3, … , xk.</p><p>A construção de uma tabela de distribuição de frequência para uma</p><p>amostra nas condições apresentadas é realizada do seguinte modo:</p><p>26Estatística</p><p>Tabela 1 - Distribuição de frequências de variáveis qualitativas ou</p><p>quantitativas discretas</p><p>Valor da</p><p>variável</p><p>Frequência</p><p>absoluta</p><p>Frequência</p><p>relativa</p><p>Frequência absoluta</p><p>acumulada</p><p>Frequência absoluta</p><p>acumulada</p><p>𝑥𝑖 𝑛𝑖 𝑓𝑖 𝑁𝑖 𝐹𝑖</p><p>𝑥1 𝑛1</p><p>𝑛1</p><p>𝑓1 = 𝑛</p><p>𝑁1 = 𝑛1 𝐹1 = 𝑓1</p><p>𝑥2 𝑛2</p><p>𝑓 = 𝑛2</p><p>2 𝑛</p><p>𝑁2 = 𝑛1 + 𝑛2 𝐹2 = 𝑓1 + 𝑓2</p><p>… … … … …</p><p>𝑥𝑘 𝑛𝑘</p><p>𝑛𝑘</p><p>𝑓𝑘 = 𝑛</p><p>𝑁𝑘 = 𝑛1 + 𝑛2 + ⋯ + 𝑛𝑘</p><p>= 𝑛</p><p>𝐹𝑘 = 𝑓1 + 𝑓2 + ⋯ + 𝑓𝑘</p><p>= 1</p><p>Total</p><p>𝑘</p><p>∑ 𝑛𝑖 = 𝑛</p><p>𝑖=1</p><p>𝑘</p><p>∑ 𝑓𝑖 = 1</p><p>𝑖=1</p><p>(ou 100%)</p><p>- -</p><p>Fonte: adaptada de Cunha et al. (2007).</p><p>Observar que:</p><p>	A variável é designada por uma letra maiúscula, usualmente a letra X,</p><p>o fator da variável (ou categoria, no caso de variáveis qualitativas) por</p><p>uma letra minúscula xi .;</p><p>	O índice (i = 1, … k) representa cada uma k modalidades da</p><p>característica em estudo;</p><p>	A frequência absoluta da variável x na categoria i representa-se por</p><p>ni, correspondendo ao número de vezes que o valor da variável é</p><p>observado nesta modalidade.</p><p>A partir do valor das frequências absolutas e do conhecimento da dimensão</p><p>da amostra, que assume ser n, é possível calcular as frequências relativas,</p><p>frequências absolutas acumuladas e as frequências relativas acumuladas.</p><p>A frequência relativa de xi, representada por fi, é definida pelo quociente</p><p>entre a frequência absoluta e a dimensão da amostra, ou seja, fi = nin , que</p><p>apresenta a proporção de ocorrências do valor da variável na categoria i.</p><p>27Estatística</p><p>A frequência absoluta acumulada até xi, representada por Ni, corresponde</p><p>à soma do número de ocorrências para os valores da variável inferior ou igual a xi.</p><p>De forma idêntica, é definida a frequência relativa acumulada de xi, representada</p><p>por Fi. Esta correspondente à soma da proporção de ocorrências registrada para</p><p>os valores da variável inferiores ou iguais a xi .</p><p>Quadro 1 - Foi observado uma amostra de 10 atletas do sexo masculino,</p><p>com baixo desempenho no desporto, com idades compreendidas entre 20 e 25</p><p>anos, os quais tinham sido diagnosticados com déficit de vitamina D. Referente</p><p>a cada um dos atletas, durante o monitoramento do seu estado de saúde, foram</p><p>registradas as seguintes informações:</p><p>Nº de ordem Peso ideal Desempenho no desporto</p><p>Nível de Vitamina D</p><p>(ng/mL)</p><p>1 Sim Regular 14,3</p><p>2 Sim alto 7,8</p><p>3 Não baixo 27,0</p><p>4 Sim Regular 11,0</p><p>5 Sim alto 9,9</p><p>6 Não baixo 14,5</p><p>7 Sim baixo 15,4</p><p>8 Não baixo 20,8</p><p>9 Não alto 10,5</p><p>10 Sim baixo 15,9</p><p>Fonte: Elaborado pela Autora (2021).</p><p>Interessa identificar e classificar as variáveis presentes no exemplo 2.11.</p><p>Dispõe-se de três variáveis: X, Y e Z.</p><p>X = Peso ideal, variável qualitativa nominal.</p><p>Y = Desempenho no desporto, variável qualitativa ordinal. Z = Nível de</p><p>Vitamina D, variável quantitativa contínua.</p><p>Pretende-se construir uma tabela de frequência para cada uma das três</p><p>principais variáveis que caracterizam os atletas, isto é, X, Y e Z. A variável Nº de</p><p>ordem é considerada uma variável auxiliar, fundamental quando os dados</p><p>são</p><p>introduzidos em suporte eletrônico.</p><p>Apresenta-se a tabela de frequências de cada uma das variáveis</p><p>qualitativas, X e Y.</p><p>28Estatística</p><p>Tabela 2 - Distribuição de Frequência da Variável X – Peso ideal</p><p>Dieta Equilibrada Frequência</p><p>absoluta</p><p>Frequência</p><p>relativa</p><p>Frequência</p><p>absoluta</p><p>acumulada</p><p>Frequência absoluta</p><p>Acumulada</p><p>Valor da Variável 𝑛𝑖 𝑓𝑖 𝑁𝑖 𝐹𝑖</p><p>𝑛1 = Sim 6</p><p>6</p><p>𝑓𝑠𝑖𝑚 = 10 = 0,6</p><p>𝑁1 = 6 𝐹1 = 0,6</p><p>𝑛2 = Não 4</p><p>4</p><p>𝑓𝑠𝑖𝑚 = 10 = 0,4</p><p>𝑁2 = 6 + 4 = 10 𝐹2 = 0,6 + 0,4 = 1</p><p>Total</p><p>2</p><p>∑ 𝑛𝑖 = 10</p><p>𝑖=1</p><p>2</p><p>∑ 𝑓𝑖 = 1,0</p><p>𝑖=1</p><p>- -</p><p>Fonte: Elaborada pela Autora (2021).</p><p>Tabela 3 - Distribuição de Frequência da Variável Y – Desempenho no</p><p>desporto</p><p>Intensidade dos</p><p>Treinos</p><p>Frequência</p><p>absoluta</p><p>Frequência</p><p>relativa</p><p>Frequência absoluta</p><p>acumulada</p><p>Frequência absoluta</p><p>Acumulada</p><p>Valor da</p><p>Variável</p><p>𝑛𝑖 𝑓𝑖 𝑁𝑖 𝐹𝑖</p><p>𝑛1 = baixa 5</p><p>5</p><p>𝑓𝑏𝑎𝑖 = 10 = 0,5</p><p>𝑁1 = 5 𝐹1 = 0,5</p><p>𝑛2 = mode-</p><p>rada</p><p>2</p><p>2</p><p>𝑓𝑚 𝑜𝑑 = 10 = 0,2</p><p>𝑁2 = 5 + 2 = 7 𝐹2 = 0,5 + 0,2 = 0,7</p><p>𝑛3 = elevada 3</p><p>3</p><p>𝑓𝑒𝑙𝑒 = 10 = 0,3</p><p>𝑁2 = 5 + 2 + 3</p><p>= 10 𝐹3 = 0,5 + 0,2 + 0,3 = 1,0</p><p>Total</p><p>2</p><p>∑ 𝑛𝑖 = 10</p><p>𝑖=1</p><p>2</p><p>∑ 𝑓𝑖 = 1,0</p><p>𝑖=1</p><p>- -</p><p>Fonte: Elaborada pela Autora (2021).</p><p>2.14.1 Distribuição de Frequências de Variáveis Quantitativas</p><p>Discretas</p><p>Para a construção de tabelas de frequências para variáveis quantitativas</p><p>discretas, procede-se de modo análogo ao das variáveis qualitativas.</p><p>29Estatística</p><p>Quadro 2 – Ranking Folha de São Paulo (RUF) 2019, dos cursos de</p><p>graduação em Física mais bem colocados em Instituições de Ensino Superior</p><p>Públicos, em 23 unidades da Federação</p><p>Estados Número de instituições</p><p>São Paulo – SP 5</p><p>Rio de Janeiro – RJ 4</p><p>Minas Gerais – MG 6</p><p>Rio Grande do Sul – RS 2</p><p>Ceará – CE 4</p><p>Pernambuco – PE 1</p><p>Santa Catarina – SC 1</p><p>Paraná – PR 4</p><p>Distrito Federal – DF 1</p><p>Bahia – BA 3</p><p>Espírito Santo – ES 1</p><p>Goiás – GO 1</p><p>Rio Grande do Norte - RN 2</p><p>Alagoas – AL 1</p><p>Paraíba – PB 3</p><p>Sergipe – SE 1</p><p>Pará – PA 1</p><p>Piauí – PI 2</p><p>Maranhão – MA 2</p><p>Amazonas – AM 2</p><p>Tocantins – TO 1</p><p>Mato Grosso – MT 1</p><p>Fonte: A Autora com base em dados extraído RUF- Folha de São Paulo (2019).</p><p>A variável em estudo X, corresponde aos números de instituições</p><p>classificadas entre os melhores cursos de Física, das Instituições de Ensino</p><p>Superior Públicos brasileiro por UF no Ranking Folha de São Paulo (RUF) em</p><p>2019. É uma variável quantitativa, discreta, medida numa escala de razão.</p><p>Mesmo não sendo em grande número a disposição dos valores, tal como</p><p>estão apresentados, não permite uma rápida e fácil análise. Não é imediato saber-se</p><p>qual o número total universidades públicas classificadas por Unidades Federativas,</p><p>e qual a Unidade Federativa com mais ou menos universidades classificadas.</p><p>Para a construção manual de uma tabela de frequência para, é importante</p><p>proceder à ordenação dos dados, e convenciona-se que seja do menor para o</p><p>maior valor:</p><p>30Estatística</p><p>a) A construção de tabelas de frequência com a utilização de software</p><p>estatístico, ou folhas de cálculo, tem outros procedimentos.</p><p>Após a ordenação dos valores registrados para as universidades públicas</p><p>classificadas por Unidades Federativas apresenta-se o rol de dados:</p><p>1 1 1 1 1 1 1 1 1 1 1 2 2 2 2 2 3 3 4 4 4 5 6</p><p>A tabela de distribuição de frequência apresentada é:</p><p>Tabela 4 – Distribuição de Frequências do Ranking Folha de São Paulo</p><p>(RUF) 2019, dos cursos de graduação em Física mais bem colocados em</p><p>Instituições de Ensino Superior Públicos, em 23 unidades da Federação</p><p>Nº de cursos</p><p>por unidades</p><p>federativas</p><p>Frequência</p><p>absoluta Frequência relativa Frequências absolutas</p><p>acumuladas</p><p>Frequências relativas</p><p>acumuladas</p><p>𝑥𝑖 𝑛𝑖 𝑓𝑖 𝑁𝑖 𝐹𝑖</p><p>1 11</p><p>11</p><p>23 = 0,48</p><p>𝑁1 = 11</p><p>11</p><p>23 = 0,48</p><p>2 5</p><p>5</p><p>23 = 0,22</p><p>11 + 5 = 16</p><p>16</p><p>23 = 0,70</p><p>3 2</p><p>2</p><p>23 = 0,09</p><p>11 + 5 + 2 = 18</p><p>18</p><p>23 = 0,78</p><p>4 3</p><p>3</p><p>23 = 0,13</p><p>11 + 5 + 2 + 3 = 21</p><p>21</p><p>23 = 0,91</p><p>5 1</p><p>1</p><p>23 = 0,04</p><p>11 + 5 + 2 + 3 + 1 = 22</p><p>22</p><p>23 = 0,95</p><p>6 1</p><p>1</p><p>23 = 0,04</p><p>11 + 5 + 2 + 3 + 1 = 23</p><p>23</p><p>23 = 1</p><p>TOTAL</p><p>6</p><p>∑ 𝑛𝑖 = 23</p><p>𝑖=1</p><p>6</p><p>∑ 𝑓𝑖 = 1</p><p>𝑖=1</p><p>(ou 100%)</p><p>- -</p><p>Fonte: Elaborada pela Autora (2021).</p><p>31Estatística</p><p>Após a ordenação dos valores registrados do número dos cursos de</p><p>graduação em Física mais bem colocados em Instituições de Ensino Superior</p><p>Públicos, e com base na tabela de frequência conclui-se que:</p><p>a) Das 23 unidades da Federação, 11 possuem 1 instituição classificada,</p><p>5 possuem 2 instituições classificadas, 3 possuem 4 instituições</p><p>classificadas, 1 possui 5 instituições classificadas e 1 possui 6</p><p>instituições classificadas. Verifica-se que o total de instituições públicas</p><p>classificadas são 50;</p><p>b) Das 23 unidades da Federação, 48% (0,48 x 100) possui 1 instituição</p><p>classificada, 4% possui 5 instituições classificadas, e 4% possui 6</p><p>instituições classificadas; e</p><p>c) Também pode-se observar que o número mínimo de cursos classificados</p><p>por Unidade Federativa é de 1, e o número máximo é de 6.</p><p>2.15 Construção de uma distribuição de frequência</p><p>Quando se estuda uma variável, o maior interesse do pesquisador é</p><p>conhecer o comportamento dessa variável, analisando a ocorrência de suas</p><p>possíveis realizações. Para ilustrar como se constrói uma distribuição de</p><p>frequência, será considerado considerar um exemplo específico.</p><p>Assim, suponha que uma pesquisa foi feita, e o seguinte conjunto de dados</p><p>foi obtido:</p><p>32Estatística</p><p>Quadro 3 – A Variável estatística X, é a classificação dos alunos na</p><p>disciplina de Estatística do Curso de Física EaD na Universidade Estadual do</p><p>Maranhão (UEMA)</p><p>Classificação na disciplina de estatística EaD (UEMA)</p><p>43 52 57 53 41</p><p>56 39 44 47 49</p><p>57 33 59 43 69</p><p>80 79 56 59 58</p><p>71 50 45 78 64</p><p>66 61 87 65 61</p><p>73 74 36 55 52</p><p>65 53 69 77 34</p><p>74 76 73 55 60</p><p>49 51 53 44 27</p><p>Fonte: Elaborado pela Autora (2021).</p><p>Para construir uma tabela de distribuição de frequência com dados</p><p>contínuos:</p><p>	O primeiro procedimento a ser feito, é ordenação dos dados do</p><p>menor para o maior, formando o rol de dados.</p><p>Dados Brutos: os dados demonstrados no Quadro 2, estão no seu modo</p><p>bruto, ou seja, apresentam-se na mesma ordem aleatória em que foram</p><p>coletados.</p><p>Rol de dados:</p><p>27 33 34 36 39 41 43 43 44 44 45 47 49 49 50 51 52 52 53 53 53 55 55 56</p><p>56 57 57 58 58 59 60 61 61 64 65 66 69 69 71 73 73 74 74 76 77 78 79 80 87</p><p>Com a ordenação dos valores, os elementos do conjunto de dados</p><p>ficam de mais fácil identificação.</p><p>33Estatística</p><p>Se os dados são contínuos com n > 100, fica difícil observar a distribuição</p><p>dos dados, portanto, para melhor observação, deve-se apresentar em tabelas</p><p>de distribuição de frequências.</p><p>	 Em seguida, calcula-se amplitude total, ou seja, o maior valor obtido</p><p>na amostra subtraído do menor valor obtido na amostra:</p><p>Amplitude Total ou ranger: é a diferença entre o maior e o menor valor</p><p>de dados observados.</p><p>At = xmáx − xmin</p><p>Onde:</p><p>At = Amplitude total</p><p>xmáx = valor máximo da amostra</p><p>xmin = valor mínimo da amostra Portanto:</p><p>At = 87 – 27 = 60</p><p>	 Quando dizemos que a amplitude total dos valores é 60, estamos</p><p>afirmando alguma coisa referente à sua concentração.</p><p>	 Quanto maior a amplitude total, maior a dispersão ou variabilidade dos</p><p>dados da variável.</p><p>	 O inconveniente da amplitude total é que só podem ser levados</p><p>em consideração os valores extremos, desconsiderando os valores</p><p>intermediários.</p><p>Divida a amplitude dos dados pelo número de faixas que pretende</p><p>organizar (Quadro 3) os dados são variáveis quantitativas, contínuas, medida</p><p>numa escala de razão.</p><p>Número de classes:</p><p>	 Deve ser escolhido pelo pesquisador, em função do seu objetivo;</p><p>	 É comum se determinar entre 5 e 20 classes;</p><p>	 Se o número de classes for demasiado pequeno, perde-se informações;</p><p>	 Se o número de classes for muito grande, têm-se detalhes</p><p>desnecessários;</p><p>34Estatística</p><p>	 Há fórmulas para estabelecer quantas classes devem ser construídas.</p><p>Entretanto, a decisão fica sob o encargo do pesquisador, que deve</p><p>utilizar bom senso para definir o número ideal de classes, para</p><p>melhor</p><p>descrever o conjunto de dados;</p><p>	 Os resultados obtidos por meio de fórmulas podem servir como</p><p>referência, mas não devem ser entendidos como obrigatórios, é</p><p>razoável que o pesquisador decida de acordo com sua experiência, e</p><p>a sua escolha metodológica.</p><p>Construindo uma distribuição de frequência:</p><p>	 Determine número de classes (k)</p><p>Pela regra da Raiz Quadrada (este método é aplicado para n ≤ 100) Para</p><p>usar uma dessas fórmulas, faça n indicar o número de dados.</p><p>O número de classes será o inteiro próximo de k, obtido pela fórmula: k = √n</p><p>Revendo a tabela do quadro 3:</p><p>k = √n = √50 = 7,07 ≅ 7</p><p>Ou seja, poderiam ter sido organizados 7 classes.</p><p>	 Regra de Sturges (Regra do Logaritmo)</p><p>K = 1 + 3,3 log n</p><p>Revendo a tabela do exemplo 2.11:</p><p>k = 1 + 3,3 log 50 = 6,74 ≅ 7</p><p>Os valores de k podem ser acrescidos ou diminuídos a critério dos</p><p>propósitos e méritos do pesquisador, no geral são acrescidos ou reduzidos em</p><p>dois valores, acordo com o valor de k calculado.</p><p>	 O resultado da divisão é o intervalo de classe. Para facilitar o trabalho,</p><p>pode-se arredondar os valores, para o valor mais alto.</p><p>	 Decida a quantidade de classes que garanta observar como os valores</p><p>se distribuem. Os valores não devem ficar nem muito dispersos,</p><p>ao ponto de não identificar seus principais atributos, e nem muito</p><p>concentrados, ao ponto de se obter informações desnecessárias.</p><p>35Estatística</p><p>Utilizar o bom senso.</p><p>	 Organize as classes, de maneira que a primeira contenha o menor</p><p>valor observado.</p><p>Tamanho do Intervalo de Classe (h)</p><p>h = k</p><p>R aplicando os valores já calculado na fórmula ℎ = 7</p><p>60 = 8, 57 ≅ 9</p><p>Como colocado anteriormente, para facilitar os cálculos, é melhor</p><p>arredondar esse valor. Então o intervalo de classe terá a amplitude de 9.</p><p>Limites das Classes</p><p>Os limites das classes, inferior ( l ) e superior (L), para amplitudes de</p><p>classes constantes e iguais a ai, podem ser obtidos de acordo o que se apresenta</p><p>na Tabela a seguir.</p><p>Tabela 5 – Determinação dos Limites de Classes</p><p>Nº da</p><p>Classe</p><p>Limite inferior da</p><p>classe</p><p>Limite Superior da</p><p>Classe Classes</p><p>1 𝑥𝑚 𝑖𝑛 𝑥𝑚 𝑖𝑛 + 𝑎 [𝑥𝑚 𝑖𝑛; 𝑥𝑚 𝑖𝑛 + 𝑎[</p><p>2 𝑥𝑚 𝑖𝑛 + 𝑎 𝑥𝑚 𝑖𝑛 + 2𝑎 [𝑥𝑚 𝑖𝑛 + 𝑎; 𝑥𝑚 𝑖𝑛 + 2𝑎[</p><p>3 𝑥𝑚 𝑖𝑛 + 2𝑎 𝑥𝑚 𝑖𝑛 + 3𝑎 [𝑥𝑚 𝑖𝑛 + 2𝑎; 𝑥𝑚 𝑖𝑛 + 3𝑎[</p><p>… … … …</p><p>𝑘 𝑥𝑚 𝑖𝑛 + (𝑘 − 1)𝑎 𝑥𝑚 𝑖𝑛 + 𝑘𝑎 [𝑥𝑚 𝑖𝑛 + (𝑘 − 𝑙)𝑎; 𝑥𝑚 𝑖𝑛 +</p><p>𝑘𝑎[</p><p>Fonte: Fonte: adaptada de Cunha et al. (2007).</p><p>Considerar-se-ão classes abertas à direita e fechadas à esquerda, com</p><p>exceção da última classe, na qual se poderá integrar o máximo da amostra,</p><p>correspondendo ao seu limite superior.</p><p>	Aplicando os valores do Quadro 3: Classificação na disciplina de</p><p>estatística EaD Física (UEMA).</p><p>Limite inferior (l) da primeira classe: xmin = 27, e, “a ou k = 9”, como</p><p>já calculado previamente</p><p>36Estatística</p><p>Portanto:</p><p>Limite superior (L) da primeira classe xmin + a, aplicando aos dados do</p><p>quadro 2.11:</p><p>27 + 9 = 36. Onde: 27 é o limite Inferior e 36 será o limite superior da</p><p>primeira classe.</p><p>Depois se constrói a segunda classe, que será de e: 36 + 9 = 45.</p><p>Onde: 36 será o limite inferior e 45 será o limite superior da segunda classe. E</p><p>assim sucessivamente, até que todos os valores amostrais sejam distribuídos</p><p>em suas respectivas classes.</p><p>Continue o procedimento, sempre somando, ao exemplo superior que</p><p>você calculou o intervalo de classe, como mostra a Tabela 6.</p><p>Tabela 6 – Determinação dos Limites de Classes para a classificação</p><p>na disciplina de estatística EaD Física (UEMA)</p><p>Nº da</p><p>Classe</p><p>Limite inferior da</p><p>Classe</p><p>Limite superior da</p><p>Classe</p><p>𝐿𝑖</p><p>1 [27 36 [</p><p>2 [36 45 [</p><p>3 [45 54 [</p><p>4 [54 63 [</p><p>5 [63 72 [</p><p>6 [72 81 [</p><p>7 [81 90 [</p><p>Fonte: Elaborada pela Autora (2021).</p><p>Centro de Classes ou Ponto Médio</p><p>Designa-se por ci, o centro da classe i. Este é obtido a partir da</p><p>seguinte expressão:</p><p>(1) ci =</p><p>2</p><p>li+Li (2) ci = Li + 2</p><p>li – Li</p><p>A construção da tabela de frequências para dados classificados é tudo</p><p>análoga à construção da tabela de frequências para dados simples.</p><p>37Estatística</p><p>Tabela 7 – Distribuição de Frequências para Variáveis Contínuas</p><p>Classes Freq.</p><p>Absoluta</p><p>Freq.</p><p>Relativa</p><p>Frequências Absolutas</p><p>Acumuladas</p><p>Frequências Relativas</p><p>Acumuladas</p><p>𝑛𝑖 𝑓𝑖 𝑁𝑖 𝐹𝑖</p><p>[𝑥𝑚 𝑖𝑛; 𝑥𝑚 𝑖𝑛 + 𝑎[ 𝑛1</p><p>𝑛𝑖</p><p>𝑓𝑖 = 𝑛</p><p>𝑁1 = 𝑛1 𝐹1 = 𝑓1</p><p>[𝑥𝑚 𝑖𝑛 + 𝑎; 𝑥𝑚 𝑖𝑛 + 2𝑎[ 𝑛2</p><p>𝑛2</p><p>𝑓2 = 𝑛</p><p>𝑁2 = 𝑛1 + 𝑛2 𝐹2 = 𝑓1 + 𝑓2</p><p>[𝑥𝑚 𝑖𝑛 + 2𝑎; 𝑥𝑚 𝑖𝑛 + 3𝑎[ 𝑛3</p><p>𝑛3</p><p>𝑓3 = 𝑛</p><p>𝑁3 = 𝑛1 + 𝑛2 + 𝑛3 𝐹3 = 𝑓1 + 𝑓2 + 𝑓3 + 𝑓4</p><p>… … … … …</p><p>𝑘-ésima classe 𝑛𝑘</p><p>𝑛𝑘</p><p>𝑓𝑘 = 𝑛</p><p>𝑁𝐾 = 𝑛1 + 𝑛2 + 𝑛3 + ⋯ + 𝑛𝐾</p><p>= 𝑛</p><p>𝐹𝑘 = 𝑓1 + 𝑓2 + 𝑓3 + 𝑓4 +</p><p>𝑓𝑘=1</p><p>Total</p><p>𝑘</p><p>∑ 𝑛𝑖 = 𝑛</p><p>𝑖− 1</p><p>𝑘</p><p>∑ 𝑓𝑖 = 1</p><p>𝑖− 1</p><p>- -</p><p>Fonte: Adaptada de Cunha et al. (2007).</p><p>Tabela 8 – Distribuição da frequência da classificação dos alunos na</p><p>disciplina de Estatística do Curso de Física EaD na Universidade Estadual do</p><p>Maranhão (UEMA)</p><p>Classes Frequência</p><p>absoluta</p><p>Frequência</p><p>relativa</p><p>Frequências relativas</p><p>acumulada</p><p>Frequência absoluta</p><p>Acumulada</p><p>𝑛𝑖 𝑓𝑖 𝐹𝑖 𝑁𝑖</p><p>[27, 36 [ 3 3/50 = 0,06 3/50=0,06 3</p><p>[36, 45 [ 7 7/50 = 0,14 (3+7) /50=0,2 3+7= 10</p><p>[45, 54 [ 11 11/50 = 0,22 (3+7+11) /50=0,42 3+7+11= 21</p><p>[54, 62 [ 12 12/50 = 0,24 (3+7+11+12) /50=0,46 3+7+11+12=33</p><p>[63, 72 [ 7 7/50 = 0,14 (3+7+11+12+7) /50=14,8 3+7+11+12+7=40</p><p>[72, 81 [ 9 9/50 = 0,18 (3+7+11+12+7+9) /50=0,98 3+7+11+12+7+9=49</p><p>[81, 90 [ 1 1/50 = 0,02 (3+7+11+12+7+9+1) /50=1 3+7+11+12+7+9+1=50</p><p>TOTAL</p><p>7</p><p>∑ 𝑛𝑖 = 50</p><p>𝑖=1</p><p>7</p><p>∑ 𝑓𝑖 = 1</p><p>𝑖− 1</p><p>- -</p><p>Fonte: Elaborada pela Autora (2021).</p><p>38Estatística</p><p>Continuação da Tabela 8</p><p>Centro de Classe</p><p>ci</p><p>(27 + 36) / 2 = 31,50</p><p>(36 + 45) / 2 = 40,50</p><p>(45 + 54) / 2 = 49,50</p><p>(54 + 62) / 2 = 58</p><p>(63 + 72) / 2 = 67,50</p><p>(72 + 81) / 2 = 76,5</p><p>(81 + 90) / 2 = 85,5</p><p>-</p><p>Fonte: Elaborada pela Autora (2021).</p><p>Com base na informação disponibilizada pode-se afirmar:</p><p>	Dimensão da amostra n = 50</p><p>	Número de Classes: K = 1 + 3,3 log 50 = 6,74 ≅ 7</p><p>O número de classes tem de ser um número inteiro, pelo que se deve</p><p>arredondar as unidades o valor obtido. O arredondamento pode ser feito por</p><p>excesso (7 classes) ou por defeito (6 classes). Se o arredondamento é feito</p><p>por excesso, a amplitude das classes será menor. Se o arredondamento é feito</p><p>por defeito, amplitude das classes será maior. Neste exemplo, optou-se por um</p><p>arredondamento por excesso relativamente ao número de classes.</p><p>	Amplitude total da amostra: At = x max – x min: At = 87 – 27 = 60</p><p>	Tamanho do Intervalo de Classe (h): ℎ = k</p><p>R aplicando os valores já</p><p>calculado na fórmula ℎ = 7</p><p>60 = 8, 57 ≅ 9, ou Amplitude de cada classe:</p><p>Li - li = 9</p><p>39Estatística</p><p>2.16 Representações gráficas para diferentes tipos de variáveis</p><p>A representação gráfica da distribuição de uma variável tem a vantagem de</p><p>rápida e concisamente, informar sobre sua variabilidade. Entretanto, na escolha</p><p>da representação gráfica, deve-se considerar os seguintes aspectos:</p><p>a) Natureza e escala de medição da variável;</p><p>b) Objetivo da representação gráfica (o que se pretende evidenciar).</p><p>2.16.1 Representações gráficas para variáveis qualitativas ou quantitativas</p><p>discretas</p><p>Gráficos de barras horizontais e de colunas</p><p>Para representar a distribuição de frequências, absolutas ou relativas,</p><p>de uma variável qualitativa ou quantitativa discreta pode utilizar-se o gráfico</p><p>de barras ou de colunas (também denominado diagrama de barras). O gráfico</p><p>de barras horizontais difere do gráfico de colunas apenas pela colocação dos</p><p>retângulos no sentido horizontal ou vertical.</p><p>Esta representação gráfica tem como referência dois eixos:</p><p>a) No eixo das abcissas são representados os valores (ou categorias, no</p><p>caso de variáveis qualitativas) da variável;</p><p>b) No eixo das ordenadas são representadas as respectivas frequências</p><p>(absolutas ou relativas) de ocorrência dos valores observados.</p><p>A largura das barras é igual para todas as categorias ou valores, e a altura</p><p>é proporcional à frequência observada.</p><p>O espaço existente entre as barras adjacentes evidencia a natureza</p><p>qualitativa ou quantitativa discreta</p><p>da variável.</p><p>Essas barras são dispostas paralelamente umas às outras, horizontal</p><p>(gráfico em barras horizontais) ou verticalmente (gráfico de colunas).</p><p>40Estatística</p><p>Gráfico de coluna</p><p>Gráfico 1 – Ranking (RUF) 2019, dos cursos de graduação em Física mais</p><p>bem colocados em IES Públicos, em 23 unidades da Federação</p><p>Fonte: Elaborado pela Autora (2021).</p><p>O gráfico em barras consiste em construir retângulos ou barras, em que</p><p>uma das dimensões é proporcional à magnitude a ser representada ( ni ou fi ),</p><p>sendo a outra arbitrária, porém igual para todas as barras.</p><p>Gráfico de barras horizontais</p><p>Gráfico 2 – Ranking (RUF) 2019, dos cursos de graduação em Física mais</p><p>bem colocados em IESuperior Públicos, em 23 unidades da Federação</p><p>Fonte: Elaborado pela Autora (2019).</p><p>40</p><p>O espaço existente entre as barras adjacentes evidencia a natureza</p><p>qualitativa ou quantitativa discreta da variável.</p><p>Essas barras são dispostas paralelamente umas às outras,</p><p>horizontal (gráfico em barras horizontais) ou verticalmente (gráfico de colunas).</p><p>Gráfico de coluna</p><p>Gráfico 1 – Ranking (RUF) 2019, dos cursos de graduação em Física mais bem</p><p>colocados em IES Públicos, em 23 unidades da Federação</p><p>Fonte: Elaborado pela Autora (2021).</p><p>O gráfico em barras consiste em construir retângulos ou barras, em</p><p>que uma das dimensões é proporcional à magnitude a ser representada (𝑛𝑛𝑖𝑖 ou</p><p>𝑓𝑓𝑖𝑖 ), sendo a outra arbitrária, porém igual para todas as barras.</p><p>Gráfico de barras horizontais</p><p>Gráfico 2 – Ranking (RUF) 2019, dos cursos de graduação em Física mais bem</p><p>colocados em IESuperior Públicos, em 23 unidades da Federação</p><p>Fonte: Elaborado pela Autora (2019).</p><p>11</p><p>5</p><p>2 3 1 1</p><p>0</p><p>2</p><p>4</p><p>6</p><p>8</p><p>10</p><p>12</p><p>1 2 3 4 5 6</p><p>Ranking (RUF) 2019, dos cursos de</p><p>graduação em Física mais bem</p><p>colocados em IES Públicos, em 23</p><p>unidades da Federação.</p><p>0 0,1 0,2 0,3 0,4 0,5 0,6</p><p>1</p><p>3</p><p>5</p><p>Ranking (RUF) 2019, dos cursos de</p><p>graduação em Física mais bem colocados</p><p>em IESuperior Públicos, em 23 unidades</p><p>da Federação.</p><p>40</p><p>O espaço existente entre as barras adjacentes evidencia a natureza</p><p>qualitativa ou quantitativa discreta da variável.</p><p>Essas barras são dispostas paralelamente umas às outras,</p><p>horizontal (gráfico em barras horizontais) ou verticalmente (gráfico de colunas).</p><p>Gráfico de coluna</p><p>Gráfico 1 – Ranking (RUF) 2019, dos cursos de graduação em Física mais bem</p><p>colocados em IES Públicos, em 23 unidades da Federação</p><p>Fonte: Elaborado pela Autora (2021).</p><p>O gráfico em barras consiste em construir retângulos ou barras, em</p><p>que uma das dimensões é proporcional à magnitude a ser representada (𝑛𝑛𝑖𝑖 ou</p><p>𝑓𝑓𝑖𝑖 ), sendo a outra arbitrária, porém igual para todas as barras.</p><p>Gráfico de barras horizontais</p><p>Gráfico 2 – Ranking (RUF) 2019, dos cursos de graduação em Física mais bem</p><p>colocados em IESuperior Públicos, em 23 unidades da Federação</p><p>Fonte: Elaborado pela Autora (2019).</p><p>11</p><p>5</p><p>2 3 1 1</p><p>0</p><p>2</p><p>4</p><p>6</p><p>8</p><p>10</p><p>12</p><p>1 2 3 4 5 6</p><p>Ranking (RUF) 2019, dos cursos de</p><p>graduação em Física mais bem</p><p>colocados em IES Públicos, em 23</p><p>unidades da Federação.</p><p>0 0,1 0,2 0,3 0,4 0,5 0,6</p><p>1</p><p>3</p><p>5</p><p>Ranking (RUF) 2019, dos cursos de</p><p>graduação em Física mais bem colocados</p><p>em IESuperior Públicos, em 23 unidades</p><p>da Federação.</p><p>41Estatística</p><p>Gráficos circulares ou de setores</p><p>Esta representação gráfica é particularmente utilizada na representação</p><p>da distribuição de frequências de variáveis qualitativas. A sua funcionalidade</p><p>diminui quando os valores que uma variável pode assumir são em número</p><p>elevado.</p><p>Os gráficos circulares estão divididos em áreas proporcionais à frequência</p><p>da categoria que representam. O círculo representa a totalidade das observações.</p><p>Habitualmente, estes gráficos evidenciam as frequências relativas (em</p><p>percentagem) e usam-se quando o número de categorias é pequeno (não</p><p>superior a 10)</p><p>Gráfico 3 – Distribuição de Frequência da Variável Desempenho no Desporto</p><p>Fonte: Elaborado pela Autora (2021).</p><p>2.16.2 Representações gráficas para variáveis quantitativas contínuas</p><p>As representações gráficas mais habituais para as frequências simples</p><p>da distribuição de uma variável contínua são os histogramas, os polígonos de</p><p>41</p><p>Gráficos circulares ou de setores</p><p>Esta representação gráfica é particularmente utilizada na</p><p>representação da distribuição de frequências de variáveis qualitativas. A sua</p><p>funcionalidade diminui quando os valores que uma variável pode assumir são</p><p>em número elevado.</p><p>Os gráficos circulares estão divididos em áreas proporcionais à</p><p>frequência da categoria que representam. O círculo representa a totalidade das</p><p>observações.</p><p>Habitualmente, estes gráficos evidenciam as frequências relativas</p><p>(em percentagem) e usam-se quando o número de categorias é pequeno (não</p><p>superior a 10)</p><p>Gráfico 3 – Distribuição de Frequência da Variável Desempenho no Desporto</p><p>Fonte: Elaborado pela Autora (2021).</p><p>2.16.2 Representações gráficas para variáveis quantitativas</p><p>contínuas</p><p>As representações gráficas mais habituais para as frequências</p><p>simples da distribuição de uma variável contínua são os histogramas, os</p><p>polígonos de frequências, o polígono integral ou os gráficos de linhas, estes</p><p>últimos mais utilizados na representação gráfica de séries temporais.</p><p>50%</p><p>20%</p><p>30%</p><p>Distribuição de Frequência da Variável</p><p>Desempenho no Desporto</p><p>Baixo</p><p>Regular</p><p>Alto</p><p>42Estatística</p><p>frequências, o polígono integral ou os gráficos de linhas, estes últimos mais</p><p>utilizados na representação gráfica de séries temporais.</p><p>Histograma</p><p>O Histograma permite representar graficamente a distribuição de frequência</p><p>de uma variável contínua. No eixo horizontal representam-se as classes e no eixo</p><p>vertical as frequências absolutas ou relativas. Utilizam-se as barras com área</p><p>proporcional à frequência da classe correspondente. As barras são contíguas</p><p>para evidenciar a continuidade da variável, tendo uma fronteira comum.</p><p>Considerando classes com igual amplitude cada barra tem a mesma base</p><p>igual a α e a altura igual à respectiva frequência (relativa ou absoluta). A área</p><p>total do gráfico é igual à soma de cada uma das barras. A área de cada uma das</p><p>barras é igual ao produto da largura pela sua altura.</p><p>Refira-se que quando se trabalha com variáveis contínuas, a amplitude das</p><p>classes extremas não está, muitas vezes, definida. Nestes casos convenciona-</p><p>se que estas classes têm a amplitude das classes adjacentes.</p><p>Gráfico 4 – Classificação na disciplina de estatística do curso</p><p>de Física EaD (UEMA)</p><p>Fonte: Elaborado pela autora (2021).</p><p>42</p><p>Histograma</p><p>O Histograma permite representar graficamente a distribuição de</p><p>frequência de uma variável contínua. No eixo horizontal representam-se as</p><p>classes e no eixo vertical as frequências absolutas ou relativas. Utilizam-se as</p><p>barras com área proporcional à frequência da classe correspondente. As barras</p><p>são contíguas para evidenciar a continuidade da variável, tendo uma fronteira</p><p>comum.</p><p>Considerando classes com igual amplitude cada barra tem a mesma</p><p>base igual a α e a altura igual à respectiva frequência (relativa ou absoluta). A</p><p>área total do gráfico é igual à soma de cada uma das barras. A área de cada</p><p>uma das barras é igual ao produto da largura pela sua altura.</p><p>Refira-se que quando se trabalha com variáveis contínuas, a</p><p>amplitude das classes extremas não está, muitas vezes, definida. Nestes casos</p><p>convenciona-se que estas classes têm a amplitude das classes adjacentes.</p><p>Gráfico 4 – Classificação na disciplina de estatística do curso de Física EaD</p><p>(UEMA)</p><p>Fonte: Elaborado pela autora (2021).</p><p>Polígono de Frequências</p><p>Os Polígonos de Frequências são gráficos de linha que são obtidos</p><p>unindo sucessivamente, por segmentos de reta, os pontos médios dos topos</p><p>dos retângulos do histograma que representa as frequências relativas. O</p><p>0,00%</p><p>50,00%</p><p>100,00%</p><p>150,00%</p><p>0</p><p>5</p><p>10</p><p>15</p><p>65 55 45 75 85 35 Mais 25</p><p>FR</p><p>EQ</p><p>UÊ</p><p>NC</p><p>IA</p><p>BLOCO</p><p>Classificação na disciplina de</p><p>estatística do curso de Física EaD</p><p>(UEMA)</p><p>Frequência % acumulada</p><p>43Estatística</p><p>Polígono de Frequências</p><p>Os Polígonos de Frequências são gráficos de linha que são obtidos</p><p>unindo sucessivamente, por segmentos de reta, os pontos médios dos topos</p><p>dos retângulos do histograma que representa as frequências relativas. O</p><p>Polígono de frequências é uma das representações gráficas que possibilita</p><p>uma rápida comparação de duas ou mais distribuições frequências de variáveis</p><p>contínuas.</p><p>Gráfico 5 – Classificação na disciplina de estatística do curso</p><p>de Física EaD (UEMA)</p><p>Fonte: Elaborado pela autora (2021).</p><p>2.17 Organizar e analisar os Dados com a utilização do</p><p>Programa Excel</p><p>Para organizar e demonstrar um conjunto de observações com a ajuda</p><p>de uma planilha de cálculo, como o Excel, e produzir tabela de frequência e</p><p>gráficos, deve-se atender os seguintes procedimentos:</p><p>5</p><p>43</p><p>Polígono de frequências é uma das representações gráficas que possibilita</p><p>uma rápida comparação de duas ou mais distribuições frequências de variáveis</p><p>contínuas.</p><p>Gráfico 5 – Classificação na disciplina de estatística do curso de Física EaD</p><p>(UEMA)</p><p>Fonte: Elaborado pela autora (2021).</p><p>2.17 Organizar e analisar os Dados com a utilização do</p><p>Programa Excel</p><p>Para organizar e demonstrar um conjunto de observações com a</p><p>ajuda de uma planilha de cálculo, como o Excel, e produzir tabela de</p><p>frequência e gráficos, deve-se atender os seguintes procedimentos:</p><p>a) Observar e recolher os dados;</p><p>b) Determinar o valor máximo e o valor mínimo da variável</p><p>observada;</p><p>c) Escolher o número de classe pretendido: c = Int [1+3,32 log(n)]</p><p>ou √𝑛𝑛2 ;</p><p>d) Determinar a amplitude das classes e decidir o seu valor;</p><p>e) Determinar os limites das classes;</p><p>f) Construir uma tabela de frequências e o histograma;</p><p>g) Operar sobre os gráficos obtidos, efetuando algumas alterações</p><p>(opcional).</p><p>0,00%</p><p>50,00%</p><p>100,00%</p><p>150,00%</p><p>0</p><p>5</p><p>10</p><p>15</p><p>25 35 45 55 65 75 85 Mais</p><p>FR</p><p>EQ</p><p>UÊ</p><p>NC</p><p>IA</p><p>BLOCO</p><p>Classificação na disciplina de</p><p>estatística do curso de Física EaD</p><p>(UEMA)</p><p>Frequência % acumulada</p><p>44Estatística</p><p>a) Observar e recolher os dados;</p><p>b) Determinar o valor máximo e o valor mínimo da variável observada;</p><p>c) Escolher o número de classe pretendido: c = Int [1+3,32 log(n)] ou</p><p>2√n ;</p><p>d) Determinar a amplitude das classes e decidir o seu valor;</p><p>e) Determinar os limites das classes;</p><p>f) Construir uma tabela de frequências e o histograma;</p><p>g) Operar sobre os gráficos obtidos, efetuando algumas alterações</p><p>(opcional).</p><p>Seguindo os procedimentos já listados temos que:</p><p>a) Registrar as classificações e inserir numa folha de Excel;</p><p>b) Inserir as fórmulas para determinar o número de observações (Figura</p><p>3); o valor máximo (Figura 4); valor mínimo (Figura 5) da variável.</p><p>Neste caso:</p><p>Número de observações (Figura 3) Fórmula para o Excel = CONTAR</p><p>(A3:E12)</p><p>45Estatística</p><p>Figura 3 – Número de observações do conjunto de dados</p><p>Fonte: Elaborada pela Autora (2021).</p><p>Valor máximo (Figura 4). Fórmula para Excel xmáx: = MÁXIMO(A3:E12)</p><p>Figura 4 – Valor máximo da variável</p><p>Figura 4 – Valor máximo da variável</p><p>Fonte: Elaborada pela Autora (2021).</p><p>44</p><p>Seguindo os procedimentos já listados temos que:</p><p>a) Registrar as classificações e inserir numa folha de Excel;</p><p>b) Inserir as fórmulas para determinar o número de observações</p><p>(Figura 3); o valor máximo (Figura 4); valor mínimo (Figura 5) da</p><p>variável.</p><p>Neste caso:</p><p>Número de observações (Figura 3) Fórmula para o Excel =CONTAR(A3:E12)</p><p>Figura 3 – Número de observações do conjunto de dados</p><p>Fonte: Elaborada pela Autora (2021).</p><p>45</p><p>Valor máximo (Figura 4). Fórmula para Excel 𝑥𝑥𝑚𝑚𝑚𝑚𝑚𝑚: =MÁXIMO(A3:E12)</p><p>Figura 4 – Valor máximo da variável</p><p>Fonte: Elaborada pela Autora (2021).</p><p>Valor mínimo (Figura 5) Fórmula para o Excel 𝑥𝑥𝑚𝑚𝑚𝑚𝑚𝑚: = MÍNIMO (A3:E12)</p><p>Figura 5 – Valor mínimo da variável</p><p>Fonte: Elaborada pela Autora (2021).</p><p>46Estatística</p><p>Valor mínimo (Figura 5) Fórmula para o Excel xmin: = MÍNIMO (A3:E12)</p><p>Figura 5 – Valor mínimo da variável</p><p>Fonte: Elaborada pela Autora (2021).</p><p>45</p><p>Valor máximo (Figura 4). Fórmula para Excel 𝑥𝑥𝑚𝑚𝑚𝑚𝑚𝑚: =MÁXIMO(A3:E12)</p><p>Figura 4 – Valor máximo da variável</p><p>Fonte: Elaborada pela Autora (2021).</p><p>Valor mínimo (Figura 5) Fórmula para o Excel 𝑥𝑥𝑚𝑚𝑚𝑚𝑚𝑚: = MÍNIMO (A3:E12)</p><p>Figura 5 – Valor mínimo da variável</p><p>Fonte: Elaborada pela Autora (2021).</p><p>47Estatística</p><p>c) Escolher o número de classes pretendido (Figura 6 2.4). Fórmula para</p><p>o Excel K = INT(RAIZQ(D15)) para n ≤ 100; ou K = INT(D15^0,5) para</p><p>n > 100</p><p>Figura 6 – Número de classe</p><p>Fonte: Elaborada pela Autora (2021).</p><p>46</p><p>c) Escolher o número de classes pretendido (Figura 6 2.4). Fórmula</p><p>para o Excel K =INT(RAIZQ(D15)) para n ≤ 100; ou</p><p>K=INT(D15^0,5) para n > 100</p><p>Figura 6 – Número de classe</p><p>Fonte: Elaborada pela Autora (2021).</p><p>d) Determinar a amplitude das classes de acordo com o</p><p>procedimento anteriormente apresentado. (Figura 7)</p><p>Fórmula na folha do Excel para Amplitude de classes = (D16-D17)/D20</p><p>Figura 7 - Número de classe estimado</p><p>Fonte: Elaborada pela Autora (2021).</p><p>48Estatística</p><p>d) Determinar a amplitude das classes de acordo com o procedimento</p><p>anteriormente apresentado. (Figura 7)</p><p>Fórmula na folha do Excel para Amplitude de classes = (D16-D17)/D20</p><p>Figura 7 – Número de classe estimado</p><p>Fonte: Elaborada pela Autora (2021).</p><p>Amplitude de classes pretendidas: o pesquisador decide o valor da</p><p>amplitude das classes (arredondar a estimativa obtida para um valor conveniente)</p><p>e inserir este valor. Este valor pode ser de até dois números a mais ou a menos</p><p>que a Amplitude de Classe estimada.</p><p>46</p><p>c) Escolher o número de classes pretendido (Figura 6 2.4). Fórmula</p><p>para o Excel K =INT(RAIZQ(D15)) para n ≤ 100; ou</p><p>K=INT(D15^0,5) para n > 100</p><p>Figura 6 – Número de classe</p><p>Fonte: Elaborada pela Autora (2021).</p><p>d) Determinar a amplitude das classes de acordo com o</p><p>procedimento anteriormente apresentado. (Figura 7)</p><p>Fórmula na folha do Excel para Amplitude de classes = (D16-D17)/D20</p><p>Figura 7 - Número de classe estimado</p><p>Fonte: Elaborada pela Autora (2021).</p><p>49Estatística</p><p>e) Determinar média dos dados. (Figura 8)</p><p>Fórmula na folha do Excel para Classificação da Média dos dados = SOMA</p><p>(A3:E12)/D15</p><p>Figura 8 – Classificação da Média dos dados</p><p>Fonte: Elaborada pela Autora (2021).</p><p>47</p><p>Amplitude de classes pretendidas: o pesquisador decide o valor da amplitude</p><p>das classes (arredondar a estimativa obtida para um valor conveniente) e</p><p>inserir este valor. Este valor pode ser de até dois números a mais ou a menos</p><p>que a Amplitude de Classe estimada.</p><p>e) Determinar média dos dados. (Figura 8)</p><p>Fórmula na folha do Excel para Classificação da Média dos dados</p><p>= SOMA (A3:E12)/D15</p><p>Figura 8 – Classificação da Média dos dados</p><p>Fonte: Elaborada pela Autora (2021).</p><p>50Estatística</p><p>f) Elaboração dos gráficos. (Figura 9)</p><p>Figura 9 – Elaboração de gráficos</p><p>Fonte: Elaborada pela Autora (2021).</p><p>Resumo</p><p>Na Unidade, abordamos sobre População ou Universo; Amostra; Escala; Dados</p><p>de Frequências para variáveis qualitativas e quantitativas, entre outros conteúdos</p><p>fundamentais para demonstrar o resultado da investigação estatística através</p><p>da elaboração de tabelas e gráficos.</p><p>48</p><p>f) Elaboração dos gráficos. (Figura 9)</p><p>Figura 9 – Elaboração de gráficos</p><p>Fonte: Elaborada pela Autora (2021).</p><p>Resumo</p><p>Na Unidade, abordamos sobre População ou Universo; Amostra; Escala;</p><p>Dados de Frequências para variáveis qualitativas e quantitativas, entre outros</p><p>conteúdos fundamentais para demonstrar o resultado da investigação</p><p>estatística através da elaboração de tabelas e gráficos.</p><p>51Estatística</p><p>Referências</p><p>BUSSAB, Wilton de O; MORETTIN, Pedro</p>

Mais conteúdos dessa disciplina