Prévia do material em texto
ESTATÍSTICA APLICADA
À EDUCAÇÃO
A Faculdade Multivix está presente de norte a sul
do Estado do Espírito Santo, com unidades em
Cachoeiro de Itapemirim, Cariacica, Castelo, Nova
Venécia, São Mateus, Serra, Vila Velha e Vitória.
Desde 1999 atua no mercado capixaba,
destacando-se pela oferta de cursos de
graduação, técnico, pós-graduação e
extensão, com qualidade nas quatro áreas
do conhecimento: Agrárias, Exatas,
Humanas e Saúde, sempre primando pela
qualidade de seu ensino e pela formação
de profissionais com consciência cidadã
para o mercado de trabalho.
Atualmente, a Multivix está entre o seleto
grupo de Instituições de Ensino Superior que
possuem conceito de excelência junto ao
Ministério da Educação (MEC). Das 2109 institu-
ições avaliadas no Brasil, apenas 15% conquis-
taram notas 4 e 5, que são consideradas
conceitos de excelência em ensino.
Estes resultados acadêmicos colocam
todas as unidades da Multivix entre as
melhores do Estado do Espírito Santo e
entre as 50 melhores do país.
MISSÃO
Formar profissionais com consciência
cidadã para o mercado de trabalho, com elevado
padrão de qualidade, sempre mantendo a credibil-
idade, segurança e modernidade, visando à satis-
fação dos clientes e colaboradores.
VISÃO
Ser uma Instituição de Ensino Superior reconheci-
da nacionalmente como referência em qualidade
educacional.
R E I TO R
GRUPO
MULTIVIX
R E I
2
MULTIVIX EAD
Credenciada pela portaria MEC nº 767, de 22/06/2017, Publicada no D.O.U em 23/06/2017
BIBLIOTECA MULTIVIX (Dados de publicação na fonte)
Haroldo Augusto Santos de Sant Anna.
Estatística Aplicada à Educação / De Sant Anna, Haroldo Augusto Santos. - Multivix, 2020.
Catalogação: Biblioteca Central Multivix
2020 • Proibida a reprodução total ou parcial. Os infratores serão processados na forma da lei.
3
MULTIVIX EAD
Credenciada pela portaria MEC nº 767, de 22/06/2017, Publicada no D.O.U em 23/06/2017
4
MULTIVIX EAD
Credenciada pela portaria MEC nº 767, de 22/06/2017, Publicada no D.O.U em 23/06/2017
LISTA DE QUADROS E TABELAS
Tabela 1 – Matriz de respostas: dupla entrada 29
Tabela 2 - Ranking de competitividade digital da escola de
negócios suíça IMD 30
Tabela 3 - Impacto das restrições do Fies – Renda
(salários mínimos) 2018 31
Tabela 4 - Tabela de contingência 33
Tabela 5 – Ramos e folhas 36
Tabela 6 - Distribuição de alunos do primeiro grau por faixa etária do
Colégio A – maio 2017 40
Tabela 1 – Distribuição de frequências por faixa etária e renda 50
Tabela 2 – Distribuição de frequências por faixa etária e renda 54
Tabela 3 – Distribuição de frequências por faixa etária e renda 56
Tabela 4 – Distribuição de frequências por faixa etária e renda 59
Tabela 1 - Frequência de notas 70
Tabela 2 - Frequência de notas 71
Tabela 3 - Frequência de notas 71
Tabela 4 - Frequência de notas 75
Tabela 5 - Frequência de notas 76
Tabela 6 - Frequência de notas 77
Tabela 7 - Frequência de notas 78
Tabela 8 - Frequência de notas 79
Tabela 9 - Frequência de notas 80
Tabela 10 - Frequência de notas 81
Tabela 1 – Distribuição de alunos segundo o sexo e escolha do curso 91
Tabela 2 – Distribuição de alunos segundo o sexo e escolha do curso 93
Tabela 3 - Distribuição de variável aleatória X 95
Tabela 4 – Número de pontos no lançamento de um dado 97
Tabela 5 – Modelos para variáveis discretas 98
Quadro 1 – Principais características da Distribuição Normal 99
Quadro 1 – Resumo das estatísticas por distribuição de probabilidade
amostral 106
Quadro 2 – Estimativas pontuais ou intervalares 111
Quadro 3 - Tabela escala de significância de Fisher 119
5
MULTIVIX EAD
Credenciada pela portaria MEC nº 767, de 22/06/2017, Publicada no D.O.U em 23/06/2017
LISTA DE FIGURAS E GRÁFICOS
Figura 1 – Porcentagem 21
Gráfico 1 – Setores 41
Gráfico 2 - Colunas 42
Gráfico 3 - Barras 42
Gráfico 4 - Linhas 43
Gráfico 5 – Demonstrativos 43
Gráfico 1 – Distribuição de frequências por faixa etária 48
Gráfico 2 – Curva da distribuição de frequências por faixa etária 51
Gráfico 3 – Distribuição de frequências por faixa etária e renda 62
Gráfico 4 – Distribuição de frequências por faixa etária e renda 63
Gráfico 5 - Demonstrativo Distribuição de frequências por faixa etária e
renda 64
Gráfico 1 – Distribuição de frequências por notas 68
Gráfico 2 – Distribuição de frequências por notas 72
Gráfico 3 – Distribuição de frequências por classes 72
Gráfico 4 – Distribuição de frequências por notas 73
Gráfico 5 – Distribuição de frequências por classes 73
Demonstrativo 1 – Distribuição de notas por classes e frequências 82
Demonstrativo 2 – Distribuição de notas por classes e frequências 83
Figura 1 86
Gráfico 1 – Distribuição Normal –médias e desvios 99
Gráfico 2 – Representação do exercício 1 100
Gráfico 1 – Distribuição Normal –Médias e Desvios 112
6
MULTIVIX EAD
Credenciada pela portaria MEC nº 767, de 22/06/2017, Publicada no D.O.U em 23/06/2017
1UNIDADE
2UNIDADE
3UNIDADE
SUMÁRIO
APRESENTAÇÃO DA DISCIPLINA 9
1 ESTATÍSTICA – CONCEITO, FINALIDADE E SURGIMENTO 13
INTRODUÇÃO 13
1.1 EVOLUÇÃO DO PENSAMENTO ESTATÍSTICO 13
1.2 CONCEITOS E OBJETIVOS 16
1.3 ESTUDOS E APLICAÇÕES DO ENSINO DA ESTATÍSTICA 19
1.4 RAZÃO, PROPORÇÃO E PORCENTAGEM 21
1.5 SOMATÓRIO 23
2 DISTRIBUIÇÃO DE FREQUÊNCIAS E REPRESENTAÇÃO GRÁFICA 27
INTRODUÇÃO 27
2.1 PLANEJAMENTO, COLETA E APRESENTAÇÃO DE DADOS 27
2.2 VARIÁVEIS 30
2.3 ANÁLISE EXPLORATÓRIA DOS DADOS 32
2.4 RAMOS E FOLHAS 36
2.5 NÚMEROS ÍNDICES 37
2.6 SÉRIES E DISTRIBUIÇÕES DE FREQUÊNCIAS, ESPACIAIS, ESPECÍFICAS
E TEMPORAIS 39
2.7 GRÁFICOS EM SETORES, LINHA, POLÍGONO, HISTOGRAMA E OUTROS
DIAGRAMAS 41
3 MEDIDAS DE TENDÊNCIA CENTRAL, DE POSIÇÃO E SEPARATRIZES 47
INTRODUÇÃO 47
3.1 MÉDIA ARITMÉTICA, MÉDIA GEOMÉTRICA, MÉDIA HARMÔNICA E
MÉDIA PONDERADA 49
3.2 QUARTIS, DECIS E PERCENTIS (QUANTIS) – MEDIDAS SEPARATRIZES. 57
3.3 REPRESENTAÇÕES GRÁFICAS 61
7
MULTIVIX EAD
Credenciada pela portaria MEC nº 767, de 22/06/2017, Publicada no D.O.U em 23/06/2017
4UNIDADE
5UNIDADE
6UNIDADE
4 MEDIDAS DE DISPERSÃO OU VARIABILIDADE 67
INTRODUÇÃO 67
4.1 VARIÂNCIA ( ) 69
4.2 DESVIO PADRÃO 74
4.3 DESVIO MÉDIO (Dm.) 76
4.4 COEFICIENTE DE VARIAÇÃO (C.V.) 78
4.5 AMPLITUDE TOTAL 80
4.6 REPRESENTAÇÕES GRÁFICAS 81
5 PROBABILIDADE - DISTRIBUIÇÕES CONTÍNUAS - DISTRIBUIÇÕES 85
INTRODUÇÃO 85
5.1 INTRODUÇÃO À PROBABILIDADE 85
5.2 PROBABILIDADE CONDICIONAL E INDEPENDÊNCIA 90
5.3 INDEPENDÊNCIA DE EVENTOS 92
5.4 TEOREMA DE BAYES 93
5.5 DISTRIBUIÇÕES UNIFORME, BINOMIAL, HIPERGEOMÉTRICA E
POISSON 95
5.6 DISTRIBUIÇÃO NORMAL E REPRESENTAÇÃO GRÁFICA DA ÁREA DA
CURVA NORMAL 98
6 INFERÊNCIA ESTATÍSTICA 103
INTRODUÇÃO 103
6.1 POPULAÇÃO E AMOSTRA, DISTRIBUIÇÕES E TAMANHO
DA AMOSTRA 104
6.2 ESTIMAÇÃO: PROPRIEDADES, ESTIMADORES, INTERVALOS DE
CONFIANÇA E ERRO PADRÃO 110
6.3 TESTES DE HIPÓTESES: TESTE SOBRE A MÉDIA, PROPORÇÃO,
VARIÂNCIA E VALOR “P” 115
6.4 INFERÊNCIA PARA DUAS POPULAÇÕES E INFERÊNCIA PARA
VÁRIAS POPULAÇÕES 120
6.5 ANÁLISE DE ADERÊNCIA E ASSOCIAÇÃO 122
6.6 ANÁLISE DE REGRESSÃO E CORRELAÇÃO 123
8
MULTIVIX EAD
Credenciada pela portaria MEC nº 767, de 22/06/2017, Publicada no D.O.U em 23/06/2017
ATENÇÃO
PARA SABER
SAIBA MAIS
ONDE PESQUISAR
DICAS
LEITURA COMPLEMENTAR
GLOSSÁRIO
ATIVIDADES DE
APRENDIZAGEM
CURIOSIDADES
QUESTÕES
ÁUDIOSMÍDIAS
INTEGRADAS
ANOTAÇÕES
EXEMPLOS
CITAÇÕES
DOWNLOADS
ICONOGRAFIA
9
MULTIVIX EAD
Credenciada pela portaria MEC nº 767, de 22/06/2017, Publicada no D.O.U em 23/06/2017
APRESENTAÇÃO DA DISCIPLINA
Bem-vindos! É um prazer tê-los na disciplina de Estatística Aplicada à Educa-
ção, que nos auxilia na interpretação da realidade.
Nela, aprenderemos sobre os conceitos e as aplicações das ferramentas estatís-
ticas e aprofundaremos os nossos conhecimentos com relação à importância
da análise, interpretação e compreensão dos fluxos de dados e informações.
A EstatísticaAplicada à Educação vem ganhando espaço significativo nos
currículos escolares, na medida que volumes consideráveis de dados e infor-
mações atingem diferentes contingentes da população através do uso con-
tínuo das redes sociais e das tecnologias disponíveis, alertando para a neces-
sária formação da consciência crítica em torno do que é divulgado e das suas
possíveis implicações.
Nesse cenário complexo a utilização adequada das ferramentas constitui um
recurso imprescindível à interpretação, à análise e à decisão sobre as alterna-
tivas mais adequadas dentro dos mais variados contextos. Ainda assim, reco-
nhecendo a sua importância, é preciso lidar com as resistências e limitações
de todos nós com os números.
O nosso objetivo é viabilizar a integração, acesso e participação das popula-
ções no compartilhamento e reuso de forma livre e lícita dessas técnicas para
construção da Sociedade do Conhecimento.
Essa orientação tem sido praticada com o incentivo à expansão da internet
nas escolas, nos ambientes públicos, na divulgação e em parcerias com ins-
tituições da sociedade civil na promoção de cursos e programas de inclusão
digital, e muitas outras inciativas conhecidas e difundidas no mundo todo.
Dentre todos esses esforços, distribuídos nos diferentes níveis de acesso e atu-
ação, a responsabilidade das instituições de ensino, sobretudo as de nível su-
perior, é desenvolver conteúdos teóricos visando a formação de profissionais
qualificados e aptos a desempenhar ações estratégicas e efetivas.
É nessa perspectiva que o estudo da disciplina de Estatística Aplicada à Edu-
cação poderá contribuir na formulação, no compartilhamento e na formação
do cidadão com uma postura crítica diante das novas tendências, aconteci-
mentos e decisões.
10
ESTATÍSTICA APLICADA À EDUCAÇÃO
MULTIVIX EAD
Credenciada pela portaria MEC nº 767, de 22/06/2017, Publicada no D.O.U em 23/06/2017
Então, longe de qualquer pretensão de formar um especialista, a metodolo-
gia proposta na presente disciplina visa qualificar você diante da realidade. Os
desafios sugeridos no desenvolvimento dos textos, exemplos e exercícios vêm
ao encontro de prioridades e práticas consagradas internacionalmente.
Para que o nosso estudo seja proveitoso, recomendamos que você faça a lei-
tura dos textos com atenção e realize as consultas indicadas na bibliografia e
nas dicas de conteúdo complementar destacadas nos tópicos. Pode ser ne-
cessário que você recorra aos recursos externos para uma melhor compreen-
são do conteúdo ou até mesmo se aprofunde em alguns conteúdos já vistos
anteriormente.
Por fim, convidamos-lhe a percorrer conosco as várias unidades que com-
põem a disciplina, percebendo gradativamente sua utilidade no seu dia a dia
e a importância para a sua área profissional.
Até breve!
11
MULTIVIX EAD
Credenciada pela portaria MEC nº 767, de 22/06/2017, Publicada no D.O.U em 23/06/2017
ESTATÍSTICA APLICADA À EDUCAÇÃO
UNIDADE 1
12
MULTIVIX EAD
Credenciada pela portaria MEC nº 767, de 22/06/2017, Publicada no D.O.U em 23/06/2017
ESTATÍSTICA APLICADA À EDUCAÇÃO
> Identificar
a origem da
Estatística,
sua história,
fundamentos e as
principais aplicações
no cotidiano
das pessoas, das
organizações e dos
governos;
> Possibilitar o
entendimento e a
aplicação prática
do conhecimento
estatístico, através
dos fatos históricos
que marcaram o seu
desenvolvimento
enquanto Ciência.
OBJETIVO
Ao final da
unidade,
esperamos que
você seja capaz
de:
13
MULTIVIX EAD
Credenciada pela portaria MEC nº 767, de 22/06/2017, Publicada no D.O.U em 23/06/2017
ESTATÍSTICA APLICADA À EDUCAÇÃO
1 ESTATÍSTICA – CONCEITO,
FINALIDADE E SURGIMENTO
INTRODUÇÃO
Esta unidade se propõe a apresentar uma reflexão sobre o estudo da Edu-
cação Estatística e sua contribuição para a Pedagogia de ensino aplicada à
Educação.
Auxiliar na efetiva compreensão, análise e interpretação dos conceitos são
condições fundamentais para alcançarmos os objetivos propostos. Outro fa-
tor motivador do estudo reside no uso das ferramentas para selecionar, orga-
nizar e proporcionar análises das informações veiculadas nas redes sociais e
plataformas disponíveis no mundo digital.
Apresentaremos, nesta unidade, o relato sobre as pesquisas realizadas por
especialistas voltadas à realidade profissional e à prática dos métodos estatís-
ticos baseados na realidade de alunos e usuários das ferramentas.
1.1 EVOLUÇÃO DO PENSAMENTO ESTATÍSTICO
A partir de agora iniciaremos a nossa trajetória. Neste tópico, você compreen-
derá a origem e o percurso da Estatística, bem como saberá o seu significado.
Vamos começar!
Primeiramente, é importante que você saiba o significado de Estatística e a
sua importância. Você poderia conceituá-la? Ao responder o questionamen-
to anterior você deve ter dito que a Estatística estuda os números. Mas ela é
mais do que isso.
A Estatística é utilizada em várias áreas da sociedade e em nosso cotidiano. Ela
tem por objetivo realizar pesquisas, coletar dados, processá-los e analisá-los. Há
Estatística na relação candidato-vaga em concursos públicos, nas pesquisas de
intenção de voto que são realizadas no período eleitoral e ao contratar o seguro
do seu automóvel. Você sabia que o valor pago à seguradora é baseado em es-
tatísticas de outros clientes? Perceba que a Estatística é importante por vários
motivos e que ela está envolvida em muito do que se fala hoje.
14
ESTATÍSTICA APLICADA À EDUCAÇÃO
MULTIVIX EAD
Credenciada pela portaria MEC nº 767, de 22/06/2017, Publicada no D.O.U em 23/06/2017
Segundo Crespo (1995, p. 13), “A Estatística é uma parte da Matemática Aplicada
que fornece métodos para a coleta, organização, descrição, análise e interpreta-
ção de dados e para a utilização dos mesmos na tomada de decisões [...]”.
Assim como as demais ciências que tiveram uma ascensão significativa a par-
tir do século XVII, a Estatística se destacou enquanto pensamento inovador
para a compreensão dos processos de produção, de estudo e de pesquisa re-
lacionados a todos os tipos de eventos e fenômenos mensuráveis. Porém, isso
não significa que antes disso não existissem preocupações com os cálculos
de grandes números.
Na História, vemos que a palavra Estatística apareceu pela primeira vez no
século XVIII e foi sugerida pelo alemão Gottfried Achemmel (1719-1772). “Esta-
tística” é um nome que deriva de estado (statu, em Latim) e, de fato, as ativi-
dades da Estatística em sua origem eram, basicamente, atividades de Estado.
Mas hoje isso mudou bastante.
Avanços importantes da evolução da Estatística se traduziram em teorias
como:
• 1654 - O Cálculo das Probabilidades, pelos matemáticos italianos Blaise
Pascal e Pierre de Fermat, que são considerados os primeiros estudos.
• 1662 - Aritmética Política, de John Grant na Inglaterra.
• 1693- Tábua de Sobrevivência, pelo astrônomo inglês Edmond Halley.
• 1823 - Curva de Gauss ou Curva Normal, pelo matemático Carl Friedrich
Gauss.
Além dos estudos apresentados anteriormente, outros influenciaram na for-
mulação das teorias estatísticas durante a primeira metade do século XX. Se
destacaram os estudos realizados por Ronald Aylmer Fisher (1890-1962), Karl
Pearson (1857-1936), William Sealy Gosset (1876-1937), Frank Yates (1902-1994)
e muitos outros, que possibilitaram a descoberta e o aprimoramento de con-
ceitos relacionados a Inferência Estatística em toda a sua complexidade (este
conteúdo será objeto de estudo nas próximas unidades).
A Estatística ganhou maior destaque na proporção em que a as chamadas
Ciências da Natureza (Matemática, Química e Física) se desenvolveram e con-
quistaram espaços importantes no meio científico e acadêmico. Não menos
15
MULTIVIX EAD
Credenciada pela portaria MEC nº 767, de 22/06/2017, Publicada no D.O.U em 23/06/2017
ESTATÍSTICA APLICADA À EDUCAÇÃO
importante foram as influências e aplicações nas áreas da administração, da
economia e das ciências sociais, se tornando uma disciplina fundamental noplanejamento de empresas, governos e entidades voltadas à produção de
pesquisas.
Destaca-se, ainda, o desenvolvimento das tecnologias nos períodos das duas
grandes guerras mundiais, que proporcionaram investimentos pesados em
direção a ampliação dos armamentos e na capacidade de precisão e poderio
bélicos. Dentre esses avanços está a construção do primeiro protótipo que
serviu de base para criação dos computadores.
O filme “O jogo da imitação” (EUA, 2014) trata da história
de Alan Turing. O matemático britânico foi decisivo para
a derrota do nazismo e precursor dos computadores e
da inteligência artificial.
Atualmente, a Estatística é uma ciência consolidada, com fundamentos ajus-
tados ao convívio com o que há de melhor no mundo digital, com aplicações
dos seus métodos em programas e aplicativos de fácil acesso e manuseio,
capazes de produzir e oferecer dados e informações em tempo real. O retorno
desse aprimoramento se reflete no aumento da utilidade nos diversos setores
da atividade humana, democratizando e integrando conhecimentos.
Efeito idêntico se constata junto aos profissionais, usuários e especialistas quan-
to as exigências na capacitação e aperfeiçoamento contínuos das suas funções
para um desempenho profissional à altura da expectativa. Da mesma maneira,
empresas, instituições compartilhadoras, produtoras e consumidoras de dados
e informações, reestruturam e aperfeiçoam procedimentos, controles e cultura
organizacional para se manterem atualizadas e competitivas.
Estudos de ponta promovidos por Institutos Técnicos e Universidades em te-
mas relacionados a Rede Neural, Teoria do Caos, Softwares para análise de
Dados, Probabilidade, Estatísticas Multivariadas, Teoria dos Grafos, Modela-
gem Estocástica e dezenas de outros, que sugerem aplicações em sistemas
complexos e, cada vez mais sofisticados, multiplicam-se com facilidade e pos-
sibilitam um diagnóstico promissor na área de ciência e tecnologia com a
contribuição da Estatística.
16
ESTATÍSTICA APLICADA À EDUCAÇÃO
MULTIVIX EAD
Credenciada pela portaria MEC nº 767, de 22/06/2017, Publicada no D.O.U em 23/06/2017
Em que pese todo o desenvolvimento, muitos confundem os papéis exer-
cidos pela Estatística e a Matemática no campo das Ciências Exatas, assim
como interpretam de forma equivocada conceitos e resultados obtidos pela
aplicação de uma medida ou parâmetro estatístico. O problema não são
as dúvidas porventura existentes nesse ou naquele termo ou definição, ou
mesmo nos resultados alcançados, a questão central está na ausência de
uma “Educação Estatística” permanente e atualizada, que se diferencie no
enriquecimento da discussão e da abordagem (essas questões serão apro-
fundadas nas unidades seguintes).
1.2 CONCEITOS E OBJETIVOS
Após o breve relato de ocorrências históricas e dos desafios impostos à evo-
lução do pensamento estatístico, os argumentos para a implementação da
Educação Estatística nos currículos escolares ganham maior escala, muito
embora tenham aumentado as preocupações e os cuidados quanto a meto-
dologia mais apropriada a ser adotada.
Nesse aspecto, o presente tópico busca demonstrar alguns critérios que fo-
ram levados em consideração na superação das dificuldades geradas pelo
chamado “ensino tradicional”, a partir dos esforços realizados pela comunida-
de acadêmica representadas na bibliografia indicada por Garfield e Bem-Zvi
no sentido de incorporar os conceitos da Literacia Estatística, Raciocínio Esta-
tístico e Pensamento Estatístico à pedagogia de ensino da Estatística.
Literacia: diz respeito à habilidade de comunicação estatística, que envolve
ler, escrever, demonstrar e trocar informações, interpretar gráficos e tabelas
e entender as informações estatísticas dadas nos jornais e outras mídias,
sendo capaz de se pensar criticamente sobre elas. (CAMPOS; WODEWOTZI;
JACOBINI, 2011, p. 44)
Essa visão da Literacia Estatística foi construída por diversos autores no de-
correr de décadas de debates, em que aspectos voltados ao entendimento
básico, atitudes, interpretações, questionamentos sobre conceitos e termino-
logias, amadureceram a ponto de formar um entendimento mínimo sobre a
aplicação.
Durante o processo, o fortalecimento das ideias em torno de conceitos es-
tatísticos dividia espaço entre a importância do preparo do aluno para lidar
com volume considerável de dados e informações, ao mesmo tempo que se
17
MULTIVIX EAD
Credenciada pela portaria MEC nº 767, de 22/06/2017, Publicada no D.O.U em 23/06/2017
ESTATÍSTICA APLICADA À EDUCAÇÃO
buscava o compromisso social de formação da cidadania crítica capaz de dis-
tinguir e analisar os contextos apresentados. Esta concepção fez surgir o ter-
mo “cidadania estatística, se referindo às habilidades adquiridas pela pessoa
como resultado dessa atuação.
A Literacia prioriza o entendimento e a razão de ser dos conceitos explorados
na teoria estatística ao invés das fórmulas e cálculos propriamente ditos. A
interpretação nos diversos níveis de alcance do estudante deve ser explorada
com devida complementação de exemplos e exercícios baseados na realida-
de social e profissional. Deseja-se que haja um aumento na capacidade de o
aluno desenvolver a habilidade de comunicação estatística, discussão e cons-
trução de argumentos sólidos sobre o significado das fases e resultados do
experimento ou assunto. Vejamos o que Campos, Wodewotzi e Jacobini (2011,
p. 44) nos dizem com relação ao Raciocínio Estatístico:
O Raciocínio Estatístico pode ser categorizado, envolve a conexão ou a
combinação de ideias e conceitos estatísticos, significa compreender
um processo estatístico e ser capaz de explicá-lo, significa interpretar por
completo os resultados de um problema baseado em dados reais.;
Entende-se por Raciocínio Estatístico a capacidade desenvolvida para racioci-
nar sobre dados, realizar a sua representação, ter o entendimento sobre as me-
didas estatísticas, sobre as incertezas, amostras e associações entre variáveis.
Por ser uma fase caracterizada pelo contato mais imediato com fórmulas e
cálculo das medidas, os autores priorizam avaliar se essas atividades estão
proporcionando condições de interpretação e conclusão satisfatórias do con-
teúdo estudado.
A experiência demonstrou que a capacidade de aumento do raciocínio es-
tatístico não está diretamente relacionada somente com a aplicação de tra-
balhos, procedimentos e conceitos conectados com a realidade. A pesquisa
apontou que o aluno possui níveis diferentes de raciocínio que vão determi-
nar o grau de assimilação e desenvolvimento dos conteúdos.
Dentre os vários autores, Garfield (2002) foi o pesquisador que identificou es-
ses níveis e os classificou objetivando o acompanhamento da evolução dos
estudantes. Vejamos.
18
ESTATÍSTICA APLICADA À EDUCAÇÃO
MULTIVIX EAD
Credenciada pela portaria MEC nº 767, de 22/06/2017, Publicada no D.O.U em 23/06/2017
Nível 1 – Raciocínio idiossincrático.
O estudante sabe algumas palavras e símbolos estatísticos, usa-
os mesmo sem entende-los completamente e mistura-os com
informações não relacionadas. [...]
Nível 2 - Raciocínio verbal.
O estudante tem entendimento verbal de certos conceitos, mas não
aplica isso em seu comportamento. [...]
Nível 3 – Raciocínio transicional.
O estudante é capaz de identificar uma ou duas dimensões de
um processo estatístico, mas sem integrar completamente essas
dimensões. [...]
Nível 4 – Raciocínio processivo.
O estudante é capaz de identificar corretamente as dimensões de
um conceito ou processo estatístico, mas não integra completamente
essas dimensões ou não entende o processo por completo. [...]
Nível 5 – Raciocínio processual integrado.
O estudante tem um completo entendimento sobre um processo
estatístico, coordenando as regras e o comportamento da variável. Ele
pode até explicar o processo com suas próprias palavras. [...]
(CAMPOS; WODEWOTZI; JACOBINI, 2011, p. 33-4)
Em 2008, Garfield e Bem-Zvi, propõem o Ambiente de Aprendizagemdo Ra-
ciocínio Estatístico (AARE). Nesse estudo, os autores “estabelecem seis prin-
cípios que combinam sugestões de atividades de classe, textos, discussões,
tecnologia, procedimentos de ensino e de avaliação” (apud CAMPOS; WO-
DEWOTZI; JACOBINI, 2011, p. 36).
19
MULTIVIX EAD
Credenciada pela portaria MEC nº 767, de 22/06/2017, Publicada no D.O.U em 23/06/2017
ESTATÍSTICA APLICADA À EDUCAÇÃO
O Pensamento Estatístico é a capacidade de relacionar dados quantitativos
com situações concretas, admitindo a presença da variabilidade e da
incerteza, escolher adequadamente as ferramentas estatísticas, enxergar
o processo de maneira global, explorar os dados além do que os textos
prescrevem e questionar espontaneamente os dados e os resultados.
(CAMPOS, WODEWOTZI; JACOBINI, 2011, p.44).
Como mencionado anteriormente, a pesquisa em torno da aplicação dos mé-
todos mais adequados para o desenvolvimento da Educação Estatística con-
sidera o Pensamento Estatístico como mais um aspecto imprescindível na
sequência de estudos dos conceitos.
Nas formulações dos pesquisadores, o pensamento é o estágio onde o estu-
dante deve estar capacitado a relacionar dados quantitativos com situações
concretas, conhecer precisamente os conceitos de variabilidade e da incerte-
za, tendo facilidade em comunicá-los, entendê-los de forma global e resolver
problemas.
Esperamos que os conceitos abordados neste tópico possam auxiliar o aluno
na identificação de qual em quais estágio ele se encontra no aprendizado da
disciplina Estatística.
1.3 ESTUDOS E APLICAÇÕES DO ENSINO DA
ESTATÍSTICA
Neste tópico, reunimos alguns exemplos que resumem as aspirações levan-
tadas pelos autores com o objetivo de difundir os métodos de aprendizagem
e experiências de sucesso da Educação Estatística.
Foram vários os casos relatados e todas se assemelharam quanto ao método
e a forma de construção.
O envolvimento dos alunos também se fez presente em todo processo. A par-
ticipação ativa na busca de temas em comum resultou em maiores contribui-
ções individuais e motivação entre os grupos.
A apresentação dos trabalhos como forma de enriquecer a discussão de con-
teúdo e exercitar a comunicação da estatística fortalece o perfil do Pensa-
mento Estatístico.
Ao final, o docente realiza um resumo de tudo que foi objeto de estudo nos
grupos e apresentações e faz uma conclusão geral do assunto.
20
ESTATÍSTICA APLICADA À EDUCAÇÃO
MULTIVIX EAD
Credenciada pela portaria MEC nº 767, de 22/06/2017, Publicada no D.O.U em 23/06/2017
Diante desses pressupostos, verificamos que o estabelecimento de critérios
claros nas atividades desenvolvidas pode ser um determinante para o cum-
primento dos objetivos propostos.
Critérios que aproximem professor e aluno; permitam o uso do conhecimen-
to estatístico ao longo do projeto com base no conteúdo estudado; estabe-
leçam o foco nos métodos e processos estatísticos; façam a interface com a
Educação Crítica e a contextualização dos fatos; estimulem a escrita, interpre-
tação, discussão e conclusão dos dados e informações; fortaleçam o trabalho
de grupo; e que proporcione avaliação constante do raciocínio, pensamento
e da literacia estatística.
Por fim, constatamos nas bibliografias apresentadas o quanto foi positivo a
escolha dos modelos para a aplicação prática dos conhecimentos estatísti-
cos que cumpriram os requisitos necessários para o cumprimento das metas
propostas.
Destacamos a escolha de temas como eleições, mercado acionário, temas
que utilizam diversas variáveis (drogas, sexo, religião, raça, renda); e tantos
outros que demandaram conteúdos ligados à análise exploratória de dados,
amostragem, teste de significância, uso e interpretação de medidas de ten-
dência central, variabilidade, correlação e analise de regressão.
Outras aplicações ligadas à área de tecnologia e produção como o número
de defeitos ou porcentagem de peças defeituosas, custo médio da produção,
expectativa de durabilidade de equipamentos e sazonalidades no consumo,
poderiam fazer parte de mais outros modelos.
Observamos nos relatos que o resultado foi extremamente positivo tanto para
alunos quanto para professores que construíram juntos os processos de elabo-
ração de questionários, do uso de softwares com a plotagem dos resultados,
da elaboração de diversos gráficos e tabelas, além de possibilitar a consulta e
utilização completa de tábuas com os valores dos testes de significância.
Mais do que o uso eficaz dos métodos e processos, os experimentos demons-
traram que é perfeitamente possível o emprego dessas metodologias na bus-
ca do aperfeiçoamento do ensino da Estatística. Tornando-o mais acessível,
incorporado às demais disciplinas e importante no cumprimento dos objeti-
vos propostos no Ensino da Estatística.
21
MULTIVIX EAD
Credenciada pela portaria MEC nº 767, de 22/06/2017, Publicada no D.O.U em 23/06/2017
ESTATÍSTICA APLICADA À EDUCAÇÃO
1.4 RAZÃO, PROPORÇÃO E PORCENTAGEM
O objetivo deste tópico é estabelecer algumas correlações consideradas im-
portantes para o uso e interpretação dos resultados advindos de conclusões
ou processos envolvendo dados estatísticos.
Portanto, reafirmar as definições e conceitos importantes para estabelecermos
parâmetros e tirarmos algumas conclusões acerca de algumas observações.
FIGURA 1 – PORCENTAGEM
Fonte: Plataforma Deduca (2019).
• Razão é o quociente encontrado na divisão de dois números racionais a e b,
sendo b diferente de zero, ou seja: a/b=d, sendo b≠0. Significa dizer o quanto
cada unidade de a corresponde a unidades de b.
• Proporção é quando duas ou mais razões possuem o mesmo resultado, elas
recebem o nome de proporção, isto é: a/b=c/d, sendo b e d≠0
• Porcentagem é o resultado do quociente representados por uma fração
centesimal, ou seja, a/100. Proporção é a igualdade entre duas razões.
22
ESTATÍSTICA APLICADA À EDUCAÇÃO
MULTIVIX EAD
Credenciada pela portaria MEC nº 767, de 22/06/2017, Publicada no D.O.U em 23/06/2017
Em várias fórmulas e cálculos utilizados na estatística nos deparamos com
a necessidade de aplicar os conhecimentos de razão e proporção para com-
pletar dados numéricos em tabelas, gráficos etc., em face da importância de
comparar valores das variáveis, parâmetros e medidas.
Todavia, elas são as bases para outros conceitos derivados das suas aplicações
que vão contribuir na qualidade para comparação de resultados, interpreta-
ções e conclusões importantes.
• Índice: mede variações quantitativas ao longo do tempo. Muito utilizado para
comparar grupo de varáveis distintas relacionadas entre si, exemplos: preços
x quantidades, produtos x tempo, produto x área, pessoa x área, pessoa x
produto, pessoa x preço e assim por diante.
Índice de aceitação do produto
quantidades vendidasA
consumo das pessoas
=
• Coeficiente: obtido pela comparação entre duas quantidades de mesma
grandeza, ou seja, razão parte/todo, exemplos: pessoa/ população,
comprimento/área, tempo/tempo médio, quantidade/volume médio etc.
tempo disponível para visitaçãoCoeficiente de rotação
duração média das visitas
=
• Taxa: expressa em frações cujo denominador é uma potência de 10, ou uma
porcentagem, exemplo:
1 00
quartos ocupadosTaxa de ocupação
total de quartos disponíveis
×=
Observa-se que os resultados alcançados nos exemplos acima poderão ser
transformados e interpretados de forma relativa.
Nos processos estatísticos essas aplicações são fundamentais na concepção e
utilização do cálculo dos índices de Laspeyres, de Paache e de Fisher, funda-
mentais para aplicação no cálculo de preços e quantidades.
Os coeficientes na estatística são importantes na mensuração da variabilida-
de, relação entre variáveis, erros, distribuições, como por exemplo: Coeficiente
de Variação, Coeficiente de Pearson, Coeficiente de Determinação, Coeficien-
te de Correlação etc.
23
MULTIVIX EAD
Credenciada pela portaria MEC nº 767, de 22/06/2017, Publicada no D.O.U em 23/06/2017ESTATÍSTICA APLICADA À EDUCAÇÃO
O uso das taxas, geralmente, está associado à transformação de valores ab-
solutos em valores relativos para a realização de comparações entre variáveis,
classes de distribuições, colunas de frequência e cálculo de proporções entre
amostras e populações.
Através desses contextos que os conceitos de razão, proporção e porcenta-
gem se apresentam enquanto alternativas viáveis no uso dos métodos e fer-
ramentas estatísticas, contribuindo para a interpretação e conclusão dos ex-
perimentos.
1.5 SOMATÓRIO
Os somatórios compõem um conjunto de notações, fórmulas e demonstra-
ções, que sintetizam bem a razão de ser do raciocínio e pensamento estatís-
ticos. É representado pela letra grega sigma ∑ que significa soma, sendo
muito utilizado como recurso para a dedução e desenvolvimento de fórmu-
las, princípios, teoremas etc. que auxiliam na fundamentação teórica daquilo
que se deseja provar ou demonstrar.
Muitas vezes nos deparamos com o uso indiscriminado do termo somatório
enquanto sinônimo da soma de simples parcelas ou totais. No entanto, so-
matório é uma notação científica complexa e robusta, capaz de oferecer ao
operador a capacidade de argumentar sobre o padrão e o comportamento
de eventos. Vejamos alguns exemplos: X1, X2, X3, X4... Xn - observações de uma
determinada população.
X1 corresponde ao número de ordem da primeira observação.
i = 1, sub-índice (primeiro)
i = n, sub-índice (enésimo)
XI=índice de soma ou do somatório
Os sub-índices também podem ser representados por j, l, m, n etc., geralmen-
te podem ser utilizados simultaneamente para representar limites entre os
intervalos de observações. Os índices de soma podem ser substituídos por
qualquer outra letra (desde que não intervenha na soma), como por exemplo
a letra K.
24
ESTATÍSTICA APLICADA À EDUCAÇÃO
MULTIVIX EAD
Credenciada pela portaria MEC nº 767, de 22/06/2017, Publicada no D.O.U em 23/06/2017
Exemplo 1:
X1+ X2+ X3+ X4 +...+ Xn
Então, 1 2 3 41 ...
n
ni
x x x x x
=
+ + + + +∑
Com base na demonstração acima, é possível operar a soma de n variáveis
desde a primeira observação até a última, perfazendo o entendimento resu-
mido através de uma única notação de somatório:
Logo 1
n
ni
x
=∑
Leia-se, somatório de n variáveis X compreendidas entre a primeira e a última
observação.
Exemplo 2:
2 2 2 2
1 2 3 ... nX X X X+ + + +
Então 2 2 2 22 31 ...
n
i ni
X X X X
=
+ + + +∑
Logo 2
1
n
ni
x
=∑
Leia-se, somatório de variável X elevada a potência 2 compreendidos entre a
primeira até primeira até última observação.
Essas notações são a base para a demonstração das fórmulas que utilizam a
soma de variáveis e compõem boa parte dos processos estatísticos.
25
MULTIVIX EAD
Credenciada pela portaria MEC nº 767, de 22/06/2017, Publicada no D.O.U em 23/06/2017
ESTATÍSTICA APLICADA À EDUCAÇÃO
CONCLUSÃO
Esta unidade objetivou-se a apresentar uma reflexão sobre o estudo da Ed-
ucação Estatística e sua contribuição para a pedagogia de ensino da ciência
Estatística, aplicadas aos diversos setores e atividades. O exemplo dos pesqui-
sadores Garfield e Bem-Zvi – que propuseram o “Ambiente de Aprendizagem
do Raciocínio Estatístico” – vem oferecendo subsídios ao aperfeiçoamento do
ensino da Estatística.
Registrou-se a sua efetiva utilidade e importância para a compreensão, análise
e interpretação dos fluxos de dados e informações veiculados nas redes soci-
ais e plataformas disponíveis no mundo digital.
Por último, comprovou-se através dos resultados o uso satisfatório dos méto-
dos e processos experimentados com a utilização dos conceitos e exemplos
voltados a realidade dos alunos, indicam alternativas concretas para o desen-
volvimento pleno da disciplina.
ANOTAÇÕES
UNIDADE 2
26
MULTIVIX EAD
Credenciada pela portaria MEC nº 767, de 22/06/2017, Publicada no D.O.U em 23/06/2017
ESTATÍSTICA APLICADA À EDUCAÇÃO
> Estudar como
estruturar os dados
e transformá-los em
informações.
> Aplicar as
metodologias para a
coleta, classificação,
organização e
apresentação.
OBJETIVO
Ao final da
unidade,
esperamos que
você seja capaz
de:
27
MULTIVIX EAD
Credenciada pela portaria MEC nº 767, de 22/06/2017, Publicada no D.O.U em 23/06/2017
ESTATÍSTICA APLICADA À EDUCAÇÃO
2 DISTRIBUIÇÃO DE
FREQUÊNCIAS E REPRESENTAÇÃO
GRÁFICA
INTRODUÇÃO
Esta unidade se propõe a apresentar uma reflexão sobre o estudo da distri-
buição de frequências e representação gráfica, destacando a importância da
aplicação das suas metodologias para a coleta, classificação, organização e
apresentação dos dados. Além do emprego sobre o cálculo de índices e taxas,
distinguindo as diferentes formas de distribuição, séries e gráficos.
Ao final, espera-se que você tenha condições de interpretar as informações a
partir da coleta e da organização dos dados.
Serão, também, objetos desta unidade os exemplos de tabelas de distribui-
ção de frequências e das séries estatísticas, devidamente relacionadas com
os gráficos e demonstrativos, buscando adequar o conteúdo à realidade e à
prática profissional.
2.1 PLANEJAMENTO, COLETA E APRESENTAÇÃO
DE DADOS
O planejamento, a coleta e a apresentação de dados tratam-se das etapas ini-
ciais e importantes do processo estatístico. Geralmente, o objetivo é produzir
informações e relatórios, auxiliar na elaboração de estudos, pareceres, ações
e decisões, além de subsidiar políticas, diretrizes e o atingimento de metas.
Para tanto, é fundamental organizar os processos de trabalho através de
um planejamento que ofereça as condições para o desenvolvimento ade-
quado de todas as fases, considerando o foco e o interesse no objeto. Pla-
nejamento é uma função administrativa importante em toda organização,
seja em uma empresa, entidade ou mesmo na vida pessoal. O seu desen-
volvimento adequado significa organicidade, economia e racionalidade
aos processos.
28
ESTATÍSTICA APLICADA À EDUCAÇÃO
MULTIVIX EAD
Credenciada pela portaria MEC nº 767, de 22/06/2017, Publicada no D.O.U em 23/06/2017
O planejamento figura como a primeira função
administrativa, por ser aquela que serve de base para
as demais funções. Ele é a função administrativa que
determina antecipadamente quais são os objetivos a
serem atingidos e como s e deve fazer para alcançá-los.
Trata-se, pois, de um modelo teórico para a ação futura.
Começa com a determinação dos objetivos e detalha os
planos necessários para atingi-los da melhor maneira
possível. Planejar é definir os objetivos e escolher
antecipadamente o melhor curso de ação para alcançá-
los. O planejamento define onde se pretende chegar, o
que deve ser feito, quando, como e em que sequência.
(CHIAVENATO, 2004, p. 167-168)
Diante dessa constatação, passa-se a escolha das melhores alternativas dis-
poníveis com base nas metodologias e processos estatísticos, considerando,
sobretudo, a natureza daquilo que se deseja pesquisar. Essa definição é fun-
damental, pois tudo que vier a partir do objeto de estudo estará dentro do
planejamento que, por sua vez, determinará os melhores meios para a reali-
zação dos trabalhos.
Como o objetivo desta unidade não é o detalhamento de um planejamento
estatístico para pesquisa ou projeto, que passaria obrigatoriamente pela es-
colha do processo de coleta, justificativas, fundamentação teórica, plano de
trabalho, testes piloto e instrumentos de análise definitivos, partiremos do
princípio de que o objeto a ser estudado ou o foco do nosso trabalho seja des-
critivo, isto é, apenas descrever as características de um determinado fenô-
meno ou evento e as etapas para coleta, organização e divulgação dos dados
e informações.
Já a coleta de dados pode ser realizada por meio de vários processos: pes-
quisas, levantamentos, consultas, entrevistas, acessos a arquivos, documentos
etc. Podendo ser feita, ainda, de maneira direta pelo próprio pesquisador por
meio de pesquisas ou aplicação de questionários, ou indireta, através do uso
de fontes de consulta para extrair dadose informações.
29
MULTIVIX EAD
Credenciada pela portaria MEC nº 767, de 22/06/2017, Publicada no D.O.U em 23/06/2017
ESTATÍSTICA APLICADA À EDUCAÇÃO
A partir da definição do planejamento e da forma de coleta, faz-se necessária
a realização da tabulação dos dados. Na tabulação, os dados são ordenados
de acordo com o tipo de informação que se deseja obter, elencando as variá-
veis e os respectivos atributos.
Exemplo
TABELA 1 – MATRIZ DE RESPOSTAS: DUPLA ENTRADA
Funcionários
Atributos
Idade
(Em
anos)
Tempo na
empresa
(em anos)
Gênero
Grau de
escolaridade
Número de
dependentes
Função na
empresa
Funcionário 1
Funcionário 2
[...]
Fonte: Novaes (2013, p. 33) .
Matriz de respostas das características dos funcionários da empresa X. Dessa
forma, cada coluna representa uma variável estatística que se quer estudar.
Vamos pensar em cada uma dessas colunas separadamente. Se considerarmos
a ordem na qual esses dados foram coletados, o conjunto assim constituído
recebe o nome de conjunto de dados brutos. Na empresa (em anos) Gênero,
Grau de escolaridade e Número de dependentes [...]
Nesse estágio, alguns conceitos são utilizados para melhor precisão e diferen-
ciação do trabalho:
1. Dados brutos – são os dados obtidos na sua forma natural, sem qualquer
organização.
2. Rol – são os dados brutos ordenados.
3. Tabelas – são os dados ordenados em linhas e colunas indicadoras das
variáveis e valores. Têm como elementos: título, corpo, cabeçalho e co-
luna indicadora (no decorrer dos tópicos estaremos trabalhando com
vários exemplos).
4. Gráficos – imagens e figuras representativas dos dados tabulados e or-
denados. Apresentam diferentes tipos e funcionalidades (a serem deta-
lhados nos próximos tópicos).
30
ESTATÍSTICA APLICADA À EDUCAÇÃO
MULTIVIX EAD
Credenciada pela portaria MEC nº 767, de 22/06/2017, Publicada no D.O.U em 23/06/2017
A apresentação ou divulgação são etapas finais após a coleta e a tabulação.
Nelas, o trabalho é resumido e apresentado sob a forma de tabela, gráficos e
demonstrativos para melhor garantir a transparência dos resultados
2.2 VARIÁVEIS
As variáveis são elementos importantes e decorrentes do objeto planejado.
Conhecer a origem do evento, a pesquisa ou o experimento a ser estudado
passa pelo conhecimento da variável ou das variáveis que podem interferir na
condução dos métodos e processos de trabalho.
“A variável é uma condição ou característica dos elementos da população que
pode assumir valores diferentes em diferentes elementos” (VIEIRA, 2015, p. 2).
Ela pode ser qualitativa ou nominal, ou, ainda, quantitativa. A primeira se ca-
racteriza por um atributo do objeto de pesquisa. Pode ser categorizada como
nominal ou ordinal. Uma variável qualitativa nominal é aquela em que não
se pode estabelecer uma relação de ordem ou hierarquia, exemplo: cor dos
olhos, sexo, estado civil etc. Quanto à variável qualitativa ordinal, esta permite
a hierarquização e ordenação, exemplo: grau de satisfação, cargo hierárquico,
grau de concordância, grau de instrução, classe social etc.
“Variável qualitativa ou categorizada é quando se distribui em categorias, ou
seja, em classes diferentes. É expressa por meio de palavras” (VIEIRA, 2015, p. 2).
Para ilustrar um exemplo de variável qualitativa, a tabela a seguir apresenta
duas colunas contendo informações sobre o ranking de países mais bem
colocados em competitividade digital. Algumas características se destacam,
tais como: o tratamento da variável país associada a uma classificação ou
categoria.
TABELA 2 - RANKING DE COMPETITIVIDADE DIGITAL DA ESCOLA DE NE-
GÓCIOS SUÍÇA IMD
Países Ranking
Estados Unidos 1
Singapura 2
Suécia 3
Dinamarca 4
Fonte: Adaptada de Tuon (2019) .
31
MULTIVIX EAD
Credenciada pela portaria MEC nº 767, de 22/06/2017, Publicada no D.O.U em 23/06/2017
ESTATÍSTICA APLICADA À EDUCAÇÃO
A Tabela 2 é parte do estudo avaliar competitividade digital econômica dos
países, foram analisados três fatores: conhecimento, que significa a capaci-
dade do país de entender e aprender novas tecnologias; tecnologia, que é a
competência para desenvolver inovações digitais; e preparação para o futuro.
A variável quantitativa é aquela que pode ser mensurada numericamente. Divi-
de-se em discreta e contínua. Discretas são aquelas variáveis que podem repre-
sentar quantidade finita ou enumerável de valores, exemplo: número de filhos,
quantidade de gols, salários etc. Já contínuas são aquelas que podem assumir
qualquer valor dentro de um intervalo; exemplo: altura, peso, salários etc.
Vale lembrar que, em todos os casos citados, o contexto em que estão inse-
ridas as variáveis é que determina a sua classificação. “A variável quantitativa
ou numérica é quando resulta de um processo de contagem ou medição. É
expressa por meio de números” (VIEIRA, 2015, p. 2).
Para ilustrar um exemplo de variável quantitativa, a tabela a seguir mostra
duas colunas contendo informações sobre a quantidade de salários mínimos
distribuídos em faixas de 0,5 salários, relacionados ao valor per capta.
TABELA 3 - IMPACTO DAS RESTRIÇÕES DO FIES – RENDA (SALÁRIOS MÍNI-
MOS) 2018
Faixa de Renda SM Per Capita Renda Per Capita
Até 0,5 R$ 499,00
De 0,5 a 1,0 R$ 998,00
De 1,0 a 1,5 R$ 1.497,00
De 1,5 a 2,0 R$ 1.996,00
De 2,0 a 3,0 R$ 2.495,00
Fonte: Brasil (2019)
A Tabela 3 faz parte do estudo de impacto das restrições do Fies para o finan-
ciamento do ensino superior no Brasil, apresentado por especialistas que de-
bateram sobre a readequação do atual modelo de financiamento em direção
a um sistema que seja condicionado à renda, em Brasília, no ano de 2019.
32
ESTATÍSTICA APLICADA À EDUCAÇÃO
MULTIVIX EAD
Credenciada pela portaria MEC nº 767, de 22/06/2017, Publicada no D.O.U em 23/06/2017
2.3 ANÁLISE EXPLORATÓRIA DOS DADOS
A análise exploratória aborda um campo vasto de conceitos e aplicações. Es-
tende-se desde a coleta, tabulação e organização dos dados, passando pela
elaboração das medidas de tendência central, separatrizes e variabilidade.
Trata-se da própria estatística descritiva na maior parte das suas aplicações.
Com o objetivo de facilitar o seu entendimento, resolvemos fazê-la de forma
destacada para termos a oportunidade de apontar detalhes e observações que
serão mais proveitosas no entendimento da matéria. Para tanto, priorizamos
métodos cuja observação das variáveis, da dispersão e dos aspectos das distri-
buições fiquem mais visíveis a partir da adoção de alguns procedimentos.
As bibliografias apresentadas exploram alguns processos que entendemos
serem mais adequados enquanto análise exploratória. Tratam da análise bi-
dimensional – que são as diferentes formas de verificar, analisar e medir a
associação, dependência e correlação entre as variáveis; e o método de ramos
e folhas – identificação das distribuições, medidas de posição ou centrais, de
variabilidade e separatrizes, a partir das observações das frequências e classes
das variáveis.
2.3.1 Análise bidimensional
Analisar variáveis de forma conjunta e identificar as possíveis relações entre
elas são importantes para aprofundarmos os conhecimentos sobre objeto de
estudo em todas as suas dimensões.
O principal objetivo das análises nessa situação é explorar relações
(similaridades) entre as colunas, ou algumas vezes entre as linhas. Como
no caso de apenas uma variável que estudamos, a distribuição conjunta
das frequências será́ um instrumento poderoso para a compreensão do
comportamento dos dados. (BUSSAB; MORETTIN, 2017, p. 80)
Geralmente, são expressas sob a forma de matriz em que as variáveis são dis-
postas em linhas e colunas, perfazendo totais e estabelecendo campos de in-
tersecção entre os dados. Essa construção visual favorece o estabelecimento de
relações entre as variáveis e permite deduzir possíveis associações entre elas.
33
MULTIVIX EAD
Credenciada pela portaria MEC nº 767, de 22/06/2017, Publicada no D.O.U em 23/06/2017
ESTATÍSTICA APLICADA À EDUCAÇÃO
Durante o processo nos depararemoscom três situações:
1. Duas variáveis são qualitativas.
2. Duas variáveis são quantitativas.
3. Uma variável é qualitativa e outra é quantitativa.
Vejamos o exemplo da Tabela 4 a seguir. Nela, são dispostas as variáveis em
linhas (1, 2..., i...., n) e colunas (X1, X2..., Xj... Xp), em que é possível verificar os
pontos comuns entre a linha 1 e a coluna 1 11X ; entre a linha 2 e a coluna 2 22X ;
e assim sucessivamente; assim como os totais por linhas e colunas.
TABELA 4 - TABELA DE CONTINGÊNCIA
Indivíduos
Variáveis
1X 2X ... jX ... pX
1 11X 12X ... 1 jX ... 1pX
2 21X 2 jX ... 2 jX ... 2 pX
.
.
.
.
.
.
.
.
.
...
.
.
.
...
.
.
.
i 1iX 2iX ... ijX ... ipX
.
.
.
.
.
.
.
.
.
...
.
.
.
...
.
.
.
n 1nX 2nX ... njX ... npX
Fonte: Bussab e Morettin (2017, p. 80) .
34
ESTATÍSTICA APLICADA À EDUCAÇÃO
MULTIVIX EAD
Credenciada pela portaria MEC nº 767, de 22/06/2017, Publicada no D.O.U em 23/06/2017
2.3.2 Associação entre variáveis qualitativas
Associação entre variáveis qualitativas significa identificar entre duas ou mais
variáveis aleatórias como elas se comportam quando comparadas umas com
as outras.
Geralmente são dispostas em tabelas de dupla entrada para representar as
frequências nas linhas e colunas. Importante que estejam apresentadas sob
a forma de números relativos para a realização de uma boa análise, dessa ma-
neira a comparação entre as variáveis fica facilitada.
Conforme conteúdo complementar indicado abaixo, destacamos as tabelas
de dupla entrada para representação das variáveis qualitativas, também cha-
mada tabelas de contingências. Ressaltamos, ainda, as distribuições conjun-
tas- representadas pelos pares ordenados formados pela interseção de linhas
e colunas das variáveis; e das distribuições marginais - resultado do valor total
da coluna ou linha de uma variável específica.
(BUSSAB, W. de O.; MORETTIN, P. A. Estatística básica. 9.
ed. São Paulo: Saraiva, 2017. p. 71 a 73).
2.3.3 Medidas de associação entre variáveis
qualitativas
O coeficiente de contingência de Pearson é uma das medidas que quantifica
o grau de associação entre as variáveis qualitativas. Sua representação é re-
sultado do comparativo entre os valores relativos das distribuições conjuntas
das variáveis relacionados na tabela de contingência, considerando os desvios
entre valores esperados e valores observados.
A diferença é que o coeficiente de Pearson tem como resultado a utilização
do 2X Qui− . Quadrado (uma medida do afastamento global dada pela soma
de todos os desvios em relação à média), ou seja, quanto maior a discrepância,
maior a associação entre as variáveis. O segundo método (Tschuprov) utiliza,
35
MULTIVIX EAD
Credenciada pela portaria MEC nº 767, de 22/06/2017, Publicada no D.O.U em 23/06/2017
ESTATÍSTICA APLICADA À EDUCAÇÃO
assim como o primeiro, o 2X e o n (nº de variáveis) e acrescenta as categorias
das variáveis, representadas por r e s. A vantagem do segundo método é que
o resultado fica dentro do limite de 0 1T≤ ≤ . Quanto mais próximo de 1, maior
a associação entre as variáveis.
2.3.4 Medidas de associação entre variáveis
quantitativas
O coeficiente de correlação de Pearson mensura o grau de associação entre
as variáveis quantitativas. Sua representação é resultado do comparativo en-
tre os valores relativos das distribuições conjuntas das variáveis relacionados
na tabela de contingência ou dupla entrada, considerando a média dos pro-
dutos dos valores padronizados das variáveis. Como resultado da operação, o
coeficiente calculado estará entre –1 ≤ corr (XY) ≤ 1, indicando forte associação
negativa ou positiva na medida que o resultado aponta para os extremos.
1
1( , )
( ) ( )
n i ix x y yCorr X Y
n dp X dp Y
− −=
∑ ou
cov( , )( , )
( ). ( )
X YCorr X Y
dp X dp Y
=
Em que cov = covariância
2.3.5 Medidas de associação entre variáveis
qualitativas e quantitativas
Nesses casos, a associação se faz através da análise da variância total (global) e
da variância calculada dentro da categoria. A variância global é calculada pela
variável quantitativa; a variância dentro da categoria representa a variabilida-
de da variável qualitativa. Se a variância da variável qualitativa for menor que a
quantitativa, podemos afirmar que a variável qualitativa melhora a capacida-
de de previsão da quantitativa, ou seja, existe uma relação entre elas.
2 var( ) var(S)
var( )
SR
S
−= sendo:
Var (S) = Variância global
36
ESTATÍSTICA APLICADA À EDUCAÇÃO
MULTIVIX EAD
Credenciada pela portaria MEC nº 767, de 22/06/2017, Publicada no D.O.U em 23/06/2017
var(S) = Variância da categoria
2R = ² 0 ² 1Coeficiente de Determinação R= ≤ ≤
2.4 RAMOS E FOLHAS
Para Morettin (2017, p. 20), “ramos e folhas é um procedimento alternativo
para resumir um conjunto de valores, com o objetivo de se obter uma ideia da
forma de sua distribuição”.
Na Tabela 5 a seguir, reproduzimos o exemplo do uso do ramos e folhas dos
salários de 36 empregados da Companhia MB. As observações são divididas
em duas partes: a primeira (o ramo) é colocada à esquerda de uma linha ver-
tical, a segunda (a folha) é colocada à direita. Nesse caso, para os salários 4,00
e 4,56, o 4 é o ramo e 00 e 56 são as folhas, e assim sucessivamente.
TABELA 5 – RAMOS E FOLHAS
4 00 56
5 25 73
6 26 66 86
7 39 44 59
8 12 46 74 95
9 13 35 77 80
10 53 76
11 06 59
12 00 79
13 23 60 85
14 69 71
15 99
16 22 61
17 26
18 75
19 40
20
21
22
23 30
Fonte: Vieira (2015, p. 20).
37
MULTIVIX EAD
Credenciada pela portaria MEC nº 767, de 22/06/2017, Publicada no D.O.U em 23/06/2017
ESTATÍSTICA APLICADA À EDUCAÇÃO
Observando os valores anteriores, identificamos que:
I. Os valores estão concentrados entre os salários 4,00 e 19,40.
II. O valor 23,20 é um ponto distante da distribuição, e deve ser desconside-
rado para efeito de cálculo das medidas principais.
III. A distribuição dos valores é assimétrica devido à concentração nos salá-
rios iniciais.
Outras considerações podem ser realizadas em torno das medidas de ten-
dência central, variabilidade, medidas separatrizes etc. Como havíamos co-
mentado no início, a nossa intenção era trazer para a análise exploratória de
dados aqueles procedimentos mais exclusivos, sendo que os conceitos das
medidas mencionadas anteriormente serão objeto de aprofundamento em
unidade específica.
Recomendamos a leitura do conteúdo relativo ao método
de ramos e folhas e seus exercícios para fixação dos
conceitos: BUSSAB, W. de O.; MORETTIN, P. A. Estatística
básica. 9. ed. São Paulo: Saraiva, 2017. p. 20-23.
2.5 NÚMEROS ÍNDICES
É o quociente entre valores pertencentes a variáveis idênticas, cujo resultado
geralmente se remete a uma comparação de preços, quantidades ou valores
entre períodos distintos.
100
valor consideradoÍndice
valor de referência
= ×
Na economia, os índices são utilizados para comparar valores em datas distin-
tas. São as denominados valor na data corrente e o valor na data base. Na data
base, o índice vale 100 e a variação do período é acrescida ou retirada para
refletir a comparação entre os valores no tempo.
100
valor data correnteÍndice
valor na data base
= ×
38
ESTATÍSTICA APLICADA À EDUCAÇÃO
MULTIVIX EAD
Credenciada pela portaria MEC nº 767, de 22/06/2017, Publicada no D.O.U em 23/06/2017
IV. Índice 110 significa 110% do valor da variável na data
base, ou seja, ocorreu um aumento de 10% no valor da
variável.
V. Índice 80 significa 80% do valor na data base, ocorreu
um decréscimo no valor da variável de 20% (VIEIRA,
2015, p. 101).
2.5.1 Índices relativos simples
Refere-se ao cálculo de preços ou quantidades relativas a um único bem ou
serviço em determinado período.
• Índice relativo de preço ou preço relativo
0 0
100tt PPI P P
= ×
• Índice relativo de quantidade ou quantidade relativa
0 0
100tt QQI Q Q
= ×
2.5.1 Índices gerais
Trata da média aritmética dospreços relativos, ou seja, é a representação de
vários preços através de um único índice de valores correspondente a um
conjunto de bens e serviços. Difere-se do índice simples pelo fato de conter
mais de um valor ou item de análise.
( ) 100
º
soma dos preços relativosÍndice geral média dos preços relativos
n de produtos
= ×
0 0
1Im 100itt
i
PP
P n P
= × ∑
100
Índice agregativo simples ou índice agregativo simples de preços
soma dos preços na data t
soma dos preços na data base
=
×
39
MULTIVIX EAD
Credenciada pela portaria MEC nº 767, de 22/06/2017, Publicada no D.O.U em 23/06/2017
ESTATÍSTICA APLICADA À EDUCAÇÃO
Índice agregativo simples ou índice agregativo simples de qualidades
soma das quantidades na data t
soma das quantidades na data base
=
0 0
100itt
i
QQIa Q Q
= × ∑
Recomendamos a leitura do conteúdo relativo aos
números índices e seus exercícios para fixação dos
conceitos: VIEIRA, S. Estatística básica. São Paulo:
Cengage Learning, 2015. cap. 7-8.
2.6 SÉRIES E DISTRIBUIÇÕES DE FREQUÊNCIAS,
ESPACIAIS, ESPECÍFICAS E TEMPORAIS
Distribuição de frequências é a forma como organizamos os dados, e as va-
riáveis com as respectivas frequências de acordo com suas características e
especificidades.
Distribuição de frequências: relação estabelecida, na
qual cada opção tem apenas um valor de observações
feitas e todas as opções são associadas a um único valo.
(NOVAES, 2013, p. 35).
Nela, encontramos a base para a realização dos cálculos das medidas e a or-
ganização por meio de tabelas.
As distribuições podem ser classificadas pelo tipo de série estatística:
I. Série de distribuição específica: em que o fenômeno ou o fato estudado é o
principal fator de organização das informações.
II. Série de distribuição espacial: deve-se ao fato de a análise envolver regiões,
locais e relacioná-los com aspectos econômicos, sociais etc.
40
ESTATÍSTICA APLICADA À EDUCAÇÃO
MULTIVIX EAD
Credenciada pela portaria MEC nº 767, de 22/06/2017, Publicada no D.O.U em 23/06/2017
III. Série de distribuições temporais: ênfase no tempo ou período em que o fato
foi observado.
As distribuições de frequências são formadas a partir da construção de uma
tabela baseada no número total de observações realizadas e distribuídas se-
gundo as suas frequências. A sequência a seguir demonstra como realizar a
sua elaboração:
I. Calcula-se a amplitude total = maior valor menos o menor valor observado.
Aplica-se a fórmula de Sturges = 1 3,3 K log X= + , em que k é nº de classes a ser
calculado, X é a amplitude total.
Calcula-se a classe e a sua amplitude, distribuindo as observações nos respec-
tivos intervalos de classe.
TABELA 6 - DISTRIBUIÇÃO DE ALUNOS DO PRIMEIRO GRAU POR FAIXA
ETÁRIA DO COLÉGIO A – MAIO 2017
Distribuição de alunos por idade Valores por idade
13 a 14 77
15 a 16 150
17 a 18 50
Total 277
Fonte: Elaborada pelo autor (2019).
Recomendamos a leitura do conteúdo relativo ao
método de ramos e folhas e seus exercícios para fixação
dos conceitos: NOVAES, D. V. Estatística para educação
profissional e tecnológica. 2. ed. São Paulo: Atlas, 2013.
p. 33-36.
41
MULTIVIX EAD
Credenciada pela portaria MEC nº 767, de 22/06/2017, Publicada no D.O.U em 23/06/2017
ESTATÍSTICA APLICADA À EDUCAÇÃO
2.7 GRÁFICOS EM SETORES, LINHA, POLÍGONO,
HISTOGRAMA E OUTROS DIAGRAMAS
A forma de representação gráfica mais adequada está relacionada à distribui-
ção e ao tipo de série em que estão organizados os dados coletados.
Outro aspecto importante são os tipos de variáveis incluídas no estudo. Se
qualitativa ou quantitativa; com dados discretos ou contínuos. Todos devem
possuir fontes, títulos e legendas para efeito de complemento e integridade
da informação (os demonstrativos a seguir são ilustrativos e não contêm o
rigor das recomendações acima).
Gráfico em setores: objetiva a representação de partes relativas ao todo pes-
quisado. Pode oferecer variações de cores, estilos e legendas de forma a evi-
denciar o que se deseja divulgar. Não há restrições quanto ao tipo de dado ou
variável.
GRÁFICO 1 – SETORES
Fonte: Elaborado pelo autor (2019).
Gráfico em colunas: demonstra a evolução de determinado fato em períodos.
Nos eixos, estão o período e a escala de valores. As legendas expressam as va-
riáveis estudadas com as respectivas porcentagens. No primeiro modelo, as
colunas apresentam pequenos espaços, o que evidencia a apresentação de
dados discretos.
No segundo, a forma estilizada contempla a continuidade das observações e,
portanto, melhor representa as variáveis contínuas. O histograma é o exem-
plo mais clássico onde as colunas são dispostas de forma contínua para a re-
presentação da distribuição.
42
ESTATÍSTICA APLICADA À EDUCAÇÃO
MULTIVIX EAD
Credenciada pela portaria MEC nº 767, de 22/06/2017, Publicada no D.O.U em 23/06/2017
GRÁFICO 2 - COLUNAS
Fonte: Elaborado pelo autor (2019).
Gráfico em barras é uma variação do gráfico em colunas. É aconselhável para
informações cujos títulos sejam melhores dispostos na forma horizontal (vari-
áveis qualitativas).
GRÁFICO 3 - BARRAS
Fonte: Elaborado pelo autor (2019).
43
MULTIVIX EAD
Credenciada pela portaria MEC nº 767, de 22/06/2017, Publicada no D.O.U em 23/06/2017
ESTATÍSTICA APLICADA À EDUCAÇÃO
Gráfico em linhas também deriva dos dois anteriores. Aconselhável para a
demonstração de períodos longos com quantidades grandes de dados. Não
tem restrições quanto ao tipo de variável e a dados na sua apresentação. No
caso do polígono de frequência, as linhas são ligadas por um ponto médio do
histograma.
GRÁFICO 4 - LINHAS
Fonte: Elaborado pelo autor (2019).
Existem vários outros gráficos e demonstrativos que visam aumentar o grau
de sensibilidade para o que se deseja informar, em que o uso de figuras, fotos
e ilustrações auxiliam na comunicação e no entendimento.
GRÁFICO 5 – DEMONSTRATIVOS
Fonte: Elaborado pelo autor (2019).
44
ESTATÍSTICA APLICADA À EDUCAÇÃO
MULTIVIX EAD
Credenciada pela portaria MEC nº 767, de 22/06/2017, Publicada no D.O.U em 23/06/2017
O fundamental nesses trabalhos é atentar-se para as normas que regem tais
apresentações, como os títulos, as fontes, as notas e as chamadas. A informa-
ção é que deve ser a prioridade na construção das imagens e dos conteúdos
divulgados.
CONCLUSÃO
Esta unidade objetivou-se a apresentar uma reflexão sobre o estudo da dis-
tribuição de frequências e a representação gráfica, destacando a importância
da aplicação das suas metodologias para a coleta, classificação, organização e
apresentação dos dados, bem como no cálculo de índices e taxas, buscando
distinguir as diferentes formas de distribuição, séries e gráficos
Esperamos que faça bom uso do conteúdo e atente-se para os estudos com-
plementares indicados nos tópicos.
45
MULTIVIX EAD
Credenciada pela portaria MEC nº 767, de 22/06/2017, Publicada no D.O.U em 23/06/2017
ESTATÍSTICA APLICADA À EDUCAÇÃO
ANOTAÇÕES
UNIDADE 3
46
MULTIVIX EAD
Credenciada pela portaria MEC nº 767, de 22/06/2017, Publicada no D.O.U em 23/06/2017
ESTATÍSTICA APLICADA À EDUCAÇÃO
> Calcular e
diferenciar cada uma
das medidas, realizar
a devida aplicação
nos casos concretos
e estabelecer a
devida comparação
gráfica entre elas.
> Ênfase na
compreensão sobre
a distribuição,
concentração e
dispersão dos
valores.
OBJETIVO
Ao final da
unidade,
esperamos que
você seja capaz
de:
47
MULTIVIX EAD
Credenciada pela portaria MEC nº 767, de 22/06/2017, Publicada no D.O.U em 23/06/2017
ESTATÍSTICA APLICADA À EDUCAÇÃO
3 MEDIDAS DE TENDÊNCIA
CENTRAL, DE POSIÇÃO E
SEPARATRIZES
INTRODUÇÃO
As Medidas de Tendência Central, as Medidas de Posição ou Medidas Resumo
são as denominações representativas do grupo de medidas importantes na
análise da concentração dos dados dentro da distribuição, mais precisamen-
te daqueles dados que se posicionam aocentro. Eles são representados pelas
Médias, Mediana e Moda. Cada uma delas possui características e funções
singulares na mensuração do tipo de distribuição resultante do trabalho de
coleta dos dados.
As Medidas Separatrizes são as responsáveis pelo posicionamento dos dados
dentro da distribuição, estendendo a análise para as informações do centro
até as extremidades. Elas são representadas pelos Quartis, Decis e Percentis.
Por fim, a amplitude ou intervalo interquartílico detalha, ainda mais, o posi-
cionamento dos valores entre os Quartis e seus valores máximos e mínimos,
proporcionando uma análise mais apurada. Nesse caso encontramos uma
representação gráfica muito utilizada chamada box-plots, onde são demons-
tradas tais relações.
48
ESTATÍSTICA APLICADA À EDUCAÇÃO
MULTIVIX EAD
Credenciada pela portaria MEC nº 767, de 22/06/2017, Publicada no D.O.U em 23/06/2017
GRÁFICO 1 – DISTRIBUIÇÃO DE FREQUÊNCIAS POR FAIXA ETÁRIA
Fonte: Banco de imagens autor (2019).
Medidas de Posição: “Vimos que o resumo de
dados por meio de tabelas de frequências e ramo-
e-folhas fornece muito mais informações sobre o
comportamento de uma variável do que a própria
tabela original de dados. Muitas vezes, queremos
resumir ainda mais estes dados, apresentando um
ou alguns valores que sejam representativos da
série toda. Quando usamos um só́ valor, obtemos
uma redução drástica dos dados. Usualmente,
emprega-se uma das seguintes medidas de
posição (ou localização) central: media, mediana
ou moda” (BUSSAB; MORETTIN, 2017).
49
MULTIVIX EAD
Credenciada pela portaria MEC nº 767, de 22/06/2017, Publicada no D.O.U em 23/06/2017
ESTATÍSTICA APLICADA À EDUCAÇÃO
3.1 MÉDIA ARITMÉTICA, MÉDIA GEOMÉTRICA,
MÉDIA HARMÔNICA E MÉDIA PONDERADA
As medidas de tendência central ou de posição são muito semelhantes na
sua composição teórica e finalidades quando se trata de representação de
um conjunto de números. Tal constatação se deve ao fato de que nas suas
formulações a preocupação em quantificar os valores estudados, ponderá-
-los com frequências e outras variáveis, e atribuir a estes um resultado mais
próximo possível e representativo do todo, estão presentes em todas as fases
do processo de cálculo.
As suas aplicações dependem do objetivo e de como os valores estão dispos-
tos na sua distribuição. Podemos nos deparar com maiores ou menores con-
centrações de valores na parte central, que torna a escolha da melhor medida
uma decisão estratégica para expressar corretamente o fenômeno estudado.
Há casos em que as características das variáveis, em razão do tipo de even-
to, determina o melhor processo para a representação do todo pesquisado.
Portanto, estaremos priorizando esses e outros aspectos mais direcionados à
composição das medidas e suas influencias no processo decisório.
Quando elaboramos uma tabela de distribuição de frequências ou outro mo-
delo qualquer, devemos estar atentos às informações necessárias que devem
constar das linhas e colunas que auxiliem na montagem do cálculo da medi-
da desejada. No caso da média aritmética, a mais usual de todas as medidas
representativas de conjunto de valores, devemos estar atentos sobre quais in-
formações desejamos expressar na tabela e utilizadas na obtenção da média.
Então, partimos do princípio de que Média Aritmética ( ) é calculada pela
fórmula:
1
n i
n
x
n=∑ ; para dados não agrupados e
1
( . )n i i
n
i
x f
f=∑ ; para dados agrupados ou em classes.
A considerar o tipo de distribuição e a organização dos dados na Tabela 1,
temos que construir as colunas de modo que expresse a necessidade de cál-
culo contido nas fórmulas. Relacionamos a seguir um exemplo de tabela de
distribuição de frequências onde as variáveis estão agrupadas e dispostas em
classes / intervalos.
50
ESTATÍSTICA APLICADA À EDUCAÇÃO
MULTIVIX EAD
Credenciada pela portaria MEC nº 767, de 22/06/2017, Publicada no D.O.U em 23/06/2017
TABELA 1 – DISTRIBUIÇÃO DE FREQUÊNCIAS POR FAIXA ETÁRIA E RENDA
Alunos (xi) Frequência (fi) Renda (yi) Xi x fi Freq Yi x fi Rend
17 a 19 100 R$ 950 1800 R$ 95.000
20 a 22 200 R$ 1.500 4200 R$ 300.000
23 a 25 300 R$ 2.000 7200 R$ 600.000
26 a 28 400 R$ 3.000 10800 R$ 1.200.000
29 a 31 450 R$ 4.000 13500 R$ 1.800.000
32 a 34 400 R$ 5.000 13200 R$ 2.000.000
35 a 37 300 R$ 5.500 10800 R$ 1.650.000
38 a 40 200 R$ 6.000 7800 R$ 1.200.000
41 a 43 100 R$ 6.500 4200 R$ 650.000
Total 2450 R$ 34.450 73500 R$ 9.495.000
Fonte: Banco de imagens autor (2019).
Em que:
n
i i ix=∑ = total da coluna alunos;
1
n
i if=∑ = total da coluna frequência;
2
Limite inferior Limite superior+
Logo: 1
( . ) 73.500 30
2.450
n i i
i
i
x fX
f=
= = =∑ , ou seja, por se tratar de cálculo da variável
idade temos como resultado a média de idade dos alunos pesquisados.
Perceba que, na Tabela 1, no caso da renda, o procedimento é idêntico. Substi-
tuindo o somatório de Xi. por Yi, em que teremos 1
(Y . ) 9.495.000 3.875,51
2.450
n i i
i
i
fX
f=
= = =∑ ,
representando o valor médio da renda dos estudantes.
A média aritmética possui propriedades que fazem dela uma medida sensível
aos valores extremos, de forma que se deve observar se a assimetria da curva
de distribuição está próxima da forma de “sino” ou curva normal. Quanto mais
próxima da curva normal, mais representativa será a média. Esse conteúdo
será objeto de estudo nas nossas próximas unidades.
51
MULTIVIX EAD
Credenciada pela portaria MEC nº 767, de 22/06/2017, Publicada no D.O.U em 23/06/2017
ESTATÍSTICA APLICADA À EDUCAÇÃO
Demonstramos no Gráfico 2 a seguir a correspondente à curva da distribui-
ção de idades, indicando a média de idade (30 anos) e a concentração dos
valores nas classes centrais.
GRÁFICO 2 – CURVA DA DISTRIBUIÇÃO DE FREQUÊNCIAS POR FAIXA ETÁRIA
500
400
300
200
100
0
20 a 22 23 a 25 26 a 28 29 a 31 32 a 34 35 a 37 38 a 40 41 a 4317 a 19
Fonte: Banco de imagens autor (2019).
Apesar de não constar de forma explicita na bibliografia apresentada, enten-
demos que informar os demais tipos de Médias seria interessante a título de
conhecimento e, quem sabe, dependendo do estudo, oferecer alternativas
para melhor interpretação dos valores e da distribuição estatística.
Média Aritmética: “[...] ou simplesmente média, é a
medida de tendência central mais conhecida e utilizada
para resumir a informação contida em um conjunto de
dados” (VIEIRA, 2015, p. 38).
52
ESTATÍSTICA APLICADA À EDUCAÇÃO
MULTIVIX EAD
Credenciada pela portaria MEC nº 767, de 22/06/2017, Publicada no D.O.U em 23/06/2017
Média Geométrica ( X g )
É a raiz enésima do produto de todas as observações. Pode ser
utilizada de forma simples ou ponderada (variáveis e frequências).
Normalmente, é utilizada quando pretendemos calcular valores
representativos de índices, multiplicadores e de coeficientes.
Média Harmônica ( Xh )
É o inverso da média aritmética dos inversos. Pode ser utilizada de
forma simples ou ponderada (variáveis e frequências). Normalmente,
é utilizada quando nos deparamos com variáveis fracionadas e
desejamos manter tal representação no resultado calculado. Não deve
ser utilizada em distribuições com valor nulo.
1 1 1
1 2
nXh
x x xn
=
+ + ⋅⋅⋅+
, simples;
fi
Xhp fi
xi
= ∑
∑
dados agrupados
(ponderada).
Moda
Dentre as medidas de tendência central ou de posição, a moda
expressa o valor de maior frequência dentro de uma distribuição. Nada
difícil de imaginar na medida em que o número de repetições de um
ou mais valores acaba por influenciar a distribuição como um todo. E
quando a moda está próxima do centro da distribuição ela acaba por
fortalecer a média e a própria mediana enquanto medidas correlatas.
Moda: é definida como a realização mais frequente do
conjunto de valores observado (BUSSAB; MORETTIN,
2017).
53
MULTIVIX EAD
Credenciada pela portaria MEC nº 767, de 22/06/2017, Publicada no D.O.U em 23/06/2017
ESTATÍSTICA APLICADA À EDUCAÇÃO
Seguindo a mesma dinâmica de cálculo da Média, a Moda pode ser cal-
culada paradados simples ou agrupados. Na forma simplificada, a Moda será
o valor de maior frequência da distribuição. As distribuições podem ter mais
de uma Moda ou nenhuma. No caso dos dados agrupados, ela é expressa
pela seguinte fórmula:
Em que:
Lim. inf. = limite inferior da classe modal;
fc = frequência da classe modal;
fant = frequência da classe anterior à modal;
fpost = frequência da classe posterior à modal;
h = Amplitude da classe modal.
Esse método foi desenvolvido por Czuber. Existem outros como o de King –
que utiliza a mesma construção da fórmula de Czuber, mas se diferencia por
não utilizar a frequência da classe moda ( fc ).
Para cálculos mais simples, a Moda Bruta também pode ser uma alternativa
menos complexa , sendo os limites pertencentes à classe de
maior frequência (ou classe modal)
A seguir, relacionamos o exemplo de tabela de distribuição de frequências
utilizado no exemplo anterior, onde as variáveis estão agrupadas e dispostas
em classes / intervalos.
54
ESTATÍSTICA APLICADA À EDUCAÇÃO
MULTIVIX EAD
Credenciada pela portaria MEC nº 767, de 22/06/2017, Publicada no D.O.U em 23/06/2017
TABELA 2 – DISTRIBUIÇÃO DE FREQUÊNCIAS POR FAIXA ETÁRIA E RENDA
Alunos (xi) Frequência (fi) Renda (yi) Xi x fi Freq Yi x fi Rend
17 a 19 100 R$ 950 1800 R$ 95.000
20 a 22 200 R$ 1.500 4200 R$ 300.000
23 a 25 300 R$ 2.000 7200 R$ 600.000
26 a 28 400 R$ 3.000 10800 R$ 1.200.000
29 a 31 450 R$ 4.000 13500 R$ 1.800.000
32 a 34 400 R$ 5.000 13200 R$ 2.000.000
35 a 37 300 R$ 5.500 10800 R$ 1.650.000
38 a 40 200 R$ 6.000 7800 R$ 1.200.000
41 a 43 100 R$ 6.500 4200 R$ 650.000
Total 2450 R$ 34.450 73500 R$ 9.495.000
Fonte: Banco de imagens autor (2019).
Lim. inf. = limite inferior da classe modal = 29
fc = frequência da classe modal = 450
fant = frequência da classe anterior à modal = 400
fpost = frequência da classe posterior à modal = 400
h = Amplitude da classe modal = 3
O resultado representa a idade de maior frequência dentro da distribuição.
No caso da renda, a própria distribuição já indica que o valor de R$ 4.000,00 é
o que apresenta maior frequência estando no intervalo 29 a 31 anos.
55
MULTIVIX EAD
Credenciada pela portaria MEC nº 767, de 22/06/2017, Publicada no D.O.U em 23/06/2017
ESTATÍSTICA APLICADA À EDUCAÇÃO
• Mediana
Dentre as medidas de Tendência Central, a Mediana se encontra entre aquelas
que não sofrem influência dos valores extremos, pois a sua concepção está na
ordenação do conjunto de observações e separá-lo em duas partes iguais de
forma que o valor central corresponda à Mediana da distribuição. Essa é uma
vantagem comparativa importante porque na hipótese de a média não ser um
parâmetro representativo, justamente por sofrer a influência de valores extre-
mos, como visto no tópico anterior, a mediana pode assumir o papel de melhor
estimador (amostra) ou valor representativo da distribuição (população).
Essa concepção permite oferecer recursos importantes à análise dos dados
como, por exemplo: qual o valor de salário, renda, idade etc. divide em duas
partes iguais o quantitativo de observações realizadas. Daí a importância de
se estabelecer a diferença entre valor médio e valor mediano. Também possui
grande utilidade quando a distribuição possui variáveis com características
de ordem ou classificação.
Mediana: “[...] é a realização que ocupa a posição central
da série de observações, quando estão ordenadas em
ordem crescente [...]” (BUSSAB; MORETTIN, 2017).
A Mediana ( xMd ) é calculada para dados simples ou agrupados, assim como
as médias e a moda. Na forma simplificada, a Mediana será o valor central
após a ordenação da distribuição. Quando o número de observações for ím-
par, o valor que divide em duas partes o conjunto corresponderá à Mediana.
No caso de distribuições com número par de observações, a mediana será
calculada através da média aritmética dos dois valores centrais. Vejamos os
exemplos:
Considere a distribuição devidamente ordenada, 1 2 3 4 5x x x x x+ + + + a Mediana
será o valor central que divide duas em partes iguais, ou seja, 1 2 3 4 5x x x x x+ + + +. Na distribui-
ção com número par de observações ordenadas 2 3
2x
x xMd += .
Logo, a notação geral será:
1
2
n
x
xMd += = se n=ímpar;
1
2 2
2
n n
x
x x
Md
+
+
=
, se par;
56
ESTATÍSTICA APLICADA À EDUCAÇÃO
MULTIVIX EAD
Credenciada pela portaria MEC nº 767, de 22/06/2017, Publicada no D.O.U em 23/06/2017
Com n = número de observações.
No caso dos dados agrupados a xMd é expressa pela seguinte fórmula:
inf
2
x
med
fi Fant h
Md Lim
f
− × = +
∑
, onde:
2
fi∑ = somatório da coluna de frequência divido por 2 para achar em qual
classe está o valor da mediana;
Lim. inf. = limite inferior da classe da mediana;
medf = frequência simples da classe da mediana;
antF = frequência acumulada anterior da classe da mediana;
h = Amplitude da classe.
A seguir, relacionamos a tabela de distribuição de frequências utilizada no
exemplo anterior, em que foram acrescentadas as colunas de Frequência
Acumulada para o cálculo da Mediana.
TABELA 3 – DISTRIBUIÇÃO DE FREQUÊNCIAS POR FAIXA ETÁRIA E RENDA
Alunos (xi) Frequência (fi) Renda (yi) Xi x fi Freq Yi x fi Rend
17 a 19 100 R$ 950 100 R$ 950
20 a 22 200 R$ 1.500 300 R$ 2.450
23 a 25 300 R$ 2.000 600 R$ 4.450
26 a 28 400 R$ 3.000 1000 R$ 7.450
29 a 31 450 R$ 4.000 1450 R$ 11.450
32 a 34 400 R$ 5.000 1850 R$ 16.450
35 a 37 300 R$ 5.500 2150 R$ 21.950
38 a 40 200 R$ 6.000 2350 R$ 27.950
41 a 43 100 R$ 6.500 2450 R$ 34.450
Total 2450 R$ 34.450 12250 R$ 127.550
Fonte: Banco de imagens autor (2019).
57
MULTIVIX EAD
Credenciada pela portaria MEC nº 767, de 22/06/2017, Publicada no D.O.U em 23/06/2017
ESTATÍSTICA APLICADA À EDUCAÇÃO
2
fi∑ = somatório da coluna de frequência divido por 2.4502 1.2252= = , através
da coluna Fac. (xi) ou frequência acumulada verifica-se que o valor está inclu-
so na classe 29 a 31(5ª classe).
Lim. inf. = limite inferior da classe da mediana = 29
medf = frequência simples da classe da mediana = 450
antF = frequência acumulada anterior da classe da mediana = 1.000
h = Amplitude da classe = 3
Interpretando o resultado anterior, a distribuição tem exatamente a metade
dos estudantes com idades superiores e inferiores a 30,5 anos.
No caso da renda, a própria distribuição já indica que o valor em torno de
R$ 4.000,00 divide em partes iguais a distribuição da renda dos alunos. Valor
mais preciso poderá ser calculado empregando a mesma metodologia e uti-
lizando as colunas relativas à renda dos estudantes.
3.2 QUARTIS, DECIS E PERCENTIS (QUANTIS) –
MEDIDAS SEPARATRIZES.
Tão importante quanto as demais medidas de Tendência Central, as Medidas
Separatrizes acrescentam detalhes na análise das distribuições. Os Quartis,
Decis e Percentis são, nada mais nada menos, do que a divisão da distribui-
ção em:
1. Quatro partes, no caso dos Quartis.
2. Dez partes, nos Decis.
3. 100 partes iguais nos Percentis.
58
ESTATÍSTICA APLICADA À EDUCAÇÃO
MULTIVIX EAD
Credenciada pela portaria MEC nº 767, de 22/06/2017, Publicada no D.O.U em 23/06/2017
Logo, por esse entendimento, fica mais fácil compreender o papel que esses
conceitos desempenham no processo estatístico, mais precisamente, no po-
sicionamento das variáveis dentro de uma distribuição.
As possibilidades de se estabelecer relações entre as Medidas Separatrizes e
as Medidas de tendência Central são múltiplas. Ao calcular a Mediana de uma
distribuição, tem-se a divisão em duas partes iguais do conjunto de dados
observados. Da mesma maneira que, ao calcularmos 2º Quartil e o 50º Per-
centil, obtemos valores iguais. A vantagem nessa relação é que os resultados
obtidos não estão sujeitos a distorção de valores extremos, o que oferece mais
credibilidade para conclusões em torno de valores representativos, como as
médias, bem como abre possibilidades de análise sobre a variabilidade ou
dispersão das observações.
Outras relações são possíveisem torno dos conceitos anteriores, o que faz
desses recursos tão importantes quanto a Média, a Moda e Mediana de uma
Distribuição, apesar de menos conhecidos ou restritos a quem utiliza as ferra-
mentas estatísticas com certa frequência.
Indicamos a leitura do livro: BUSSAB, W. de O.; MORETTIN,
P. A. Estatística básica. 9. ed. São Paulo: Saraiva, 2017. p.
43-48.
As Medidas Separatrizes ( xMs ) são calculadas para dados simples ou agrupa-
dos, assim como as médias e a moda. Na forma simplificada, será o valor cor-
respondente ao respectivo percentual da distribuição, após a sua ordenação.
Considere a distribuição devidamente ordenada ou Quantis (p) = 0≤p≤1 para
todo Quartil, Decil ou Percentil calculado:
1 2 3 4 5 6 7 8 9x x x x x x x x x< < < < < < < <
2º Quartil e 50º Percentil = 5x ;
1º Quartil e 25º Percentil = 2 3
2
x x+
3º Quartil e 75º Percentil =. 7 8
2
x x+
59
MULTIVIX EAD
Credenciada pela portaria MEC nº 767, de 22/06/2017, Publicada no D.O.U em 23/06/2017
ESTATÍSTICA APLICADA À EDUCAÇÃO
Nos dados agrupados ou em frequência, a fórmula é bem parecida com a da
Mediana:
inf
i
ant
x
f F h
p
Ms Lim
fp
− ×
= +
∑
, onde:
fi
p∑ = somatório da coluna de frequência divido por p para achar em qual
classe está o valor do Quartil, Decil ou Percentil;
Lim. inf. = limite inferior da classe;
medf = frequência simples da classe;
antF = frequência acumulada anterior à classe;
h = Amplitude da classe.
A seguir, relacionamos o exemplo de tabela de distribuição de frequências
utilizado no exemplo anterior, mantendo-se as colunas de Frequência Acu-
mulada para o cálculo das Medidas. Calculando o 3º Quartil:
TABELA 4 – DISTRIBUIÇÃO DE FREQUÊNCIAS POR FAIXA ETÁRIA E RENDA
Alunos (xi) Frequência (fi) Renda (yi) Xi x fi Freq Yi x fi Rend
17 a 19 100 R$ 950 100 R$ 950
20 a 22 200 R$ 1.500 300 R$ 2.450
23 a 25 300 R$ 2.000 600 R$ 4.450
26 a 28 400 R$ 3.000 1000 R$ 7.450
29 a 31 450 R$ 4.000 1450 R$ 11.450
32 a 34 400 R$ 5.000 1850 R$ 16.450
35 a 37 300 R$ 5.500 2150 R$ 21.950
38 a 40 200 R$ 6.000 2350 R$ 27.950
41 a 43 100 R$ 6.500 2450 R$ 34.450
Total 2450 R$ 34.450 12250 R$ 127.550
Fonte: Banco de imagens autor (2019).
60
ESTATÍSTICA APLICADA À EDUCAÇÃO
MULTIVIX EAD
Credenciada pela portaria MEC nº 767, de 22/06/2017, Publicada no D.O.U em 23/06/2017
3
4
fi∑ = somatório da coluna de frequência = 3(2.450) 1.8384 = , através da coluna
Fac. (xi) ou frequência acumulada verifica-se que o valor do terceiro quartil
está incluso na classe 32 a 34(6ª classe).
Lim. inf. = limite inferior da classe = 32
antF = frequência simples da classe = 400
antF = frequência acumulada anterior da classe = 1.450
h = Amplitude da classe = 3
Interpretando o resultado anterior, a distribuição tem 75% dos estudantes
com idades até a 34,91anos.
Procedimento análogo pode ser adotado em relação ao cálculo da renda, con-
siderando, obviamente, as colunas e linhas correspondentes a essa variável.
3.2.1 Intervalo interquartílico
Apesar de ser uma medida de variabilidade ou dispersão, o objetivo de tratar
esse assunto dentro das medidas separatrizes se deve ao fato de que a teo-
ria contida no cálculo entre os Quantis permite uma maior compreensão da
sua importância no posicionamento das observações e auxilia em conclusões
preliminares sobre as variáveis envolvidas.
É bem verdade que a sua análise conjugada com a dispersão oferece maiores
condições para uma conclusão definitiva sobre a assimetria da distribuição e
o desenvolvimento dos demais parâmetros estatísticos. O que não impede de
realizarmos a devida comparação no momento oportuno.
O significado do Intervalo ou Amplitude Interquartílica expressa a diferença
entre o 3º e 1º Quartil, ou seja, Dint = Q3 – Q1. Através dele, temos a dimen-
são aproximada do posicionamento entre os limites inferiores e superiores e
a sua distância das observações centralizadas. Em outras palavras, entre o 1º e
61
MULTIVIX EAD
Credenciada pela portaria MEC nº 767, de 22/06/2017, Publicada no D.O.U em 23/06/2017
ESTATÍSTICA APLICADA À EDUCAÇÃO
3º Quartil estão compreendidas 50% das observações, restando 25% abaixo e
acima da distribuição. Esses elementos oferecem condições de identificamos
as cinco medidas base.
Segundo Bussab e Morenttin (2017, p. 47), os cinco valores correspondem:
X (1), = limite inferior
Q 1, = primeiro quartil
Q 2, = segundo quartil ou a mediana
Q 3 = terceiro quartil
X (n) = limite superior
E são importantes para identificar a assimetria ou simetria aproximada quan-
do:
(a) Q2 - X (1) ≈ X (n) - Q2;
(b) Q2 - Q1 ≈ Q3 - Q2;
(c) Q1 - X (1) ≈ X (n) - Q3;
(d) distâncias entre mediana e Q1, Q3 menores do que distâncias entre os ex-
tremos e Q1, Q3.
Logo, concluímos que a diferença Q2 – X (1) - dispersão inferior e X (n) - Q2
- dispersões superiores deve ser a menor possível para uma distribuição seja
considerada, aproximadamente, simétrica.
Recomendamos leitura do conteúdo relativo aos Quantis
e seus exercícios para fixação dos conceitos BUSSAB, W.
de O.; MORETTIN, P. A. Estatística básica. 9. ed. São Paulo:
Saraiva, 2017. Cap. 3.
3.3 REPRESENTAÇÕES GRÁFICAS
Vimos o quanto as Medidas de Tendência Central, Separatrizes e Intervalo In-
terquartílico são importantes na fundamentação dos métodos e processos
estatísticos. Todas são passíveis de representação gráfica como demonstra-
ção geométrica das suas relações com as variáveis e destas com o conjun-
to da distribuição. Os conteúdos complementares indicados apontam vários
62
ESTATÍSTICA APLICADA À EDUCAÇÃO
MULTIVIX EAD
Credenciada pela portaria MEC nº 767, de 22/06/2017, Publicada no D.O.U em 23/06/2017
desses exemplos gráficos estimulando a devida correspondência com a teo-
ria apresentada. Nesse sentido, apresentaremos alguns exemplos ligados aos
conteúdos abordados para ilustrar essas relações.
O importante é fixar que os gráficos, assim como as fórmulas, são recursos
complementares e importantes no processo de aprendizagem e compreen-
são dos conceitos.
GRÁFICO 3 – DISTRIBUIÇÃO DE FREQUÊNCIAS POR FAIXA ETÁRIA E RENDA
Alunos (xi) Frequência (fi) Renda (yi)
17 a 19 100 R$ 950
20 a 22 200 R$ 1.500
23 a 25 300 R$ 2.000
26 a 28 400 R$ 3.000
29 a 31 450 R$ 4.000
32 a 34 400 R$ 5.000
35 a 37 300 R$ 5.500
38 a 40 200 R$ 6.000
41 a 43 100 R$ 6.500
Total 2450 R$ 34.450
Frequência por Alunos
500
400
300
200
100
0
20 a 22 23 a 25 26 a 28 29 a 31 32 a 34 35 a 37 38 a 40 41 a 4317 a 19
500
400
300
200
100
0
20 a 22 23 a 25 26 a 28 29 a 31 32 a 34 35 a 37 38 a 40 41 a 4317 a 19
17 a 19
20 a 22
23 a 25
26 a 28
29 a 31
32 a 34
35 a 37
38 a 40
41 a 43
100
100
200
200
300
300
400
400
450
Frequência po Alunos
100%
Fonte: Banco de imagens autor (2019).
O demonstrativo anterior resume a disposição gráfica do modelo adotado
como exemplo nesta Unidade - distribuição de frequências por faixa etária e
renda. Nela, vemos como a distribuição é aproximadamente simétrica para
os valores observados em relação à frequência da faixa etária dos estudantes,
através do gráfico em curvas (simulando a curva normal) e o de colunas (si-
mulando um histograma). Além da tabela de valores – que representa a orga-
nização dos dados, e do Gráfico tipo “Funil”, que oferece uma forma diferente
de distribuir graficamente as idades e as frequências.
63
MULTIVIX EAD
Credenciada pela portaria MEC nº 767, de 22/06/2017, Publicada no D.O.U em 23/06/2017
ESTATÍSTICA APLICADA À EDUCAÇÃO
GRÁFICO 4 – DISTRIBUIÇÃO DE FREQUÊNCIAS POR FAIXA ETÁRIA E RENDA
FAC po Alunos
2500
2000
1500
1000
500
0
20 a 22 23 a 25 26 a 28 29 a 31 32 a 34 35 a 37 38 a 40 41 a 4317 a 19
100
300
1000
400
1450
1850
2150
2350
2450
Alunos (xi) Frequência (fi) Renda (yi) Xi x fi Freq Yi x fi Rend
17 a 19 100 R$ 950 100 R$ 950
20 a 22 200 R$ 1.500 300 R$ 2.450
23 a 25 300 R$ 2.000 600 R$ 4.450
26 a 28 400 R$ 3.000 1000 R$ 7.450
29 a 31 450 R$ 4.000 1450 R$ 11.450
32 a 34 400 R$ 5.000 1850 R$ 16.450
35 a 37 300R$ 5.500 2150 R$ 21.950
38 a 40 200 R$ 6.000 2350 R$ 27.950
41 a 43 100 R$ 6.500 2450 R$ 34.450
Total 2450 R$ 34.450 12250 R$ 127.550
Quartis
1° = 600
2º = 1.450
3° = 2.150
Decis
2,5º = 600
5º = 1.450
7,5 = 2.150
Percentis
25º = 600
50° = 1.450
75° = 2.150
Fonte: Banco de imagens autor (2019).
Em seguida, temos o Demonstrativo 2 com a visualização dos Quantis por
idade dos alunos, com destaque para os cálculos realizados e as devidas re-
presentações gráficas.
64
ESTATÍSTICA APLICADA À EDUCAÇÃO
MULTIVIX EAD
Credenciada pela portaria MEC nº 767, de 22/06/2017, Publicada no D.O.U em 23/06/2017
GRÁFICO 5 - DEMONSTRATIVO DISTRIBUIÇÃO DE FREQUÊNCIAS POR FAIXA ETÁRIA E
RENDA
FAC por Alunos
R$ 40 Mil
R$ 30 Mil
R$ 20 Mil
R$ 10 Mil
R$ 0 Mil
20 a 22 23 a 25 26 a 28 29 a 31 32 a 34 35 a 37 38 a 40 41 a 4317 a 19
R$ 1 Mil
R$ 2 Mil
R$ 4 Mil
R$ 7 Mil
R$ 11 Mil
R$ 16 Mil
R$ 22 Mil
R$ 28 Mil
R$ 34 Mil
Fonte: Banco de imagens autor (2019).
O Demonstrativo 3 detalha a visualização dos Quantis por renda dos alunos,
demonstrando graficamente os cálculos realizados nesta Unidade e seguin-
do a sequência apresentada no Demonstrativo 2, ou seja, a linha inferior do
gráfico corresponde a 25% das observações; a linha intermediária está a Me-
diana da distribuição – 50% dos valores; e a linha superior corresponde a 75%
das observações.
65
MULTIVIX EAD
Credenciada pela portaria MEC nº 767, de 22/06/2017, Publicada no D.O.U em 23/06/2017
ESTATÍSTICA APLICADA À EDUCAÇÃO
CONCLUSÃO
Esta unidade apresentou uma reflexão sobre o estudo da Medidas de Tendên-
cia Central, as Medidas Separatriz, Intervalo Interquartílico e suas Representa-
ções Gráficas, destacando a importância da aplicação das suas metodologias
para a análise dos valores centrais da distribuição, assim como a simetria.
Esperamos que faça bom uso do conteúdo e atente para os estudos comple-
mentares indicados nos tópicos.
ANOTAÇÕES
UNIDADE 4
66
MULTIVIX EAD
Credenciada pela portaria MEC nº 767, de 22/06/2017, Publicada no D.O.U em 23/06/2017
ESTATÍSTICA APLICADA À EDUCAÇÃO
> Possibilitar
a análise das
distribuições a
partir do grau
de concentração
ou dispersão dos
dados em torno das
medidas apuradas.
> Ênfase na
representatividade
da distribuição.
OBJETIVO
Ao final da
unidade,
esperamos que
você seja capaz
de:
67
MULTIVIX EAD
Credenciada pela portaria MEC nº 767, de 22/06/2017, Publicada no D.O.U em 23/06/2017
ESTATÍSTICA APLICADA À EDUCAÇÃO
4 MEDIDAS DE DISPERSÃO OU
VARIABILIDADE
INTRODUÇÃO
A Variabilidade ou Dispersão são as denominações representativas do grupo
de medidas importantes na análise da concentração dos dados dentro da
distribuição, mais precisamente ao centro. Elas são representadas pela Vari-
ância, pelo Desvio Padrão, pelo Desvio Médio, pelo Coeficiente de Variação e
pela Amplitude Total.
Cada uma delas possui características e funções singulares na mensuração
do grau de dispersão das informações.
Calcular a dispersão entre os valores observados significa mensurar o quanto
o posicionamento dos dados dentro da distribuição pode afetar o resultado
dos demais parâmetros, principalmente as medidas de tendência central,
que dependem de uma representatividade mínima para serem consideradas
boas estatísticas tanto para populações quanto para amostras.
A Variância, o Desvio Médio e o Desvio Padrão são medidas que têm na sua
base de cálculo a atribuição de medir o distanciamento de cada observação
da média da distribuição. Como veremos mais adiante, cada uma das medi-
das tem suas características, uma vez que o formato do resultado poderá ser
utilizado de acordo com o objetivo da pesquisa ou da própria condução do
cálculo ou medida que se deseja utilizar.
Medidas de Variabilidade ou Dispersão: “Tanto
a variância como o desvio médio são medidas
de dispersão calculadas em relação à média das
observações. Assim como a média, a variância
(ou o desvio padrão) é uma boa medida se a
distribuição dos dados for aproximadamente
normal. O desvio médio é mais resistente que o
desvio padrão” (BUSSAB; MORETTIN, 2017, p. 42).
68
ESTATÍSTICA APLICADA À EDUCAÇÃO
MULTIVIX EAD
Credenciada pela portaria MEC nº 767, de 22/06/2017, Publicada no D.O.U em 23/06/2017
Nesse sentido, o Coeficiente de Variação e a Amplitude total são métodos
mais simples, pois não necessitam de tantas transformações para a sua ob-
tenção. Eles caminham no mesmo sentido das demais medidas, ou seja, bus-
cam oferecer subsídios para a análise geral dos valores.
Dessa forma, quando elaboramos uma tabela de distribuição de frequências
ou outro modelo qualquer, devemos estar atentos às informações necessárias
que devem constar das linhas e colunas que auxiliem na montagem do cál-
culo da medida desejada.
Portanto, seguindo os objetivos desta Unidade, buscamos oferecer a você o
máximo de informações sobre a importância dessas medidas na mensuração
da variabilidade das distribuições e suas principais características na formula-
ção teórica e prática dos processos e processos estatísticos. Vamos começar
os nossos estudos!
GRÁFICO 1 – DISTRIBUIÇÃO DE FREQUÊNCIAS POR NOTAS
Fonte: Banco de imagens autor (2019).
69
MULTIVIX EAD
Credenciada pela portaria MEC nº 767, de 22/06/2017, Publicada no D.O.U em 23/06/2017
ESTATÍSTICA APLICADA À EDUCAÇÃO
4.1 VARIÂNCIA ( )
Iniciaremos este tópico conceituando Variância. Vamos entender o seu signi-
ficado.
A Variância é calculada a partir do somatório das diferenças entre variáveis e a
média, elevado ao quadrado.
Sua notação corresponde a:
∑ dados simples com = média; e
∑ dados agrupados ou em classes, em que = ponto médio.
Variância: “Quando a média é usada como medida de
tendência central, ou seja, quando a média indica o
centro da distribuição, podemos calcular o desvio de
cada observação em relação à média como segue: desvio
= observação - média desvio = x – . Se os desvios em
relação à média são pequenos, podemos concluir que
as observações estão aglomeradas em torno da média.
A variabilidade dos dados é, portanto, pequena. Se os
desvios são grandes, os dados estão muito dispersos.
Logo, a variabilidade dos dados é grande. A variância
é uma medida de variabilidade que capta essas duas
situações” (VIEIRA, 2015).
Essas formulações permitem calcular as distâncias de cada variável em rela-
ção à média da distribuição, elevando-se a diferença ao quadrado com o obje-
tivo neutralizar a influência dos valores negativos. O símbolo de ∑ (somatório),
conforme estudado na Unidade 1, representa o total de cada diferença das
parcelas somadas n vezes. Os valores de corresponde à frequência
da distribuição e n a quantidade de observações.
A considerar o tipo de distribuição e a organização dos dados na tabela, te-
mos que construir as colunas de modo que expresse a necessidade de cálculo
70
ESTATÍSTICA APLICADA À EDUCAÇÃO
MULTIVIX EAD
Credenciada pela portaria MEC nº 767, de 22/06/2017, Publicada no D.O.U em 23/06/2017
contido nas fórmulas. Relacionamos a seguir um exemplo de tabela de distri-
buição de frequências onde as variáveis estão agrupadas e dispostas em clas-
ses/intervalos. A seguir, a Tabela 1 que corresponde à distribuição hipotética
de notas agrupadas como exemplo de aplicação da Variância.
TABELA 1 - FREQUÊNCIA DE NOTAS
Notas (x) Frequência (fi)
1 29
2 21
3 16
4 18
5 16
6 15
7 12
8 16
9 20
10 16
Total 179
Fonte: Banco de imagens autor (2019).
A coluna de notas (x) apresenta as dez observações com as respectivas frequ-
ências (fi), onde é computado o total de todas as observações realizadas.
O objetivo de calcular a Variância da distribuição nos remete ao acréscimo de
outras colunas de modo a fornecer os dados complementares à aplicação da
fórmula, ou seja, ∑ deverão ser calculadas as colunas para obtermos
a média e os demais valores para a Variância Registra-se que no exemplo em
questão a variável (nota) foi disposta de forma agrupada (frequências), atra-
vés dos seus valores individualizados,diferentemente dos intervalos de classe
que serão objeto do segundo exemplo.
A seguir, relacionamos os novos valores da Tabela 2.
71
MULTIVIX EAD
Credenciada pela portaria MEC nº 767, de 22/06/2017, Publicada no D.O.U em 23/06/2017
ESTATÍSTICA APLICADA À EDUCAÇÃO
TABELA 2 - FREQUÊNCIA DE NOTAS
Notas (x) Frequência (fi) xi.fi x- µ (x- µ)2 (x- µ)2 . fi
1 29 29 -4,10 16,81 487,49
2 21 42 -3,10 9,61 201,81
3 16 48 -2,10 4,41 70,56
4 18 72 -1,10 1,21 21,78
5 16 80 -0,10 0,01 0,16
6 15 90 0,90 0,81 12,15
7 12 84 1,90 3,61 43,32
8 16 128 2,90 8,41 134,56
9 20 180 3,90 15,21 304,20
10 16 160 4,90 24,01 384,16
Total 179 913 4,00 84,10 1660,19
Fonte: Banco de imagens autor (2019).
Logo, obtemos Variância = ∑ = 9,2748
No Exemplo 2, a Tabela 3 corresponde a uma distribuição de notas agrupadas
e organizadas em classes.
TABELA 3 - FREQUÊNCIA DE NOTAS
Notas (x) Frequência (fi) xi xi.fi xi- µ (xi- µ)2 (xi- µ)2 . fi
1 a 10 50 1,50 75,00 -3,6201 13,1052 655,2604
3 a 4 34 3,60 119,00 -1,6201 2,6248 89,2419
5 a 6 31 5,50 170,50 0,3799 0,1443 4,4738
7 a 8 28 7,50 210,00 2,3799 5,6639 158,5883
9 a 10 36 9,50 342,00 4,3799 19,1834 690,6032
Total 179 27,50 916,50 1,8994 40,7216 1598,1676
Fonte: Banco de imagens autor (2019).
72
ESTATÍSTICA APLICADA À EDUCAÇÃO
MULTIVIX EAD
Credenciada pela portaria MEC nº 767, de 22/06/2017, Publicada no D.O.U em 23/06/2017
Logo, obtemos Variância = ∑ = 8,9283
Nos exemplos anteriores, conclui-se que a variância da distribuição das notas
agrupadas do Exemplo 2 tem o valor menor do que a obtida no Exemplo 1.
Em que se deduz que os valores do Exemplo 2 estão mais próximos da média
das observações. Os demonstrativos a seguir ilustram a dispersão e a frequ-
ência das notas dos Exemplos 1 e 2.
GRÁFICO 2 – DISTRIBUIÇÃO DE FREQUÊNCIAS POR NOTAS
Fr
eq
u
ên
ci
a
(f
r)
xi
100
90
80
70
60
50
40
30
20
10
1 2 3 4 5 6 7 8 9 10
Dispersão das notas
Notas (xi) 1 a 2 3 a 4 5 a 6 7 a 8 9 a 10
Fonte: Banco de imagens autor (2019).
GRÁFICO 3 – DISTRIBUIÇÃO DE FREQUÊNCIAS POR CLASSES
1 a 2
9 a10
3 a 4
5 a 6
7 a 8
0 10 20 30 40 50
Frequência por classe de notas
50
36
34
31
28
Fonte: Banco de imagens autor (2019).
73
MULTIVIX EAD
Credenciada pela portaria MEC nº 767, de 22/06/2017, Publicada no D.O.U em 23/06/2017
ESTATÍSTICA APLICADA À EDUCAÇÃO
GRÁFICO 4 – DISTRIBUIÇÃO DE FREQUÊNCIAS POR NOTAS
Fr
eq
u
ên
ci
a
(f
r)
xi
100
90
80
70
60
50
40
30
20
10
1 2 3 4 5 6 7 8 9 10
Dispersão das notas
Notas (xi) 1 a 2 3 a 4 5 a 6 7 a 8 9 a 10
Fonte: Banco de imagens autor (2019).
GRÁFICO 5 – DISTRIBUIÇÃO DE FREQUÊNCIAS POR CLASSES
1 a 2
9 a10
3 a 4
5 a 6
7 a 8
0 10 20 30 40 50
Frequência por classe de notas
50
36
34
31
28
Fonte: Banco de imagens autor (2019).
74
ESTATÍSTICA APLICADA À EDUCAÇÃO
MULTIVIX EAD
Credenciada pela portaria MEC nº 767, de 22/06/2017, Publicada no D.O.U em 23/06/2017
4.2 DESVIO PADRÃO
O Desvio Padrão é a medida de dispersão mais utilizada no cálculo da disper-
são entre os valores das observações e a média.
É obtido através do cálculo da raiz quadrada da Variância. Na verdade, o seu
resultado retoma os valores anteriormente elevados ao quadrado, conforme
explicado na composição da fórmula da variância no Tópico 4.1, à realidade
inicial da distribuição, ou seja, retoma à medida de grandeza original.
A compreensão deste conceito vai além do simples cálculo ou interpretação
do grau de variabilidade entre a média e as respectivas observações. Sua apli-
cação também está vinculada a uma série de outros processos e métodos
estatísticos que vão desde a combinação com outras medidas, a exemplo do
coeficiente de variação – que estaremos abordando nesse tópico, bem como
na sua utilização em várias distribuições de probabilidade que serão objeto de
estudo nas Unidades 5 e 6.
Desvio Padrão: “Para obter uma medida de variabilidade
na mesma unidade de medida dos dados, extrai-se a raiz
quadrada da variância. Obtém-se, assim, o desvio padrão.
Desvio padrão é a raiz quadrada da variância, com sinal
positivo. O desvio padrão é uma medida de variabilidade
muito usada porque mede de maneira eficaz a dispersão
dos dados” (VIEIRA, 2015).
Um exemplo da sua importância, enquanto principal conceito de medida de
dispersão, está na sua aplicação no mercado financeiro, mais precisamente
no cálculo do risco em determinados investimentos. O Desvio Padrão é consi-
derado uma medida para calcular o retorno de ativos em relação à sua média,
cujo resultado indicará a margem de possíveis ganhos ou perdas conside-
rando o valor médio da distribuição desses ativos. Todavia, deixaremos esse
aprofundamento para as próximas Unidades.
75
MULTIVIX EAD
Credenciada pela portaria MEC nº 767, de 22/06/2017, Publicada no D.O.U em 23/06/2017
ESTATÍSTICA APLICADA À EDUCAÇÃO
Retornando aos exemplos da distribuição notas agrupadas por frequência e
classes, os resultados para o Desvio Padrão dos exemplos 1 e 2 são:
Exemplo 1 – Desvio Padrão = 3,04545
A seguir, a Tabela 4 referente ao Exemplo 1.
TABELA 4 - FREQUÊNCIA DE NOTAS
Notas (x) Frequência (fi) xi.fi x- µ (x- µ)2 (x- µ)2 . fi
1 29 29 -4,10 16,81 487,49
2 21 42 -3,10 9,61 201,81
3 16 48 -2,10 4,41 70,56
4 18 72 -1,10 1,21 21,78
5 16 80 -0,10 0,01 0,16
6 15 90 0,90 0,81 12,15
7 12 84 1,90 3,61 43,32
8 16 128 2,90 8,41 134,56
9 20 180 3,90 15,21 304,20
10 16 160 4,90 24,01 384,16
Total 179 913 4,00 84,10 1660,19
Fonte: Banco de imagens autor (2019).
Em que a Variância =∑ = 9,2748
Exemplo 2 – Desvio Padrão = 2,98803
A seguir, a Tabela 5 referente ao Exemplo 2.
76
ESTATÍSTICA APLICADA À EDUCAÇÃO
MULTIVIX EAD
Credenciada pela portaria MEC nº 767, de 22/06/2017, Publicada no D.O.U em 23/06/2017
TABELA 5 - FREQUÊNCIA DE NOTAS
Notas (x) Frequência (fi) xi xi.fi xi- µ (xi- µ)2 (xi- µ)2 . fi
1 a 10 50 1,50 75,00 -3,6201 13,1052 655,2604
3 a 4 34 3,60 119,00 -1,6201 2,6248 89,2419
5 a 6 31 5,50 170,50 0,3799 0,1443 4,4738
7 a 8 28 7,50 210,00 2,3799 5,6639 158,5883
9 a 10 36 9,50 342,00 4,3799 19,1834 690,6032
Total 179 27,50 916,50 1,8994 40,7216 1598,1676
Fonte: Banco de imagens autor (2019).
Em que a Variância = ∑ = =
Por fim, confirma-se que os valores do Exemplo 2 estão mais próximos da
média das observações, como expresso acima no cálculo da variância, no en-
tanto, os resultados obtidos com o desvio padrão estão na mesma grandeza
das notas, ou seja, o resultado da média estará entre 2,98803 ≤ µ ≤ + 2,98803,
ou 2,11≤ 5,10 ≤ 8,09.
4.3 DESVIO MÉDIO (Dm.)
O Desvio Médio é uma medida de dispersão pouco utilizada. O seu cálculo
também segue a lógica do Desvio Padrão quando utiliza as diferenças entre
as observações e a média – quanto maior o resultado maior a variabilidade
em relação à média, no entanto, o resultado acaba expressando somente a
média das diferenças entre valores absolutos, não sendo passíveis de uma
utilização mais extensa.
É calculado através da fórmula:
Dm = para dados não agrupados; e
Dm = para dados agrupados.
77
MULTIVIX EAD
Credenciada pela portaria MEC nº 767, de 22/06/2017, Publicada no D.O.U em 23/06/2017
ESTATÍSTICA APLICADA À EDUCAÇÃO
Desvio Médio: “[...] é a média do valor absoluto dos desvios
de cada valor em relação à média da distribuição”
(NOVAES, 2013).
Retornando aos exemplos da distribuição notas agrupadas por frequência e
classes, os resultados para o Desvio Médio dos Exemplos 1 e 2 são:
Exemplo 1 – Desvio Médio Dm = = = 2,67095,
A seguir, a Tabela 6 do Exemplo 1.
TABELA 6 - FREQUÊNCIA DE NOTAS
Notas (x) Frequência (fi) xi.fi x- µ (x- µ)2 (x- µ)2 . fi
1 29 29 -4,10 16,81 487,49
2 21 42 -3,10 9,61 201,81
3 16 48 -2,10 4,41 70,56
4 18 72 -1,10 1,21 21,78
5 16 80 -0,10 0,01 0,16
6 15 90 0,90 0,81 12,15
7 12 84 1,90 3,61 43,32
8 16 128 2,90 8,41 134,56
9 20 180 3,90 15,21 304,20
10 16 160 4,90 24,01 384,16
Total 179 913 4,00 84,10 1660,19
Fonte: Banco de imagens autor (2019).
Obs.: ∑ = 478,01
Exemplo 2 – Desvio Médio Dm == = 2,6378
A seguir, a Tabela 7 do Exemplo 2.
78
ESTATÍSTICA APLICADA À EDUCAÇÃO
MULTIVIX EAD
Credenciada pela portaria MEC nº 767, de 22/06/2017, Publicada no D.O.U em 23/06/2017
TABELA 7 - FREQUÊNCIA DE NOTAS
Notas (x) Frequência (fi) xi xi.fi xi- µ (xi- µ)2 (xi- µ)2 . fi
1 a 10 50 1,50 75,00 -3,6201 13,1052 655,2604
3 a 4 34 3,60 119,00 -1,6201 2,6248 89,2419
5 a 6 31 5,50 170,50 0,3799 0,1443 4,4738
7 a 8 28 7,50 210,00 2,3799 5,6639 158,5883
9 a 10 36 9,50 342,00 4,3799 19,1834 690,6032
Total 179 27,50 916,50 1,8994 40,7216 1598,1676
Fonte: Banco de imagens autor (2019).
Obs.: ∑ = 472,17
4.4 COEFICIENTE DE VARIAÇÃO (C.V.)
O Coeficiente de Variação altera a lógica predominante nas medidas anterio-
res. A sua formulação privilegia as características de um coeficiente, ou seja,
ele oferece resultado entre grandezas diferentes e como número relativo.
A sua utilidade reside em medir o quanto há de variação percentual entre a
média e o desvio padrão, ou seja, ele representa uma taxa volatilidade, uma
medida comparativa entre a média e o desvio padrão.
Assim como o desvio padrão, o coeficiente de variação também é bastante em-
pregado no mercado financeiro na avaliação de riscos e análise de investimentos
Coeficiente de Variação: “Para analisar a variabilidade dos
dados nessas situações, podemos usar o coeficiente de
variação (CV), que é uma medida relativa de dispersão, ou
seja, serve para comparação em termos relativos do grau
de concentração em torno da média de distribuições
diferentes” (NOVAES, 2013).
79
MULTIVIX EAD
Credenciada pela portaria MEC nº 767, de 22/06/2017, Publicada no D.O.U em 23/06/2017
ESTATÍSTICA APLICADA À EDUCAÇÃO
É calculado através da fórmula:
(C.v.) = , em que = média aritmética; e
= desvio padrão
Retornando aos exemplos da distribuição notas agrupadas por frequência e
classes, os resultados para o Coeficiente de Variação dos Exemplos 1 e 2 são:
Exemplo 1 – Coeficiente de Variação (C.v.) = = = 0,5970
A seguir, a Tabela 8 do Exemplo 1.
TABELA 8 - FREQUÊNCIA DE NOTAS
Notas (x) Frequência (fi) xi.fi x- µ (x- µ)2 (x- µ)2 . fi
1 29 29 -4,10 16,81 487,49
2 21 42 -3,10 9,61 201,81
3 16 48 -2,10 4,41 70,56
4 18 72 -1,10 1,21 21,78
5 16 80 -0,10 0,01 0,16
6 15 90 0,90 0,81 12,15
7 12 84 1,90 3,61 43,32
8 16 128 2,90 8,41 134,56
9 20 180 3,90 15,21 304,20
10 16 160 4,90 24,01 384,16
Total 179 913 4,00 84,10 1660,19
Fonte: Banco de imagens autor (2019).
Exemplo 2 – Coeficiente de Variação (C.v.) = = = 0,5835
A seguir, a Tabela 9 do Exemplo 2.
80
ESTATÍSTICA APLICADA À EDUCAÇÃO
MULTIVIX EAD
Credenciada pela portaria MEC nº 767, de 22/06/2017, Publicada no D.O.U em 23/06/2017
TABELA 9 - FREQUÊNCIA DE NOTAS
Notas (x) Frequência (fi) xi xi.fi xi- µ (xi- µ)2 (xi- µ)2 . fi
1 a 10 50 1,50 75,00 -3,6201 13,1052 655,2604
3 a 4 34 3,60 119,00 -1,6201 2,6248 89,2419
5 a 6 31 5,50 170,50 0,3799 0,1443 4,4738
7 a 8 28 7,50 210,00 2,3799 5,6639 158,5883
9 a 10 36 9,50 342,00 4,3799 19,1834 690,6032
Total 179 27,50 916,50 1,8994 40,7216 1598,1676
Fonte: Banco de imagens autor (2019).
Por fim, confirma-se que os valores do Exemplo 2 estão mais próximos da
média das observações, pois a taxa de variação ou dispersão está em torno de
58% contra 59% do primeiro exemplo.
Aprofunde seus estudos com a leitura do livro: NOVAES,
Diva Valério. Estatística para educação profissional e
tecnológica. 2. ed. São Paulo: Atlas, 2013. Parte II; 4.
4.5 AMPLITUDE TOTAL
Na sequência do nosso estudo, o conceito de Amplitude Total significa o in-
tervalo entre o menor e o maior valor dos valores observados. Geralmente
utilizada na construção da fórmula de Sturges para o cálculo do número de
classes e seus intervalos. Amplitude Total = Valor da maior observação – valor
da menor observação
81
MULTIVIX EAD
Credenciada pela portaria MEC nº 767, de 22/06/2017, Publicada no D.O.U em 23/06/2017
ESTATÍSTICA APLICADA À EDUCAÇÃO
TABELA 10 - FREQUÊNCIA DE NOTAS
Notas (x) Frequência (fi)
1 29
2 21
3 16
4 18
5 16
6 15
7 12
8 16
9 20
10 16
Total 179
Fonte: Banco de imagens autor (2019).
A coluna de notas (x) apresenta as dez observações com as respectivas fre-
quências (fi), onde é computado o total de todas as observações realizadas. A
Amplitude Total das notas será: 10 – 1 = 9.
4.6 REPRESENTAÇÕES GRÁFICAS
Vimos o quanto as Medidas de Dispersão ou de Variabilidade são importantes
na fundamentação dos métodos e processos estatísticos.
Todas são passíveis de representação gráfica como demonstração geométri-
ca das suas relações com as variáveis e destas com o conjunto da distribuição.
Os conteúdos complementares indicados apontam vários desses exemplos
gráficos estimulando a devida correspondência com a teoria apresentada.
Nesse sentido, apresentaremos alguns exemplos ligados aos conteúdos abor-
dados para ilustrar essas relações.
O importante é fixar que os gráficos, assim como as fórmulas, são recursos
complementares e importantes no processo de aprendizagem e compreen-
são dos conceitos.
82
ESTATÍSTICA APLICADA À EDUCAÇÃO
MULTIVIX EAD
Credenciada pela portaria MEC nº 767, de 22/06/2017, Publicada no D.O.U em 23/06/2017
DEMONSTRATIVO 1 – DISTRIBUIÇÃO DE NOTAS POR CLASSES E FREQUÊNCIAS
Notas (x)
Frequência
(fi)
xi xi.fi xi- µ (xi- µ)2 (xi- µ)2 . fi
1 a 10 50 1,50 75,00 -3,6201 13,1052 655,2604
3 a 4 34 3,60 119,00 -1,6201 2,6248 89,2419
5 a 6 31 5,50 170,50 0,3799 0,1443 4,4738
7 a 8 28 7,50 210,00 2,3799 5,6639 158,5883
9 a 10 36 9,50 342,00 4,3799 19,1834 690,6032
Total 179 27,50 916,50 1,8994 40,7216 1598,1676
5,12 Média das notas
8,9283 Variância
2,9880279 Desvio padrão
Fr
eq
u
ên
ci
a
(f
r)
xi
100
90
80
70
60
50
40
30
20
10
1 2 3 4 5 6 7 8 9 10
Dispersão das notas
Notas (xi) 1 a 2 3 a 4 5 a 6 7 a 8 9 a 10
1 a 2
9 a10
3 a 4
5 a 6
7 a 8
0 10 20 30 40 50
Frequência por classe de notas
50
36
34
31
28
Fonte: Banco de imagens autor (2019).
O Demonstrativo anterior resume a disposição gráfica do modelo adotado
como Exemplo 1 nesta Unidade. Consta de uma tabela contendo as informa-
ções necessárias para o cálculo das medidas, um gráfico de dispersão das
notas e outro gráfico em barras representando a distribuição das notas em
classes e frequências.
83
MULTIVIX EAD
Credenciada pela portaria MEC nº 767, de 22/06/2017, Publicada no D.O.U em 23/06/2017
ESTATÍSTICA APLICADA À EDUCAÇÃO
DEMONSTRATIVO 2 – DISTRIBUIÇÃO DE NOTAS POR CLASSES E FREQUÊNCIAS
Notas
(x)
Frequência
(fi)
xi.fi x- µ (x- µ)2 (x- µ)2 . fi
1 29 29 -4,10 16,81 487,49
2 21 42 -3,10 9,61 201,81
3 16 48 -2,10 4,41 70,56
4 18 72 -1,10 1,21 21,78
5 16 80 -0,10 0,01 0,16
6 15 90 0,90 0,81 12,15
7 12 84 1,90 3,61 43,32
8 16 128 2,90 8,41 134,56
9 20 180 3,90 15,21 304,20
10 16 160 4,90 24,01 384,16
Total 179 913 4,00 84,10 1660,19
Fr
eq
u
ên
ci
a
(f
r)
xi
100
90
80
70
60
50
40
30
20
10
1 2 3 4 5 6 7 8 9 10
Dispersão das notas
Notas (xi) 1 a 2 3 a 4 5 a 6 7 a 8 9 a 10
1 a 2
9 a10
3 a 4
5 a 6
7 a 8
0 10 20 30 40 50
Frequência por classe de notas
50
36
34
31
28
5 Média
9,27 Variância
3,0454564 Desvio padrão
Fonte: Banco de imagens autor (2019).
Em seguida, temos o Demonstrativo 2 com a visualização da distribuição
das notas por frequências. Constam tabela, gráfico de dispersão e gráfico
em barras.
CONCLUSÃO
Esta unidade apresentou uma reflexão sobre o estudo das Medidas de Variabili-
dade e de Dispersão, destacando a importância na aplicação das suas metodo-
logias para a análise dos valores centrais da distribuição em relação aos desvios.
Esses procedimentos se demonstram indispensáveis na decisão da melhor
medida representativa da distribuição considerando a dispersão dos dados.
Esperamos que façam bom uso do conteúdo e atentem para as informações
indicadas nos tópicos.
UNIDADE 5
84
MULTIVIX EAD
Credenciada pela portaria MEC nº 767, de 22/06/2017, Publicada no D.O.U em 23/06/2017
ESTATÍSTICA APLICADA À EDUCAÇÃO
> Fornecer os conceitosnecessários ao entendimento
e à compreensão da teoria
das probabilidades e suas
aplicações básicas, assim como
as distribuições baseadas
nos conceitos das variáveis
contínuas e discretas.
> Possibilitar a análise das
distribuições a partir do grau
de concentração ou dispersão
dos dados em torno das
medidas apuradas.
> Dar ênfase no emprego de
modelos voltados às práticas
de pesquisas e aos processos
de trabalho, estimulando a
identificação com a realidade
do aluno.
OBJETIVO
Ao final da
unidade,
esperamos que
você seja capaz
de:
85
MULTIVIX EAD
Credenciada pela portaria MEC nº 767, de 22/06/2017, Publicada no D.O.U em 23/06/2017
ESTATÍSTICA APLICADA À EDUCAÇÃO
5 PROBABILIDADE -
DISTRIBUIÇÕES CONTÍNUAS -
DISTRIBUIÇÕES
INTRODUÇÃO
O estudo da probabilidade tem se destacado, ultimamente, através da sua in-
clusão nos livros didáticos de segundo grau com abordagens básicas do seu
emprego aliado à análise combinatória e à teoria dos conjuntos.
Essas iniciativas constituem em avanços no caminho de despertar o interesse
dos alunos para temas que fazem parte de estudos avançados nas áreas de
tecnologia e inovação, além de motivá-los na ampliação dos conhecimentos
na área de ciências exatas e suas mais variadas aplicações.
A nossa abordagem estará voltada à aplicação dos conceitos de probabilida-
de no estudo da Estatística. Sem perder de vista que muitos dos conceitos
básicos farão parte da nossa exposição e utilização.
Fazem parte deste tópico estudos sobre a introdução de alguns conceitos de
probabilidade: a probabilidade condicional e independência; o Teorema de
Bayes; e as respectivas distribuições de probabilidade (algumas mais impor-
tantes).
Esperamos que você faça um ótimo proveito e que o conteúdo possa lhe aju-
dar a compreender e auxiliar na sua vida acadêmica e profissional.
5.1 INTRODUÇÃO À PROBABILIDADE
Como vimos na Unidade 1 do nosso estudo, os ensaios sobre probabilidade ini-
ciaram na primeira metade do século XVII com experimentos ligados a jogos de
azar. Com o decorrer do tempo, a partir da evolução da matemática e da estatís-
tica, a probabilidade teve suas aplicações ampliadas para as diversas áreas, tor-
nando-se uma importante teoria para compreensão dos fenômenos aleatórios
e elaboração de cálculos aproximados, visando mensurar as suas ocorrências.
86
ESTATÍSTICA APLICADA À EDUCAÇÃO
MULTIVIX EAD
Credenciada pela portaria MEC nº 767, de 22/06/2017, Publicada no D.O.U em 23/06/2017
Atualmente, a probabilidade é utilizada nas diversas áreas das ciências, go-
vernos, empresas etc. enquanto ferramenta importante de análise e decisão.
Nesta introdução, apresentaremos alguns conceitos básicos para a funda-
mentação teórica, considerando a bibliografia apresentada e a complexidade
do tema, visto que, a partir dos demais tópicos, veremos exemplos práticos
para a sua compreensão e aplicação.
FIGURA 1
Fonte: Plataforma Deduca (2019).
Probabilidade: “a teoria das probabilidades estuda os
fenômenos que envolvem a aleatoriedade, ou seja, a
ação do acaso. Alguns desses fenômenos podem ser
interpreta- dos como experimentos (intencionalidade
humana para seu desenvolvimento) e recebem o
nome de experimentos aleatórios. Os que possuem
uma evolução que independe da intencionalidade
humana recebem o nome de fenômenos aleatórios
(por exemplo, fenômenos meteorológicos)” (NOVAES;
COUTINHO, 2013, p. 137).
87
MULTIVIX EAD
Credenciada pela portaria MEC nº 767, de 22/06/2017, Publicada no D.O.U em 23/06/2017
ESTATÍSTICA APLICADA À EDUCAÇÃO
5.1.1 Espaço amostral (ᾨ)
Veremos a seguir a definição de espaço amostral: “[...] conjunto de todos os
possíveis resultados para um experimento aleatório é denominado conjunto
universo ou espaço amostral. Cada um desses possíveis resultados recebe o
nome de evento” (NOVAES; COUTINHO, 2013, p. 138).
A definição anterior resume bem os limites de ocorrência dos eventos e as
suas relações no espaço. Assim podemos resumir alguns conceitos e repre-
sentações gráficas:
A probabilidade de qualquer evento A é representada por um número entre 0
e 1 = 0 ≤ P (A) ≤ 0.
A probabilidade representada pelo espaço amostral é de 100%.
A probabilidade de não ocorrência de um evento 1 – a probabilidade da sua
ocorrência 1 – P (A) = P (A’) ou P (A) + P (A’) = 1,00.
5.1.2 Enfoque subjetivo
Para Novaes e Coutinho (2013, p. 138):
A probabilidade subjetiva é determinada por especialistas, que analisam
todo o contexto e os resultados já́ conhecidos de experimentos ocorridos
nas mesmas condições (série histórica de resultados) para então estimar um
valor a ser adotado. Tal valor é testado no final do processo, para avaliar sua
adequação. Este tipo de enfoque está́ na base do que se chama Métodos
Bayesianos.
É o método mais utilizado para a realização dos estudos probabilísticos. Di-
ferentemente dos chamados métodos clássicos ou objetivos, que têm na
experiência empírica a base para o atingimento do resultado. Os métodos
subjetivos generalizam os eventos a serem estudados e passam a expressar
a experiência, o histórico e as características do evento. Um exemplo da sua
utilização é nas pesquisas de opinião, eleições, censos demográficos etc.
88
ESTATÍSTICA APLICADA À EDUCAÇÃO
MULTIVIX EAD
Credenciada pela portaria MEC nº 767, de 22/06/2017, Publicada no D.O.U em 23/06/2017
5.1.3 Enfoque combinatório
Vejamos a seguir o conceito de probabilidade combinatória por Novaes e
Coutinho (2013):
A probabilidade combinatória (que é a mais conhecida e estudada até́ o
Ensino Médio) é aquela determinada pela razão entre o número de sucessos
e o número total de casos, quando se considera cada um dos casos possíveis
igualmente prováveis. (NOVAES; COUTINHO, 2013, p. 138)
É utilizado para a explicação das primeiras noções de probabilidade em que
são adotadas técnicas de contagem, análise combinatória, teoria dos conjun-
tos e outras formas e exemplos mais simples de como aplicar a teoria. Tem
como característica a teórica clássica e com métodos empíricos e objetivos.
Um exemplo seria o cálculo de probabilidade de retirada de uma carta de um
determinado naipe em um baralho do resultado do lançamento de dados e a
probabilidade de determinada face ser registrada, etc.
Representação:
5.1.4 Enfoque frequentista
Sobre a probabilidade frequentista, vejamos o que Novaes e Coutinho (2013)
nos dizem na citação a seguir.
A probabilidade frequentista é determinada pela observação da estabilização
da frequência relativa acumulada de um evento que se quer estudar, quando
o experimento é repetido um número infinito de vezes. Dessa forma, a
probabilidade frequentista é, na prática, obtida por meio de uma estimação
feita a partir do estudo das frequências relativas acumuladas. (NOVAES;
COUTINHO, 2013, p. 138)
Seguindo o exemplo clássico e empírico, a obtenção da probabilidade é resul-
tante do número de vezes que determinado experimento é repetido. Quanto
maior a amostra, melhor será a estimativa da frequência relativa.
Um exemplo da probabilidade frequentista seria o lançamento de uma moe-
da repetidas vezes, a quantificação do diâmetro de uma grande quantidade
de peças produzidas etc.
89
MULTIVIX EAD
Credenciada pela portaria MEC nº 767, de 22/06/2017, Publicada no D.O.U em 23/06/2017
ESTATÍSTICA APLICADA À EDUCAÇÃO
Representação:
“Primeiras noções de Probabilidade” (NOVAES;
COUTINHO, 2013, p. 138-141).
5.1.5 Propriedades
As propriedades são importantes para entendermos a probabilidade de ocor-
rência dos eventos (probabilidade conjunta). Apresentam várias as possibili-
dades de relações entre os conjuntos de eventos.
Os conceitos de eventos independente, dependente e mutuamente exclusivo
ou excludente aumentam as possibilidades de representação dos diferentes
situações dentro do espaço amostral.
Vejamos as propriedades:
P (A U B) = P (A) + P (B) – P (A ∩ B) = P (A ou B) ambos ocorrem.
Significa a probabilidade do evento A ou B ocorrerem conjuntamente.
A exclusão da intersecção P (A ∩B) significa a retirada dos elementos
comuns ou repetidos entre os dois conjuntos.
P (A U B) = P (A) + P (B) = mutuamente exclusivos = (A ou B)
ocorrerá.
Significa a probabilidade do evento A ou B ocorrerem conjuntamente,
sendo que ambos são mutuamente exclusivos, ou seja, não há
intersecção ou elementos comuns entre eles, P (A ∩ B) = ∅.
90
ESTATÍSTICA APLICADA À EDUCAÇÃO
MULTIVIX EAD
Credenciada pela portaria MEC nº 767, de 22/06/2017, Publicada no D.O.U em 23/06/2017
P (A e B) = P (A) x P (B) = eventos independentes.
Significa a probabilidade do evento A ou B ocorrerem conjuntamente,
sendo que ambos são independentes, ou seja, ocorrem independente
do outro, P (A ∩ B) = ∅.
P (A e B) = P (B) x (A\B) ou P (A) x P (B\A) = eventos
dependentes.
Significa a probabilidade do primeiro evento ocorrer dado que
o segundo já ocorreu, isto é, P (B) x (A\B) equivale dizer que
probabilidade de B ocorrer dado que A já ocorreu, logo B depende de
A, sendo P (B) > 0.
Realizadas as devidas considerações iniciais nesta introdução, passamos para
os tópicos desta unidade.
BUSSAB, W. de O.; MORETTIN, P. A. Estatística básica.
9. ed. São Paulo: Saraiva, 2017. p.106-118.
5.2 PROBABILIDADE CONDICIONAL E
INDEPENDÊNCIA
A probabilidade condicional é calculada entre dois eventos, sendo que um
deles depende do outro para ocorrer.
É representada como: P (A\B) =
91
MULTIVIX EAD
Credenciada pela portaria MEC nº 767, de 22/06/2017, Publicada no D.O.U em 23/06/2017
ESTATÍSTICA APLICADA À EDUCAÇÃO
TABELA 1 – DISTRIBUIÇÃO DE ALUNOS SEGUNDO O SEXO E ESCOLHA DO
CURSO
Sexo
Curso Homens Mulheres Total
Matemática Pura 70 40 110
Matemática Aplicada 15 15 30
Estatística 10 20 30
Computação 20 10 30
Total 115 85 200
Fonte: Bussab e Morettin (2017, p. 109).
Considerando a Tabela 1, se escolhermos um estudante ao acaso, matricula-
do no curso de computação, a probabilidade de que seja mulher será aquela
que, ao verificar o posicionamento das colunas e das linhas na direção curso
de computação, mulheres e total, informar os valores necessários ao preen-
chimento da formulação, conforme detalhado na sequência.
Teremos na terceira coluna, correspondente ao curso de computação, um to-
tal de dez mulheres e um total de 30 alunos para todo curso de computação.
Assim, fazendo a divisão das mulheres do curso de computação pelo total de
alunos do curso de computação, teremos:
Na Formulação 1, observando a Tabela 1, na terceira e quarta colunas e quarta
linha, temos:
= =
Utilizando a fórmula de probabilidade condicional, teremos:
Para dois eventos quaisquer A e B, sendo P (B) > 0, definimos probabilidade
condicional de A dado B, P (A\B) como sendo:
P (A\B) =
92
ESTATÍSTICA APLICADA À EDUCAÇÃO
MULTIVIX EAD
Credenciada pela portaria MEC nº 767, de 22/06/2017, Publicada no D.O.U em 23/06/2017
Logo, para o exemplo anterior, se B e A correspondem, respectivamente, aos
eventos “alunos matriculados em Computação” e “aluno mulher computa-
ção”, então:
Na Formulação 2, observando a Tabela 1, na terceira e quarta colunas e quarta
linha e quinta linha, temos:
P (A\B) = = =
Assim, teremos o mesmo resultado calculado na Formulação 1 (em que as ob-
servações foram realizadas diretamente na Tabela 1, sem a adoção do cálculo
da probabilidade). A questão principal é que nem sempre será possível visu-
alizar os valores de forma simples, por isso, a Formulação 2, com a aplicação
do conceito de probabilidade condicional, é a indicada na resolução desses
problemas.
5.3 INDEPENDÊNCIA DE EVENTOS
Como visto nas propriedades, um evento B é dito interdependente de um
evento A se a probabilidade de B ocorrer não é influenciada pelo fato de A ter
ocorrido ou não. A relevância de trazer essa definição reside no fato de que
a probabilidade condicional entre eventos independentes contribuiu com a
dedução do conceito de independência, conforme a seguir:
A probabilidade de B é igual a probabilidade condicional de B dado A: P (B) =
P (B\A); se B é um evento independente, então ele ocorre independente de A,
logo a P (B\A), dado que A ocorreu será igual a probabilidade de B.
Pelo Teorema das Multiplicações, P (A ∩ B) = P (A). P (B\A), substituindo P (B\A)
por P (B) teremos a definição formal da independência:
P (A ∩ B) = P (B). P (A)
Conceitos como a probabilidade condicional e independência serão muito
utilizados na interpretação das aplicações do Teorema de Bayes, tema do nos-
so próximo tópico.
93
MULTIVIX EAD
Credenciada pela portaria MEC nº 767, de 22/06/2017, Publicada no D.O.U em 23/06/2017
ESTATÍSTICA APLICADA À EDUCAÇÃO
5.4 TEOREMA DE BAYES
Como vimos, a probabilidade condicional é calculada entre dois eventos
quando um deles depende do outro para ocorrer, agora, quando essa relação
de dependência é ampliada com a inclusão de novas condições que se rela-
cionam com essa dependência, temos a elaboração de um novo conceito, o
Teorema de Bayes.
Para facilitar o entendimento, refizemos a Tabela 1 – Distribuição de alunos
segundo o sexo e escolha do curso, e substituímos os valores absolutos por
relativos com base no total de alunos dos cursos, ou seja, cada valor foi divido
pelo total de 200 alunos. Os resultados passaram a expressar o quanto cada
curso e aluno do sexo masculino e feminino representam do total apurado.
TABELA 2 – DISTRIBUIÇÃO DE ALUNOS SEGUNDO O SEXO E ESCOLHA DO
CURSO
Sexo
Curso Homens (%) Mulheres (%) Total (%)
Matemática Pura 0,35 0,20 0,55
Matemática Aplicada 0,08 0,08 0,15
Estatística 0,05 0,10 0,15
Computação 0,10 0,05 0,15
Total 0,58 0,43 1,00
Fonte: Adaptada Bussab e Morettin (2017, p. 109).
Iremos considerar o evento a seguir. Vejamos.
Uma universidade escolhe uma aluna para a realização de um curso de mes-
trado dentre as matriculadas nos cursos listados na tabela anterior, se a esco-
lha é uma aluna, qual a probabilidade de pertencer ao curso de Matemática
Aplicada?
Logo, para o cálculo da probabilidade de escolha de uma aluna para a rea-
lização do curso de mestrado ser uma aluna do curso de matemática pura,
dentre os outros três cursos existentes, será, segundo o Teorema de Bayes, a
94
ESTATÍSTICA APLICADA À EDUCAÇÃO
MULTIVIX EAD
Credenciada pela portaria MEC nº 767, de 22/06/2017, Publicada no D.O.U em 23/06/2017
probabilidade condicionada de escolha de uma aluna dado que pertence ao
curso de matemática pura, dividido por todas as possibilidades de escolha de
uma aluna.
Nesse raciocínio, entra em cena outra notação importante, o teorema da pro-
babilidade total, que significa o espaço amostral de todas probabilidades de
ocorrência do evento. Aplicando ao Teorema de Bayes, o espaço amostral se-
ria todas as possibilidades de ocorrência do evento considerando as probabi-
lidades condicionais:
Logo, a formulação do Teorema de Bayes será:
P (Bj\A) =
• Sendo P(A) = a probabilidade do evento A ocorrer.
• Sendo P(Bj) = a probabilidade do evento B ocorrer.
• Sendo P(A\Bj) = a probabilidade do evento A ocorrer dado que B ocorreu.
São diversos os modelos para aplicação. Recomendamos a leitura e os exer-
cícios.
O exemplo da Tabela 2 poderá ser resolvido com a aplicação dos pressupostos
acima, acrescido das propriedades e das relações estabelecidas na probabili-
dade condicional. Como o tema é extenso e os exercícios variados, recomen-
damos a leitura do conteúdo complementar.
BUSSAB, W. de O.; MORETTIN, P. A. Estatística básica.
9. ed. São Paulo: Saraiva, 2017. p. 119-131.
95
MULTIVIX EAD
Credenciada pela portaria MEC nº 767, de 22/06/2017, Publicada no D.O.U em 23/06/2017
ESTATÍSTICA APLICADA À EDUCAÇÃO
5.5 DISTRIBUIÇÕES UNIFORME, BINOMIAL,
HIPERGEOMÉTRICA E POISSON
O estudo das probabilidades aliado com às distribuições significa o início do
processo de transição dos métodos relacionados à Estatística Descritiva para
a Estatística Indutiva ou Inferencial.
E, para que possamos compreendê-lo, faz-se necessário entender que as dis-
tribuições deprobabilidade são os espaços amostrais onde as variáveis pas-
sam a atuar. Dessa associação entre probabilidade e variável surge a função
de probabilidade que representa os resultados dos eventos no espaço amos-
tral da distribuição, assumindo valores relativos entre 0 e 1, de acordo com as
características da distribuição.
As variáveis discretas são denominadas função de probabilidade ou função (x,
p (x)) ou f (x) = p (x), chamada função de probabilidade da v.a. X (variável ale-
atória de X). Ao assumir esse papel, as variáveis incorporam as características
da distribuição, e os parâmetros naturais como a média e variância podem ser
calculados considerando essa relação entre variável e a distribuição de proba-
bilidade.
“Chama-se função de probabilidade da v.a. discreta X, que assume os valores
x1, x2, Κ, xn, Κ, a função {(xi, p (xi)), i = 1, 2, Κ}, que a cada valor de xi associa a
sua probabilidade de ocorrência, isto é, p(xi) = P(X = xi) = pi, i = 1, 2, Κ” (BUSSAB;
MORETTIN, 2017, p. 138).
Vejamos a Tabela 3 a seguir.
TABELA 3 - DISTRIBUIÇÃO DE VARIÁVEL ALEATÓRIA X
x P (x)
15 0,56
10 0,23
5 0,02
-5 0,19
Total 1
Fonte: Adaptada Bussab e Morettin (2017, p. 135).
96
ESTATÍSTICA APLICADA À EDUCAÇÃO
MULTIVIX EAD
Credenciada pela portaria MEC nº 767, de 22/06/2017, Publicada no D.O.U em 23/06/2017
O raciocínio é valido para as variáveis contínuas, em que a representação no
espaço amostral ou na distribuição de probabilidade se faz através de interva-
lo contínuo de dados, são classificadas como função de densidade de proba-
bilidade = da variável aleatória v.a.X.
“Uma função X, definida sobre o espaço amostral Ω e assumindo valores num
intervalo de números reais, é dita uma variável aleatória continua” (BUSSAB;
MORETTIN, 2017, p. 168).
As distribuições de probabilidade são o resultado de experimentos, estudo e
aplicações que fizeram delas modelos para representar determinados even-
tos. A Tabela 3 representa uma distribuição de probabilidade da variável alea-
tória X, isto é, cada variável aleatória possui uma probabilidade corresponden-
te no espaço amostral ou na distribuição.
5.5.1 Valor médio de uma variável aleatória
(discreta e contínua)
“Dada a v.a. X discreta, assumindo os valores , Κ, , chamamos valor médio
ou esperança matemática de X ao valor [...]” (BUSSAB; MORETTIN, 2017, p. 139).
E (x) = ∑ , em que xi é o valor da variável aleatória e é a sua probabili-
dade associada.
“Define uma v.a. continua X, ou seja, cria um modelo teórico para as frequên-
cias relativas de uma v.a. continua. A área compreendida entre dois valores, a
e b, da abscissa x, sob a curva representativa de f (x), dá a probabilidade [...]”
(BUSSAB; MORETTIN, 2017, p. 172).
E (x) =
5.5.2 Valor da variância de uma variável
aleatória (discreta e contínua)
Var (x) = ∑ , em que xi é o valor da variável aleatória, E (x) a mé-
dia e pi é a sua probabilidade ou frequência.
Var (x) =
97
MULTIVIX EAD
Credenciada pela portaria MEC nº 767, de 22/06/2017, Publicada no D.O.U em 23/06/2017
ESTATÍSTICA APLICADA À EDUCAÇÃO
5.5.3 Função distribuição acumulada de uma
variável aleatória (discreta e contínua)
“Definição: Dada a variável aleatória X, chamaremos de função de distribuição
acumulada (f.d.a.), ou simplesmente função de distribuição (f.d.) F (x)” (MO-
RETTIN, 2017, p. 142).
F (X) = P (X ≤ x) ou F (x) = ∑ f ), para ≤ x
F’ (x) = = f(x) – utilizada para todos os valores de x para os quais F(x)é de-
rivável.
5.5.4 Distribuição uniforme
É a distribuição de variáveis aleatórias discretas em que todas possuem a
mesma probabilidade de ocorrer dentro da distribuição ou espaço amostral.
Representação: P (X ≤ x) = P ( = p = , em que todo i = 1, 2, 3..., k.
Média = E (x) = ∑
Variância = Var (X) =
Frequência Acumulada = F (x) = ∑
Vejamos o exemplo a seguir expresso na Tabela 4 que retrata o evento de um
lançamento de um dado.
TABELA 4 – NÚMERO DE PONTOS NO LANÇAMENTO DE UM DADO
x 1 2 3 4 5 6 Total
P (x) 1/6 1/6 1/6 1/6 1/6 1/6 1
Fonte: Bussab e Morettin (2017, p. 145).
Média = E (x) = ∑ 1/6(1+2+3+4+5+6) = 21/6=3,5
Variância = Var (X) = = 1/6 ((1+4+... +36) - (21) / 6) = 2,9
A Tabela 5 a seguir relaciona algumas distribuições discretas e detalha a sua
função de probabilidade, parâmetros e respectivas médias e variâncias. Adap-
tamos a tabela a seguir acrescentando algumas funcionalidades de cada dis-
tribuição.
98
ESTATÍSTICA APLICADA À EDUCAÇÃO
MULTIVIX EAD
Credenciada pela portaria MEC nº 767, de 22/06/2017, Publicada no D.O.U em 23/06/2017
TABELA 5 – MODELOS PARA VARIÁVEIS DISCRETAS
Modelo P (X=x) Parâmetros E (X), Var (X)
Bernoulli
Eventos de sucesso
e fracasso x = 0,1
p p, p
Binomial
Eventos de sucesso
e fracasso. Admite
dois resultados
n, p np, np
Poisson
Eventos de
tempo e espaço
(ocorrências)
, x = 0, 1, ...
Geométrica
Eventos relativos a
tempo, fila, espera
ou repetições x = 1, 2, ...
p
,
Hipergeométrica
Uusada na
extração de
amostras com e
sem reposição.
Sucesso e fracasso
do evento. Admite
vários resultados.
N, r, n
n
Fonte: Bussab e Morettin (2017, p. 145).
5.6 DISTRIBUIÇÃO NORMAL E REPRESENTAÇÃO
GRÁFICA DA ÁREA DA CURVA NORMAL
A Distribuição Normal, ou Gaussiana, é a principal distribuição de variáveis
contínuas e a mais utilizada para no cálculo da probabilidade e da inferência
estatística.
Ela é o resultado da distribuição de probabilidade dos parâmetros média e
desvio padrão. “Dizemos que a v.a. X tem distribuição normal com parâmetros
99
MULTIVIX EAD
Credenciada pela portaria MEC nº 767, de 22/06/2017, Publicada no D.O.U em 23/06/2017
ESTATÍSTICA APLICADA À EDUCAÇÃO
µ e σ², -∞ < μ < +∞ e 0 < σ < ∞, se a sua densidade é dada por f(x; µ, σ) =
, -∞<x<∞” (BUSSAB; MORETTIN, 2017, p. 181).
Parâmetros da Distribuição Normal:
E (X) = μ, e Var (X) =
QUADRO 1 – PRINCIPAIS CARACTERÍSTICAS DA DISTRIBUIÇÃO NORMAL
Forma Limites Parâmetros Utilizada
Forma de Sino.
Simétrica em
relação à média
-∞ a +∞
Área sob a curva
normal
100%
µ, σ²
A probabilidade de uma
variável aleatória tomar
um valor entre dois
pontos é igual a área da
curva entre os pontos.
Distribuição teórica mais utilizada
seja por aplicação direta ou por
aproximação com outras distribuições.
Fonte: Elaborado pelo autor (2019).
Vejamos o Gráfico 1 a seguir.
GRÁFICO 1 – DISTRIBUIÇÃO NORMAL –MÉDIAS E DESVIOS
Va
lo
re
s
-3s +3s
-2s +2s
-1s +1s
68,26%
95,44%
99,74%
Fonte: Sigma (2018).
100
ESTATÍSTICA APLICADA À EDUCAÇÃO
MULTIVIX EAD
Credenciada pela portaria MEC nº 767, de 22/06/2017, Publicada no D.O.U em 23/06/2017
No Gráfico 1 anterior, as áreas cobertas pela curva são representadas pelos
intervalos entre o desvio padrão e a média, de forma que a diferença entre o
primeiro até o terceiro desvio, correspondem aos percentuais de 68%, 95% e
99% das observações. Na próxima unidade, aprofundaremos essas relações
com a estimação dos parâmetros dentro de uma amostra ou população.
5.6.1 Curva normal padrão reduzida
Quando a média (µ) e o desvio padrão (σ) são respectivamente 0 e 1.
Logo, a variável aleatória passa a ser representada:
Z =
Z = escores padronizados da variável X em relação a curva normal.
“Exemplos de Aplicação sob a área da curva normal padrão reduzida, onde
Z≈N (0;1)” (BUSSAB; MORETTIN, 2017, p. 185).
Calculemos algumas probabilidades
1) P (-1,73 ≤ Z ≤ 0) = P (0 ≤ Z ≤ 1,73) = 0,4582, devido à simetria da curva.
GRÁFICO 2 – REPRESENTAÇÃO DO EXERCÍCIO 1
0 1,73
45%
Fonte: Adaptado de Bussab e Morettin (2017, p. 185).
101
MULTIVIX EAD
Credenciada pela portaria MEC nº 767, de 22/06/2017, Publicada no D.O.U em 23/06/2017
ESTATÍSTICA APLICADA À EDUCAÇÃO
Procedimento: consultar a tabela de distribuição de escores ou probabilida-
des e localizar o valor 1,73 visualizando a coluna e a linha correspondente. O
resultado será a área da curva normal padrão reduzida 0,4582. Esse é o valor
que corresponde à probabilidade de Z pertencer ao intervalo desejado.
2) P (Z <-1,73) = P (Z 1,73) = 0,0418.
O procedimento de consulta à tabela é idêntico ao da questão anterior. O re-
sultado será a área de 0,0418 ou 4%. Esse é o valor que corresponde à probabi-
lidade de Z estar entre o intervalo desejado. E faz sentido, pois, se verificarmos
que a área está ao lado direito, ou seja, 50% dos resultados se concentram em
um dos lados da curva e, como havíamos calculado no exercício anterior, a
área compreendida entre a média (0) e o ponto 1,73 = 45%, aproximadamente,
logo as observações anteriores de 1,73, corresponderão, aproximadamente, a
0,5 - 0,45 = 4 % ou 5 % da área.
São inúmeras as aplicações e formas de calcular a área ou a probabilidade
de ocorrência de um determinado evento numa curva normal padrão. Reco-
mendamos o aprofundamento desses conceitos com o intuito de auxiliar nos
trabalhos e na aplicação prática em pesquisas e experimentos.
CONCLUSÃO
Esta unidade apresentou uma reflexão sobre o estudo das probabilidades e
suas distribuições, destacando a importância na aplicação das suas metodo-
logias para a análise dos eventos, das características de cada evento e as dis-
tribuições de probabilidades correspondentes, assim como a apresentação
de algumas distribuições, com ênfase nas distribuições normal (contínua) e
uniforme (discreta).
Esperamos que faça bom uso do conteúdo e atente-se para as informações
indicadas nos tópicos.
UNIDADE 6
102
MULTIVIX EAD
Credenciada pela portaria MEC nº 767, de 22/06/2017, Publicada no D.O.U em 23/06/2017
ESTATÍSTICA APLICADA À EDUCAÇÃO
> Estudar as
diversas formas
de análise dos
dados estimados,
buscando oferecer
o instrumental
necessário para
a decisão mais
próxima da realidade
apurada nas
distribuições e nos
modelos aferidos.
> Explicar a
apresentação
de exemplos
calculados com
base em planilhas
e programas
específicos.
OBJETIVO
Ao final da
unidade,
esperamos que
você seja capaz
de:
103
MULTIVIX EAD
Credenciada pela portaria MEC nº 767, de 22/06/2017, Publicada no D.O.U em 23/06/2017
ESTATÍSTICA APLICADA À EDUCAÇÃO
6 INFERÊNCIA ESTATÍSTICA
INTRODUÇÃO
Até a Unidade 5 foram analisados os métodos para a análise de variáveis, pa-
râmetros e distribuições de probabilidade com base em medidas populacio-
nais. A partir de agora, começaremos a aprofundar como estimar parâmetros
e estatísticas que melhor representem populações e amostras.
A inferência estatística é resultado de toda essa construção. As propriedades,
os métodos e os processos da estatística, aliados às teorias probabilísticas dão
o contorno aos assuntos que serão abordados nesta unidade.
O presente estudo obedecerá ao modelo clássico, metodologia sugerida na
bibliografia principal, cujo objetivo é estudar exemplos aplicáveis à distribui-
ção normal e distribuições aproximadamente normais; logo, a tarefa principal
seria oferecer instrumentos para compreensão desses conceitos dentro dos
limites estabelecidos na ementa.
Outros enfoques como o bayesiano e modelos não paramétricos serão obje-
to de citações dado o seu caráter extenso que poderia tirar o foco do objeto
principal do nosso estudo.
Esperamos que possa fazer um ótimo proveito dos conteúdos aqui apresen-
tados e que as aplicações e exemplos tratados nesta unidade se ajustem aos
interesses do seu desenvolvimento profissional e pessoal.
Inferência estatística: “o objetivo da Inferência Estatística
é produzir afirmações sobre dada característica da
população, na qual estamos interessados, a partir de
informações colhidas de uma parte dessa população”
(BUSSAB; MORETTIN, 2017, p. 268).
104
ESTATÍSTICA APLICADA À EDUCAÇÃO
MULTIVIX EAD
Credenciada pela portaria MEC nº 767, de 22/06/2017, Publicada no D.O.U em 23/06/2017
6.1 POPULAÇÃO E AMOSTRA, DISTRIBUIÇÕES E
TAMANHO DA AMOSTRA
Os termos população e amostra referem-se a coletivos diversos formados por
pessoas, objetos, produtos, escolas, notas de alunos, preços, quantidades, en-
fim, tudo que possa ser mensurado e reunido sob determinadas características
e semelhanças em grupos. O que difere cada um dos conceitos é a finalidade
e a forma como cada um é constituído e como são mantidas certas caracterís-
ticas. A população concentra todos os elementos do grupo. Já a amostra é uma
parte representativa desses elementos, ou seja, uma parcela da população.
População: “[...] é o conjunto de todos os elementos
ou resultados sob investigação. Amostra é qualquer
subconjunto da população” (BUSSAB; MORETTIN, 2017,
p. 266).
Também há que se diferenciar os termos utilizados quando nos referirmos a
uma população ou amostra. Vejamos.
Parâmetros:
significam as medidas calculadas levando em consideração os dados
da população, exemplo: média, mediana, variância, desvio padrão etc.
Estatísticas ou estimadores:
significam as medidas calculadas levando em consideração a
distribuição amostral enquanto população estimada pela amostra.
Trata-se dos mesmos parâmetros da população devidamente
alterados na sua formulação para atender a especificidade da amostra.
Na sequência do presente estudo, verificamos que muitas são as dúvidas em
relação ao método de escolha das amostras e a sua importância na represen-
tatividade junto à população. Afinal, qual deve ser o tamanho da amostra e
105
MULTIVIX EAD
Credenciada pela portaria MEC nº 767, de 22/06/2017, Publicada no D.O.U em 23/06/2017
ESTATÍSTICA APLICADA À EDUCAÇÃO
como podemos calculá-la para atender aos objetivos da Inferência Estatísti-
ca? Os parâmetros e as estimativas? Como saber se são representativos? Es-
sas e outras questões serão aprofundadas nos próximos tópicos.
Em princípio, devemos ter claro que todo processo estatístico é precedido de
planejamento das etapas considerando uma série de informações, dentre as
quais se destacam os critérios técnicos para a elaboração do estudo.
A determinação do processo de amostragem é realizada no planejamento e
poderá ser executada considerando os seguintes aspectos:
1. Se a população é finita ou infinita; discreta ou contínua.
2. Se a escolha do método amostral será probabilístico ou não.
3. Em relação ao tipo de extração amostral, se aleatória, sistemática, estrati-
ficada ou por conglomerado.
Essas definições fazem parte dos processos de levantamentos amostrais, pla-
nejamento de investimentos e levantamentos observacionais, sendo os dois
primeiros mais utilizados.
Para efeito de processo de amostragem, consideraremos as amostragens ale-
atórias simples como método, seguindo orientação bibliográfica principal. A
sua utilização é mais simples e pode ser aplicada de forma probabilística e su-
jeita a análise da variabilidade da distribuição amostral, que vem ao encontro
do nosso objetivo.
Para obter mais informações sobre o processo de
amostragem, acesse a obra a seguir.
BUSSAB, W. de O.; MORETTIN, P. A. Introdução à
Inferência Estatística. In: Estatística Básica. 9. ed. São
Paulo: Saraiva, 2017. p. 265-276.
106
ESTATÍSTICA APLICADA À EDUCAÇÃO
MULTIVIX EAD
Credenciada pela portaria MEC nº 767, de 22/06/2017, Publicada no D.O.U em 23/06/2017
6.1.1 Distribuições amostrais
São os espaços amostrais em que estão representadas as probabilidades das
estatísticas e suas variabilidades em relação a amostra. Em outras palavras,
significa que, ao escolher um processo amostral, o cálculo de uma estatística,
como a média, variância, mediana, desvio padrão etc., deverá ser comparado
e avaliado diante das possíveis variações que a amostra está sujeita. Vejamos
o exemplo a seguir.
Se escolhida certa amostra, a sua distribuição amostral
deverá ser analisada a partir do cálculo da média e das
suas variações em torno dos valores centrais da amostra.
Por fim, será realizada análise semelhante na população
para saber se a distribuição se enquadra realmente
no modelo adotado e compatível com a distribuição
de probabilidade da população. Os parâmetros
populacionais e a proporção entre os valores da amostra
definirão as estimativas ou estatísticas.
QUADRO 1 – RESUMO DASESTATÍSTICAS POR DISTRI-
BUIÇÃO DE PROBABILIDADE AMOSTRAL
Distribuição
amostral
Médias Desvio
padrão
população
infinita
Desvio padrão
população finita
Médias
= =
Proporções
= = =
Fonte: Elaborado pelo autor (2019).
Baseando-se nas informações apresentadas no exemplo anterior, observem
que as formulações se referem a dois parâmetros mais utilizados. As estatís-
ticas média e desvio padrão estão relacionadas à proporção da população ou
107
MULTIVIX EAD
Credenciada pela portaria MEC nº 767, de 22/06/2017, Publicada no D.O.U em 23/06/2017
ESTATÍSTICA APLICADA À EDUCAÇÃO
da amostra (p), número de amostras (n), quantidade populacional (N). Essa
relação expressa o quanto um evento binomial ou hipergeométrico (falso ou
verdadeiro, sim ou não, positivo ou negativo etc.) pode ser generalizado no
cálculo de tais estimativas. O resultado indica uma proporção que poderá ser
representada através de uma distribuição normal. O fator determinante para
essa conclusão está no fato de que o aumento do tamanho da amostra apro-
xima o valor dos estimadores amostrais dos parâmetros populacionais, en-
quanto a variância diminui.
Essas observações são consagradas através do Teorema do Limite Central que
veremos a seguir.
6.1.2 Teorema do limite central
O conceito intrínseco do Teorema explica a aproximação de algumas distri-
buições da distribuição normal devido ao aumento da amostra, ou à repeti-
ção dos experimentos.
“[...] quando o tamanho da amostra aumenta,
independentemente da forma da distribuição da
população, a distribuição amostral de X– aproxima-
se cada vez mais de uma distribuição normal. Esse
resultado, fundamental na teoria da Inferência
Estatísticas, é conhecido como Teorema Limite Central
(TLC).” (BUSSAB; MORETTIN, 2017, p. 282)
Convencionou-se, ainda, que uma população 30 observações é considerada
grande e, portanto, apta a ser tratada pela distribuição normal e as distribui-
ções aproximadamente normais. As observações a seguir (abaixo) de 30 serão
consideradas pequenas e tratadas pela tabela “t” (student) ou assemelhadas.
A distribuição “t” (student) também é utilizada quando o desvio padrão é des-
conhecido, independentemente do tamanho da amostra, nesse caso, o des-
vio padrão a ser utilizado é o desvio amostral.
108
ESTATÍSTICA APLICADA À EDUCAÇÃO
MULTIVIX EAD
Credenciada pela portaria MEC nº 767, de 22/06/2017, Publicada no D.O.U em 23/06/2017
6.1.3 Distribuições de médias
É o processo que procura analisar as médias extraídas das amostras e compa-
rá-las à distribuição amostral buscando identificar o valor que melhor repre-
senta a distribuição.
São caracterizadas por representarem a média da população e por se tratar
de distribuição normal ou normal aproximada, tendo sua probabilidade au-
mentada e a sua variabilidade reduzida, na medida que cresce o número de
observações da amostra.
µ = Média amostral será sempre igual a média da população.
= = Desvio padrão amostral populações infinitas, em que = Desvio
padrão populacional; n = tamanho da amostra.
= = desvio padrão amostral populações finitas, em que = des-
vio padrão populacional; n = tamanho da amostra; N = tamanho da população.
Vejamos o exemplo a seguir.
Uma população muito grande tem média 27,0 e desvio
padrão 1,5. Extrai-se uma amostra de 50 observações.
Calcule a média e o desvio padrão da distribuição
amostral.
µ = média da amostra = média da população = 27,0
= = desvio padrão amostral = = = = 0,21
6.1.4 Distribuições de proporções (binomial e
hipergeométrica)
também apresentam características semelhantes à distribuição de médias
determinados pelo Teorema do Limite Central, ou seja, distribuições bino-
109
MULTIVIX EAD
Credenciada pela portaria MEC nº 767, de 22/06/2017, Publicada no D.O.U em 23/06/2017
ESTATÍSTICA APLICADA À EDUCAÇÃO
miais, hipergeométricas e poisson são aproximadamente normais para gran-
des amostras, mesmo quando a população básica não é normal.
= média da proporção - média amostral sempre igual à média populacional
– distribuição binomial aproximada para normal.
= = desvio padrão amostral de uma proporção, em que p = pro-
porção da amostra e (1 – p) a proporção complementar.
Vejamos o exemplo a seguir.
Uma universidade deseja aumentar a sua qualificação
nas avaliações do MEC. Periodicamente, é realizada
uma avaliação dos alunos para determinar a proporção
de notas satisfatórias. Nos últimos anos, 40% dos
alunos obtiveram aprovação. Sabendo que foram feitos
investimentos significativos na estrutura e capacitação,
qual a probabilidade de que a aprovação pelo MEC seja
de 50% para uma amostra de 100 alunos?
A média de aprovação segue a proporção de 40% e um
objetivo de atingir 50% em uma amostra de 100 alunos.
Logo, vamos trabalhar em cima da dispersão dos valores
e compará-los através da tabela normal.
= = = = 0,04889
Determinando z = Z = = 10%/4,8% = 2,08
Consultando a tabela normal temos: z = 0,5 - 0,4812 =
0,0188 ou 2%
Portanto será de 2% a probabilidade de uma amostra de
100 alunos da universidade atingir 50% de aprovação.
Recomendamos os exercícios da bibliografia indicada
para fixação.
110
ESTATÍSTICA APLICADA À EDUCAÇÃO
MULTIVIX EAD
Credenciada pela portaria MEC nº 767, de 22/06/2017, Publicada no D.O.U em 23/06/2017
6.1.5 Tamanho da amostra
O tamanho ideal da amostra será uma combinação entre o grau de confiança
desejado, o valor do desvio padrão (dispersão) e o valor de erro tolerável. É uti-
lizada para a determinação do tamanho da amostra para o desvio padrão co-
nhecido. Em caso de desvio padrão desconhecido, adota-se o desvio padrão
amostral ( ) e a distribuição t de student que é aproximadamente normal
para amostras 30.
= Z = erro tolerável ou erro padrão (objeto de estudo no tópico seguinte);
isolando o n, teremos: n =
Em que n = tamanho da amostra.
= desvio padrão
= erro provável
Outros exemplos do uso do tamanho e amostra podem ser encontrados na
bibliografia indicada, conforme a seguir.
Recomendamos a leitura da obra indicada a seguir no que
se refere ao aprofundamento do tamanho da amostra.
BUSSAB, W. de O; MORETTIN, P. A. Introdução à Inferência
Estatística. In: Estatística Básica. 9. ed. São Paulo: Editora
Saraiva, 2017. p. 291-299
A seguir, trataremos de um outro assunto que será estimação.
6.2 ESTIMAÇÃO: PROPRIEDADES, ESTIMADORES,
INTERVALOS DE CONFIANÇA E ERRO PADRÃO
Estimação é o processo pelo qual são utilizados dados amostrais para estimar
valores populacionais desconhecidos.
Conforme afirmamos no início dos nossos estudos, a base das informações será
extraída de uma amostra aleatória. As características mais comuns buscadas
em uma população são a média, o desvio padrão e a proporção populacional.
111
MULTIVIX EAD
Credenciada pela portaria MEC nº 767, de 22/06/2017, Publicada no D.O.U em 23/06/2017
ESTATÍSTICA APLICADA À EDUCAÇÃO
No entanto, para que uma amostra expresse as características de uma popu-
lação, é necessário que, além da distribuição amostral ser igual à populacio-
nal, as estatísticas ou estimadores sejam representativos dessa distribuição
amostral e, por consequência, representativos da própria população.
Nesse contexto, o estudo prévio dos estimadores e sua representatividade
através das suas propriedades é fundamental para a sequência do processo.
As estimativas podem ser pontuais ou intervalares. Pontuais quando o obje-
tivo é identificar um determinado ponto ou medida exata de uma estatística
ou estimador amostral. Intervalar, quando o processo leva em conta um inter-
valo onde o estimador ou a estatística está representado.
É importante entender que, ao analisarmos uma estatística ou estimativa re-
presentativas de uma distribuição amostral, estamos falando da sua aplica-
ção e uso na distribuição normal, enquanto variável z (padrão normalizada),
para avaliarmos de maneira relativa o quão representativo é o estimador ou a
estatística em relação à média e o desvio padrão.
Vejamos o Quadro 2 aseguir com os valores médios per capta representando
valor pontual e valor intervalar do consumo de carne de frango num determi-
nado restaurante (valores hipotéticos).
QUADRO 2 – ESTIMATIVAS PONTUAIS OU INTERVALARES
Estimativa
Parâmetro
Pontual Intervalar
Média Um restaurante apurou um
consumo médio de 41 kg de
carne de frango em 2016
O consumo médio de carne
de frango esteve entre 37 a 45
kg por pessoa
Proporção O destino da produção de
carne de frango foi de 66%
o almoço contra 34% para o
jantar
A estimativa de consumo
de carne de frango para o
almoço foi calculada entre
63% a 69%
Desvio padrão O desvio padrão do consumo
de carne de frango foi de 2kg
per capta em 2016
O desvio padrão do consumo
de frango per capta ficou
entre 1,5 kg e 2,5 kg
Fonte: Elaborado pelo autor (2019).
112
ESTATÍSTICA APLICADA À EDUCAÇÃO
MULTIVIX EAD
Credenciada pela portaria MEC nº 767, de 22/06/2017, Publicada no D.O.U em 23/06/2017
Supondo que os valores calculados da média de consumo per capta de car-
ne de frango seja representativo da população pesquisada, segundo a tabela
normal padronizada, poderíamos afirmar que que a média da amostra está a
menos de 1,96 desvios padrões a contar da média verdadeira em de 95% das
vezes e, em 5% das vezes fora do valor calculado.
O Gráfico 1 a seguir ilustra os valores dos desvios padrões distribuídos na cur-
va normal considerando os afastamentos em torno da média (valor central).
O resultado são as probabilidades obtidas em cada lado da curva normal. No
exemplo anterior, a tabela da curva normal padronizada correlaciona ao va-
lor de z = 1,96 a probabilidade 0,4750 do lado direito da curva (z = positivo).
Quando subtraímos 0,5 – 0,4750 (metade da área da curva menos a área da
probabilidade de z=1,96), obtemos 0,05, que multiplicado por 100 é igual a 5 %.
O valor de z = 1,96 desvios padrões está entre a área correspondente à µ =
e “+2s” desvios padrões, representando, aproximadamente,
95% de certeza de que a média amostral se encontra nesse intervalo.
GRÁFICO 1 – DISTRIBUIÇÃO NORMAL –MÉDIAS E DESVIOS
68%
95%
99,7%
μ
-1σ +1σ
-2σ +2σ
-3σ +3σ
Fonte: IBM Knowledge Center (2019).
No tópico a seguir, aprenderemos as propriedades dos estimadores.
113
MULTIVIX EAD
Credenciada pela portaria MEC nº 767, de 22/06/2017, Publicada no D.O.U em 23/06/2017
ESTATÍSTICA APLICADA À EDUCAÇÃO
6.2.1 Propriedades dos estimadores
O estimador seria um candidato a uma estatística de uma distribuição amos-
tral, associado a um parâmetro (média ou variância). Para se tornar uma esta-
tística, deve ser testado perante as propriedades. Essas propriedades são uti-
lizadas para estimar de forma pontual o parâmetro ou estatística, bem como
testar se o estimador pode ser ou não a melhor estatística para a distribuição
amostral.
Estimador T do parâmetro θ: um estimador T do parâmetro
θ é qualquer função das observações da amostra, ou seja,
T = g (X1, ... Xn) (BUSSAB; MORETTIN, 2017, p. 302).
1. Estimador não viesado = E ( ) = θ, expectância, esperança ou média de T
= θ.
2. Estimador não viesado = = proporção amostral e proporção p indi-
víduos.
3. Estimador consistente = .
4. Estimador eficiente = Var ( ) < Var ( ’), T diz-se mais eficiente do que T’.
Outros estimadores como o de momentos ( = = e = , mínimos qua-
drados (Y= g (X; θ) + ε) e de máxima verossimilhança (L (θ; x1..., xn) = f (x1; θ)...f
(xn;θ) ) são objeto de estudo mais apurado na bibliografia indicada.
Em suma, ao tratarmos deste tópico, buscamos registrar que as amostras são
submetidas a determinadas condições para que sejam aceitas como repre-
sentativas. Outras condições como teste de significância, erro padrão, etc. se-
rão objeto de estudo nos próximos tópicos.
114
ESTATÍSTICA APLICADA À EDUCAÇÃO
MULTIVIX EAD
Credenciada pela portaria MEC nº 767, de 22/06/2017, Publicada no D.O.U em 23/06/2017
Recomendamos a leitura da obra indicada a seguir no
que se refere ao aprofundamento de Propriedade de
Estimadores.
BUSSAB, W. de O.; MORETTIN, P. A. Introdução à Inferência
Estatística. In: Estatística Básica. 9. ed. São Paulo: Saraiva,
2017. p. 302-315.
6.2.2 Intervalo de confiança
É o intervalo de valores em que presumimos estar contido o parâmetro ou
estatística representativa da amostra ou população, considerando o risco co-
nhecido de erro. Em outras palavras, quando escolhemos um parâmetro ou
estatística, estamos presumindo que esse valor será tão representativo quan-
to os limites que determinarmos em função do erro esperado. No exemplo
do consumo de carne de frango tratado no tópico anterior, se consideramos
a média calculada igual a 41 kg per capta, o desvio padrão de 2kg, e um nível
de confiança de 95%, conforme estabelecido anteriormente, com base nesses
valores, acrescido de que a amostra extraída foi de 31 pessoas, teríamos o se-
guinte intervalo de confiança para a média de consumo:
± 1,96 = 41± 1,96 = 41 ± 1,96(5,57) = 41± 10,91
Em que: = média da amostra.
1,96 = z equivalente a 95% de confiança desejada
= desvio padrão da amostra
n = tamanho da amostra
Logo, a média se encontrará no intervalo de 30,09 a 51,91 kg per capta com
95% de probabilidade de certeza contra 5% (risco calculado).
Os intervalos de confiança seguem a mesma construção lógica: o parâmetro
é calculado no intervalo superior e inferior considerando a variação do desvio
padrão e o nível de significância que determinará a margem de erro no re-
sultado. As formulações vão variar de acordo com a distribuição amostral e o
parâmetro ou estatística a ser calculada.
115
MULTIVIX EAD
Credenciada pela portaria MEC nº 767, de 22/06/2017, Publicada no D.O.U em 23/06/2017
ESTATÍSTICA APLICADA À EDUCAÇÃO
Um estimador T do parâmetro θ é qualquer função das
observações da amostra, ou seja, T = g (X1, ... Xn) (BUSSAB;
MORETTIN, 2017, p. 302).
6.2.3 Erro padrão
É a diferença entre os valores estimados na amostra e os valores reais da po-
pulação. É determinado pela confiança desejada (valor de ”z”), a dispersão da
população ( ) e o tamanho da amostra (n) = z
Recomendamos a leitura da obra indicada a seguir no
que se refere ao aprofundamento de erro padrão de um
estimador e inferência bayesiana.
BUSSAB, W. de O.; MORETTIN, P. A. Introdução à
Inferência Estatística. In: Estatística Básica. 9. ed. São
Paulo: Saraiva, 2017. p. 321-329.
6.3 TESTES DE HIPÓTESES: TESTE SOBRE A
MÉDIA, PROPORÇÃO, VARIÂNCIA E VALOR “P”
6.3.1 Teste de hipóteses
É o teste realizado nas estatísticas e parâmetros amostrais visando identificar
a existência ou não de variações casuais ou significativas desses valores esti-
mados diante da distribuição amostral.
A realização do teste requer a formulação das possíveis hipóteses para que
um determinado valor estimado seja aceito ou não. A hipótese nula ou
representa o parâmetro ou estatística calculada e que se deseja testar a sua
veracidade. A hipótese alternativa significa afirmar que a alegação de ve-
racidade de é discutível e que o valor pode ser maior ou menor do que o
calculado.
116
ESTATÍSTICA APLICADA À EDUCAÇÃO
MULTIVIX EAD
Credenciada pela portaria MEC nº 767, de 22/06/2017, Publicada no D.O.U em 23/06/2017
Os testes são realizados a partir do cálculo do desvio padrão da distribuição
amostral e comparados com a hipótese alternativa no cálculo da variável pa-
dronizada “z”. O resultado corresponderá na quantidade relativa de desvios
padrões em relação à média amostral e será considerado o valor crítico do pa-
râmetro. Por fim, observado o valor da área correspondente na curva normal,
tem-se o resultado do teste.
Em que:
= estatística teste
= estatística alegada - valor alternativo à hipótese nula
= estatística amostral valor da hipótese nula calculado na amostra e que
se deseja testar
= desvio padrão amostral
O teste bilateral é aplicado considerando as duas caudas da curva normal.
Essa hipótese visa aferir os valores máximos e mínimos em que o parâmetro
ou aestatística poderá ser aceita. O teste unilateral à esquerda significa o limi-
te mínimo aceito e, o unilateral à direita, o limite máximo de aceitação.
Por fim, objetivando apresentar uma visão mais geral sobre esses conceitos,
e após a realização dos testes, os valores apurados estão sujeitos à análise do
tipo de erro a partir da decisão tomada na escolha do parâmetro.
Erro do Tipo I – quando rejeitamos a quando verdadeira. Probabilidade = .
Erro do Tipo II – quando aceitamos como verdadeiro a falsa. Probabilidade
= .
A aplicação desses conceitos é estendida à análise de médias, proporção, vari-
ância, conforme tópicos posteriores. As sugestões de exercícios da bibliografia
serão ideais para o aperfeiçoamento e entendimento das práticas.
117
MULTIVIX EAD
Credenciada pela portaria MEC nº 767, de 22/06/2017, Publicada no D.O.U em 23/06/2017
ESTATÍSTICA APLICADA À EDUCAÇÃO
Recomendamos a leitura da obra indicada a seguir
no que se refere ao aprofundamento sobre testes de
hipóteses.
BUSSAB, W. de O.; MORETTIN, P. A. Testes de Hipóteses.
In: Estatística Básica. 9. ed. São Paulo: Saraiva, 2017. p.
336-329.
6.3.2 Teste sobre a média
O método é semelhante ao adotado no tópico anterior, a diferença é que o
teste de significância será realizado para a média de uma amostra objetivan-
do identificar possíveis variações e determinar se elas são ou não casuais a
ponto de rejeitar ou aceitar a Hipótese nula ( ). São divididos entre grandes
e pequenas amostras.
Em que:
= estatística teste
= média alegada - valor alternativo à hipótese nula
= média amostral valor da hipótese nula calculado na amostra e que se
deseja testar.
= desvio padrão amostral (desvio conhecido)
Obs.: quando o desvio padrão for desconhecido ou uma pequena amostra,
usar - desvio amostral e t (student) = estatística teste.
6.3.3 TESTE SOBRE A PROPORÇÃO
Refere-se à análise sobre a proporção amostral em relação à população. O
objetivo é testar se a proporção é representativa da distribuição amostral ou
se a sua variabilidade pode ser causada por algum fator significativo que re-
comende a rejeição de : p = po e :
118
ESTATÍSTICA APLICADA À EDUCAÇÃO
MULTIVIX EAD
Credenciada pela portaria MEC nº 767, de 22/06/2017, Publicada no D.O.U em 23/06/2017
H1: p ≠ p0 (teste bilateral);
H1: p p0 (teste unilateral à direita); e
H1: p < p0 (teste unilateral à esquerda).
= onde:
= estatística teste
= proporção alegada - valor alternativo à hipótese nula
= proporção amostral valor da hipótese nula calculado na amostra e que
se deseja testar.
= = desvio padrão amostral (desvio conhecido)
Obs.: quando o desvio padrão for desconhecido ou uma pequena amostra,
usar - desvio amostral e t (student) = estatística teste.
6.3.4 Variância
A análise da variância tem por objetivo verificar se as populações estudadas
são iguais a partir dos resultados obtidos com no cálculo das respectivas es-
timativas de variâncias. Se as estimativas tiverem o mesmo resultado, as po-
pulações são iguais, caso contrário, deverá ser testada para identificar se
a variabilidade pode ter ocorrido em razão de algum fator significativo que
recomende a sua rejeição.
No entanto, para chegarmos ao resultado esperado na análise, faz-se neces-
sário a adoção de dois processos distintos:
1. Se as populações tiverem distribuição normal, a média das populações
serão iguais e, consequentemente, as suas variâncias também. Logo,
é verdadeira; caso contrário, deve-se calcular as estimativas “dentro” e
“entre” variâncias.
2. Estimativa “dentro” da variância é calculada através da média de todas as
variâncias amostrais =
3. Estimativa “entre” da variância é calculada através da determinação da
média da população e das respectivas variâncias amostrais =
119
MULTIVIX EAD
Credenciada pela portaria MEC nº 767, de 22/06/2017, Publicada no D.O.U em 23/06/2017
ESTATÍSTICA APLICADA À EDUCAÇÃO
4. Ao final, compara-se e se for aproximadamente igual a
a variação poderá ser considerada casual da amostra, caso contrário,
aplica-se razão entre os dois métodos e o resultado é comparado
em tabela apropriada chamada razão “F”.
A distribuição “F” indica o valor máximo da estatística no caso de for ver-
dadeira, a um determinado nível de significância.
As observações quanto ao valor desconhecido da estatística seguem a me-
todologia dos demais casos, ou seja, utiliza-se o valor amostral e aplica-se a
tabela t (student).
6.3.5 Valor “P”
O valor “p” do teste consiste em determinar um nível de significância para
teste do valor da amostra sem construir a região crítica onde os valores fora
do padrão seriam automaticamente rejeitados.
“O que se faz é indicar a probabilidade de ocorrer valores da estatística mais
extremos do que o observado, sob a hipótese de ser verdadeira” (BUSSAB;
MORETTIN, 2017, p. 354).
Portanto, o valor “p” poderá ser determinado considerando a sua relevância
específica em face do evento estudado e a amostra calculada. O quadro a se-
guir expressa a escala de significância de Fisher para ilustrar a sua utilização.
QUADRO 3 - TABELA ESCALA DE SIGNIFICÂNCIA DE FISHER
Valor p 0,10 0,05 0,025 0,01 0,005 0,001
Natureza da
evidência
Marginal Moderada Substancial Forte
Muito
Forte
Fortíssima
Fonte: Bussab e Morettin (2017, p. 356).
Logo, um valor de = 0,0025,0,01, 0,005 ou 0,001, indica uma gradação estabe-
lecendo uma importância para avaliação de , ou seja, para essas faixas (de
substancial a fortíssima), a hipótese nula seria rejeitada (para qualquer valor α
p, você não deve rejeitar H0, e, para qualquer valor α p, você rejeita H0.) .
120
ESTATÍSTICA APLICADA À EDUCAÇÃO
MULTIVIX EAD
Credenciada pela portaria MEC nº 767, de 22/06/2017, Publicada no D.O.U em 23/06/2017
6.4 INFERÊNCIA PARA DUAS POPULAÇÕES E
INFERÊNCIA PARA VÁRIAS POPULAÇÕES
6.4.1 Inferência para duas populações
O método é semelhante ao adotado para uma média amostral, a diferença é
que o teste de significância será realizado para duas médias independentes
sobre duas populações diferentes. O objetivo é identificar se ( ) tem médias
iguais apesar de serem populações diferentes, e se variações existentes são ou
não casuais a ponto de rejeitar ou aceitar a hipótese nula. São utilizadas para
comparação entre duas marcas, dois métodos de ensino, dois municípios, etc.
é também conhecida como hipótese de homogeneidade.
Em que:
= estatística teste
= média amostral da população 1
= média amostral da população 2.
= variância amostral da população 1
= variância amostral da população 2
Obs.: quando o desvio padrão for desconhecido, usar - desvio amostral e t
(student) = estatística teste.
6.4.2 Inferência para várias populações
Este estudo tem por objetivo analisar as diversas subpopulações ou estratos
contidos nas populações, extraindo destes as informações de interesse. A apu-
ração das variâncias de cada subpopulação ou estrato é o método adotado para
estabelecer a confiabilidade dos estimadores e a aceitação ou rejeição de .
121
MULTIVIX EAD
Credenciada pela portaria MEC nº 767, de 22/06/2017, Publicada no D.O.U em 23/06/2017
ESTATÍSTICA APLICADA À EDUCAÇÃO
A análise da variância (ANOVA) inclui uma série de testes para verificar a igual-
dade de três ou mais médias populacionais, fundamentada na análise das
variâncias amostrais.
Fator – característica que distingue os diferentes estratos ou populações e
podem ser subdivididos em níveis co-fatores.
: µ₁ = µ₂ = ... = µj = µ → hipótese de interesse – a média de todas as popula-
ções são iguais ou o fator não tem efeito (não existe variação das médias entre
os estratos)
: µi µj→ hipótese alternativa – nem todas as médias populacionais
são iguais (pelo menos uma é diferente ou existe efeito do fator sobre as
populações).
Modelo com efeitos fixos: significa que o pesquisador escolhe as subpopula-
ções determinadas pelos níveis do fator:
“Uma escola analisa seu curso por meio de um
questionário com 50 questões sobre diversosaspectos
de interesse. Cada pergunta tem uma resposta, numa
escala de 1 a 5 (v.a. Y), em que a maior nota significa
melhor desempenho [...]. O fator é o período e os três
níveis: i = 1: manhã. I = 2: tarde, i = 3: noite, com n1 = 7, n2 =
6 e n3 = 8 (tamanho da amostra)” (BUSSAB; MORETTIN,
2017, p. 431).
Existe o modelo para duas subpopulações = = +
Em que:
= efeito comum a todos os elementos do nível i = 1, 2
= efeito aleatório, não controlado, do j-ésimo indivíduo do nível i
= tempo de reação ao estímulo do j-ésimo indivíduo do nível i
Os demais passos no sentido de se apurar e testar seguem metodologias
já mencionadas na presente unidade. Algumas particularidades em relação a
122
ESTATÍSTICA APLICADA À EDUCAÇÃO
MULTIVIX EAD
Credenciada pela portaria MEC nº 767, de 22/06/2017, Publicada no D.O.U em 23/06/2017
conceitos de variância, mas, ao final, busca-se a demonstração dos valores crí-
ticos e decisão sobre as estatísticas calculadas amparadas na tabela F (ANO-
VA) que são explicadas por Bussab e Morettin (2017) nas páginas de 515 a 529.
Recomendamos a leitura da obra indicada a seguir no
que se refere ao aprofundamento de inferência para
várias populações.
BUSSAB, W. de O.; MORETTIN, P. A. Inferência para Várias
Populações. In: Estatística Básica. 9. ed. São Paulo:
Saraiva, 2017. p. 427-453.
6.5 ANÁLISE DE ADERÊNCIA E ASSOCIAÇÃO
6.5.1 Aderência e associação
São testes realizados para julgar se determinada população está associada a
alguma distribuição de probabilidade. São utilizados também para verificar
se determinados métodos podem diferir na medida que se altera a distribui-
ção de probabilidade. Os resultados obtidos são importantes na decisão so-
bre alternativas seguirem diante de situações distintas, à medida que se tem
algum nível de confiança com base nos testes registrados.
=
São realizados testes de homogeneidade, independência e para coeficiente
de correlação.
“Temos uma população P e queremos verificar se ela
segue uma distribuição especificada P0, isto é, queremos
testar a hipótese H0 : P = p0 [...] Aqui, o teste comparará
o número de casos ocorridos em caselas especificadas,
com o número esperado de casos nelas, quando a
hipótese H0 for verdadeira” (BUSSAB; MORETTIN, 2017,
p. 406-407).
123
MULTIVIX EAD
Credenciada pela portaria MEC nº 767, de 22/06/2017, Publicada no D.O.U em 23/06/2017
ESTATÍSTICA APLICADA À EDUCAÇÃO
A tabela utilizada para a verificação dos testes de aderência é a Tabela qui-
-quadrado, visto que os procedimentos se assemelham aos demais quando
o objetivo é identificar se é verdadeira ou falsa e qual a probabilidade de
aceitação com base na estatística teste e dos valores críticos.
6.6 ANÁLISE DE REGRESSÃO E CORRELAÇÃO
São métodos que buscam estimar uma relação ou associação entre variá-
veis e estabelecer um modelo matemático que explique essa relação. Nosso
objetivo não será o aprofundamento dos cálculos, mas tão somente oferecer
algumas informações acerca dos conceitos e utilidade.
6.6.1 Correlação simples e múltipla
A correlação mede o grau de relacionamento entre uma ou mais variáveis.
A correlação simples mensura o grau de associação entre uma variável in-
dependente e outra dependente. A correlação múltipla analisa a associação
entre várias variáveis independentes com as demais.
Os estudos da correlação podem nos levar a conclusão sob três aspectos dis-
tintos: existência de relação de causa e efeito; que as variáveis podem estar
relacionadas com uma terceira variável; ou a correlação é devida ao acaso.
Os resultados obtidos podem ser submetidos a testes de significância ou
apresentados enquanto intervalos de confiança.
6.6.2 Regressão linear e múltipla
As equações de regressão linear são dispostas na forma Yc = a + bx. Em que
Yc é a variável independente, “a” a constante e bx a variável dependente. Tem
como técnica para a utilização dos mínimos quadrados para determinação da
equação de regressão. A reta explica ou descreve a relação matemática entre
as variáveis independente e dependente com base nos valores da amostra.
A análise de regressão integra a inferência estatística pois os valores das vari-
áveis x e y precisam ser testados quanto a sua normalidade (distribuição nor-
mal), teste de significância e construção de intervalos de confiança.
124
ESTATÍSTICA APLICADA À EDUCAÇÃO
MULTIVIX EAD
Credenciada pela portaria MEC nº 767, de 22/06/2017, Publicada no D.O.U em 23/06/2017
Outro dado importante diz respeito ao cálculo do coeficiente de determina-
ção que verifica se os valores de x e y realmente ajustam os valores à reta, de
forma a garantir a menor variação e maior representatividade.
A regressão múltipla se aplica a mais de uma variável independente e depen-
dente. Possui cálculos complexos e as características semelhantes a regressão
simples quando o objetivo é testar e ajustar as variáveis ao modelo adequado.
CONCLUSÃO
Esta unidade concluiu os estudos da estatística aplicada oferecendo um pa-
norama sobre os principais conceitos da inferência estatística. A importân-
cia deste estudo reside no fato de que ele representa uma síntese das de-
mais unidades, uma vez que todos os conceitos foram revistos sob um olhar
mais prático da sua aplicação quando o estudo dos problemas e eventos é
aplicado à realidade.
125
MULTIVIX EAD
Credenciada pela portaria MEC nº 767, de 22/06/2017, Publicada no D.O.U em 23/06/2017
ESTATÍSTICA APLICADA À EDUCAÇÃO
ANOTAÇÕES
126
ESTATÍSTICA APLICADA À EDUCAÇÃO
MULTIVIX EAD
Credenciada pela portaria MEC nº 767, de 22/06/2017, Publicada no D.O.U em 23/06/2017
REFERÊNCIAS
BRASIL. Instituto de Pesquisa Econômica Aplicada. Financiamento Vinculado à Renda pode
ser uma alternativa para ensino superior. 12 jul. 2019. Disponível em: http://www.ipea.gov.br/
portal/index.php?option=com_content&view=article&id=34901&catid=9&Itemid=8. Acesso em: 4
dez. 2019.
BUSSAB, W. de O.; MORETTIN, P. A. Estatística básica. 9. ed. São Paulo: Saraiva, 2017.
CAMPOS, C. R.; WODEWOTZI, M. L. L.; JACOBINI, O. R.. Educação Estatística: teoria e prática em
ambientes de modelagem matemática. Belo horizonte: Autêntica, 2011.
CRESPO, A. A. Estatística fácil. 13. ed. São Paulo: Saraiva, 1995.
NOVAES, D. V. Estatística para educação profissional e tecnológica. 2. ed. São Paulo: Atlas,
2013.
NOVAES, D. V.; COUTINHO, C. de Q. e S. Estatística para educação profissional e tecnológica. 2.
ed. São Paulo: Atlas, 2013.
TUON, L. O que faz o Brasil ser um dos piores no ranking de competitividade digital. Exame, 26
set. 2019. Disponível em: https://exame.abril.com.br/economia/o-que-faz-o-brasil-ser-um-dos-
-piores-no-ranking-de-competitividade-digital/. Acesso em: 4 dez. 2019.
VIEIRA, S. Estatística básica. São Paulo: Cengage Learning, 2015.
http://www.ipea.gov.br/portal/index.php?option=com_content&view=article&id=34901&catid=9&Itemid=8.
http://www.ipea.gov.br/portal/index.php?option=com_content&view=article&id=34901&catid=9&Itemid=8.
https://exame.abril.com.br/economia/o-que-faz-o-brasil-ser-um-dos-piores-no-ranking-de-competitividade-digital/
https://exame.abril.com.br/economia/o-que-faz-o-brasil-ser-um-dos-piores-no-ranking-de-competitividade-digital/
127
MULTIVIX EAD
Credenciada pela portaria MEC nº 767, de 22/06/2017, Publicada no D.O.U em 23/06/2017
ESTATÍSTICA APLICADA À EDUCAÇÃO
ANOTAÇÕES
EAD.MULTIVIX.EDU.BR
CONHEÇA TAMBÉM NOSSOS CURSOS DE PÓS-GRADUAÇÃO A DISTÂNCIA NAS ÁREAS DE:
SAÚDE • EDUCAÇÃO • DIREITO • GESTÃO E NEGÓCIOS
Tabela 1 – Matriz de respostas: dupla entrada
Tabela 2 - Ranking de competitividade digital da escola de negócios suíça IMD
Tabela 3 - Impacto das restrições do Fies – Renda (salários mínimos) 2018
Tabela 4 - Tabela de contingência
Tabela 5 – Ramos e folhas
Tabela 6 - Distribuição de alunos do primeiro grau por faixa etária do Colégio A – maio 2017
Tabela 1 – Distribuição de frequências por faixa etária e renda
Tabela 2 – Distribuição de frequências por faixa etária e renda
Tabela 3 – Distribuiçãode frequências por faixa etária e renda
Tabela 4 – Distribuição de frequências por faixa etária e renda
Tabela 1 - Frequência de notas
Tabela 2 - Frequência de notas
Tabela 3 - Frequência de notas
Tabela 4 - Frequência de notas
Tabela 5 - Frequência de notas
Tabela 6 - Frequência de notas
Tabela 7 - Frequência de notas
Tabela 8 - Frequência de notas
Tabela 9 - Frequência de notas
Tabela 10 - Frequência de notas
Tabela 1 – Distribuição de alunos segundo o sexo e escolha do curso
Tabela 2 – Distribuição de alunos segundo o sexo e escolha do curso
Tabela 3 - Distribuição de variável aleatória X
Tabela 4 – Número de pontos no lançamento de um dado
Tabela 5 – Modelos para variáveis discretas
Quadro 1 – Principais características da Distribuição Normal
Quadro 1 – Resumo das estatísticas por distribuição de probabilidade amostral
Quadro 2 – Estimativas pontuais ou intervalares
Quadro 3 - Tabela escala de significância de Fisher
Figura 1 – Porcentagem
Gráfico 1 – Setores
Gráfico 2 - Colunas
Gráfico 3 - Barras
Gráfico 4 - Linhas
Gráfico 5 – Demonstrativos
Gráfico 1 – Distribuição de frequências por faixa etária
Gráfico 2 – Curva da distribuição de frequências por faixa etária
Gráfico 3 – Distribuição de frequências por faixa etária e renda
Gráfico 4 – Distribuição de frequências por faixa etária e renda
Gráfico 5 - Demonstrativo Distribuição de frequências por faixa etária e renda
Gráfico 1 – Distribuição de frequências por notas
Gráfico 2 – Distribuição de frequências por notas
Gráfico 3 – Distribuição de frequências por classes
Gráfico 4 – Distribuição de frequências por notas
Gráfico 5 – Distribuição de frequências por classes
Demonstrativo 1 – Distribuição de notas por classes e frequências
Demonstrativo 2 – Distribuição de notas por classes e frequências
Figura 1
Gráfico 1 – Distribuição Normal –médias e desvios
Gráfico 2 – Representação do exercício 1
Gráfico 1 – Distribuição Normal –Médias e Desvios
Apresentação da disciplina
1 ESTATÍSTICA – CONCEITO, FINALIDADE E SURGIMENTO
INTRODUÇÃO
1.1 EVOLUÇÃO DO PENSAMENTO ESTATÍSTICO
1.2 CONCEITOS E OBJETIVOS
1.3 ESTUDOS E APLICAÇÕES DO ENSINO DA ESTATÍSTICA
1.4 RAZÃO, PROPORÇÃO E PORCENTAGEM
1.5 SOMATÓRIO
2 DISTRIBUIÇÃO DE FREQUÊNCIAS E REPRESENTAÇÃO GRÁFICA
INTRODUÇÃO
2.1 PLANEJAMENTO, COLETA E APRESENTAÇÃO DE DADOS
2.2 VARIÁVEIS
2.3 ANÁLISE EXPLORATÓRIA DOS DADOS
2.4 RAMOS E FOLHAS
2.5 NÚMEROS ÍNDICES
2.6 SÉRIES E DISTRIBUIÇÕES DE FREQUÊNCIAS, ESPACIAIS, ESPECÍFICAS E TEMPORAIS
2.7 GRÁFICOS EM SETORES, LINHA, POLÍGONO, HISTOGRAMA E OUTROS DIAGRAMAS
3 MEDIDAS DE TENDÊNCIA CENTRAL, DE POSIÇÃO E SEPARATRIZES
INTRODUÇÃO
3.1 MÉDIA ARITMÉTICA, MÉDIA GEOMÉTRICA, MÉDIA HARMÔNICA E MÉDIA PONDERADA
3.2 QUARTIS, DECIS E PERCENTIS (QUANTIS) – MEDIDAS SEPARATRIZES.
3.3 REPRESENTAÇÕES GRÁFICAS
4 MEDIDAS DE DISPERSÃO OU VARIABILIDADE
INTRODUÇÃO
4.1 VARIÂNCIA ( )
4.2 DESVIO PADRÃO 
4.3 DESVIO MÉDIO (Dm.)
4.4 COEFICIENTE DE VARIAÇÃO (C.v.)
4.5 AMPLITUDE TOTAL
4.6 REPRESENTAÇÕES GRÁFICAS
5 PROBABILIDADE - DISTRIBUIÇÕES CONTÍNUAS - DISTRIBUIÇÕES
INTRODUÇÃO
5.1 INTRODUÇÃO À PROBABILIDADE
5.2 PROBABILIDADE CONDICIONAL E INDEPENDÊNCIA
5.3 INDEPENDÊNCIA DE EVENTOS
5.4 TEOREMA DE BAYES
5.5 DISTRIBUIÇÕES UNIFORME, BINOMIAL, HIPERGEOMÉTRICA E POISSON
5.6 DISTRIBUIÇÃO NORMAL E REPRESENTAÇÃO GRÁFICA DA ÁREA DA CURVA NORMAL
6 INFERÊNCIA ESTATÍSTICA
INTRODUÇÃO
6.1 POPULAÇÃO E AMOSTRA, DISTRIBUIÇÕES E TAMANHO DA AMOSTRA
6.2 ESTIMAÇÃO: PROPRIEDADES, ESTIMADORES, INTERVALOS DE CONFIANÇA E ERRO PADRÃO
6.3 TESTES DE HIPÓTESES: TESTE SOBRE A MÉDIA, PROPORÇÃO, VARIÂNCIA E VALOR “P”
6.4 INFERÊNCIA PARA DUAS POPULAÇÕES E INFERÊNCIA PARA VÁRIAS POPULAÇÕES
6.5 ANÁLISE DE ADERÊNCIA E ASSOCIAÇÃO
6.6 ANÁLISE DE REGRESSÃO E CORRELAÇÃO