Prévia do material em texto
INSTITUTO PEDAGÓGICO DE MINAS GERAIS Estatística Básica Coordenação Pedagógica – IPEMIG Belo Horizonte SUMÁRIO INTRODUÇÃO ...................................................................................... 03 1 O ENSINO DE ESTATÍSTICA E OS PCN .......................................... 04 1.1 ESTATÍSTICA: conceitos, fundamentos e epistemologia ................................... 05 1.2 A Estatística na escola ........................................................................................ 09 1.3 A Estatística na formação da cidadania .............................................................. 12 1.3.1 No Ensino Fundamental ................................................................................... 13 1.4 Os livros didáticos e a construção de conceitos .................................................. 15 2 O ENSINO DA ESTATÍSTICA NA EDUCAÇÃO BÁSICA: IMPORTÂNCIA, ENTRAVES E PERSPECTIVAS .............................. 24 2.1 A didáticas do ensino de estatística .................................................................... 29 2.1.1 Sequências didáticas desenvolvidas ................................................................ 34 3 PRINCÍPIOS DE ESTATÍSTICA ......................................................... 37 3.1 População e Amostra .......................................................................................... 38 3.1.1 Recenseamento ............................................................................................... 39 3.1.2 Estatística descritiva e estatística indutiva ....................................................... 39 3.1.3 Não probabilística ............................................................................................. 40 3.1.4 Probabilística .................................................................................................... 41 3.2 Dimensionamento da amostra ............................................................................. 42 3.3 Tipos de dados .................................................................................................... 43 3.3.1 Agrupamento dos dados .................................................................................. 44 3.3.2 Algumas funções do Excel para descrição dos dados ..................................... 46 3.4 Frequência acumulada ........................................................................................ 51 3.5 Distribuição de frequências com dados agrupados ............................................. 54 3.6 Dados, tabelas e gráficos .................................................................................... 58 3.6.1 Distribuições simétricas .................................................................................... 60 3.6.2 Distribuições Assimétricas ................................................................................ 60 3.6.3 Distribuições com “caudas” longas ................................................................... 60 3.7 Medidas de tendência central .............................................................................. 60 3.8 Moda ................................................................................................................... 62 3.9 Mediana............................................................................................................... 62 3.10 Considerações a respeito de Média e Mediana ................................................ 62 3.11 Medidas de dispersão ....................................................................................... 63 3.11.1 Variância ........................................................................................................ 63 3.11.2 Desvio Padrão ................................................................................................ 64 3.11.3 Distribuição normal ......................................................................................... 65 REFERÊNCIAS UTILIZADAS E CONSULTADAS ............................... 67 ANEXOS ............................................................................................... 69 AVALIAÇÃO ......................................................................................... 92 3 INTRODUÇÃO Esta disciplina foi desenvolvida, objetivando analisar o ensino da estatística na educação básica. Para tanto, abordar-se-á a o ensino da estatística em consonância com os Parâmetros Curriculares Nacionais, dentro do que é proposto para o ensino da Matemática, principalmente, da Matemática Financeira e seus conceitos, juntamente com os elementos básicos que constituem a estatística e sua didática, além de analisar as operações elementares da mesma, objetivando contextualizá-la e analisá-la do ponto de vista da didática e da pedagogia. Por acreditarmos que a pesquisa é fundamental para o desenvolvimento de uma educação de qualidade, enumeramos e analisamos diversas publicações acadêmicas, sobre a temática do ensino e aprendizagem da Estatística, no âmbito do Brasil, bem como, relatamos trabalhos que tratam das dificuldades, demonstradas pelos alunos, nessa disciplina. Dando continuidade a nossa proposta, esboçada no título dessa disciplina: O Ensino da Estatística, buscamos analisá-la numa perspectiva dos Parâmetros Curriculares Nacionais, bem como, as abordagens que são feitas em alguns dos muitos livros didáticos utilizados nas escolas do país, culminando com algumas sugestões e sequências didáticas para o ensino da mesma. Por fim, achamos importante relacionar algumas fórmulas utilizadas na estatística, bem como um glossário contendo os termos referentes à mesma e, não obstante, algumas atividades são ofertadas para a prática da mesma. Por tudo isso, esperamos que você desenvolva seus conhecimentos, acerca do tema proposto e que faça, também, uma excelente leitura, obtendo o sucesso que almejas. Outras informações e aprofundamentos devem ser buscados através da leitura da bibliografia utilizada e relacionada ao final desta. Coordenação pedagógica do Instituto IPEMIG. IPEMIG - Instituto Pedagógico de Minas Gerais www.ipemig.com.br (31) 3484-4334 - (31) 8642-1801 "IPEMIG – Conhecimento que transforma" 4 1 O ENSINO DE ESTATÍSTICA E OS PCN A problemática da educação de qualidade no Brasil vem sendo discutida a todo o momento e, em diversos veículos de informação, visto que, os resultados obtidos, pelo país, em testes e avaliações, internas e externas, no que tange à Matemática, causam um grande impacto àqueles que se preocupam com o futuro do país e de seus cidadãos, bem como, nos levam a refletir sobre, o que de fato, provoca ou interfere nesses resultados. Dentre os fatores causadores desses péssimos resultados, um deles reside nos livros didáticos e na complexidade que os cerca, haja vista, o envolvimento de uma série de fatores que dificultam a sua solução, tais como: a formação de professores; as propostas curriculares (regionais) bastante distintas; as questões comerciais das editoras e, ainda, as avaliações do Ministério de Educação e Cultura (MEC). Em sendo, pensamos que um olhar cuidadoso sobre os livros didáticos recomendados para o ensino fundamental, auxilia na percepção da concepção de ensino de estatística que predomina em nossa escola básica. Assim, de acordo com os Parâmetros Curriculares Nacionais elaborados e publicados pela SEF/MEC, o tema estatística e probabilidade estão recomendados no bloco de conteúdo “Tratamento da Informação” do currículo de Matemática. Nesse bloco, além da probabilidade e da estatística inclui-se a combinatória, considerando que tais assuntos possibilitam, de acordo com os ParâmetrosCurriculares Nacionais, “o desenvolvimento de formas particulares de pensamento e raciocínio, envolvendo fenômenos aleatórios, interpretando amostras, fazendo inferências e comunicando resultados por meio da linguagem estatística”. (BRASIL,1998, p. 134). Além dessa visão de ensino apontada pelos Parâmetros Curriculares Nacionais, consideramos importante destacar os argumentos que têm sido evidenciados nas recentes pesquisas sobre o ensino da Estocástica na Escola Básica, como os destacados por Cardeñoso e Azcárate (2005), justificando a inclusão desse tema: IPEMIG - Instituto Pedagógico de Minas Gerais www.ipemig.com.br (31) 3484-4334 - (31) 8642-1801 "IPEMIG – Conhecimento que transforma" 5 Seu interesse para a resolução de problemas relacionados com o mundo real e com outras matérias do currículo. Sua influência na tomada de decisões das pessoas quando dispõem somente de dados afetados pela incerteza. Seu domínio facilita a análise crítica da informação recebida através, por exemplo, dos meios de comunicação. Sua compreensão proporciona uma filosofia do azar de grande repercussão para a compreensão do mundo atual (CARDEÑOSO e AZCÁRATE, 2005, p. 41). Assim, procuramos ao longo de nossa análise perceber as divergências de concepções de ensino de probabilidade e de estatística existentes entre a proposta nacional e os livros didáticos, buscando evidenciar questões mais preocupantes que levem os estudantes, desse nível de ensino, a adquirir conceitos errôneos a respeito desses temas ou mesmo não acrescentar ao seu desenvolvimento mais do que habilidades de cálculo. Antes, porém, vejamos os conceitos e fundamentos da Estatística. 1.1 Estatística: conceitos, fundamentos e epistemologia Estatística significa enumeração ou informação numérica habitualmente contida em tabelas ou gráficos. Quando se fala em Estatística pensa-se em censos, inventários, amostras ou médias. Em sentido restrito tudo isso se pode considerar uma Estatística. Num sentido mais amplo, Estatística é a ciência que se ocupa em recolher e dar um tratamento adequado às informações, tendo como objetivo analisar os dados recolhidos, descrevendo-os e organizando-os para posterior interpretação e eventual utilização na previsão de acontecimentos futuros. Epistemologicamente, a Estatística é um segmento da matemática aplicada surgida nas questões de estado e governo. Daí o nome, Estatística, originado do termo latino status. Situações ocasionais como número de habitantes, quantidade de óbitos e nascimentos, quantidades produzidas e quantitativos das riquezas, formaram os primórdios dos problemas que deram início ao pensamento estatístico. A palavra Estatística surge, pela primeira vez, no séc. XVIII. Alguns autores atribuem esta origem ao alemão Gottfried Achemmel (1719-1772), que teria utilizado IPEMIG - Instituto Pedagógico de Minas Gerais www.ipemig.com.br (31) 3484-4334 - (31) 8642-1801 "IPEMIG – Conhecimento que transforma" 6 pela primeira vez o termo statistik, do grego statizein; outros dizem ter origem na palavra estado, do latim status, pelo aproveitamento que dela tiravam os políticos e o Estado. A partir do século XVIII são vários os nomes que se destacaram na história da evolução da estatística, tais como Quételet (1796-1874), Galton (1822-1911), Karl Pearson (1857-1936), Weldon (1860-1906), Ronald Fisher (1890-1962). Na sua origem, a Estatística estava ligada ao Estado. Hoje, não só se mantém esta ligação, como todos os Estados e a sociedade em geral, dependem cada vez mais dela. Por isso, em todos os Estados existe um Departamento ou Instituto Nacional de Estatística. No Brasil Chama-se: Instituto Brasileiro de Geografia e Estatística (IBGE). Para tanto, a Estatística divide-se em dois ramos distintos: a Estatística Descritiva (vide anexo 01), responsável pelo estudo das características de uma dada população; e a Estatística Indutiva (vide anexo 2), que generaliza um conjunto de resultados, tendo por base uma amostra de uma dada população ou universo, enunciando a(s) consequente(s) lei(s). Inicialmente, no século XVI, pensada pelos ingleses como uma ciência política, destinava-se a descrever características de um país, tais como população, área, riquezas e recursos naturais. Deste papel histórico, origina-se a sua função de caracterização numérica de uma série de informações populacionais. Com esta abordagem, o termo é utilizado no plural, como as “estatísticas de saúde”, as “estatísticas de mortalidade”, as “estatísticas do registro civil”, entre outras. Assim, ao abrirmos uma revista ou um jornal é quase impossível não encontrarmos alguma representação Estatística/matemática complementar aos textos, ilustrando ou sintetizando a comunicação, tornando a leitura mais atrativa e objetiva. Em muitos casos, os modelos estatísticos/matemáticos assumem a importância maior, ficando o texto como complemento ou restrito a observações. Outrossim, a Estatística, vista enquanto ciência só ocorreu a partir do século XVIII, nos registros do alemão Godofredo Achenwall, ainda como catalogação não regular de dado. IPEMIG - Instituto Pedagógico de Minas Gerais www.ipemig.com.br (31) 3484-4334 - (31) 8642-1801 "IPEMIG – Conhecimento que transforma" 7 Mas, a sua evolução histórica é muito interessante, iniciando-se com as primeiras sociedades primitivas, a partir das necessidades que exigiam o conhecimento numérico dos recursos disponíveis. Por conta disso, os Estados, desde tempos remotos, precisaram conhecer determinadas características da população, efetuar a sua contagem e saber a sua composição ou os seus rendimentos. Para que os governantes das grandes civilizações antigas tivessem conhecimento dos bens que o Estado possuía e como estavam distribuídos pelos habitantes, realizaram-se as primeiras estatísticas, nomeadamente, para determinarem leis sobre impostos e números de homens disponíveis para combater. Estas estatísticas eram frequentemente limitadas à população adulta masculina. O primeiro dado disponível sobre um levantamento estatístico foi referido por Heródoto, que afirmava ter-se efetuado, em 3050 a.C., um estudo das riquezas da população do Egito com a finalidade de averiguar quais os recursos humanos e econômicos disponíveis para a construção das pirâmides. Há também notícia de que no ano 2238 a.C. realizou-se na China, um levantamento estatístico com fins industriais e comerciais ordenado pelo imperador chinês Yao. Existem indícios, que constam da Bíblia, relativos a recenseamentos feitos por Moisés (1490 a.C.). Outra estatística referida pelos investigadores foi feita no ano 1400 a.C., quando Ramsés II mandou realizar um levantamento das terras do Egito. Também os romanos faziam o recenseamento dos cidadãos e dos bens. Eram os censores, magistrados romanos, que asseguravam o censo dos cidadãos. Uma das convenções da História é ligar a datação (a.C. ou d.C.) ao recenseamento populacional ordenado pelo imperador César Augusto. As estatísticas realizadas por Pipino, em 758, e por Carlos Magno, em 762, sobre as terras que eram de propriedade da Igreja, são algumas das estatísticas importantes de que há referências desde a queda do império romano. Guilherme, “O Conquistador”, que reinou entre 1066 e 1087, ordenou que se fizesse um levantamento estatístico da Inglaterra. Este levantamento deveria incluir IPEMIG - Instituto Pedagógico de Minas Gerais www.ipemig.com.br (31) 3484-4334 - (31) 8642-1801 "IPEMIG – Conhecimento que transforma" 8 informações sobre terras, proprietários,uso da terra, animais... e serviria de base, também, para o cálculo de impostos. Para responder ao desenvolvimento social surgiram estas primeiras técnicas estatísticas: classificar, apresentar, interpretar os dados recolhidos foram para os censos e são para a Estatística um aspecto essencial do método utilizado. Mas, um longo caminho havia de ser percorrido até os dias de hoje. Até o início do séc. XVII, a Estatística limitou-se ao estudo dos “assuntos de Estado”. Usada pelas autoridades políticas na inventariação ou arrolamento dos recursos disponíveis, a Estatística limitava-se a uma simples técnica de contagem, traduzindo, numericamente, fatos ou fenômenos observados – fase da Estatística Descritiva. No séc. XVII, com os “aritméticos políticos”, nomeadamente John Graunt (1620-1674) e Sir William Petty (1623-1687), inicia-se em Inglaterra uma nova fase de desenvolvimento da Estatística, virada para a análise dos fenômenos observados – fase da Estatística Analítica. John Graunt, comerciante londrino, “pessoa engenhosa e estudiosa, tinha o hábito de se levantar cedo para estudar, antes da abertura da sua loja”, inspirado nas tábuas de mortalidade que, semanalmente, eram publicadas na sua paróquia, publicou, em 1660, um trabalho estatístico sobre a mortalidade dos habitantes de Londres, procurando dar interpretações sociais às listas de tempos de vida. Sir William Petty, baseado neste trabalho, escreveu um livro de enorme sucesso, divulgando a nova ciência da “Aritmética Política”. Em 1692, o astrônomo Edmund Halley (1658-1744), famoso pela descoberta do cometa de órbita elíptica que se aproxima da Terra de 75 em 75 anos, baseando- se também em listas de nascimento e falecimento, foi o precursor das atuais tabelas de mortalidade, base das anuidades dos seguros de vida. O desenvolvimento do Cálculo das Probabilidades surge também no século XVII. A ligação das probabilidades com os conhecimentos estatísticos veio dar uma nova dimensão à Estatística, que progressivamente se foi tornando um instrumento científico poderoso e indispensável. Considera-se assim uma nova fase, a terceira, em que se começa a fazer inferência estatística: quando a partir de observações se IPEMIG - Instituto Pedagógico de Minas Gerais www.ipemig.com.br (31) 3484-4334 - (31) 8642-1801 "IPEMIG – Conhecimento que transforma" 9 procurou deduzir relações causais, entre variáveis, realizando-se previsões a partir daquelas relações. Atualmente, a Estatística já não se limita apenas ao estudo da Demografia e da Economia. O seu campo de aplicação alargou-se à análise de dados em Biologia, Medicina, Física, Psicologia, Indústria, Comércio, Meteorologia, Educação, etc., e ainda a domínios aparentemente desligados, como estrutura de linguagem e estudo de formas literárias. Os modelos estatísticos, enquanto modelos matemáticos aplicados, reúnem características de precisão na linguagem, adequados ao ambiente de informações rápidas. A necessidade de expressar o grau de incerteza, na ocorrência dos experimentos e, de explicar o fato de duas experiências iguais poderem ter resultados diferentes, leva ao reconhecimento da racionalidade probabilística em eventos da natureza. A pesquisa em probabilidade no século XVIII culmina com o notável trabalho de Pierre-Simon de Laplace, “Theorie Analitique de Probabilités”. À luz da concepção do cientificismo, rapidamente amplia-se o domínio de abrangência do cálculo probabilístico. Este se torna indispensável para lidar com dados relativos a temas de interesse social e econômico, como administração das finanças públicas, saúde coletiva, conduta de eleições e seguro de vida. 1.2 A Estatística na Escola A inclusão da Estatística nos currículos da Educação Básica é uma realidade nas escolas e redes escolares preocupadas com um ensino de qualidade, tendo em vista as necessidades dos conhecimentos de Estatística em nosso cotidiano. Os principais livros didáticos de Matemática já destinam capítulos aos conteúdos de Estatística, num processo de adequação dessas obras às demandas por conhecimentos estatísticos. Nos Parâmetros Curriculares Nacionais (PCN), o ensino da Probabilidade e da Estatística, está inserido no contexto do bloco de conteúdos com nome de “Tratamento das Informações”, conforme já dito anteriormente, tendo como IPEMIG - Instituto Pedagógico de Minas Gerais www.ipemig.com.br (31) 3484-4334 - (31) 8642-1801 "IPEMIG – Conhecimento que transforma" 10 justificativa a demanda social e o frequente uso na sociedade contemporânea, pela necessidade de o indivíduo compreender as informações divulgadas, tomar decisões e fazer previsões que influenciam sua vida pessoal e em comunidade. Em sendo, podemos afirmar que os PCN ressaltam a questão da utilização da Estatística como possibilitadora do desenvolvimento de formas específicas de pensamento e raciocínio, envolvendo fenômenos aleatórios, interpretando amostras, fazendo inferências e comunicando resultados por meio da linguagem própria quantitativa. Atualmente, quase todos os meios de comunicação, como jornais, revistas, rádio, televisão e Internet lançam mão de modelos estatísticos como gráficos, diagramas, pictogramas, tabelas e pesquisas para integrar e enriquecer seus conjuntos de informações a serem divulgadas para a população. Grande parte desse público acaba não decifrando essa nova linguagem. E, sendo a Estatística, a ciência que permite, através de sua utilização, a descrição e interpretação de dados específicos das várias áreas de conhecimento, essa se constitui em uma poderosa ferramenta para a solução de problemas de fundamentação de decisões. É interessante fornecer aos alunos elementos que, uma vez possuídos, levam ao reconhecimento da importância de se dominar técnicas de análise de dados. Esses elementos começam com o conhecimento da linguagem estatística. Nesse sentido, vale destacar que a simbologia matemática foi, e ainda é, um fator de evolução das ideias matemáticas que se desenvolveram lentamente ao longo de séculos. Essa evolução tomou por base dois objetivos permanentes: 1. Tornar possível a comunicação matemática entre as pessoas, independentemente das nacionalidades e culturas; 2. Simplificar a expressão das ideias e pensamentos matemáticos. Assim, a matemática, como nenhuma outra ciência, conseguiu construir um conjunto universal de signos, moldando uma linguagem com códigos que atravessam idiomas e culturas. Dessa forma é possível, por exemplo, um matemático chinês escrever equações ou proposições que um matemático brasileiro entenderá com facilidade. Essa propriedade é utilizada pela Estatística e passa a ser IPEMIG - Instituto Pedagógico de Minas Gerais www.ipemig.com.br (31) 3484-4334 - (31) 8642-1801 "IPEMIG – Conhecimento que transforma" 11 apropriada largamente pela informática, permeando as comunicações no mundo cibernético. A evolução da matemática fez surgir aplicações específicas, com linguagens e símbolos próprios, como foi o caso da matemática financeira, com sua constante evolução, e também da Estatística. Com o avanço tecnológico, as exigências de sofisticadas competências para o mundo do trabalho e a facilidade oferecida pela informática, as pesquisas deixaram de acontecer apenas em ocasiões para se tornarem parte integrante e inseparável de nossas vidas em todos os instantes. A partir dos anos 40, a pesquisa Estatística se volta para solucionar problemas envolvendo variados aspectos da inferência, cada um tendo a sua aplicação a situações específicas. Os testes de hipótesespara médias, variâncias e proporções, a teoria dos testes uniformemente mais poderosos, o processo de inclusão (exclusão) de variáveis nos modelos de regressão são algumas das formas de inferência de uso consagrado. O mundo corporativo passou a adotar a linguagem Estatística em suas rotinas operacionais exigindo dos profissionais conhecimentos e competências numéricas para o correto entendimento e produção de relatórios, tabelas, gráficos, diagramas e fluxogramas. Na comunicação de massa, os programas de televisão com maior índice de audiência, além de serem totalmente direcionados a institutos de pesquisa, passaram a ter obrigatoriamente pesquisas interativas em suas pautas, na busca de uma permanente aproximação com o público. Contudo, diante desse ambiente saturado de informações, poucas pessoas questionam a forma como esses dados foram coletados, tratados e trabalhados até chegarem ao formato “acabado” em que são apresentados. Isto é, o público tem sido consumidor de resultados de pesquisas da forma como se apresentam, sem a devida interpretação crítica e um entendimento do que se está “consumindo”. Os meios de comunicação refletem também a facilidade que os modelos estatísticos oferecem para sintetização de informações. Por exemplo: uma medida de tendência central pode representar bem o perfil de uma população, ou um histograma pode melhor apresentar um universo de dados. Existe um ditado em IPEMIG - Instituto Pedagógico de Minas Gerais www.ipemig.com.br (31) 3484-4334 - (31) 8642-1801 "IPEMIG – Conhecimento que transforma" 12 matemática que diz: “Um gráfico bem construído equivale a mil palavras”. Essa nova linguagem passa a demandar das pessoas o entendimento e o domínio de novos códigos diferentes do “ler e escrever” tradicionais. É nessa perspectiva que o mundo moderno caminha, com tecnologias voláteis, otimizando espaços, tempo, recursos, e fazendo uso intenso dos argumentos estatísticos. Nesse contexto, a escola não pode ignorar essas novas linguagens tão presentes no mundo dos educandos. Os Parâmetros Curriculares Nacionais recomendam o trabalho com Estatística com a finalidade de que o estudante construa procedimentos para coletar, organizar, comunicar e interpretar dados, utilizando tabelas, gráficos e representações, e que seja capaz de descrever e interpretar sua realidade, usando conhecimentos matemáticos. É fundamental que as práticas e os conteúdos ministrados em aula estejam em sintonia com as novas exigências do mundo em que vivemos, para que a educação não seja algo distante da vida dos alunos, mas, ao contrário, seja parte integrante de suas experiências para uma existência melhor. 1.3 A Estatística na formação da cidadania Desmistificar as pesquisas, estimulando a capacidade de leitura e interpretação dos fatos, é função do trabalho escolar na busca da formação de um cidadão pleno. Assim, o ensino e o uso dos modelos estatísticos/matemáticos, em sala de aula, devem estar em consonância com as necessidades, os interesses e as experiências de vida dos alunos. As ininteligíveis fórmulas prontas e os modelos acabados, com poucos atrativos para os educandos, devem ceder lugar aos modelos construídos a partir de suas vivências, na busca de soluções dos problemas que fazem parte de suas relações na sociedade. Dessa maneira, o ensino de Estatística deve ser disseminado em toda a nossa estrutura escolar, em todos os níveis de ensino, buscando levar aos jovens uma compreensão mais completa de suas realidades. IPEMIG - Instituto Pedagógico de Minas Gerais www.ipemig.com.br (31) 3484-4334 - (31) 8642-1801 "IPEMIG – Conhecimento que transforma" 13 As comunicações corporativas e as publicações científicas/tecnológicas optam pela significativa objetividade que a utilidade desses modelos estatísticos e/ou matemáticos proporcionam para implementar as informações, compactando textos e condensando frases. Essa linguagem exata passa a demandar das pessoas o entendimento e o domínio dos novos códigos mais refinados, exigindo habilidades e competências quantitativas. Assim, o mundo do trabalho evolui, em sintonia com as necessidades das organizações empresariais. Antigamente, o cidadão completamente alfabetizado precisava apenas de saber ler e escrever. Hoje, a alfabetização plena passa pela leitura e escrita, adicionada às noções de informática e conhecimentos de Estatística. 1.3.1 No Ensino Fundamental Os Parâmetros Curriculares Nacionais recomendam o trabalho com Estatística com a finalidade de que o estudante construa procedimentos para coletar, organizar, comunicar e interpretar dados, utilizando tabelas, gráficos e representações, e que seja capaz de descrever e interpretar sua realidade, usando conhecimentos matemáticos. Em relação à Probabilidade, consideram que esta pode promover a compreensão de grande parte dos acontecimentos do cotidiano que são de natureza aleatória, possibilitando a identificação de resultados possíveis desses acontecimentos. Destacam o acaso e a incerteza que se manifestam intuitivamente, portanto cabendo à escola propor situações em que as crianças possam realizar experimentos e fazer observações dos eventos. Quanto à Combinatória, o objetivo é possibilitar ao aluno lidar com situações- problema que envolvam diferentes tipos de agrupamentos e possibilitem a compreensão do princípio multiplicativo da contagem. Com esses objetivos, os PCN elencam seus conteúdos, destacando-se: a leitura e interpretação de informações contidas em imagens; a coleta e organização de informações; a interpretação e elaboração de listas, tabelas simples, tabelas de dupla entrada e gráficos para comunicar a informação obtida; IPEMIG - Instituto Pedagógico de Minas Gerais www.ipemig.com.br (31) 3484-4334 - (31) 8642-1801 "IPEMIG – Conhecimento que transforma" 14 a produção de textos escritos a partir da interpretação de gráficos e tabelas; a construção de gráficos e tabelas com base em informações contidas em textos jornalísticos, científicos ou outros; a obtenção e interpretação de média aritmética; a exploração da ideia de probabilidade em situações-problema, identificando sucessos possíveis, sucessos certos e as situações de “sorte”; a utilização de informações dadas para avaliar probabilidades; a identificação das possíveis maneiras de combinar elementos de uma coleção e de contabilizá-las, usando estratégias pessoais. Os Parâmetros indicam que a coleta, a organização e descrição de dados são procedimentos utilizados com muita frequência na resolução de problemas e estimulam as crianças a fazer perguntas, estabelecer relações, construir justificativas e desenvolver o espírito de investigação. Sugerem que, nos dois primeiros ciclos, desenvolvam-se atividades relacionadas a assuntos de interesse dos estudantes, que se proponha observação de acontecimentos, que se promovam situações para se fazer previsões, que algumas noções de probabilidade sejam desenvolvidas. Ressaltam que se desenvolva o raciocínio estatístico e probabilístico através da exploração de situações de aprendizagem que levem o aluno a coletar, organizar e analisar informações, formular argumentos e fazer inferências convincentes, tendo por base a análise de dados organizados em representações matemáticas diversas. Enfatizam, dessa forma, a realização de investigações, a resolução de problemas, a criação de estratégias com argumentos e justificativas. Dessa forma, os Parâmetros Curriculares Nacionais justificam o ensino da probabilidade e da estatística acenandopara a necessidade do indivíduo compreender as informações veiculadas, tomar decisões e fazer previsões que influenciam sua vida pessoal e em comunidade. Porém, ao descreverem as noções de estatística, probabilidade e combinatória, não o fazem de forma integrada, podendo deixar ao professor a ideia de compartimentalização desses temas. Ressaltam a necessidade de calcular medidas estatísticas, sem preocupar-se em IPEMIG - Instituto Pedagógico de Minas Gerais www.ipemig.com.br (31) 3484-4334 - (31) 8642-1801 "IPEMIG – Conhecimento que transforma" 15 IPEMIG - Instituto Pedagógico de Minas Gerais www.ipemig.com.br (31) 3484-4334 - (31) 8642-1801 "IPEMIG – Conhecimento que transforma" enfatizar que o mais importante é saber o que cada medida significa e não simplesmente efetuar seus cálculos. Destacamos essas questões dado o fato de que as atividades propostas nos livros didáticos serem permeadas por uma concepção de ensino de estatística e probabilidade bastante compartimentalizada, como se os conceitos probabilísticos e estatísticos não se relacionassem. Essa forma de olhar o ensino desses temas se contrapõe ao trabalho que recomenda o ensino da probabilidade inseparável da estatística, ou seja, da Estocástica. A Estocástica possibilita a ruptura com uma visão linear de currículo por sua própria natureza interdisciplinar, pois ao explorarmos uma determinada situação- problema, envolvemos diferentes conceitos matemáticos e estabelecemos distintas relações, sem nos prendermos à limitação do conteúdo proposto para cada série (LOPES, 1998). Acreditamos que o trabalho com Estocástica deva ser baseado em processos de investigações e na resolução de problemas, subsidiando o estudante para que ele compreenda e lide bem com sua realidade (LOPES, 1998). De acordo com essa visão de ensino de probabilidade e estatística, realizamos a análise das atividades propostas. 1.4 Os Livros Didáticos e a Construção de Conceitos Ao analisarmos o conteúdo dos livros didáticos para o ensino fundamental, percebemos um descompasso entre os objetivos a serem alcançados pela inclusão do ensino da estatística e probabilidade, no ensino fundamental, e a forma como o mesmo se faz nos textos examinados. Em uma primeira análise notamos a presença de uma super-simplificação de conteúdo e o uso da estatística como fim em exercícios de matemática. A estatística não aparece como estratégia da solução de problemas de pesquisa, como deveria ser trabalhada em todos os níveis de ensino. Em vista disso, podemos afirmar que esses objetivos não serão alcançados, haja vista que, atingi-los passa por trabalhar situações-problema nas quais o conteúdo estatístico compareça como estratégia, na obtenção de respostas a 16 IPEMIG - Instituto Pedagógico de Minas Gerais www.ipemig.com.br (31) 3484-4334 - (31) 8642-1801 "IPEMIG – Conhecimento que transforma" perguntas de interesse dos alunos. O que observamos é que a concepção de estatística que permeia os livros da 1ª à 8ª séries ou do 1º ao 9º anos, é de um fazer empobrecido, por não inserir a construção dos conceitos estatísticos e probabilísticos na metodologia da resolução de problemas. No manual para o professor apresentado em algumas coleções, a estatística é apresentada como um meio para organizar e interpretar informações numéricas, tabelas e gráficos. Nas séries iniciais introduz-se algum fazer através das, inadequadamente chamadas, pesquisas estatísticas, como se a estatística fornecesse o problema substantivo de pesquisa, no qual ela apenas oferece estratégia de solução. Confunde-se aí o problema com sua solução. Em vista disso, a tal pesquisa, então, especializa-se em geral em pesquisa de opinião, e as perguntas limitam-se, nas categorias observadas. Há uma preocupação em nomear apenas o mais frequente, deixando-se de considerar a informação coletada, como a 2ª ou 3ª preferência ou mesmo, o menos preferido. O que nos chama a atenção, é que nesse ciclo existe a proposta de trabalhar os números ordinais e que, não há, nesse sentido, o aproveitamento para integrar a aquisição desses conhecimentos. Em relação às medidas estatísticas, o mais frequente não recebe o nome de moda ou categoria modal, anunciando uma regularidade em evitar-se toda fidelidade à linguagem própria deste domínio do conhecimento e, que será encontrada independentemente do conteúdo, da matéria ou situação a que se aplicam. Embora isso se justifique nas séries iniciais, do ensino fundamental, pensamos que nas séries finais não haveria inconvenientes. Ledo engano nosso, posto que, nas séries finais, usando a estatística como um fazer que enseje a utilização de conteúdos matemáticos, encontramos menção às possibilidades em abordagens lúdicas, sem nenhuma outra função que não seja a sua listagem por si mesma. É preciso perceber que, ao listar possibilidades, estamos apenas trabalhando conceitos matemáticos. Se avaliássemos essas possibilidades através de experimentos, aí sim, estaríamos atribuindo um valor estatístico a essas atividades uma vez que a construção das possibilidades deveria estar motivada por uma necessidade de avaliação de chance. 17 IPEMIG - Instituto Pedagógico de Minas Gerais www.ipemig.com.br (31) 3484-4334 - (31) 8642-1801 "IPEMIG – Conhecimento que transforma" Ao longo da aprendizagem com números, deveria ser trabalhado a organização dos dados através do ramo-e-folhas, que é uma representação gráfica fácil, simples, elegante e que requer menos conhecimentos anteriores. Esse tipo de representação permite a ordenação de um conjunto de dados com maior facilidade, assim como a introdução de moda e mediana. Veja os exemplos: Temos 35 ursos, fêmeas, observados, porém, somente 20 puderam ter sua idade estimada. Para visualizar a distribuição dos valores de idade dessas fêmeas, usaremos um diagrama de ramo-e-folhas, já que um histograma resumiria mais ainda algo que já está resumido. Os 20 valores de idade (em meses) disponíveis, já ordenados são: 8 9 11 17 17 19 20 44 45 53 57 57 57 58 70 81 82 83 100 104 Podemos organizar os dados, separando-os pelas dezenas, uma em cada linha: 8 9 11 17 17 19 20 44 45 53 57 57 57 58 70 81 82 83 100 104 Como muitos valores em cada linha têm as dezenas em comum, podemos colocar as dezenas em evidência, separando-as das unidades por um traço. Ao dispor os dados dessa maneira, estamos construindo um diagrama de ramo-e-folhas (Figura 1). O lado com as dezenas é chamado de ramo, no qual estão dependuradas as unidades, chamadas folhas. 18 IPEMIG - Instituto Pedagógico de Minas Gerais www.ipemig.com.br (31) 3484-4334 - (31) 8642-1801 "IPEMIG – Conhecimento que transforma" Figura 1: Ramo-e-folhas da idade (meses) dos ursos fêmeas. Os ramos e as folhas podem representar quaisquer unidades de grandeza (dezenas e unidades, centenas e dezenas, milhares e centenas, etc.). Para sabermos o que está sendo representado, um ramo-e-folhas deve ter sempre uma legenda, indicando o que significam os ramos e as folhas. Se a idade estivesse medida em dias, por exemplo, usando esse mesmo ramo-e-folhas, poderíamos estabelecer que o ramo representaria as centenas e as folhas, as dezenas. Assim, 0|8 seria igual a 80 dias e 10|4 seria igual a 1040 dias. Analisando o ramo-e-folhas para a idade dos ursos fêmeas, percebemos a existência de três grupos: fêmeas mais jovens (até 20 meses), fêmeas mais crescidas (de 44 a 58 meses) e um grupo mais velho (maisde 70 meses), com destaque para duas fêmeas bem mais velhas. O ramo-e-folhas, também, pode ser usado para comparar duas distribuições de valores, como mostra a Figura 2. Aproveitando o mesmo ramo do diagrama das fêmeas, podemos fazer o diagrama dos machos, utilizando o lado esquerdo. Observe que as folhas dos ursos machos são dependuradas de modo espelhado, assim como explica a legenda, que agora deve ser dupla. 19 IPEMIG - Instituto Pedagógico de Minas Gerais www.ipemig.com.br (31) 3484-4334 - (31) 8642-1801 "IPEMIG – Conhecimento que transforma" Figura 2: Ramo-e-folhas da idade (meses) dos ursos fêmeas. Observando a Figura 2, notamos que os ursos machos são, em geral, mais jovens do que os ursos fêmeas, embora possuam dois ursos bem idosos em comparação com os demais. Importante: No ramo-e-folhas, estamos trabalhando, implicitamente, com frequências absolutas. Assim, ao comparar dois grupos de tamanhos diferentes, devemos levar isso em conta. Caso os tamanhos dos grupos sejam muito diferentes, não se deve adotar o ramo-e-folhas como gráfico para comparação de distribuições. Dessa forma, o trabalho com o ramo-e-folhas deveria preceder o uso dos histogramas, reproduzindo à semelhança com o diagrama de pontos e, portanto, precedendo às distribuições de frequências e respectivas representações gráficas. A questão acima é elucidada pela nossa preocupação com o erro mais frequente, encontrado nos livros didáticos do ensino fundamental, que é a representação gráfica por barras não adjacentes no tratamento das variáveis contínuas. Outra questão é por que não chamarmos os acontecimentos, de eventos elementares, que seria o termo mais adequado para referir-se a cada uma das 20 IPEMIG - Instituto Pedagógico de Minas Gerais www.ipemig.com.br (31) 3484-4334 - (31) 8642-1801 "IPEMIG – Conhecimento que transforma" possibilidades, ou mesmo de evento, quando nos referirmos a qualquer subconjunto do espaço amostral. Por exemplo, ao perguntar “como se mede a chance de um acontecimento ocorrer?”, na linguagem estocástica, a pergunta estaria melhor formulada “como obter a probabilidade de um evento ocorrer?”. O uso de porcentagem e estimativa ocorre a partir das séries finais e percebem-se atividades que podem possibilitar a aquisição de concepções equivocadas e difíceis de serem alteradas, posteriormente, como temos observado em nossa experiência no terceiro grau. A estimativa é encontrada como aproximação de magnitudes a serem lidas em representações gráficas e falta da precisão numérica. Como exemplo, podemos verificar que ao apresentar um gráfico de barras, representando a população de diferentes municípios e solicitar a leitura da população de um deles através desse gráfico, chamou-se esse resultado de estimativa. No sentido matemático isso está correto, porém, no sentido estatístico, estimativa é o valor de um estimador calculado a partir de uma amostra. Trabalhar esse conceito demanda no mínimo uma problematização que recaia sobre algum estimador e, então, que se observe sua variação na experimentação da retirada de várias amostras. Outro conceito que gostaríamos de destacar é a porcentagem, por ser uma ferramenta matemática necessária à construção do conceito de probabilidade e às experiências probabilísticas. Em nossa análise observamos que o trabalho com porcentagem não apareceu em nenhum momento vinculado ao raciocínio estatístico. Por exemplo, se fizermos uma proposta de “lançamentos de uma moeda” onze vezes e ocorrer “Cara”, 4 vezes; e, “Coroa”, 7 vezes, é provável que ao transformarmos esses resultados em porcentagem e compararmos com a definição clássica de probabilidade, o estudante tenha uma percepção equivocada de que a probabilidade observada na experimentação é suficiente para concluir que os eventos não são equiprováveis. Trabalhar esse conceito com os estudantes não seria uma tarefa tão difícil se deixarmos que os alunos experimentem e convivam com a variabilidade. Consideremos que se tivermos em 100 bolas, 50 pretas e 50 brancas, e perguntarmos ao aluno, em uma amostra de 10 bolas, quantas se teria de cada cor, 21 IPEMIG - Instituto Pedagógico de Minas Gerais www.ipemig.com.br (31) 3484-4334 - (31) 8642-1801 "IPEMIG – Conhecimento que transforma" muito provavelmente, no contexto de aprendizagem de porcentagem, ele responderá que em 10 bolas amostradas ocorreriam 5 de cada cor. Esse é um conceito que urge ser trabalhado, para que seja aplicado, corretamente, na resolução de problemas estatísticos. É necessário percebermos que o significado estatístico, muitas vezes, difere do significado matemático, ou seja, a mesma razão observada entre número de ocorrência de um evento e o número total de experimentos tem significado estatístico distinto dependendo da magnitude desse número total. Por exemplo, ao observarmos o lançamento de uma moeda 10 vezes, 100 vezes ou 1000 vezes, em cada caso, a ocorrência de metade de caras tem significado distinto. Em 1000 vezes, a indicação de que a moeda não é viciada é maior do que em 10 vezes. Isso desenvolve o espírito crítico da grandeza dos denominadores que pode ser desenvolvida desde o início do ensino fundamental, contribuindo para diferenciar determinismo de aleatoriedade. No final das series finais, continua a ênfase em porcentagem como domínio exclusivo do cálculo e também representações gráficas. Estas, apesar de paralelas ao ensino das grandezas e medidas, incluindo o trabalho com áreas, têm pouca ligação com as representações gráficas. Os diagramas de barras, setoriais, e histogramas são ricos para explorar as relações com áreas. Observa-se mais uma vez a não integração entre os conceitos estatísticos e matemáticos. Nesse sentido, também poderíamos considerar o trabalho de geometria envolvendo o estudo da simetria interligado a algumas das representações estatísticas. Ainda nesse momento, encontramos a média quase como para checar habilidades de soma, divisão, ou resolução de equações. Quando apresentada a partir de tabelas de frequências, a média aparece, inadequadamente, chamada de ponderada. Se feita a partir dos dados em rol bruto é média, se feita a partir dos dados agrupados então é ponderada. Esse é outro problema comum de erro conceitual, pois a simples aplicação da propriedade associativa da adição não muda o peso de cada valor correspondente a cada indivíduo. No caso da média aritmética, cada indivíduo ou cada valor tem o mesmo peso, enquanto que em média ponderada, esses pesos devem diferir e ser conhecidos a priori. 22 Talvez a média chame mais a atenção do que a moda e a mediana devido ao paradigma da distribuição gaussiana e de todos os enganos e mal entendidos do teorema central do limite que parece magicamente transformar tudo em normal, o sonho de todo pesquisador para seus dados. Assim, o ensino conjunto da média, mediana e moda, bem como explorar suas posições relativas no ensino de formas gráficas deve ser utilizado sob pena de repetirmos o erro de tratar tudo sob a perspectiva de distribuições de erros... Chamou-nos a atenção que, ao introduzir o conceito de chance, a linguagem estocástica mais uma vez esteve ausente por não se utilizar a palavra probabilidade. O conceito de probabilidade vem em sua definição clássica, favoráveis sobre possíveis, sem menção às restrições de equiprobabilidade, e conjunto finito dos possíveis. A probabilidade de que um aluno tenha peso entre 50kg e 55kg não pode ser calculada, pois o conjunto dos pesos possíveis é infinito e não enumerável. Assim comoa probabilidade de cada uma das faces de uma ficha telefônica seria obtida como ½ pela aplicação do conceito clássico. A assimetria da ficha não cumpre a restrição de equiprobabilidade. A definição frequentista, número de ocorrências do evento sobre número total de repetições, deveria ser dada, pois possibilitaria remover as duas restrições. Os eventos não precisam ser equiprováveis e o espaço amostral não precisa ser finito. Gostaríamos de ressaltar que não se sugere a definição axiomática, mas muita experimentação e observação, evidenciando-se as ideias probabilísticas. Dessa forma, os conceitos terão mais significados, e poderemos trabalhar os eventos: possível, impossível, provável, muito provável, pouco provável e certo. Os conceitos básicos de amostra probabilística e não probabilística, não são abordados. Deveriam ser trabalhados, através de vivência, os conceitos de amostra aleatória simples, no qual cada possível amostra de um determinado tamanho tem a mesma chance de ser selecionada. Nota-se que alguns autores utilizam-se de adjetivação para amostra como “representativas” e “reprodução da população”, sem utilizar o termo amostra probabilística, o que deveria ser evitado ou atribuído a essas qualidades uma chance. IPEMIG - Instituto Pedagógico de Minas Gerais www.ipemig.com.br (31) 3484-4334 - (31) 8642-1801 "IPEMIG – Conhecimento que transforma" 23 A experiência com amostragem pode ser feita em população finita, por exemplo, os alunos da classe e retiradas de amostras casuais simples, sua organização, representação e análise. Neste processo, pode-se inserir operacionalizações que gerem vícios por intencionalidade ou casualidade em sub- populações. Nesse contexto, a noção de estimativa ganha sentido, pois ao trabalhar amostragem, o objeto de estudo é a variação de estimativas. Durante o processo de análise dessas atividades propostas por alguns livros didáticos recomendados pelo MEC, para o ensino fundamental, destacamos a urgência de se pensar cuidadosamente o ensino da estocástica em nossa escola básica, tanto no que se refere à formação dos professores quanto à elaboração dos livros didáticos. Necessitamos de que o cenário da pesquisa em ensino da estocástica, no Brasil, seja ampliado rapidamente para que possamos alcançar os objetivos ressaltados pela proposta curricular brasileira e, assim, possamos formar, de fato, cidadãos mais aptos a tomadas de decisão, especialmente em situações envolvendo a presença do acaso. Consideramos que não basta verificar as análises de avaliações realizadas, seja nos cursos ou nos livros didáticos, pensamos que seja necessário o incentivo e apoio à pesquisas que alterem o atual estado da arte desta área do conhecimento. Nos anexos 3 e 4, relacionamos diversos conceitos acerca da estatística, através de um glossário, bem como, relacionamos as fórmulas utilizadas. IPEMIG - Instituto Pedagógico de Minas Gerais www.ipemig.com.br (31) 3484-4334 - (31) 8642-1801 "IPEMIG – Conhecimento que transforma" 24 2 O ENSINO DA ESTATÍSTICA NA EDUCAÇÃO BÁSICA: importância, entraves e perspectivas No Brasil, apesar da Estatística e as Probabilidades fazerem parte do currículo de Matemática do Ensino Médio antes dos anos 80, raramente eram ensinados. Segundo Ponte, Matos e Abrantes (1998) só depois dos anos 90 é que os alunos têm tido a oportunidade de aprender estes tópicos e, talvez por isso no que “se refere à Estatística e às Probabilidades, e conhecimentos, capacidades, dificuldades e estratégias de raciocínio dos alunos está essencialmente por fazer” (p. 171). Para Abrantes, Serrazina e Oliveira (1999), as competências que os alunos devem desenvolver incluem a organização e representação de dados, a aptidão para ler e interpretar tabelas e gráficos comunicando os resultados, sensibilidade para distinguir fenômenos aleatórios e deterministas e interpretar situações concretas onde estes fenômenos estejam presentes. Na literatura, é sugerido que as tarefas criadas traduzam contextos próximos dos interesses dos alunos, mas que, simultaneamente, lhes permitam desenvolver competências que os tomem cidadãos mais críticos e participativos na sociedade do próximo milênio, o que também é realçado por autores de outros países (PEREIRA MENDONZA E SWIFT, 1989). E ainda sugerido que se evite o receituário, a computação excessiva e a não utilização das novas tecnologias, como os computadores e, mais recentemente, a Internet (BATANERO, 1998). Esta última apresenta-se como uma fonte preciosa de possibilidades a explorar nas aulas de Estatística, sendo vários os sites com sugestões para a sala de aula (NG E WONG, 1999). Portanto, é necessário analisar os desempenhos estatísticos dos alunos nos conceitos de média e mediana, identificando os conhecimentos instrumentais e os conhecimentos relacionais que utilizam nas suas respostas. Para isso, é necessário compreendermos como os alunos constroem o significado desses conceitos, discutindo a influência dos fatores que podem, ou não, facilitar a atribuição desse mesmo significado. Apesar das diversas recomendações que têm sido feitas por investigadores e que aparecem referidas nos documentos de política educativa, a literatura mostra IPEMIG - Instituto Pedagógico de Minas Gerais www.ipemig.com.br (31) 3484-4334 - (31) 8642-1801 "IPEMIG – Conhecimento que transforma" 25 que, mesmo nos anos de escolaridade básica, a maioria dos alunos não aprende Estatística de acordo com essas sugestões (SHAUGHNESSY, 1992). Verifica-se, ainda, que muitos alunos revelam dificuldades na compreensão do significado matemático dos conceitos estatísticos trabalhados durante este período (BATANERO ET AL., 1994; CARVALHO, 1996, 1998; HAWKINS, JOLLIFFE E GLICKMAN, 1991). Uma outra limitação relacionada com o ensino da Estatística deve-se ao fato de a maioria dos professores que trabalham com as series iniciais são professores de Matemática com pouca ou nenhuma formação em Estatística, e menos ainda em Didática da Estatística, podendo por isso sentir uma responsabilidade acrescida quando as orientações para o ensino deste tópico são no sentido das simulações, do trabalho de projeto, da discussão das várias estratégias de resolução utilizadas, do trabalho em grupo e do recurso às novas tecnologias (SHAUGHNESSY E BERGMAN, 1993). Skemp (1979) considera que se possui um conhecimento instrumental de um conceito quando se domina uma coleção isolada de regras e algoritmos aprendidos através da repetição e da rotina, que permite resolver um conjunto limitado de situações, por oposição a um conhecimento relacional, onde o aluno construiu um esquema do conceito que pode ir atualizando sempre que novas situações assim lho exijam. As sugestões acima referidas apontam para que os objetivos a serem atingidos com o estudo da Estatística devam proporcionar aos alunos um conhecimento relacional e não, apenas, um conhecimento instrumental dos conceitos. Este fato não é, contudo, um problema que apenas diz respeito à Estatística, uma vez que Sfard e Linchevski (1994a) afirmam que “professores e investigadores queixam-se frequentemente de que a compreensão que os alunos têm da álgebra é meramente instrumental: as crianças são capazes de “avançar nos passos necessários”, mas não são capazes de explicar aquilo que estão afazer” (p. 257). Uma distinção mais subtil é introduzida por Sfard (1991) e Sfard e Linchevski (1994a) quando diferenciam a noção de processo computacional e de objeto abstrato, afirmando que“o que é concebido como processo num determinado nível IPEMIG - Instituto Pedagógico de Minas Gerais www.ipemig.com.br (31) 3484-4334 - (31) 8642-1801 "IPEMIG – Conhecimento que transforma" 26 toma-se objeto num nível mais elevado” (p. 194), o que equivale considerar que as competências computacionais precedem às formalizações mais elaboradas. Assim, para estas autoras, “as mesmas representações, os mesmos conceitos matemáticos, podem às vezes ser interpretados como processos e outras como objetos; ou, para usar a linguagem introduzida num outro artigo (Sfard, 1991), podem ser concebidos operacionalmente ou estruturalmente” (p. 193), sendo a concepção operacional associada à realização de procedimentos computacionais e a estrutural à atribuição de significado aos símbolos. Deste modo, a atribuição de significado, por parte do sujeito, influencia fortemente o modo de abordagem que ele tem em relação a uma tarefa proposta na sala de aula. Esta atribuição de significado não é independente do contrato didático estabelecido entre o professor e os alunos, uma vez que é este que legitima as expectativas mútuas de cada um dos atores da relação didática (CÉSAR, 1998; 2000; CÉSAR ET AL., 1999; 2000). Uma distinção de inspiração vygotskiana é feita por Douady (1985) quando afirma que um conceito matemático pode ser encarado como uma ferramenta, “quando o nosso interesse se foca na sua utilização para resolver problemas” (p. 35) ou como um objeto, quando o encaramos como “um objeto cultural que faz parte de um corpo científico de conhecimentos”, o que implica também o ser socialmente reconhecido (p. 35). Neste caso, considera-se um objeto qualquer definição matemática, bem como os exemplos, contra-exemplos e descrições estruturais. Se pensarmos em termos de sala de aula, um conceito é uma ferramenta se permite ao aluno resolver problemas. Mas, Douady (1985) sublinha que estas ferramentas podem ser implícitas ou explícitas, ou seja, são explícitas apenas se o aluno consegue justificar os procedimentos que usou. Assim, o objetivo educacional a atingir seria que os alunos conseguissem fazer apelo a ferramentas explícitas, pois são estas que podem favorecer a compreensão dos conceitos, permitindo-lhes passar do nível computacional para a utilização dessas mesmas ferramentas em determinadas situações que exigem uma utilização mais flexível (SFARD E LINCHEVSKI, 1994b). O modo como os alunos trabalham na sala de aula com a Estatística, com os colegas e o professor, as tarefas e as instruções de trabalho influenciam o que aprendem, como o aprendem e os seus desempenhos. IPEMIG - Instituto Pedagógico de Minas Gerais www.ipemig.com.br (31) 3484-4334 - (31) 8642-1801 "IPEMIG – Conhecimento que transforma" 27 Quando se aceita que as interações sociais que se estabelecem na sala de aula têm um papel determinante nas aprendizagens que os alunos fazem, admite-se também que esta aprendizagem é ativa e influenciada pelas propostas de trabalho que ali acontecem, valorizando-se as oportunidades dadas aos sujeitos para comunicarem os seus conhecimentos e as suas estratégias de resolução. Assim, quando as crianças têm a oportunidade de se confrontarem com tarefas e em situações de sala de aula onde são encorajadas a trabalhar de forma não rotineira, encontra-se uma grande riqueza de estratégias de resolução o que, na opinião de Yackel et al. (1990), mostra que cada criança tem “de construir o seu próprio significado matemático”. Ou seja, este conhecimento não pode ser dado à criança, pois é ela quem tem de apreendê-lo, dar-lhe um sentido próprio, uma vez que ele já é partilhado por outros sujeitos de uma mesma cultura. Porém, como qualquer professor sabe, uma tarefa não é igualmente problemática para todos os alunos, no sentido de desencadear uma variedade rica de conflitos sociocognitivos. Cada um tem conhecimentos, experiências vivenciais, sentimentos e expectativas diferentes quando é confrontado com uma mesma tarefa. Este fato pode ser, de acordo com Yackel et al. (1990), uma limitação, pois o professor não pode garantir, à partida, que todas as crianças se envolvam na tarefa da mesma maneira. Porém, pode ser também uma vantagem, já que pode ser interpretado como uma forma de valorizar a diversidade, de acordo com os objetivos da escola inclusiva e da “Matemática para Todos”. Para estes autores, as diferenças que cada criança traz para a sala de aula quanto aos conhecimentos e competências que possui permitem gerar diferentes soluções e interpretações de uma mesma tarefa, o que pode ser visto, pelo professor, como algo positivo e enriquecedor, ao contrário do que é tradicional fazer na sala de aula e que aparece descrito por diversos autores que estudaram os desempenhos matemáticos de alunos em diferentes contextos (CARRAHER, CARRAHER E SCHLIEMANN, 1989; SAXE, 1989). É neste sentido que qualquer aluno, quando tenta resolver uma tarefa, tem de lhe atribuir um significado em função dos seus conhecimentos e, só depois, é que está pronto para o fazer. “Na verdade o aluno dá significado às coisas a partir daquilo que sabe, de toda a sua experiência anterior, e não necessariamente a partir IPEMIG - Instituto Pedagógico de Minas Gerais www.ipemig.com.br (31) 3484-4334 - (31) 8642-1801 "IPEMIG – Conhecimento que transforma" 28 da lógica interna dos conteúdos ou do sentido que o professor atribui às mesmas coisas” (ABRANTES, SERRAZINA E OLIVEIRA, 1999, p. 24). Quando um aluno atribui significado a uma tarefa não nos podemos esquecer se ela tem ou não marcação social (Doise e Mugny, 1981; Mugny e Doise, 1983), ou seja, se o quotidiano em que o aluno vive lhe permite interpretá-la mais facilmente, sendo capaz de lhe atribuir um significado, pelo que consegue resolvê-la. Assim, o grau de dificuldade de uma tarefa não pode ser determinado apenas pelo nível operatório a que faz apelo, tem de ser sempre visto de uma forma contextualizada. Yackel et al. (1990) sublinham que o professor não deve dar aos alunos tarefas fechadas, como os tradicionais exercícios, mas antes atividades abertas, onde seja possível o trabalho em díade ou em pequenos grupos, levando os dois alunos cooperarem na co-construção de estratégias de resolução. No caso da Estatística, têm sido vários os documentos e os autores a manifestarem que “estes conteúdos devem ser trabalhados em pequenos grupos e em projetos” (Godino, Batanero, Cañizares, 1996, p. 54), o que realça a necessidade de os alunos conseguirem encontrar uma intersubjetividade comum (Wertsch, 1991), pois sem ela o diálogo entre os pares não seria possível. Um dos objetivos da Educação Estatística é possibilitar aos alunos que desenvolvam competências que lhes permitam descrever, julgar e inferir opiniões acerca de dados, argumentando e interpretando-os usando para isso as várias ferramentas estatísticas de forma a compreender que, em Estatística, o contexto motiva os procedimentos, é fonte de significado e a base para interpretar as soluções, sendo estas dificilmente certas ou erradas, pois os números têm de ser analisados como números num contexto determinado, só assim adquirindo significado (MOORE, 1990, citado por GAL E GARFIELD, 1997). A atribuição de significado é um passo essencial para a resolução de uma tarefa matemática e para que haja apropriação de conhecimento. Como salientou Vygotsky (1962, 1978), os alunos necessitam de descontextualizar e recontextualizar o saber para que este passe de exterior e social para interior e pessoal. Assim, facilitar a atribuição de significado às tarefas é fundamentalpara se conseguir promover o sucesso escolar, pelo que se deve ter em atenção a natureza IPEMIG - Instituto Pedagógico de Minas Gerais www.ipemig.com.br (31) 3484-4334 - (31) 8642-1801 "IPEMIG – Conhecimento que transforma" 29 das tarefas que propomos aos alunos. Para além disso, as interações sociais, nomeadamente as interações entre pares, jogam um papel muito relevante na facilitação da atribuição de significados, pelo que a implementação de um contrato didático inovador é também um elemento essencial a tomar em consideração. Para promovermos o sucesso escolar em Matemática, nomeadamente no que se refere aos conteúdos de Estatística, é necessário facilitarmos a possibilidade de os alunos passarem de um conhecimento instrumental para um conhecimento relacional, ou seja, ultrapassar o nível computacional e ser capaz de mobilizar os conceitos para os utilizar na resolução de situações da vida real. Como diz Douady (1985), a atuação dos professores, na sala de aula, deve estimular os alunos a utilizarem ferramentas explícitas em vez das implícitas, permitindo-lhes chegar a níveis de conceituação mais elaborados, atingindo os objetos científicos que integram o corpo de conhecimentos científicos que pretendemos que os alunos apreendam. Mas, para que tudo o que foi exposto seja uma realidade e não apenas uma intenção, é necessário aprendermos a observar e analisar detalhadamente as estratégias de resolução e os raciocínios dos alunos, para podermos situar-nos, enquanto investigadores e professores, para além do nível das aparências que iludem. 2.1 A Didáticas do Ensino de Estatística Aprender implica em assimilar um objeto a esquemas mentais baseados em ensaio de erro, na pesquisa, investigação, solução de problemas e não em fórmulas e definições. A aprendizagem verdadeira se dá no exercício operacional da inteligência. Além disso, os alunos devem aprender a distinguir a observação feita no domínio da realidade e a representação da mesma (domínio teórico). Como a criança ainda não possui o conhecimento destas representações teóricas, é válido que se use sequências didáticas para ensiná-las. Todos os dias recebemos um volume muito grande de informações dos mais variados meios e tipos de comunicações, com enorme rapidez e facilidade de IPEMIG - Instituto Pedagógico de Minas Gerais www.ipemig.com.br (31) 3484-4334 - (31) 8642-1801 "IPEMIG – Conhecimento que transforma" 30 acesso a elas, há a necessidade dos indivíduos terem um espaço, que lhes permita selecionar, qualificar, analisar e contextualizar tais informações. Neste aspecto, os Parâmetros Curriculares Nacionais (BRASIL, 1997, p. 27), orientam no sentido de que: a compreensão e a tomada de decisões diante de questões políticas e sociais dependem da leitura crítica e interpretação de informações complexas, muitas vezes contraditórias, que incluem dados estatísticos e índices divulgados pelos meios de comunicação. Ou seja, para exercer a cidadania é necessário saber calcular, medir, raciocinar, argumentar e tratar informações estatisticamente. Saber matemática é indispensável em qualquer área do conhecimento. Aprendê-la bem transforma pessoas em profissionais confiantes e criativos. “O bom treinamento em matemática é efetuado com ênfase no argumento lógico, oposto ao autoritário (...)” (DRUCK, 2003, p. 02). A utilização de instrumentos de medida para avaliar e acompanhar o conhecimento adquirido pelos alunos cada vez mais se torna necessária e este fato tem motivado pesquisadores da Educação Estatística a buscarem ferramentas mais sofisticadas para serem utilizadas nos processos quantitativos de análise dessas avaliações. Este tipo de avaliação “ganhou força nos anos noventa, apoiada em estudos sobre desenvolvimento industrial, tecnologia e educação (...)” (Duran, 2003) e ainda é um desafio afirmar qual maneira é a mais correta de se avaliar, pois, segundo essa autora, “mais do que o direito social do acesso à escola, o desafio era o de fazer a qualidade do cidadão, a qualidade do trabalhador, a qualidade do familiar, a qualidade do indivíduo.” A mídia impressa, em especial, utiliza, muitas vezes, gráficos para noticiar os mais variados assuntos, usando-os como ferramenta para defender seus argumentos jornalísticos, com isso, é possível entender a afirmação presente nos PCN (Brasil, 1997) que afirma que “só está alfabetizado quem sabe ler e interpretar dados numéricos dispostos de forma organizada”. Com a inclusão de tópicos relacionados à Estatística nos PCN (Brasil, 1997), evidencia-se a importância que tal ciência vem recebendo nos últimos anos por parte dos educadores. Este fato, por sua vez, nos leva a refletir que muitos dos educadores hoje em exercício, não tiveram uma base sobre o assunto em sua graduação e com isso, surge a necessidade de pesquisas na área, que contemplem IPEMIG - Instituto Pedagógico de Minas Gerais www.ipemig.com.br (31) 3484-4334 - (31) 8642-1801 "IPEMIG – Conhecimento que transforma" 31 não só a formação dos alunos mas, também, forneçam fundamentos metodológicos para o professor. Inserido no currículo de Matemática, temos o ensino da Probabilidade e da Estatística complementando o cenário de formação global do aluno de Educação Básica. Carvalho (2003, p. 35-36) enfatiza que: cada vez mais se acentua a importância da Estatística, das Probabilidades e das suas aplicações no mundo onde a criança vive, assistindo – se simultaneamente a um ensino que procura o abandono da memorização de fórmulas e algoritmos para se focar nas conexões entre a Estatística e o mundo. Ter a possibilidade de resolver problemas que lhe estão próximos leva o aluno a ser mais persistente no que está a fazer. Com isso, propomos o uso de uma pedagogia que se utiliza de sequências didáticas para construir um conhecimento significativo ao aluno, buscando desenvolver instrumentos de indagação e problematização das situações, de descoberta, escolha e integração das informações disponíveis. Segundo Pannuti, (2004, p. 04), A sequência didática é uma outra modalidade organizativa que se constitui numa série de ações planejadas e orientadas com o objetivo de promover uma aprendizagem específica e definida. Estas ações são sequenciais de forma a oferecer desafios com o grau de complexidade crescente, para que as crianças possam colocar em movimento suas habilidades, superando-as e atingindo novos níveis de aprendizagem. Deve-se buscar que o aluno compreenda que muitos dos acontecimentos do cotidiano são aleatórios, podendo identificar possíveis resultados, entendendo o que é previsível e aleatório e utilizando recursos probabilísticos para resolver situações- problema. Outro ponto importante está nas avaliações de ensino, pois os mecanismos de avaliação da Educação Básica têm sido uma das principais causas da situação de fracasso escolar que atinge uma parte considerável dos alunos. Nesse contexto, a avaliação torna-se sinônimo de classificar, selecionar e julgar a aquisição de conhecimentos e habilidades utilizando-se dos mesmos instrumentos para todos, o que, muitas vezes, é um grande erro, pois, Exigir que todos os alunos, independente das diferenças psicossociais, apresentem o mesmo desempenho, é ignorar que cada pessoa tem o seu tempo para a aprendizagem, é dotada de identidade própria, visões de mundo e padrões culturais próprios, a serem considerados em práticas docentes e avaliativas, tendo em vista uma apropriação efetiva e IPEMIG - Instituto Pedagógico de Minas Gerais www.ipemig.com.br (31) 3484-4334- (31) 8642-1801 "IPEMIG – Conhecimento que transforma" 32 IPEMIG - Instituto Pedagógico de Minas Gerais www.ipemig.com.br (31) 3484-4334 - (31) 8642-1801 "IPEMIG – Conhecimento que transforma" significativa do conhecimento. (Diretrizes para Avaliação da Aprendizagem, 2006). Mesmo para muitos professores de Matemática é de extrema dificuldade compreender a linguagem estatística utilizada na apresentação e divulgação dos resultados das avaliações educacionais, pois muitas vezes, isso é apresentado em linguagem técnica altamente sofisticada e, até mesmo, incompreensível. Para o aluno, uma avaliação deve representar seus ganhos e apontar onde estão suas dificuldades a fim de melhorar seu conhecimento; para o professor, ela deve levá-lo a perceber onde sua pedagogia é falha e, a partir dessa constatação, ele deve estar pronto para modificá-la. É importante salientar que: A avaliação é do interesse do aluno, dos pais e da comunidade, porque tradicionalmente todo processo de aprendizagem pressupõe formas de aferição para garantir a confirmação dos conhecimentos que o aluno aprendeu e daqueles que não conseguiu compreender. A aprendizagem não é um processo individual e isolado, mas um processo coletivo, social e cultural. Só que agora o maior interesse na avaliação é dos governos no sentido de inserir a escola no mercado (BASTOS, 2001, p.128). No artigo „Diretrizes para Avaliação da Aprendizagem‟ (2006), fala-se de uma avaliação formativa que foi construída por um grupo de professores de uma instituição educacional e não por pessoas externas a ela. Essa parece ser uma grande ideia para se avaliar e obter seus ganhos, pois ela apresenta as seguintes características: • é conduzida pelo professor; • destina-se a promover a aprendizagem; • leva em conta diferentes linguagens e estilos de aprendizagem; • dá tratamento didático aos “erros”, considerando-os como informações diagnósticas; • inclui todas as atividades realizadas; • os alunos exercem papel central, devendo atuar ativamente em sua própria aprendizagem. (Diretrizes para Avaliação da Aprendizagem, 2006). Segundo Versieux (2005, p.3) “não existe uma maneira „correta‟ de definir avaliação, uma maneira que, se encontrada poria fim à argumentação sobre como ela deve proceder e quais são os seus propósitos”. Assim, podemos observar que cabe a cada instituição desenvolver sua avaliação formativa, em sua Proposta Pedagógica. Segundo a LDB, em seu artigo 26, conforme citado pelas Diretrizes para Avaliação da Aprendizagem, os currículos do Ensino Fundamental e do Ensino Médio devem ter uma Base Nacional Comum, a ser completada, em cada sistema de ensino e estabelecimento escolar, por uma Parte Diversificada, exigida pelas 33 IPEMIG - Instituto Pedagógico de Minas Gerais www.ipemig.com.br (31) 3484-4334 - (31) 8642-1801 "IPEMIG – Conhecimento que transforma" características regionais e locais da sociedade, da cultura, da economia e da clientela. (Diretrizes para Avaliação da Aprendizagem, 2006) E esta parte diversificada pode ser inserida de forma interdisciplinar, tendo como essência a reflexão das experiências vividas pelo aluno. Podem-se contextualizar conceitos, existentes no currículo da Base Nacional Comum, preparando, assim, o aluno para sua vida futura, trabalho e exercício da cidadania. Devem voltar-se, então, ao controle para a qualidade e excelência, com parâmetros de eficiência, envolvendo custo e benefício, metas e resultados quantitativos. Para as universidades brasileiras, segundo Versieux (2005), a avaliação é vista como tomada de consciência, visando melhorias na universidade, com participação individual, coletiva, visando identificação de critérios, procedimentos e avaliação de resultados (...) e (...) depende da visão de cada um dos formuladores, já que a escola, inserida no modelo capitalista, pode ser interpretada à partir de várias teorias educacionais. A avaliação tem que ser exigida, mas, ainda, precisa ser melhorada na sua forma de aplicar e divulgar resultados. É ela que mostra onde estão os problemas na educação de nosso país e não podemos esquecer que, A educação é bem social, direito de todos, obrigação do Estado e da família. Foi este o princípio estabelecido na nossa constituição. Este é um pilar da concepção de política pública. (...) Os princípios básicos seriam uma consciência crítica responsável, os princípios éticos e uma cidadania consolidada e atuante. Estes são os princípios que norteiam uma concepção de política pública para avaliação (VERSIEUX, 2005, p. 12). Com essas diversas questões em mente, após realizar uma pesquisa bibliográfica acerca de avaliações educacionais, para mapear o estado da arte de como estão sendo analisados os dados e divulgados seus resultados especialmente no que se refere aos conteúdos de Estatística nelas contidos, desenvolvemos algumas sequências didáticas com temas geradores do cotidiano, buscando desenvolver o raciocínio combinatório e probabilístico conforme as sugestões dos PCN e, também, apresentar a você professor ou futuro professor de estatística, um material didático diferenciado que o auxilie no ensino de combinatória e probabilidade. 34 IPEMIG - Instituto Pedagógico de Minas Gerais www.ipemig.com.br (31) 3484-4334 - (31) 8642-1801 "IPEMIG – Conhecimento que transforma" 2.1.1 Sequências Didáticas Desenvolvidas 1. Jogo da Memória - Objetivo: explorar situações que desenvolvam o raciocínio combinatório e probabilístico 1. O que você pensa sobre os animais? 2. O que você pensa sobre as pessoas que abandonam animais? E as que maltratam? 3. Você possui animais? Quantos? Quais? 4. Qual seria a sua reação quando presenciasse uma cena de maus tratos de animais? 5. Considere um jogo da memória no qual existem 8 gatos idênticos, 6 cachorros idênticos, 6 onças idênticas, 4 golfinhos idênticos, 2 bodes idênticos, 2 cavalos idênticos e 2 macacos idênticos. Na sua opinião, existe algum animal que é mais fácil de formar pares? Por quê? O aluno pode jogar várias vezes para ter uma ideia melhor da probabilidade. Complete a tabela abaixo indicando a probabilidade retirar cada um desses animais: Animais Probabilidade Gato Cachorro Onça Macaco Golfinho Cavalo Bode Total 35 IPEMIG - Instituto Pedagógico de Minas Gerais www.ipemig.com.br (31) 3484-4334 - (31) 8642-1801 "IPEMIG – Conhecimento que transforma" 6. Agora calcule a probabilidade de: a. Retirar a figura de um gato, sabendo que já foram retiradas todas as onças (todas as outras figurinhas ainda estão no jogo). b. Retirar a figura de um cachorro, sabendo que já foram retirados todos os cavalos. c. Retirar a figura de um golfinho, sabendo que já foram retirados todos os gatos e todos os cachorros. 7. Qual foi sua opinião para usar o jogo da memória e ao mesmo tempo começar a aprender probabilidade? 8. Você teria alguma sugestão para um outro jogo que envolvesse probabilidade? 9. Você tem alguma pergunta ou alguma dúvida sobre esse jogo? 2. Brincando com Gráficos e Tabelas Objetivo: Interpretar dados organizados em tabelas, calcular percentuais, organizar dados em tabelas, discutir os dados apresentados e tomar possíveis decisões. Atividade Um centro de zoonose da região metropolitana de Campinas divulgou os dados da Tabela 1. Tabela 1: Castrações de animais no período de Dezembro de 2006 à Junho de 2007 por um núcleo de zoonoses da região metropolitana de Campinas. PeríodoCão macho Cão fêmea Gato macho Gato fêmea Total Dez./06 4 0 0 11 Jan./07 2 0 1 10 Fev./07 2 0 7 13 22 Mar./07 6 15 61 Abr./07 14 12 24 67 Mai./07 15 46 20 28 Jun./07 17 48 35 124 Total 75 117 86 129 36 IPEMIG - Instituto Pedagógico de Minas Gerais www.ipemig.com.br (31) 3484-4334 - (31) 8642-1801 "IPEMIG – Conhecimento que transforma" 1. Complete os dados que estão faltando na tabela, calcule as porcentagens referentes a cada grupo de animais e organize uma nova tabela devidamente formatada. 2. Você seria capaz de avaliar o impacto que as castrações públicas trazem para sua cidade? Compare e explicite o motivo das castrações serem realizadas em animais machos e fêmeas. 3. Imagine que cada animal fêmea da tabela 1 não tenha sido castrado e gere 5 filhotes, dos quais 3 são fêmeas nos cães e 4 são fêmeas nos gatos. Quantos novos animais existirão quando todos os animais tiverem dado cria? Quantos machos e quantas fêmeas? 4. Imagine agora que o período de gestação de uma fêmea é de cerca de 3 meses e que a fêmea pode pegar uma nova cria um mês após de ter dado a luz.Quantos filhotes estas fêmeas terão gerado ao final de um ano? 5. Imagine ainda que cada filhote gerado entra no período de reprodução a partir do sexto mês. Utilizando os dados dos exercícios 3 e 4, calcule o total de novos animais gerados no decorrer de um ano pelas fêmeas da tabela 1. Estas sequências apresentam-se de uma maneira simples e podem ser aplicadas com alunos desde o início da escolaridade. Através da coleta de dados e da elaboração de tabelas e gráficos, os estudantes podem observar que a utilização da Estatística possibilita a resolução, compreensão e uma melhor visualização de diversificados problemas que fazem parte do seu cotidiano e de outras pessoas. Assim, podemos tornar a Matemática e seus diversos âmbitos de aplicabilidade, do ponto de vista do aluno, um tanto mais prazerosa e com significância para ele, na medida em que, oferecemos diferentes formas de aprender e de estudar, buscando inovar sempre, a metodologia escolar, renovando, assim, o espírito da escola. 37 IPEMIG - Instituto Pedagógico de Minas Gerais www.ipemig.com.br (31) 3484-4334 - (31) 8642-1801 "IPEMIG – Conhecimento que transforma" 3 PRINCÍPIOS DE ESTATÍSTICA Estatística é uma ciência exata que visa fornecer subsídios ao analista para coletar, organizar, resumir, analisar e apresentar dados. Trata de parâmetros extraídos da população, tais como média ou desvio padrão. A estatística fornece-nos as técnicas para extrair informação de dados, os quais são muitas vezes incompletos, na medida em que nos dão informação útil sobre o problema em estudo, sendo assim, é objetivo da Estatística extrair informação dos dados para obter uma melhor compreensão das situações que representam. Quando se aborda uma problemática envolvendo métodos estatísticos, estes devem ser utilizados mesmo antes de se recolher a amostra, isto é, deve-se planejar a experiência que nos vai permitir recolher os dados, de modo que, posteriormente, se possa extrair o máximo de informação relevante para o problema em estudo, ou seja, para a população de onde os dados provêm. Quando de posse dos dados, procura-se agrupá-los e reduzi-los, sob forma de amostra, deixando de lado a aleatoriedade presente. Seguidamente o objetivo do estudo estatístico pode ser o de estimar uma quantidade ou testar uma hipótese, utilizando-se técnicas estatísticas convenientes, as quais realçam toda a potencialidade da Estatística, na medida em que vão permitir tirar conclusões acerca de uma população, baseando-se numa pequena amostra, dando-nos ainda uma medida do erro cometido. Exemplo: Ao chegarmos a uma churrascaria, não precisamos comer todos os tipos de saladas, de sobremesas e de carnes disponíveis, para conseguirmos chegar a conclusão de que a comida é de boa qualidade. Basta que seja provado um tipo de cada opção para concluirmos que estamos sendo bem servidos e que a comida está dentro dos padrões. 38 IPEMIG - Instituto Pedagógico de Minas Gerais www.ipemig.com.br (31) 3484-4334 - (31) 8642-1801 "IPEMIG – Conhecimento que transforma" 3.1 População e Amostra Qualquer estudo científico enfrenta o dilema de estudo da população ou da amostra. Obviamente obter-se-ia uma precisão muito superior se fosse analisado o grupo inteiro, a população, do que uma pequena parcela representativa, denominada amostra. Observa-se que é impraticável na grande maioria dos casos, estudar a população por completo, em virtude de distâncias, custo, tempo, logística, entre outros motivos. A alternativa praticada nestes casos é o trabalho com uma amostra confiável. Se a amostra é confiável e proporciona inferir sobre a população, chamamos de inferência estatística. Para que a inferência seja válida, é necessária uma boa amostragem, livre de erros, tais como falta de determinação correta da população, falta de aleatoriedade e erro no dimensionamento da amostra. Quando não é possível estudar, exaustivamente, todos os elementos da população, estudam-se só alguns elementos, a que damos o nome de Amostra. Exemplo: Se o objetivo for estudar o desempenho escolar de um colégio, é indicado estudar as notas dos alunos ao final do ano letivo. A partir daí poderemos facilmente obter a percentagem de aprovações e reprovações. Agora, se, entretanto o interesse for aprofundar o estudo, saber se, por exemplo, o sucesso no estudo pode ser atribuído para as alunas ou alunos, deveremos recolher não somente a informação relativa a nota do aluno que aprovou ou não, mas também para cada um, o sexo. Aprovados Masculino 28% Feminino 13% Total 41% Quando a amostra não representa corretamente a população diz-se enviesada e a sua utilização pode dar origem a interpretações erradas. 39 IPEMIG - Instituto Pedagógico de Minas Gerais www.ipemig.com.br (31) 3484-4334 - (31) 8642-1801 "IPEMIG – Conhecimento que transforma" 3.1.1 Recenseamento Recenseamento é a contagem oficial e periódica dos indivíduos de um País, ou parte de um País. Ele abrange, no entanto, um leque mais vasto de situações. Assim, pode definir-se recenseamento do seguinte modo: Estudo científico de um universo de pessoas, instituições ou objetos físicos com o propósito de adquirir conhecimentos, observando todos os seus elementos, e fazer juízos quantitativos acerca de características importantes desse universo. 3.1.2 Estatística descritiva e estatística indutiva Sondagem Por vezes não é viável nem desejável, principalmente quando o número de elementos da população é muito elevado, inquirir todos os seus elementos sempre que se quer estudar uma ou mais características particulares dessa população. Assim surge o conceito de sondagem, que se pode tentar definir como: Estudo científico de uma parte de uma população com o objetivo de estudar atitudes, hábitos e preferências da população relativamente a acontecimentos, circunstâncias e assuntos de interesse comum. Amostragem Amostragem é o processo que procura extrair da população elementos que através de cálculos probabilísticos ou não, consigam prover dados inferenciais da população-alvo. Tipos de Amostragem Não Probabilística Acidental ou conveniência Intencional Quotas ou proporcional Desproporcional Probabilística Aleatória Simples Aleatória Estratificada Conglomerado 40IPEMIG - Instituto Pedagógico de Minas Gerais www.ipemig.com.br (31) 3484-4334 - (31) 8642-1801 "IPEMIG – Conhecimento que transforma" 3.1.3 Não Probabilística A escolha de um método não probabilístico, via de regra, sempre encontrará desvantagem frente ao método probabilístico. No entanto, em alguns casos, se faz necessário a opção por este método. Fonseca (1996), alerta que não há formas de se generalizar os resultados obtidos na amostra para o todo da população quando se opta por este método de amostragem. Acidental ou conveniência Indicada para estudos exploratórios. Frequentemente utilizados em supermercados para testar produtos. Intencional O entrevistador dirige-se a um grupo em específico para saber sua opinião. Por exemplo, quando de um estudo sobre automóveis, o pesquisador procura apenas oficinas. Quotas ou proporcional Na realidade, trata-se de uma variação da amostragem intencional. Necessita-se ter um prévio conhecimento da população e sua proporcionalidade. Por exemplo, deseja-se entrevistar apenas indivíduos da classe A, que representa 12% da população. Esta será a quota para o trabalho. Comumente também substratifica-se uma quota obedecendo a uma segunda proporcionalidade. Desproporcional Muito utilizada quando a escolha da amostra for desproporcional à população. Atribui-se pesos para os dados, e assim obtêm-se resultados ponderados representativos para o estudo. Exemplo: 41 IPEMIG - Instituto Pedagógico de Minas Gerais www.ipemig.com.br (31) 3484-4334 - (31) 8642-1801 "IPEMIG – Conhecimento que transforma" Em um mercado de telefones celulares, considerando uma fatia de mercado meramente ilustrativa, obteve-se os resultados conforme descritos a seguir: Marcas Participação no mercado Elementos da Amostra n % Nokia 60% 50 25% Ericson 20% 50 25% Gradiente 15% 50 25% Philips 05% 50 25% Total 100% 200 100% Objetivando obtermos os pesos a serem atribuídos a cada marca de telefone celular, para uma análise conjunta de todas as marcas no exemplo acima, obtemos os seguintes coeficientes: Marcas Pesos Número de elementos a serem entrevistados Nokia 2,4 120 Ericson 0,8 40 Gradiente 0,6 30 Philips 0,2 10 Total 4,0 200 3.1.4 Probabilística Para que se possam realizar inferências sobre a população, é necessário que se trabalhe com amostragem probabilística. É o método que garante segurança quando se investiga alguma hipótese. Normalmente os indivíduos investigados possuem a mesma probabilidade de ser selecionado na amostra. Aleatória Simples É o mais utilizado processo de amostragem. Prático e eficaz, confere precisão ao processo de amostragem. Normalmente utiliza-se uma tabela de 42 números aleatórios e nomeiam-se os indivíduos, sorteando-se um por um até completar a amostra calculada. Uma variação deste tipo de amostragem é a sistemática. Em um grande número de exemplos, o pesquisador depara-se com a população ordenada. Neste sentido, têm-se os indivíduos dispostos em sequência o que dificulta a aplicação exata desta técnica. Quando se trabalha com sorteio de quadras de casas, por exemplo, há uma regra crescente para os números das casas. Em casos como este, divide-se a população pela amostra e obtém-se um coeficiente (y). A primeira casa será a de número x, a segunda será a de número x + y; a terceira será a de número x + 3. y. Supondo que este coeficiente seja 6. O primeiro elemento será 3. O segundo será 3 + 6. O terceiro será 3 + 2.6. O quarto será 3 + 3.6, e assim sucessivamente. Aleatória Estratificada Quando se deseja guardar uma proporcionalidade na população heterogênea. Estratifica-se cada subpopulação por intermédio de critérios como classe social, renda, idade, sexo, entre outros. Conglomerado Em corriqueiras situações, torna-se difícil coletar características da população. Nesta modalidade de amostragem, sorteia-se um conjunto e procura-se estudar todo o conjunto. É exemplo de amostragem por conglomerado, famílias, organizações e quarteirões. 3.2 Dimensionamento da amostra Quando se deseja dimensionar o tamanho da amostra, o procedimento desenvolve-se em três etapas distintas: Avaliar a variável mais importante do grupo e a mais significativa; Analisar se é ordinal, intervalar ou nominal; Verificar se a população é finita ou infinita; IPEMIG - Instituto Pedagógico de Minas Gerais www.ipemig.com.br (31) 3484-4334 - (31) 8642-1801 "IPEMIG – Conhecimento que transforma" 43 IPEMIG - Instituto Pedagógico de Minas Gerais www.ipemig.com.br (31) 3484-4334 - (31) 8642-1801 "IPEMIG – Conhecimento que transforma" Variável intervalar e população infinita Variável intervalar e população finita Variável nominal ou ordinal e população infinita Variável nominal ou ordinal e população finita Obs.: A proporção (p) será a estimativa da verdadeira proporção de um dos níveis escolhidos para a variável adotada. Por exemplo, 60% dos telefones da amostra é Nokia, então p será 0,60. A proporção (q) será sempre 1 - p. Neste exemplo q, será 0,4. O erro é representado por d. Para casos em que não se tenha como identificar as proporções confere-se 0,5 para p e q. 3.3 Tipos de dados Basicamente os dados, dividem-se em contínuos e discretos. O primeiro é definido como qualquer valor entre dois limites quaisquer, tal como um diâmetro. Portanto trata-se de um valor que ser “quebrado”. São dados contínuos, questões que envolvem idade, renda, gastos, vendas, faturamento, entre muitas outras. Quando se fala em valores discretos, aborda-se um valor exato, tal como quantidade de peças defeituosas. Comumente utiliza-se este tipo de variáveis para tratar de numero de filhos, satisfação e escalas nominais no geral. A tipologia dos dados determina a variável, ela será, portanto contínua ou discreta. Isto quer dizer que ao definir-se uma variável com contínua ou discreta, futuramente já se definiu que tipo de tratamento se dará a ela. De acordo com o que dissemos anteriormente, numa análise estatística distinguem-se essencialmente duas fases: Uma primeira fase em que se procura descrever e estudar a amostra: Estatística Descritiva e uma segunda fase em que se procura tirar 44 IPEMIG - Instituto Pedagógico de Minas Gerais www.ipemig.com.br (31) 3484-4334 - (31) 8642-1801 "IPEMIG – Conhecimento que transforma" conclusões para a população: 1ª Fase Estatística Descritiva Procura-se descrever a amostra, pondo em evidência as características principais e as propriedades. 2ª Fase Estatística Indutiva Conhecidas certas propriedades (obtidas a partir de uma análise descritiva da amostra), expressas por meio de proposições, imaginam-se proposições mais gerais, que exprimam a existência de leis (na população). No entanto, ao contrário das proposições deduzidas, não podemos dizer que são falsas ou verdadeiras, já que foram verificadas sobre um conjunto restrito de indivíduos, e, portanto, não são falsas, mas não foram verificadas para todos os indivíduos da População, pelo que também não podemos afirmar que são verdadeiras! Existe, assim, um certo grau de incerteza (percentagem de erro) que é medido em termos de Probabilidade. Considerando o que foi dito anteriormente sobre a Estatística Indutiva, precisamos aqui da noção de Probabilidade, para medir o grau de incerteza queexiste, quando tiramos uma conclusão para a população, a partir da observação da amostra. 3.3.1 Agrupamento dos dados Podemos pensar em agrupar os elementos: Para isso, anotamos quantas vezes a nota aparece (frequência). No Excel, chamamos a função estatística CONT.SE e mostramos o intervalo que queremos analisar e a nota que queremos saber quantas vezes ela aparece: 45 IPEMIG - Instituto Pedagógico de Minas Gerais www.ipemig.com.br (31) 3484-4334 - (31) 8642-1801 "IPEMIG – Conhecimento que transforma" Figura: Função Cont. Se E fazendo este procedimento diversas vezes, obtemos: Tabela: Notas dos alunos da escola Y- ano 2007 NOTAS FREQUÊNCIA 2 1 3 1 4 1 5 2 6 1 7 1 8 2 9 1 10 1 46 IPEMIG - Instituto Pedagógico de Minas Gerais www.ipemig.com.br (31) 3484-4334 - (31) 8642-1801 "IPEMIG – Conhecimento que transforma" r Podemos assim, fazer o gráfico: Percebemos aqui que é preciso colocar título no gráfico e nome nos eixos. 2,5 2 ai Nota dos alunos da Série X - Escola Y- ano 2007 c 1,5 n ê ü 1 q e 0,5 f 0 nota 2 nota 3 nota 4 nota 5 nota 6 nota 7 nota 8 nota 9 nota 10 notas Figura: Gráfico das notas dos alunos da série X 14 13 12 14 13 12 12 13 14 16 13 14 14 14 “ “ 15 15 17 16 14 12 11 12 3.3.2 Algumas funções do Excel para descrição dos dados Dada a amostra: 47 IPEMIG - Instituto Pedagógico de Minas Gerais www.ipemig.com.br (31) 3484-4334 - (31) 8642-1801 "IPEMIG – Conhecimento que transforma" Teremos 4 funções mostradas aqui: Tabela: Funções estatísticas Função Estatística Intervalos de células Máximo 17 Mínimo 11 Cont. Números 22 Cont. Valores 23 Aqui temos a função Máximo = 17 A função Mínimo = 11 A função Cont. Números – que é relacionada à contagem de números apenas, não importando com células vazias. E a função Cont. Valores que é relacionada com o número de observações, mesmo sendo células que estão vazias “ “. 48 IPEMIG - Instituto Pedagógico de Minas Gerais www.ipemig.com.br (31) 3484-4334 - (31) 8642-1801 "IPEMIG – Conhecimento que transforma" Função frequência: A função estatística FREQUÊNCIA dá a distribuição de frequências da matriz_dados de acordo com a matriz_bin definida: Fig: Planilha do Excel com a tabela de funções estatísticas Verifique que, a matriz_dados está nas células: A1; A23 E a Matriz_bin está na F15; F21 Selecione as células que estão na coluna posterior da matriz_bin E digite a fórmula: =FREQUÊNCIA (A1:A3; F15:F21) Pressione as teclas CTRL + SHIFT + ENTER Onde obteremos os resultados acima. Voltemos a analisar com um gráfico: 49 IPEMIG - Instituto Pedagógico de Minas Gerais www.ipemig.com.br (31) 3484-4334 - (31) 8642-1801 "IPEMIG – Conhecimento que transforma" Fig: Como fazer gráfico É preciso selecionar o Intervalo de dados na parte de cima desta caixa e, selecionar a coluna da matriz_bin (F15: F21). Após este procedimento, clicar em série (na parte superior desta caixa). 50 Fig: Passo-a-passo para fazer gráfico no Excel Em Valores, selecione a matriz que tem os valores das frequências (G15:G21). Em Rótulo dos eixos das categorias X, selecione Rótulos do eixo das categorias, a matriz_bin: F15:F21. IPEMIG - Instituto Pedagógico de Minas Gerais www.ipemig.com.br (31) 3484-4334 - (31) 8642-1801 "IPEMIG – Conhecimento que transforma" 51 IPEMIG - Instituto Pedagógico de Minas Gerais www.ipemig.com.br (31) 3484-4334 - (31) 8642-1801 "IPEMIG – Conhecimento que transforma" 3.4 Frequência acumulada Tabela: TABELA DE FREQUÊNCIA Valores da amostra Frequência Frequência relativa Frequência acumulada 11 1 4,55% 1 12 5 22,73% 6 13 4 18,18% 10 14 7 31,82% 17 15 2 9,09% 19 16 2 9,09% 21 17 1 4,55% 22 Na 4ª coluna, obtemos frequência acumulada, através de: Fig: Planiha do Excel com tabela de frequência Coloque na célula I2, o valor da célula G2 (frequência absoluta) Fórmula na célula I3= I2+G3 Fórmula na célula I4= I3+G4 Arraste a alça de preenchimento. 52 IPEMIG - Instituto Pedagógico de Minas Gerais www.ipemig.com.br (31) 3484-4334 - (31) 8642-1801 "IPEMIG – Conhecimento que transforma" Gráfico com freqüências relativas 5,00% 0,00% 11 12 13 14 15 16 17 Freqüências acumuladas (Fa) 25 20 15 10 5 0 11 12 13 14 valores das amostras 15 16 17 Vamos fazer o gráfico das frequências relativas? Figura: Gráfico com frequências relativas E agora com frequências acumuladas: Figura: Gráfico com frequências acumuladas fr e q ü ê n c ia s r e la ti v a s F a 53 IPEMIG - Instituto Pedagógico de Minas Gerais www.ipemig.com.br (31) 3484-4334 - (31) 8642-1801 "IPEMIG – Conhecimento que transforma" É possível também, construir este gráfico combinado com as frequências: relativa e acumulada: Figura: Como construir Gráfico com frequências relativas e acumuladas Como verificamos acima, existem as 2 frequências sendo analisadas no mesmo gráfico. Conseguimos tal resultado fazendo o procedimento: Assistente de gráfico; Tipos personalizados; Lins-Cols em 2 eixos; Clicar em intervalos de dados, e selecionar os valores da frequência relativa, no caso: H15:H21; Em Série, clicar no eixo x, e colocar os valores da amostra, que estão nas células: G15:G21; 54 IPEMIG - Instituto Pedagógico de Minas Gerais www.ipemig.com.br (31) 3484-4334 - (31) 8642-1801 "IPEMIG – Conhecimento que transforma" 21 Adicionar mais uma série: Clicar no botão Adicionar e colocar a coluna que estão os valores da frequência acumulada: I15: I21; 3.5 Distribuição de frequências com dados agrupados Os dados podem ser agrupados utilizando classes, mas para determiná-las existem algumas maneiras, segundo Lapponi (2000): k= arredondando para o valor inteiro menor ou maior; k= 1+ 3,322* log n , arredondando para o valor inteiro menor ou maior; Por exemplo, temos uma amostra de 21 dados: 50 34 65 59 58 45 67 56 54 43 78 49 56 54 76 67 67 67 60 56 45 Figura: Dados da amostra Teremos então: K = = 4,58 =Podemos arredondar para 5. Ou K=1+ 3,322* log 21=5,39, podemos arredondar para 5 Assim, teremos que: 1) Determinar a amplitude de classe: Descobrindo o Mínimo =34 Descobrindo o Máximo= 78 h= Máximo K Mínimo 78 34 5 8,8 Podemos trabalhar com o número 8,8 ou arredondá-lo para 9: 55 IPEMIG - Instituto Pedagógico de Minas Gerais www.ipemig.com.br (31) 3484-4334 - (31) 8642-1801 "IPEMIG – Conhecimento que transforma" Fazendo o Histograma peloExcel, teremos: Ferramentas - Análise se dados – Histograma Figura: Função Histograma do Excel No Intervalo de entrada, colocamos os dados da amostra (A1:A21) E no intervalo do bloco, colocamos os dados sem repetição (C1: C14): Figura: Dados da amostra na coluna A e dados sem repetição na coluna C 56 IPEMIG - Instituto Pedagógico de Minas Gerais www.ipemig.com.br (31) 3484-4334 - (31) 8642-1801 "IPEMIG – Conhecimento que transforma" Histograma 6 4 2 0 150,00% 100,00% 50,00% 0,00% Freqüência % cumulativo Bloco Colocamos no intervalo de saída onde queremos que seja o resultado, e obteremos: Tabela: Resultado da Frequência e da Frequência relativa acumulada Bloco Frequência % cumulativo 5 0 0,00% 34 1 4,76% 43 1 9,52% 45 2 19,05% 49 1 23,81% 50 1 28,57% 54 2 38,10% 56 3 52,38% 59 2 61,90% 60 1 66,67% 65 1 71,43% 67 4 90,48% 76 1 95,24% 78 1 100,00% Mais 0 100,00% Figura: Histograma com frequência relativa acumulada 5 45 54 60 76 F re q ü ê n c ia 57 IPEMIG - Instituto Pedagógico de Minas Gerais www.ipemig.com.br (31) 3484-4334 - (31) 8642-1801 "IPEMIG – Conhecimento que transforma" Histograma O que percebemos é que quando fazemos as classes e fazemos um gráfico via assistente de gráfico, parece mais facilmente entendido; Tabela: Dados agrupados por classes Classes Frequência 34-43 1 43-52 5 52-61 8 61-70 5 70-79 2 Figura: Histograma sem espaço intercolunas Exemplo: Uma empresa fabricante de um automóvel, pretende avaliar a potencialidade do mercado, estimando através de um mercado teste. Através de 1000 entrevistados, pretende-se verificar como se comportará a fatia de intenção de votos para determinado candidato. F re q ü ê n c ia 58 IPEMIG - Instituto Pedagógico de Minas Gerais www.ipemig.com.br (31) 3484-4334 - (31) 8642-1801 "IPEMIG – Conhecimento que transforma" Problema: pretende-se, a partir da percentagem de respostas afirmativas, de entre os inquiridos sobre a compra do novo produto, obter uma estimativa do número de compradores na População. 3.6 Dados, tabelas e gráficos Quando da análise de dados, é comum procurar conferir certa ordem aos números tornando-os visualmente mais amigáveis. O procedimento mais comum é o de divisão por classes ou categorias, verificando-se o número de indivíduos pertencentes a cada classe: 1. Determina-se o menor e o maior valor para o conjunto: 2. Definir o limite inferior da primeira classe (Li) que deve ser igual ou ligeiramente inferior ao menor valor das observações: 3. Definir o limite superior da última classe (Ls) que deve ser igual ou ligeiramente superior ao maior valor das observações: 4. Definir o número de classes (K), que será calculado usando . Obrigatoriamente deve estar compreendido entre 5 a 20. 5. Conhecido o número de classes define-se a amplitude de cada classe: 6. Com o conhecimento da amplitude de cada classe, define-se os limites para cada classe (inferior e superior) Exemplo: 5,1 5,3 5,3 5,6 5,8 5,9 6 6,1 6,2 6,2 6,3 6,3 6,3 6,4 6,4 6,4 6,5 6,5 6,6 6,7 6,7 6,8 6,8 6,9 6,9 7 7,1 7,1 7,2 7,2 7,3 7,4 7,5 7,5 7,6 7,6 7,6 7,7 7,7 7,8 7,8 7,9 7,9 8 8 8,1 8,2 8,3 8,4 8,5 8,5 8,6 8,7 8,8 8,9 8,9 9 9,1 9,2 9,4 9,4 9,5 9,5 9,6 9,8 9 9 10 10,2 10,2 10,4 10,6 10,8 10,9 11,2 11,5 11,8 12,3 12,7 14,9 59 IPEMIG - Instituto Pedagógico de Minas Gerais www.ipemig.com.br (31) 3484-4334 - (31) 8642-1801 "IPEMIG – Conhecimento que transforma" Regras para elaboração de uma distribuição de frequências 1. Determina-se o menor e o maior valor para o conjunto: Valor mínimo: 5,1 Valor máximo: 14,9 2. Definir o limite inferior da primeira classe (Li) que deve ser igual ou ligeiramente inferior ao menor valor das observações: LI: 5,1 3. Definir o limite superior da última classe (Ls) que deve ser igual ou ligeiramente superior ao maior valor das observações: LS:15 4. Definir o número de classes (K), que será calculado usando . Obrigatoriamente deve estar compreendido entre 5 a 20. Neste caso, K é igual a 8,94, aproximadamente, 8. 5. Conhecido o número de classes define-se a amplitude de cada classe: No exemplo, a será igual a: 1,23 6. Com o conhecimento da amplitude de cada classe, definem-se os limites para cada classe (inferior e superior), onde limite Inferior será 5,1 e o limite superior será 15 + 1,23. Intervalo de Classe Frequência Absoluta Frequência Acumulada Frequência Relativa 05,10 a 06,33 13 13 16,25% 06,34 a 07,57 21 34 26,25% 07,58 a 08,81 22 56 27,50% 08,82 a 10,05 15 71 18,75% 10,06 a 11,29 4 75 5,00% 11,30 a 12,53 3 78 3,75% 12,54 a 13,77 1 79 1,25% 13,78 a 15,01 1 80 1,25% 80 100% 60 IPEMIG - Instituto Pedagógico de Minas Gerais www.ipemig.com.br (31) 3484-4334 - (31) 8642-1801 "IPEMIG – Conhecimento que transforma" 3.6.1 Distribuições simétricas A distribuição das frequências faz-se de forma aproximadamente simétrica, relativamente a uma classe média Caso especial de uma distribuição simétrica: Quando dizemos que os dados obedecem a uma distribuição normal, estamos tratando de dados que distribuem-se em forma de sino. 3.6.2 Distribuições Assimétricas A distribuição das frequências apresenta valores menores num dos lados: 3.6.3 Distribuições com “caudas” longas Observamos que nas extremidades há uma grande concentração de dados em relação aos concentrados na região central da distribuição. 3.7 Medidas de tendência Central As mais importante medidas de tendência central, são a média aritmética, média aritmética para dados agrupados, média aritmética ponderada, mediana, moda, média geométrica, média harmônica, quartis. Quando se estuda variabilidade, as medidas mais importantes são: amplitude, desvio padrão e variância. 61 IPEMIG - Instituto Pedagógico de Minas Gerais www.ipemig.com.br (31) 3484-4334 - (31) 8642-1801 "IPEMIG – Conhecimento que transforma" Medidas Média aritmética Média aritmética para dados agrupados Média aritmética ponderada Mediana 1) Se n é impar, o valor é central, 2) se n é par, o valor é a média dos dois valores centrais Moda Valor que ocorre com mais frequência. Média geométrica Média harmônica Quartil Sendo a média uma medida tão sensível aos dados, é preciso ter cuidado com a sua utilização, pois pode dar uma imagem distorcida dos dados. Pode-se mostrar, que quando a distribuição dos dados é “normal”, então a melhor medida de localização do centro, é a média. Sendo a Distribuição Normal uma das distribuições mais importantes e que surge com mais frequência nas aplicações, (esse fato justifica a grande utilização da média). A média possui uma particularidade bastante interessante, que consiste no seguinte: se calcularmos os desvios de todas as observações relativamente à média e somarmos esses desvios o resultado obtido é igual a zero. A média tem uma outra característica, que torna a suautilização vantajosa em certas aplicações: quando o que se pretende representar é a quantidade total expressa pelos dados, utiliza-se a média. Na realidade, ao multiplicar a média pelo número total de elementos, 62 IPEMIG - Instituto Pedagógico de Minas Gerais www.ipemig.com.br (31) 3484-4334 - (31) 8642-1801 "IPEMIG – Conhecimento que transforma" obtemos a quantidade pretendida. 3.8 Moda Define-se moda como sendo: o valor que surge com mais frequência se os dados são discretos, ou, o intervalo de classe com maior frequência se os dados são contínuos. Assim, da representação gráfica dos dados, obtém-se imediatamente o valor que representa a moda ou a classe modal Esta medida é especialmente útil para reduzir a informação de um conjunto de dados qualitativos, apresentados sob a forma de nomes ou categorias, para os quais não se pode calcular a média e por vezes a mediana. 3.9 Mediana A mediana é uma medida de localização do centro da distribuição dos dados, definida do seguinte modo: ordenados os elementos da amostra, a mediana é o valor (pertencente ou não à amostra) que a divide ao meio, isto é, 50% dos elementos da amostra são menores ou iguais à mediana e os outros 50% são maiores ou iguais à mediana. Para a sua determinação utiliza-se a seguinte regra, depois de ordenada a amostra de n elementos: Se n é ímpar, a mediana é o elemento médio. Se n é par, a mediana é a semissoma dos dois elementos médios. 3.10 Considerações a respeito de Média e Mediana Se representarmos os elementos da amostra ordenada com a seguinte notação: X1:n , X2:n , ... , Xn:n então uma expressão para o cálculo da mediana será: Como medida de localização, a mediana é mais robusta do que a média, pois não é tão sensível aos dados. 63 IPEMIG - Instituto Pedagógico de Minas Gerais www.ipemig.com.br (31) 3484-4334 - (31) 8642-1801 "IPEMIG – Conhecimento que transforma" 1- Quando a distribuição é simétrica, a média e a mediana coincidem. 2- A mediana não é tão sensível, como a média, às observações que são muito maiores ou muito menores do que as restantes (outliers). Por outro lado a média reflete o valor de todas as observações. Como já vimos, a média ao contrário da mediana, é uma medida muito influenciada por valores “muito grandes” ou “muito pequenos”, mesmo que estes valores surjam em pequeno número na amostra. Estes valores são os responsáveis pela má utilização da média em muitas situações em que teria mais significado utilizar a mediana. A partir do exposto, deduzimos que se a distribuição dos dados: 1. for aproximadamente simétrica, a média aproxima-se da mediana; 2. for enviesada para a direita (alguns valores grandes como “outliers”), a média tende a ser maior que a mediana; 3. for enviesada para a esquerda (alguns valores pequenos como “outliers”), a média tende a ser inferior à mediana. 3.11 Medidas de dispersão Já vimos algumas medidas de localização do centro de uma distribuição de dados. Veremos agora como medir a variabilidade presente num conjunto de dados através das seguintes medidas: Um aspecto importante no estudo descritivo de um conjunto de dados, é o da determinação da variabilidade ou dispersão desses dados, relativamente à medida de localização do centro da amostra. Supondo ser a média, a medida de localização mais importante, será relativamente a ela que se define a principal medida de dispersão - a variância, apresentada a seguir. 3.11.1 Variância Define-se a variância, como sendo a medida que se obtém somando os quadrados dos desvios das observações da amostra, relativamente à sua média, e 64 IPEMIG - Instituto Pedagógico de Minas Gerais www.ipemig.com.br (31) 3484-4334 - (31) 8642-1801 "IPEMIG – Conhecimento que transforma" dividindo pelo número de observações da amostra menos um. 3.11.2 Desvio-padrão Uma vez que a variância envolve a soma de quadrados, a unidade em que se exprime não é a mesma que a dos dados. Assim, para obter uma medida da variabilidade ou dispersão com as mesmas unidades que os dados, tomamos a raiz quadrada da variância e obtemos o desvio padrão: O desvio padrão é uma medida que só pode assumir valores não negativos e quanto maior for, maior será a dispersão dos dados. Algumas propriedades do desvio padrão, que resultam imediatamente da definição, são: o desvio padrão será maior, quanta mais variabilidade houver entre os dados. Exemplo: em uma turma de aluno, verificou-se através da análise das notas de 15 alunos, os seguintes desempenhos: Alunos Conceito na Prova 1 4,3 2 4,5 3 9 4 6 5 8 6 6,7 7 7,5 8 10 9 7,5 10 6,3 11 8 12 5,5 13 9,7 14 9,3 65 IPEMIG - Instituto Pedagógico de Minas Gerais www.ipemig.com.br (31) 3484-4334 - (31) 8642-1801 "IPEMIG – Conhecimento que transforma" 15 7,5 Total 109,8 Média 7,32 Desvio Padrão 1,77 Observamos no exemplo, que a média das provas, foi estimada em 7,32 com desvio padrão em 1,77. Concluímos que a maioria das notas concentrou-se em 9,09 e 5,55. 3.11.3 istribuição Normal A distribuição normal é a, mas importante distribuição estatística, considerando a questão prática e teórica. Já vimos que esse tipo de distribuição apresenta-se em formato de sino, unimodal, simétrica em relação a sua média. Considerando a probabilidade de ocorrência, a área sob sua curva soma 100%. Isso quer dizer que a probabilidade de uma observação assumir um valor entre dois pontos quaisquer é igual à área compreendida entre esses dois pontos. 68,26% => 1 desvio 95,44% => 2 desvios 99,73% => 3 desvios Na figura acima, tem as barras na cor marrom representando os desvios padrões. Quanto mais afastado do centro da curva normal, mais área compreendida abaixo da curva haverá. A um desvio padrão, temos 68,26% das observações contidas. A dois desvios padrões, possuímos 95,44% dos dados compreendidos e finalmente a três desvios, temos 99,73%. Podemos concluir que quanto maior a 66 IPEMIG - Instituto Pedagógico de Minas Gerais www.ipemig.com.br (31) 3484-4334 - (31) 8642-1801 "IPEMIG – Conhecimento que transforma" variabilidade dos dados em relação à média, maior a probabilidade de encontrarmos o valor que buscamos embaixo da normal. Propriedade 1: “f(x) é simétrica em relação à origem, x = média = 0; Propriedade 2: “f(x) possui um máximo para z=0, e nesse caso sua ordenada vale 0,39; Propriedade3: “f(x) tende a zero quando x tende para + infinito ou - infinito; Propriedade4: “f(x) tem dois pontos de inflexão cujas abscissas valem média + DP e média - DP, ou quando z tem dois pontos de inflexão cujas abscissas valem +1 e -1. Exemplo: As alturas de grupo de crianças são tidas como normais em sua distribuição, com desvio padrão em 0,30m e média em 1,60. Qual a probabilidade de um aluno medir (1) entre 1,50 e 1,80, (2) mais de 1,75 e menos de 1,48? (1) z1= (1,50-1,60)/0,30=-0,33 z2= (1,80-1,60)/0,30= 0,67 Então, z1 (0,1293) + z2 (0,2486) = 37,79% (2) z1= (1,75-1,60)/0,30=0,30 0,500-0,1915 = 30,85% (3) Z1= (1,48-1,50)/0,30 =-0,4 0,500-0,1554 = 34,46% 67 IPEMIG - Instituto Pedagógico de Minas Gerais www.ipemig.com.br (31) 3484-4334 - (31) 8642-1801 "IPEMIG – Conhecimento que transforma" REFERÊNCIAS UTILIZADAS E CONSULTADAS BRASIL. MEC. Ministério da Educação e do Desporto/Secretariade Educação Média e Tecnológica. PCN+ - Ensino Médio. Brasília: MEC, 2002. Disponível em: http://portal.mec.gov.br/seb/arquivos/pdf/CienciasNatureza.pdf>. Acesso em: 4 mar. 2011. . SECRETARIA DE EDUCAÇÃO FUNDAMENTAL. Parâmetros Curriculares Nacionais: Matemáticas (1o e 2o ciclos do Ensino Fundamental). Brasília: SEF/MEC, 1997a. . SECRETARIA DE EDUCAÇÃO FUNDAMENTAL. Parâmetros Curriculares Nacionais: Matemáticas (3o e 4o ciclos do Ensino Fundamental). Brasília: SEF/MEC, 1998b. . PCN. Parâmetros Curriculares Nacionais (Ensino Médio): Texto Integral. 2002. Disponível em: http://www.mec.gov.br/semtec/ensmed/pcn.shtm. Acesso em: 4 mar. 2011. . PCN. Ciências da Natureza, Matemática e suas Tecnologias. 2002. Disponível em: http://www.mec.gov.br/semtec/ensmed/ftp/CienciasNatureza.pdf. Acesso em: 4 mar. 2011. BUNCHAFT, Guenia; OLIVEIRA, Kellner Sheilah de. Estatística sem mistérios. 2 ed. Petrópolis: Vozes, 1998. 4 vol. BUSSAB, W. Estatística Básica. São Paulo: Saraiva, 2006. CARDEÑOSO, J.M; AZCÁRATE, P. Tratamiento del conocimiento probabilístico en los proyectos y materiales curriculares. Revista sobre La Enseñanza y Aprendizaje de Las Matematicas (Revista SUMA), Zaragoza, v.20, p.41-51, nov/2005. CARVALHO, C. Tarefas estatísticas e estratégias de resposta. Actas do VI Encontro de Educação Matemática (pp. 127-134) Porto alegre: SPCE-SEM. 1998. CRAMER, H. Mathemathical Methods of Statistics.USA: Princeton University Press, 1946. CRESPO, Antônio Arnot. Estatística fácil. 15 ed. São Paulo: Saraiva. 1997. GAL, I; GARFIEL, J. Curricular goals and assessment challenges in statistics education. In: I. Gal. e J. Garfiel (Eds). The assessment challenge in statistics education (pp.l-13). Amesterdão: 151. 1997. GAL, I; GINSBURG, L. The role of beliefs and attitudes in learning statistics: towards an assessment framework. Journal of Statistics Education. Disponível em: www.archieve,jse.ncsu.edu. Acesso em: 5 mar. 2011. 68 HOEL, Paul Gerhard, et al. Estatística elementar. São Paulo: Atlas. 1981. IBGE. Instituto Brasileiro de Geografia e Estatística. 2011. Disponível em: <http://www.ence.ibge.gov.br/estatistica/aplicacoes.asp>. Acesso em: 4 mar. 2011. LEVIN, Jakc. Estatística aplicada as ciências humanas. 2 ed. São Paulo: Harbra, 1985. LOPES, C. A. E. A Probabilidade e a Estatística no Ensino Fundamental: uma análise curricular. Campinas, SP: Faculdade de Educação da UNICAMP,1998. 125p. (Dissertação, Mestrado em Educação). LOPES, Celi Aparecida Espasandin; MORAN, Regina Célia Carvalho Pinto. A estatística e a probabilidade através das atividades propostas em alguns livros didáticos brasileiros recomendados para o ensino fundamental. In: CONFERÊNCIA INTERNACIONAL, EXPERIÊNCIAS E PERSPECTIVAS DO ENSINO DA ESTATÍSTICA : DESAFIOS PARA O SÉCULO XXI, 1, 1999, Florianópolis. anais... MARTINS, Gilberto de Andrade; DONAIRE, Denis. Princípios de estatística. 4 ed. São Paulo: Atlas. 1990. MINAS GERAIS (ESTADO) Secretaria da Educação. Programa para o ensino fundamental (1ª a 4ª série) – Matemática. vol. I, 1995a. . SEE. Programa para o ensino fundamental (5ª a 8ª série) – Matemática. vol.I I, 1995b. . Diretrizes curriculares de Matemática. 2004. SEE. Belo Horizonte, 2004. Disponível em: www.educacao.mg.org.br. Acesso em: 5 mar. 2011. NICK, Eva; KELLNER, Sheilah R. de O. Fundamentos de estatística para as ciências do comportamento. 2 ed. Rio de Janeiro: Renes. 1971. PEREIRA MENDOZA, L; SWIFT, J. Porquê ensinar estatística e probabilidades. Educação e Matemática (9), 17-19. 1989. PESTANA, D. D; VELOSA, S. F. Introdução à Probabilidade e à Estatística. Fundação Calouste Gulbenkian, Lisboa, Volume I. 2002. PONTE, J.P; MATOS, J.M; ABRANTES, P. Investigação em Educação Matemática. Lisboa: IIE. 1998. STUART, M. Changing the Teaching of Statistics. The Statistician, 44(1), 45-54. 1995. TRIOLA, Mário F. Introdução à Estatística. LTC. 10 ed 2008. WADA, R. S. Estatística e ensino: um estudo sobre representações de professores do 3o grau. Tese de Doutorado. Universidade Estadual de Campinas, Campinas, São Paulo. 1996. IPEMIG - Instituto Pedagógico de Minas Gerais www.ipemig.com.br (31) 3484-4334 - (31) 8642-1801 "IPEMIG – Conhecimento que transforma" 69 ANEXOS Anexo 01- Estatística Descritiva 1. Estatística Dedutiva ou Descritiva Consiste na recolha, apresentação, análise e interpretação de dados numéricos, através da criação de instrumentos adequados: quadros, gráficos e indicadores numéricos (Reis, 1996). Portanto, a Estatística Descritiva visa somente descrever e analisar um certo grupo (amostra) sem daí retirar conclusões ou inferências sobre a população da qual foi retirado esse grupo (Barreiros, 1984). Face aos resultados de experiências e da observação dos processos naturais, a questão básica que se põe é quase sempre, a seguinte: como resumir os aspectos essenciais dos dados? Será que existem regularidades, tendências, ciclos, concentrações,..., padrões, dignos de nota nos dados? Mas, por vezes, dada a enorme quantidade de dados disponíveis, a questão central é: como resumir os dados de forma que a informação neles contida possa ser facilmente comunicada e assimilada? É este o papel da Estatística Descritiva (Vairinhos, 1996). Sin.: Análise de Dados (Vairinhos, 1996). 2. Tipos de dados A interpretação das listas de números a olho é muito difícil. Ao invés disso, nós deveríamos produzir um resumo verbal ou numérico e/ou usar métodos gráficos para descrever os pontos principais dos dados. O método mais apropriado dependerá da natureza dos dados, e aqui podemos distinguir dois tipos principais: 1. Dados qualitativos ou categóricos que podem ser: 1. nominais, por exemplo sexo: masculino, feminino classificação de fósseis 2. ordinais, i.e. categorias ordenadas, tais como salinidade: baixa, média, alta abundância: dominante, abundante, frequente, ocasional, raro 2. Dados quantitativos ou numéricos que podem ser: 1. discretos, i.e. contagens ou número inteiros, por exemplo número de ovos postos pela tartaruga marinha número de ataques de asma no ano passado 2. contínuos, i.e. medidas numa escala contínua, tais como volume, área, peso, massa velocidade de corrente IPEMIG - Instituto Pedagógico de Minas Gerais www.ipemig.com.br (31) 3484-4334 - (31) 8642-1801 "IPEMIG – Conhecimento que transforma" 70 As distinções são menos rígidas do que a descrição acima insinua. Por exemplo, em geral nós trataríamos idade como uma variável contínua, mas se a idade for registrada pelo ano mais próximo, podemos trata-la como discreta, e se separarmos a amostra em ``crianças”, ``adultos jovens”, ``idade média”, ``velhos”, por exemplo, então temos faixa etária como uma variável ordenada categórica. No entanto, em geral é recomendado manter os dados em sua forma original, categorizando os dados somente para propósitos de apresentação. 2.2 Dados qualitativos Para sumarizar dados qualitativos numericamente, utiliza-se contagens, proporções, percentagens, taxas por 1000, taxas por 1.000.000, etc, dependendo da escala apropriada. Por exemplo, se encontrarmos que 70 de 140 estudantes de geologia são homens, poderíamos relatar a taxa como uma proporção (0.5) ou provavelmente ainda melhor como um percentual (50%). Se encontrarmos que 7 de uma amostra de 5000 pessoas são portadores de uma doença rara poderíamos expressar isto como uma proporçãoobservada (0.0014) ou percentual (0.14%), mas melhor seria 1.4 casos por mil. 2.2.1 Tabulando dados Frequentemente o primeiro passo da descrição de dados é criar uma tabela de frequência. Por exemplo, as espécies de “woodlice” caindo numa armadilha foram: Num relatório, a segunda coluna não seria mostrada, e os dados seriam sumarizados num formato mais simples como mostrado abaixo. Se o maioria dos dados caem em poucas categorias, então é conveniente colapssar algumas das categorias com somente uma ou duas observações em outra categoria chamada “outros”. Table showing the species of 27 woodlice that fell in a pit-fall trap: Tabelas simples como esta são na maioria das vezes suficientes para descrever dados qualitativos especialmente quando existem somente duas ou três categorias. 2.2.2 Resumindo numericamente IPEMIG - Instituto Pedagógico de Minas Gerais www.ipemig.com.br (31) 3484-4334 - (31) 8642-1801 "IPEMIG – Conhecimento que transforma" 71 IPEMIG - Instituto Pedagógico de Minas Gerais www.ipemig.com.br (31) 3484-4334 - (31) 8642-1801 "IPEMIG – Conhecimento que transforma" Considere o seguinte conjunto de dados que mostra os escores de abundância médios DAFOR de ocorrência de Nardus stricta em 100 áreas investigadas em Exmoor. A moda de um conjunto de dados categóricos é a categoria que tem o maior percentual de dados. Ela deve ser usada cuidadosamente como uma medida resumo global porque é muito dependente da forma como os dados são categorizados. Para os dados de “woodlice” a moda é Oniscus. Para os dados acima, a categoria modal é “Abundante”, mas por muito pouco. A mediana, bem como a moda, podem ser calculadas para dados ordenados. Este é valor do “meio”, mais comumente usado para dados quantitativos. A mediana não faz sentido para os dados “woodlice”. Para os dados de abundância, a categoria mediana é “Frequente”, porque 50% dos dados estão em categorias superiores, e menos do que 50% estão em categorias inferiores. A mediana é mais robusta do que a moda pois é menos sensível à categorização adotada. 2.2.3 Gráficos de Barras Dados qualitativos, particularmente quando as categorias são ordenadas, são usualmente bem ilustrados num simples gráfico de barras onde a altura da barra é igual à frequência. 2.2.4 Gráfico de setores Gráfico de setores também podem ser úteis para apresentação de dados categóricos ordenados. Os setores do gráfico são desenhados de tal forma que eles tenham área proporcional à frequência. Então para os dados “woodlice”, os ângulos seriam para Oniscus, etc. 72 IPEMIG - Instituto Pedagógico de Minas Gerais www.ipemig.com.br (31) 3484-4334 - (31) 8642-1801 "IPEMIG – Conhecimento que transforma" 2.3 Dados quantitativos 2.3.1 Histograma De longe o método mais comum de apresentação de dados numéricos é o histograma, relacionado com o gráfico de barras para dados categóricos. As áreas dos retângulos resultantes devem ser proporcionais à frequência. Algumas vezes é conveniente agregar classes de frequência nos extremos da distribuição de forma que os intervalos têm larguras diferentes. Cuidado ao fazer isso - um intervalos que é duas vezes a largura de um outro deve tem altura igual à metada de sua frequência (para preservar a área contida dentro do intervalo) Da mesma forma um intervalo que é três vezes a largura dos outros deve ter um terço da altura de sua frequência observada. Exemplo. 150 peixes mortos foram encontrados vítimas de contaminação do rio e seus comprimentos foram medidos em milímetros. As medidas foram expressas na forma de tabela de frequência. O histograma construído desses dados é mostrado abaixo. 73 IPEMIG - Instituto Pedagógico de Minas Gerais www.ipemig.com.br (31) 3484-4334 - (31) 8642-1801 "IPEMIG – Conhecimento que transforma" Gráfico de Ramos-e-Folhas Um método gráfico que merece ser mais amplamente utilizado quando a quantidade de dados não é muito grande é o gráfico de ramos-e-folhas como ilustrado a seguir. Exemplo. Um estudo geoquímico realizado utilizando amostras compostas de sedimentos de corrente com granulometria de 100-150 mesh e profundidade de 40cm, provenientes de riachos correndo sobre granulitos, revelou os seguintes resultados em ppm de Cr Uma vez que a escala tenha sido determinada, a qual define os “ramos” à esquerda da linha vertical, podemos facilmente escrever os dados no gráfico de ramos-e- folhas como no diagrama esquerdo; como um refinamento podemos então ordenar as ``folhas” no diagrama à direita: 9 4 10 6 0 11 5 4 1 8 12 5 9 6 0 13 7 0 7 6 5 74 IPEMIG - Instituto Pedagógico de Minas Gerais www.ipemig.com.br (31) 3484-4334 - (31) 8642-1801 "IPEMIG – Conhecimento que transforma" 14 1 3 0 7 15 2 4 8 8 16 5 6 6 17 4 0 18 2 4 9 4 10 0 6 11 1 4 5 8 12 0 5 6 9 13 0 5 6 7 7 14 0 1 3 7 15 2 4 8 8 16 5 6 6 17 0 4 18 2 4 Acima os ramos são números inteiros e as folhas são valores depois do ponto decimal, mas isto não é essencial em geral; por exemplo, os ramos podem representar centenas e as folhas dezenas (com unidades arredondadas para o decimal mais próximo; as folhas devem ter um único dígito). Nota: é importante escrever as folhas em colunas igualmente espaçadas, caso contrário pode resultar uma figura distorcida. O gráfico de ramos-e-folhas fornece um resumo visual dos dados sem que haja de fato a perda de qualquer informação. Compare-o com um histograma para os mesmos dados: 75 IPEMIG - Instituto Pedagógico de Minas Gerais www.ipemig.com.br (31) 3484-4334 - (31) 8642-1801 "IPEMIG – Conhecimento que transforma" 2.3.2 Resumindo numericamente Para resumir numericamente dados quantitativos o objetivo é escolher medidas apropriadas de locação (“qual o tamanho dos números involvidos?”) e de dispersão (“quanta variação existe?”) para os tipos de dados. Existem três escolhas principais para a medida de locação, a chamada “3 Ms”, as quais estão ligadas a certas medidas de dispersão como segue: 2.3.3 Média, variância e desvio padrão Para resumir dados quantitativos aproximadamente simétricos, é usual calcular a média aritmética como uma medida de locação. Se são os valores dos dados, então podemos escrever a média como onde ` ' e frequentemente é simplificada para ou até mesmo que significa `adicione todos os valores de '. 76 IPEMIG - Instituto Pedagógico de Minas Gerais www.ipemig.com.br (31) 3484-4334 - (31) 8642-1801 "IPEMIG – Conhecimento que transforma" A variância é definida como o „desvio quadrático médio da média' e é calculada de uma amostra de dados como A segunda versão é mais fácil de ser calculada, embora muitas calculadoras têm funções prontas para o cálculo de variâncias, e é raro ter que realisar todos os passos manualmente. Comumente as calculadoras fornecerão a raiz quadrada da variância, o desvio padrão, i.e. a qual é medida nas mesmas unidades dos dados originais. Uma informação útil é que para qualquer conjunto de dados, pelo menos 75% deles fica dentro de uma distância de 2 desvio padrão da média, i.e. entre e . Exemplo. Sete homens foram pesados, e os resultados em kg foram: 57.0, 62.9, 63.5, 64.1, 66.1, 67.1, 73.6. A média é , a variância é e o desvio padrão é . 2.3.4 A mediana e a amplitude inter-quartis Uma outra forma de sumarizar dados é em termosdos quartis ou percentis. Essas medidas são particularmente úteis para dados não simétricos. A mediana (ou percentil 50) é definida como o valor que divide os dados ordenados ao meio, i.e. metade dos dados têm valores maiores do que a mediana, a outra metade tem valores menores do que a mediana. Adicionalmente, os quartis inferior e superior, Q1 e Q3, são definidos como os valores abaixo dos quais estão um quarto e três quartos, respectivamente, dos dados. Estes três valores são frequentemente usados para resumir os dados juntamente com o mínimo e o máximo. Eles são obtidos ordenando os dados do menor para o maior, e então conta-se o número apropriado 77 de observações: ou seja é , e para o quartil inferior, mediana e quartil superior, respectivamente. Para um número par de observações, a mediana é a média dos valores do meio (e analogamente para os quartis inferior e superior). A medida de dispersão é a amplitude inter-quartis, IQR Q3 Q1, i.e. é a diferença entre o quartil superior e o inferior. Exemplo. O número de crianças em 19 famílias foi 0, 1, 1, 2, 2, 2, 2, 2, 3, 3, 3, 4, 4, 5, 6, 6, 7, 8, 10 A mediana é o (19+1) / 2 = valor, i.e. 3 crianças. O quartil inferior e superior são os valores e , i.e. 2 e 6 crianças, portanto amplitude inter-quartil é de 4 crianças. Note que 50% dos dados estão entre os quartis inferior e superior. 2.3.5 Box-and-Whisker Plots Box-and-Whisker plots ou simplesmente box-plots são simples representações diagramáticas dos cinco números sumários: (mínimo, quartil inferior, mediana, quartil superior, máximo). Um box-plot para os dados geoquímicos fica como mostrado a seguir. 2.3.6 A moda Nem todos os conjuntos de dados são suficientemente balanceados para o cálculo da média ou mediana. Algumas vezes, especialmente para dados de contagem, um único valor domina a amostra. A medida de locação apropriada é então a moda, a qual é o valor que ocorre com maior frequência. A proporção da amostra a qual toma este valor modal deveria ser utilizada no lugar de uma medida formal de dispersão. Algumas vezes, podemos distinguir claramente „picos' na frequência dos valores registrados. Neste caso (chamado bimodal) deveríamos apresentar ambas as localizações. Dados deste tipo são particularmente difíceis de resumir (e analisar). Exemplo. Dez pessoas registraram o número de copos de cerveja que eles tomaram num determinado sábado: 0, 0, 0, 0, 0, 1, 2, 3, 3, 6 A moda é 0 copos de cerveja, a qual foi obtida pela metade da amostra. Poderíamos adicionar mais informação separando a amostra e dizendo que daqueles que tomaram cerveja a mediana foi de 3 copos. 2.4 Dados múltiplos Os resultados de um estudo tipicamente envolverão mais do que uma única amostra de dados como discutido até aqui. Representações gráficas são úteis para comparar grupos de dados ou para verificar se existem relações entre eles. Existem muitas possibilidades, mas a mais adequada dependerá das peculiaridades de cada conjunto de dados. Além dos exemplos abaixo, podemos criar combinações de métodos já discutidos. Por exemplo, se medirmos as alturas e pesos de uma amostra de pessoas, podemos produzir box-plots de altura lado a lado para homens e mulheres, ou gráficos ramo-e-folhas lado a lado (com as alturas dos homens à esquerda do ramo, IPEMIG - Instituto Pedagógico de Minas Gerais www.ipemig.com.br (31) 3484-4334 - (31) 8642-1801 "IPEMIG – Conhecimento que transforma" 78 IPEMIG - Instituto Pedagógico de Minas Gerais www.ipemig.com.br (31) 3484-4334 - (31) 8642-1801 "IPEMIG – Conhecimento que transforma" e as alturas das mulheres à direita), ou um histograma acima do outro (com a mesma escala no eixo x de forma que eles possam ser facilmente comparados). Para um número diferente de grupos, uma série de box-plots verticais funciona bem como um simples resumo dos dados. Para combinações de dados categóricos, uma série de gráficos de setores podem ser produzidos, i.e. dois gráficos de setores, um para homens e um para mulheres. 2.4.1 Gráficos de pontos Para avaliar se existe uma relação entre duas variáveis contínuas, podemos produzir um gráfico de pontos. É importante que o eixo x faça sentido. Em geral faz pouco sentido unir os pontos, exceto onde o eixo x representa tempo (veja abaixo). Símbolos diferentes podem ser usados para diferentes grupos para adicionar uma nova dimensão ao gráfico. O gráfico abaixo mostra alturas e pesos de estudantes do sexo masculino e feminino. Para mais do que duas variáveis, pode-se produzir gráficos entre todos os pares possíveis para produzir uma matriz de gráficos de pontos. 2.4.2 Gráfico temporal Um caso especial de um gráfico de pontos é um gráfico temporal onde „tempo' está no eixo x. As medidas são feitas ao longo do tempo. Nestes casos é usual unir pontos sucessivos por retas, e é em geral uma boa prática deixar o eixo x mais longo do que o eixo y. Abaixo mostramos as temperaturas diárias médias em Philadelphia, USA nos dois primeiros meses de 1980. 79 2.4.3 Ladder plot O ladder plot não é um gráfico do tipo padrão mas pode ser útil para visualizar dados pareados. Considere o seguinte exemplo. Um ornitologista deseja saber se um determinado local é usado por pássaros migratórios de uma certa raça para engorda antes de migrar. Ele captura alguns pássaros em Agosto e pesa-os, então em Setembro ele tenta re-capturar os mesmos pássaros e faz novas medidas. Ele re-capturou 10 dos pássaros duas vezes, ambos em Agosto e Setembro. A tabela abaixo mostra as massas desses pássaros. O ladder plot destes dados fica como segue: É muito mais fácil ver do gráfico do que da tabela que os pássaros tendem a engordar, e que aqueles que não engordaram tenderam a ser os maiores que provavelmente não necessitam de uma engorda extra. IPEMIG - Instituto Pedagógico de Minas Gerais www.ipemig.com.br (31) 3484-4334 - (31) 8642-1801 "IPEMIG – Conhecimento que transforma" 80 IPEMIG - Instituto Pedagógico de Minas Gerais www.ipemig.com.br (31) 3484-4334 - (31) 8642-1801 "IPEMIG – Conhecimento que transforma" Disponível em: http://leg.ufpr.br/~paulojus/CE003/ce003/node2.html. Acesso em: 4 abr. 2011. 2.5 Exercícios 1 1. Descreva de forma concisa os seguintes dados usando suas palavras e algumas estatísticas descritivas, apontando características principais observadas. 1. As notas (de um total de 100 e ordenadas por tamanho) de 20 estudantes de estatística no primeiro exame do semestre: 30 35 37 40 40 49 51 54 54 55 57 58 60 60 62 62 65 67 74 89 2. O número de faltas de 20 trabalhadores num ano (ordenados por tamanho): 0 0 0 0 0 0 0 1 1 1 2 2 3 3 4 5 5 5 8 45 3. O número de exemplares de um jornal mensal em particular lidos por 20 pessoas num ano: 0 1 11 0 0 0 2 12 0 0 12 1 0 0 0 0 12 0 11 0 2. Produza um gráfico ramos-e-folhas para apresentação dos dados de altura (em metros) de 20 mulheres sendo estudadas para uma certa condição médica. 1.52 1.60 1.57 1.52 1.60 1.75 1.73 1.63 1.55 1.63 1.65 1.55 1.65 1.60 1.68 2.50 1.52 1.65 1.60 1.65 3. Os dados a seguir fornecem a concentração de um determinado poluente (ppm) em 8 pontos de um afluente medidos antes e uma hora depois de um acidente ambiental: 81 Faça um gráfico destes dados, e use o gráfico para ajudar a avaliar se o acidente provocou um aumento significativo nos níveis do poluente no afluente. 4. A tabela abaixo fornece o número de grânulos de arenito por cm em 20 amostras tomadas de uma certa localidade (A) e 20 amostrastomadas de uma outra localidade (B). 1. Calcule as médias e desvios-padrão desses duas amostras. 2. Faça histogramas dos dois conjuntos de dados, e compare-os. 3. Qual é o mínimo, máximo, mediana, quartil inferior e quartil superior de cada grupo? 4. Usando sua resposta ao item (c), construa boxplots para os dois conjuntos de dados - um diretamente acima do outro, ou lado a lado para facilitar a comparação. 5. Para cada grupo, o dado é aproximadamente simétrico ou assimétrico? Se assimétrico, em que direção? 6. Você acha que existe uma diferença real entre os números de grânulos de arenito nas duas localidades, ou você acha que as diferenças observadas poderiam ter simplesmente ocorrido como uma consequência dos grupos consistirem de somente 20 amostras cada? IPEMIG - Instituto Pedagógico de Minas Gerais www.ipemig.com.br (31) 3484-4334 - (31) 8642-1801 "IPEMIG – Conhecimento que transforma" 82 IPEMIG - Instituto Pedagógico de Minas Gerais www.ipemig.com.br (31) 3484-4334 - (31) 8642-1801 "IPEMIG – Conhecimento que transforma" 7. Descreva as principais características dos dados em uma ou duas sentenças. 5. O percentual de açúcar e sal em 9 cereais matinais mais populares foram medidos, com os seguintes resultados: 1. Faça um gráfico desses dados para investigar a relação entre o conteúdo de açúcar e sal nos cereais matinais. 2. Comente brevemente qualquer padrão observado nos dados. Anexo 02 – Estatística Indutiva (ou Inferencial), Estatística Matemática, Inferência Estatística ou Estatística Analítica É o conjunto de técnicas, assentes na teoria das probabilidades, que permitem construir proposições de caráter probabilístico acerca da população, partindo da observação de alguns dos seus elementos (amostra) (Vairinhos, 1996). A indução é, segundo a lógica filosófica, a operação mental que parte de um certo número de observações ou experiências, para a proposição geral, a lei (Sobral & Barreiros, 1980). Assim, os métodos de inferência estatística envolvem o cálculo de estatísticas, a partir das quais se infere sobre os parâmetros da população, isto é, permitem com determinado grau de probabilidade, generalizar à população certas conclusões, por comparação com os resultados amostrais (Reis et al., 1997a). Na Inferência Estatística ou Estatística Matemática a questão central é: como usar os dados para tentar obter conclusões acerca do todo ou população de onde são originários os dados (Vairinhos, 1996). Pretende-se conhecer algo sobre a população U, não sendo, em geral, possível o seu estudo exaustivo. A informação pretendida sobre U é então obtida a partir de uma observação limitada a uma amostra «conveniente». As amostras convenientes, permitindo inferências válidas para a totalidade do universo, são amostras aleatórias (Mello, 1997). Ou seja, o problema básico da Inferência Estatística é descobrir, face aos dados das observações, qual é a distribuição populacional, mais precisamente: qual é a distribuição da variável aleatória que caracteriza (define) a população 83 (Vairinhos, 1995). Em suma, inferir significa, portanto, deduzir como consequência, conclusão ou probabilidade. Os processos de inferência estatística introduzem ordem em qualquer tentativa para tirar conclusões da evidência fornecida por amostras. A lógica desses processos dita algumas das condições que devem reger a recolha de dados e as provas estatísticas dizem-nos quão grandes devem ser as diferenças (na amostra) para que possamos afirmar que elas representam realmente diferenças no grupo (população) do qual se extraiu a amostra para estudo. A Estatística Inferencial aborda dois tipos de problemas fundamentais: a) a estimação de parâmetros de uma população, e b) o teste de hipóteses (Siegel, 1975). IPEMIG - Instituto Pedagógico de Minas Gerais www.ipemig.com.br (31) 3484-4334 - (31) 8642-1801 "IPEMIG – Conhecimento que transforma" 84 Anexo 03 - Glossário de Termos da Estatística Amostra - é um subconjunto finito da população que se supõe representativo desta. Amostra Amodal - é uma amostra que não tem moda. Amostra Bimodal - é uma amostra que tem duas modas. Amostra Imparcial - é uma amostra em que todos os elementos tiveram igual oportunidade de fazer parte da mesma. Amostra Multimodal - é uma amostra que tem mais do que duas modas. Amostra Representativa - é aquela que deve conter em proporção todas as características qualitativas e quantitativas da população. Amostragem Aleatória Simples - é aquela em que qualquer elemento da população tem a mesma probabilidade de ser escolhido. Amostragem Estratificada - é aquela em que a população está dividida em estratos ou grupos diferenciados. Amostragem Sistemática - é aquela em que os elementos são escolhidos a partir de uma regra previamente estabelecida. Amplitude de um Conjunto de Dados - é a diferença entre o maior valor e o menor valor desse conjunto. Se os dados estiverem agrupados em classes, a amplitude é a diferença entre o limite superior da última classe e o limite inferior da primeira. Atributos Qualitativos - são atributos que estão relacionados com uma qualidade e apresentam-se com várias modalidades. Atributos Quantitativos - são atributos aos quais é possível atribuir uma medida e apresentam-se com diferentes intensidades ou valores. Censo - é um estudo estatístico que resulta da observação de todos os indivíduos da população relativamente a diferentes atributos pré-definidos. Classe Mediana ( ) - é a classe, para dados classificados, que contem a Mediana (neste caso considera-se como Mediana o valor da variável estatística que corresponde a n/2, quer n seja par, quer n seja ímpar). Classe Modal - é a classe, para dados classificados, que aparece com maior frequência. Coeficiente de Correlação Linear (r)- medida estatística que permite calcular o valor numérico correspondente ao grau de dependência entre duas variáveis, o qual varia entre -1 e 1. IPEMIG - Instituto Pedagógico de Minas Gerais www.ipemig.com.br (31) 3484-4334 - (31) 8642-1801 "IPEMIG – Conhecimento que transforma" 85 Correlação - é a relação ou dependência entre as duas variáveis de uma distribuição bidimensional. Correlação Fraca ou Nula - quando o Diagrama de Dispersão não permite o ajustamento de nenhuma reta, o que significa que r Diz-se, então, que não existe nenhuma relação entre as variáveis da Distribuição Bidimensional. Correlação Negativa Forte - quando a reta de regressão, obtida a partir do Diagrama de Dispersão, tem declive negativo. A correlação é negativa quando r varia entre -1 e 0 e será tanto mais forte quanto r se aproxima de -1. Correlação Negativa Perfeita ou Linear - quando a reta de regressão, obtida a partir do Diagrama de Dispersão, tem declive negativo com r Correlação Positiva Forte - quando a reta de regressão, obtida a partir do Diagrama de Dispersão, tem declive positivo. A correlação é positiva quando r varia entre 0 e 1 e será tanto mais forte quanto r se aproxima de 1. Correlação Positiva Perfeita ou Linear - quando a reta de regressão, obtida a partir do Diagrama de Dispersão, tem declive positivo com r Dados Classificados - são valores que uma dada variável pode tomar dentro de certo intervalo. Estes dados são classificados ou agrupados em classes. Dado Estatístico - é o resultado da observação de um atributo/variávelqualitativa ou quantitativa. Dados Simples - vão valores associados a uma dada variável e cuja representação é feita através de uma tabela. Definição do Problema - é a primeira fase do estudo estatístico e consiste na definição e formulação correta do problema a ser estudado. Desvio Médio ( d )- é a média aritmética do valor absoluto da diferença entre cada valor e a média, no caso dos dados não classificados. No caso dos dados classificados, tem que se entrar em conta com a frequência absoluta de cada observação. Desvio Padrão ( )- é a raiz quadrada positiva da variância. Diagrama de Dispersão - é a representação num referencial ortonormado de um conjunto de pares ordenados de valores (x , y), onde cada par ordenado corresponde a uma observação. Distribuição Bidimensional - é a representação de uma variável bidimensional (xi , xj), com 1 i n e xi e xj duas variáveis unidimensionais. IPEMIG - Instituto Pedagógico de Minas Gerais www.ipemig.com.br (31) 3484-4334 - (31) 8642-1801 "IPEMIG – Conhecimento que transforma" 86 Diagrama de Caule-e-Folhas - o mesmo que Separador de Frequências. Diagrama de Extremos e Quartis - é um diagrama que representa os valores extremos e os quartis de uma variável estatística. Distribuição de Frequências - o mesmo que Tabela de Frequências. Estatística - é o método que ensina a recolher, classificar, apresentar e interpretar um conjunto de dados numéricos. Estatística Descritiva - ramo da Estatística que tem por finalidade descrever certas propriedades relativas a um conjunto de dados. Estatística Indutiva - ramo da Estatística que procura inferir propriedades da população a partir de propriedades verificadas numa amostra da mesma. Fenómenos Independentes - são fenômenos respeitantes à mesma variável que não têm qualquer ligação um com o outro. Frequência Absoluta ( fi ) - é o número de vezes que o valor de determinada variável é observado. Frequência Absoluta Acumulada ( Fi )- é a soma das frequências absolutas anteriores com a frequência absoluta deste valor. Frequência Relativa ( fri ) - é o quociente entre a frequência absoluta do valor da variável e o número total de observações. Frequência Relativa Acumulada ( Fri )- é a soma das frequências relativas anteriores com a frequência relativa desse valor. Função Cumulativa - função que indica para cada valor real x a frequência absoluta (ou relativa) de observações com intensidade menor ou igual a x. A representação gráfica desta função é em forma de escada. Gráfico Circular - é representado por um círculo que está dividido em sectores cujas amplitudes são proporcionais à frequência que lhe corresponde. Gráfico de Barras - é constituído por barras, horizontais ou verticais, de comprimento proporcional à frequência. Histograma - é um gráfico de barras em que a área destas é proporcional à frequência, não havendo espaço entre as mesmas. Só se utiliza em variáveis quantitativas contínuas. Média Aritmética Simples ( ) - é o quociente da soma de todos os dados não classificados pelo número desses dados. IPEMIG - Instituto Pedagógico de Minas Gerais www.ipemig.com.br (31) 3484-4334 - (31) 8642-1801 "IPEMIG – Conhecimento que transforma" 87 IPEMIG - Instituto Pedagógico de Minas Gerais www.ipemig.com.br (31) 3484-4334 - (31) 8642-1801 "IPEMIG – Conhecimento que transforma" Média Aritmética Ponderada ( ) - é o quociente entre o somatório do produto de cada dado classificado pela sua frequência absoluta e o número desses dados. Mediana ( ) - é o valor da variável, para dados não classificados, que ocupa a posição central da distribuição. Medidas de Dispersão - é um conjunto de medidas (Amplitude, Variância e Desvio Padrão) utilizadas no estudo da variabilidade de uma determinada distribuição, permitindo obter uma informação mais completa acerca da “forma” da mesma. Medidas de Localização - é um conjunto de medidas (Média, Mediana, Moda e Quartis) que representam de uma forma global um conjunto de dados. Medidas de Tendência Central - o mesmo que Medidas de Localização. Moda (m )- observação que ocorre com maior frequência numa amostra. Nuvem de Pontos - o mesmo que Diagrama de Dispersão. Organização dos Dados - consiste em “resumir” os dados através da sua contagem e agrupamento. Pictogramas - são gráficos onde se utilizam figuras ou símbolos alusivos ao problema em estudo. Planificação do Problema - consiste na determinação de um processo para resolver o problema e, em especial, como obter informações sobra a variável em estudo. Polígono de Frequências - são gráficos com aspecto de linhas quebradas. Constroem-se unindo por segmentos de reta os pontos médios das bases superiores dos retângulos de um histograma. População - é um conjunto de seres com uma dada característica em comum e com interesse para o estudo. Quartis (Q1 e Q3)- são os valores que dividem a distribuição em quatro partes iguais. Recenseamento - o mesmo que Censo. Recolha de Dados - é a primeira etapa depois de definido o problema em estudo. Recta de Regressão - é a reta traçada sobre uma dada Nuvem de Pontos, sendo um modelo matemático que pretende descrever a relação existente entre duas variáveis unidimensionais de uma distribuição bidimensional. Relações Estatísticas - são relações que se podem estabelecer entre determinadas variáveis de um problema em estudo. 88 IPEMIG - Instituto Pedagógico de Minas Gerais www.ipemig.com.br (31) 3484-4334 - (31) 8642-1801 "IPEMIG – Conhecimento que transforma" Separador de Frequências - é um tipo de tabela que permite ter uma percepção imediata do aspecto global dos dados sem perda da informação contida na coleção dos dados inicial. Somatório ( - representa, de forma abreviada, uma soma. Sondagem - é o estudo estatístico que se baseia numa parte da população, isto é, em uma amostra que deve ser representativa dessa população. Tabela de Frequências - são tabelas onde se apresentam os dados por classes e as frequências respectivas. Tamanho da Amostra - é o número de elementos que constituem uma dada amostra. Unidade Estatística ou Indivíduo - é cada um dos elementos da população. Variância ( )- é a medida que permite avaliar o grau de dispersão dos valores da variável em relação à média. Variáveis Contínuas - são as variáveis que podem tomar qualquer valor de um determinado intervalo. Variáveis Discretas - são as variáveis que podem tomar um número finito ou uma infinidade numerável de valores. Variáveis Qualitativas - o mesmo que Atributos Qualitativos. Variáveis Quantitativas - o mesmo que Atributos Quantitativos. 89 IPEMIG - Instituto Pedagógico de Minas Gerais www.ipemig.com.br (31) 3484-4334 - (31) 8642-1801 "IPEMIG – Conhecimento que transforma" Anexo 04 - Fórmulas Amplitude Para um intervalo do conjunto de dados de [a,b], onde x1= a e xn= b Coeficiente de Correlação Linear (com n = nº de observações da amostra) Desvio Médio (com n = nº de observações da amostra) Dados não classificados Dados classificados Desvio Padrão (com n = nº de observações da amostra) Frequência Absoluta Acumulada (com n = nº de observações da amostra) 90 IPEMIG - Instituto Pedagógico de Minas Gerais www.ipemig.com.br (31) 3484-4334 - (31) 8642-1801 "IPEMIG – Conhecimento que transforma" Frequência Relativa (com n = nº de observações da amostra) Frequência Relativa Acumulada (com n = nº de observaçõesda amostra) Média Aritmética Simples (com n = nº de observações da amostra) Média Aritmética Ponderada (com n = nº de observações da amostra) Mediana (com n = nº de observações da amostra) n par n ímpar Quartis (com n = nº de observações da amostra) Quando o índice i dos xi é um número inteiro: n par: n ímpar: 91 IPEMIG - Instituto Pedagógico de Minas Gerais www.ipemig.com.br (31) 3484-4334 - (31) 8642-1801 "IPEMIG – Conhecimento que transforma" Quando o índice i dos xi não é um número inteiro, calculam-se como nos exemplos seguintes: Reta de Regressão (com n = nº de observações da amostra) onde Somatório onde gi(x) representa uma expressão, cuja variável é x, que varia consoante o índice i varia de 1 até n. Variância (com n = nº de observações da amostra) 92 IPEMIG - Instituto Pedagógico de Minas Gerais www.ipemig.com.br (31) 3484-4334 - (31) 8642-1801 "IPEMIG – Conhecimento que transforma" Avaliação 1) A inclusão da Estatística nos currículos da Educação Básica é uma realidade nas escolas e redes escolares preocupadas com um ensino de qualidade, tendo em vista as necessidades dos conhecimentos de Estatística em nosso cotidiano. Os principais livros didáticos de Matemática já destinam capítulos aos conteúdos de Estatística, num processo de adequação dessas obras às demandas por conhecimentos estatísticos. Nos Parâmetros Curriculares Nacionais (PCN), o ensino da Probabilidade e da Estatística, está inserido no contexto do bloco de conteúdos com nome de “Tratamento das Informações”, tendo como justificativa a demanda social e o frequente uso na sociedade contemporânea, pela necessidade de o indivíduo compreender as informações divulgadas, tomar decisões e fazer previsões que influenciam sua vida pessoal e em comunidade. Em sendo, podemos afirmar que os PCN ressaltam a questão da utilização da Estatística como: a) possibilitadora do desenvolvimento de formas específicas de pensamento e raciocínio, envolvendo fenômenos aleatórios, interpretando amostras, fazendo inferências e comunicando resultados por meio da linguagem própria quantitativa; b) possibilitadora do desenvolvimento de todas as formas de pensamento e raciocínio, envolvendo fenômenos aleatórios, interpretando amostras, fazendo inferências e comunicando resultados por meio da linguagem própria quantitativa; c) possibilitadora do desenvolvimento de formas específicas de pensamento e raciocínio, envolvendo fenômenos correspondentes, sem interpretação de amostras, fazendo inferências, sem comunicar os seus resultados; d) possibilitadora do desenvolvimento de formas específicas de pensamento e raciocínio, sem, no entanto, envolver fenômenos aleatórios, interpretando amostras, fazendo inferências e comunicando resultados por meio da linguagem própria quantitativa. 93 2) Atualmente, quase todos os meios de comunicação, como jornais, revistas, rádio, televisão e Internet lançam mão de modelos estatísticos como gráficos, diagramas, pictogramas, tabelas e pesquisas para integrar e enriquecer seus conjuntos de informações a serem divulgadas para a população. Grande parte desse público acaba não decifrando essa nova linguagem. E, sendo a Estatística, a ciência que permite, através de sua utilização, a descrição e interpretação de dados específicos das várias áreas de conhecimento, essa se constitui em uma poderosa ferramenta para a solução de problemas de fundamentação de decisões. É interessante fornecer aos alunos elementos que, uma vez possuídos, levam ao reconhecimento da importância de se dominar técnicas de análise de dados. Esses elementos começam com o conhecimento da linguagem estatística. Nesse sentido, vale destacar que a simbologia matemática foi, e ainda é, um fator de evolução das ideias matemáticas que se desenvolveram lentamente ao longo de séculos. Essa evolução tomou por base dois objetivos permanentes: a) tornar possível o aprendizado da matemática e levar a matemática a todos; b) tornar possível a comunicação matemática entre as pessoas, independentemente das nacionalidades e culturas e simplificar a expressão das ideias e pensamentos matemáticos; c) tornar possível a comunicação entre as pessoas e simplificar a expressão das ideias e pensamentos; d) Nenhumas das alternativas anteriores. 3) Os Parâmetros Curriculares Nacionais recomendam o trabalho com Estatística com a finalidade de que o estudante construa procedimentos para coletar, organizar, comunicar e interpretar dados, utilizando tabelas, gráficos e representações, e que seja capaz de descrever e interpretar sua realidade, usando conhecimentos matemáticos. Nesse sentido, para a formação de um cidadão pleno, a escola deve ensinar a estatística, objetivando: IPEMIG - Instituto Pedagógico de Minas Gerais www.ipemig.com.br (31) 3484-4334 - (31) 8642-1801 "IPEMIG – Conhecimento que transforma" 94 a) Desmistificar as pesquisas e estimular a capacidade de leitura e interpretação dos fatos. b) Desmentir as pesquisas e estimular a capacidade de leitura e interpretação dos fatos. c) Negar as pesquisas e estimulando ao não estudo das mesmas. d) Defender as pesquisas, estimulando a crença em sua eficácia. 4) Os Parâmetros Curriculares Nacionais recomendam o trabalho com Estatística com a finalidade de que o estudante construa procedimentos para coletar, organizar, comunicar e interpretar dados, utilizando tabelas, gráficos e representações, e que seja capaz de descrever e interpretar sua realidade, usando conhecimentos matemáticos. Em relação à Probabilidade, consideram que esta pode: a) promover a compreensão de grande parte dos acontecimentos do cotidiano que são de natureza certa e não ocasional, possibilitando a identificação de resultados possíveis desses acontecimentos; b) promover a compreensão de grande parte dos acontecimentos do cotidiano que são de natureza aleatória, possibilitando a identificação de resultados possíveis desses acontecimentos; c) promover a compreensão de uma pequena parte dos acontecimentos do cotidiano que são de natureza certa e não ocasional, possibilitando a identificação de resultados possíveis desses acontecimentos; d) promover a compreensão de grande parte dos acontecimentos do cotidiano que são de natureza incerta e ocasional, porém sem possibilitar a identificação de resultados possíveis desses acontecimentos. 5) Quanto à Combinatória, o objetivo é possibilitar ao aluno lidar com situações- problema que envolvam diferentes tipos de agrupamentos e possibilitem a compreensão do princípio multiplicativo da contagem. Com esses objetivos, os PCN elencam seus conteúdos, destacando-se, EXCETO: IPEMIG - Instituto Pedagógico de Minas Gerais www.ipemig.com.br (31) 3484-4334 - (31) 8642-1801 "IPEMIG – Conhecimento que transforma" 95 a) a leitura e interpretação de informações contidas em imagens e a coleta e organização de informações; b) a interpretação e elaboração de listas, tabelas simples, tabelas de dupla entrada e gráficos para comunicar a informação obtida; c) a construção de gráficos e tabelas com base em informações contidas em textos jornalísticos, científicos ou outros; d) a exploração da ideia de probabilidade em situações-problema, identificando insucessos possíveis, sucessos certose as situações de “falta de sorte”. 6) No Brasil, apesar da Estatística e as Probabilidades fazerem parte do currículo de Matemática do Ensino Médio antes dos anos 80, raramente eram ensinados. Segundo Ponte, Matos e Abrantes (1998) só depois dos anos 90 é que os alunos têm tido a oportunidade de aprender estes tópicos e, talvez por isso no que “se refere à Estatística e às Probabilidades, e conhecimentos, capacidades, dificuldades e estratégias de raciocínio dos alunos está essencialmente por fazer” (p. 171). Para Abrantes, Serrazina e Oliveira (1999), as competências que os alunos devem desenvolver incluem, EXCETO: a) a aptidão para a leitura e interpretação de textos; b) a organização e representação de dados; c) a aptidão para ler e interpretar tabelas e gráficos comunicando os resultados; d) a sensibilidade para distinguir fenômenos aleatórios e deterministas e interpretar situações concretas onde estes fenômenos estejam presentes. 7) Ao avaliar, devemos ter muito cuidado, pois os mecanismos de avaliação da Educação Básica têm sido uma das principais causas da situação de fracasso escolar que atinge uma parte considerável dos alunos. Nesse contexto, a avaliação torna-se sinônimo de classificar, selecionar e julgar a aquisição de conhecimentos e habilidades utilizando-se dos mesmos instrumentos para todos, o que, muitas vezes, é um grande erro, pois, exigir que todos os alunos, independente das diferenças psicossociais, apresentem o mesmo desempenho, é ignorar que cada pessoa tem o seu tempo para a aprendizagem, é dotada de identidade própria, visões de mundo e padrões culturais próprios, a serem considerados em práticas docentes e avaliativas, IPEMIG - Instituto Pedagógico de Minas Gerais www.ipemig.com.br (31) 3484-4334 - (31) 8642-1801 "IPEMIG – Conhecimento que transforma" 96 IPEMIG - Instituto Pedagógico de Minas Gerais www.ipemig.com.br (31) 3484-4334 - (31) 8642-1801 "IPEMIG – Conhecimento que transforma" tendo em vista uma apropriação efetiva e significativa do conhecimento. (Diretrizes para Avaliação da Aprendizagem, 2006). Para o aluno, uma avaliação deve representar seus ganhos e apontar onde estão suas dificuldades a fim de melhorar seu conhecimento; para o professor, ela deve levá-lo a perceber onde sua pedagogia é falha e, a partir dessa constatação, ele deve estar pronto para modificá-la. No artigo Diretrizes para Avaliação da Aprendizagem (2006), fala-se de uma avaliação formativa que foi construída por um grupo de professores de uma instituição educacional e não por pessoas externas a ela. Essa avaliação tem como principais características, EXCETO: a) é conduzida pelo professor e destina-se a promover a aprendizagem; b) leva em conta diferentes linguagens e estilos de aprendizagem e dá tratamento didático aos “erros”, considerando-os como informações diagnósticas; c) não inclui todas as atividades realizadas; d) os alunos exercem papel central, devendo atuar ativamente em sua própria aprendizagem. 8) Estatística é uma ciência exata que visa fornecer subsídios ao analista para coletar, organizar, resumir, analisar e apresentar dados. Trata de parâmetros extraídos da população, tais como média ou desvio padrão. A estatística fornece-nos as técnicas para extrair informação de dados, os quais são muitas vezes incompletos, na medida em que nos dão informação útil sobre o problema em estudo, sendo assim, é objetivo da Estatística extrair informação dos dados para obter uma melhor compreensão das situações que representam. Quando se aborda uma problemática envolvendo métodos estatísticos, estes devem ser utilizados: a) Somente após se recolher a amostra; b) Deve-se planejar a experiência que nos vai permitir recolher os dados; c) Deve-se tentar extrair o máximo de informação relevante para o problema em estudo, ou seja, para a população de onde os dados provêm; 97 d) Quando de posse dos dados, procura-se agrupá-los e reduzi-los, sob forma de amostra, deixando de lado a aleatoriedade presente. 9) Qualquer estudo científico enfrenta o dilema de estudo da população ou da amostra. Obviamente obter-se-ia uma precisão muito superior se fosse analisado o grupo inteiro, a população, do que uma pequena parcela representativa, denominada amostra. Observa-se que é impraticável na grande maioria dos casos, estudar a população por completo, em virtude de distâncias, custo, tempo, logística, entre outros motivos. A alternativa praticada nestes casos é o trabalho com uma amostra confiável. Se a amostra é confiável e proporciona inferir sobre a população, chamamos de inferência estatística. Para que a inferência seja válida, é necessária: a) Uma amostragem aleatória; b) Uma amostragem, livre de erros, tais como falta de determinação correta da população, falta de aleatoriedade e erro no dimensionamento da amostra; c) Uma amostragem livre de certos vícios, tais como, a aleatoriedade e o tamanho da mesma; d) Todas as alternativas anteriores. 10) Dentre as várias medidas de posição, qual das opções abaixo se relaciona com aquela que “é o valor que mais aparece”? a) Mediana. b) Média aritmética. c) Moda. d) Quartil. IPEMIG - Instituto Pedagógico de Minas Gerais www.ipemig.com.br (31) 3484-4334 - (31) 8642-1801 "IPEMIG – Conhecimento que transforma" 98 IPEMIG - Instituto Pedagógico de Minas Gerais www.ipemig.com.br (31) 3484-4334 - (31) 8642-1801 "IPEMIG – Conhecimento que transforma" GABARITO Nome do aluno: Matrícula: Curso: Data do envio: / / . Ass. do aluno: O ENSINO DE ESTATÍSTICA NA EDUCAÇÃO BÁSICA 1) 2) 3) 4) 5) 6) 7) 8) 9) 10)