Prévia do material em texto
ESTATÍSTICA 22 onde: μ = número médio da variável por unidade de exposição e = é um número irracional que representa a base do sistema de logaritmos naturais (é uma constante), com valor aproximada- mente igual a 2,71828. x! = fatorial do número de ocorrência do evento Em resumo temos: - Uma distribuição de probabilidade de uma variável aleatória define os valores de probabilidade de todas as possibilidades de ocorrência dessa variável aleatória X. - Quando a variável é aleatória, os valores de probabilidade são determinados por processos acidentais, ao acaso, que não estão sob o controle de nenhum observador. - Para a distribuição binomial, em cada tentativa existem ape- nas dois resultados possíveis mutuamente exclusivos, chamados de sucesso e fracasso. Cada tentativa caracteriza-se por ser um evento independente, permanecendo a probabilidade de sucesso de ocor- rência do evento constante de tentativa em tentativa, assim como a probabilidade de fracasso. - A probabilidade de sucesso é atribuída a “p”, e a probabili- dade de fracasso ou insucesso, representada por um “q”, é igual a (1 - p). - A probabilidade binomial determina a probabilidade de ocor- rência de “x” número de sucessos em “n” número de experimentos do evento, com probabilidade de sucesso igual a “p” e uma proba- bilidade de ocorrência de fracasso igual a “q”. - Nos cálculos de probabilidade é comum o uso de expressões como: “no mínimo”, “no máximo”, “pelo menos”, “menos de”, “mais de”. Como essas expressões indicam que mais de um resulta- do é possível, faz-se necessário o cálculo da probabilidade de cada evento separadamente e depois se somam esses valores. Por exem- plo, no máximo dois significa que o evento pode não ocorrer (P=0), ocorrer uma única vez (P=1) ou ainda ocorrer duas vezes (P=2); pelo menos cinco significa que o evento pode ocorrer cinco vezes, seis vezes, ... e tantos quantos o problema permitir. - Para poder aplicar a probabilidade binomial em situações de eventos dependentes, há a necessidade de haver reposição. - A distribuição de Poisson é utilizada quando a variável alea- tória está referida a uma unidade de exposição de tempo, de su- perfície ou de volume que possa assumir qualquer valor inteiro e positivo, ou seja, uma variável discreta, admitindo-se ser conhecido o valor médio da variável por unidade de exposição. - Ela é utilizada para descrever o comportamento de eventos com pequenas probabilidades de ocorrência. - A distribuição de Poisson é uma distribuição discreta de pro- babilidade de uma variável aleatória, cujo experimento consiste na contagem do número de vezes, x, que um evento ocorre em deter- minado intervalo, com igual probabilidade de ocorrência em cada intervalo, independendo o número de ocorrências em um intervalo do número de ocorrências em outros intervalos. - Aplica-se no fluxo de veículos, na previsão de acidentes, no uso de estoques por unidade de tempo, fluxo interno de pessoas em um ambiente, em qual não se tem o número total de elemen- tos, pois o fluxo é contínuo, não sendo possível determinar o limite populacional. - Em um cálculo de estoque, costuma-se utilizar Poisson, pois não há necessidade de haver a reposição de dados. Distribuição básica de probabilidade de variáveis contínuas Partindo da ideia de organização de intervalos de classe de va- riáveis contínuas, com determinada amplitude e com um número muito grande de dados, com a redução dessa amplitude e aumento do número de intervalos progressivamente, pode-se chegar a uma situação teórica de um número infinitamente grande de interva- los e amplitudes infinitamente pequenas. Dessa maneira, forma- -se uma linha contínua com a forma aproximada de um sino. Essa curva está ligada à história da descoberta das probabilidades em matemática, no século XVII. O responsável mais direto dessa curva, chamada normal, foi Abraham de Moivre, que a definiu em 1730, a partir dos trabalhos de Jacob e Nicolaus Bernoulli, da Lei dos Gran- des Números. Moivre publicou os seus trabalhos em 1773 na obra The Doctrine of chances. Assim, Laplace em 1783 a utilizou para descrever a distribuição dos erros e Gauss, 1809, a empregou para analisar dados astronômicos. Posteriormente Karl Pearson propôs o termo Distribuição Nor- mal para a curva normal desenvolvida por Moivre, na área da Esta- tística, e o nome de Curva de Gauss foi dado em homenagem a K. F. Gauss, que é aplicada em Matemática. Atualmente a curva normal representa um ganho para a ciên- cia, pois a normalidade ocorre naturalmente em muitas medidas de situações físicas, biológicas e sociais e é utilizada para fazer inferên- cias estatísticas. Assim, os modelos contínuos encontram importantes apli- cações na engenharia, nas ciências físicas, em finanças e ciências sociais. Alguns exemplos de fenômenos aleatórios contínuos são a altura, peso, tempo, como, por exemplo, tempo necessário de aten- dimento a clientes, ou na execução de tarefas etc. Nesse caso, a proporção da área incluída entre dois pontos quaisquer, debaixo da curva de probabilidade, identifica a probabi- lidade de que a variável aleatória contínua selecionada assuma um valor entre tais pontos. Características da Distribuição Normal A curva normal é definida como sendo simétrica e unimodal. Essa característica encontra-se na natureza quando o número de dados do universo analisado é relativamente grande e principal- mente com uma variável contínua. Nesse caso, a distribuição dos valores acontece em uma curva em forma de um sino, com um ponto máximo no centro, em que as áreas, em ambos os lados da média, são idênticas. ESTATÍSTICA 23 Essa situação simétrica é estabelecida porque os valores da média, mediana e moda são iguais. Como nem sempre essa situação acon- tece exatamente dessa forma, comumente usa-se também a expressão de distribuição aproximadamente normal, que se caracteriza por pequenas deformações, em que as medidas da média, moda e mediana não são mais iguais, mas com valores muito próximos. Para facilitar o uso da distribuição Normal, trabalha-se com uma curva normal padronizada, que, além das características já apresen- tadas, ainda assume que a curtose seja mesocúrtica, ou seja, com um pico mediano, nem muito empinado nem achatado. Uma curva normal padronizada baseia-se em parâmetros automaticamente definidos para qualquer escala de medida que for utiliza- da, sendo a média sempre zero e a variância igual a um. Para isso existem tabelas construídas para essa curva que mostram o percentual da população que se encontra em determinada faixa. Considerando essas características, a distribuição Normal é importante na estatística pelos seguintes aspectos: - Inúmeros fenômenos contínuos parecem segui-la ou poderem ser aproximados por meio dela; - Pode também ser usada como aproximação para distribuições de probabilidade discreta, em situações específicas; - Oferece a base para a inferência estatística clássica devido à sua afinidade com o teorema do limite central. - Em termos gerais, as características de uma Distribuição Normal padronizada podem ser resumidas da seguinte maneira: - Em termos de aparência, a curva é simétrica e tem o formato de um sino; - A reta que passa pelo ponto máximo divide a área da curva em duas partes exatamente iguais, em forma e tamanho; - As medidas de tendência central (média, mediana e moda) são idênticas; - A dispersão média é igual a 1,33 desvio-padrão. Isto significa que o intervalo interquartílico está contido dentro de um intervalo de dois terços de um desvio-padrão, abaixo da média aritmética e dois terços de um desvio-padrão, acima da média; - A área debaixo da curva é igual a 1 ou 100%; - Os valores encontrados abaixo da curva da distribuição Normal padronizada podem ser medidos em desvios-padrão e suas probabi- lidades por intervalo são as seguintes: + 1σ a - 1σ = 68,27% da área da curva; + 2σ a - 2σ = 95,44% da área da curva; + 3σ a - 3σ = 99,73% da área da curva. - A curva apresenta em ambos os ladosum ponto de inflexão que está a uma distância de (-1) desvio-padrão (s) e (+1) desvio-padrão (s)) da origem do centro da curva, onde a média, a mediana e a moda são coincidentes; - Na curva, ambos os lados se acercam cada vez mais ao eixo das abcissas, porém sem jamais tocá-lo; - Sua variável aleatória associada possui um intervalo infinito (-∞ 5 ou n.q > 5); - a aproximação melhora com o crescimento do número de ob- servações e no limite (infinito) as duas distribuições coincidem. Em resumo temos: Na natureza, quando o número de dados do universo analisado é relativamente grande e principalmente quando for de uma va- riável contínua, a distribuição dos dados apresenta uma curva com formato de um sino, com um ponto máximo no centro, em que as áreas, em ambos os lados da média, são idênticas. - A curva formada chama-se de curva normal, que é definida como sendo simétrica e unimodal, tendo como característica a igualdade entre as medidas: média, moda e mediana. - Quando as medidas, média, moda e mediana não são iguais, mas semelhantes, chama-se a distribuição de aproximadamente normal. - Pela distribuição normal padronizada, que apresenta como características uma curva simétrica e mesocúrtica, podem-se deter- minar valores de probabilidade e apresentá-los em tabelas que ex- pressam os valores da função densidade ou curva de probabilidade, com base na variável padronizada z. - Os valores da função densidade localizam-se abaixo da curva da distribuição e seu valor total é de 100%, localizando-se 50% à direita da média e 50% à sua esquerda. - Para determinar os valores de z, precisa-se dos valores da mé- dia, do desvio-padrão e do valor de Xi de referência. - Os valores de z, à direita da média, são positivos e os localiza- dos à esquerda, negativos. - Uma das alternativas é a determinação da probabilidade em função de Xi, sendo a média e o desvio-padrão conhecidos. - No cálculo do valor de z devem ser usados dois dígitos após a vírgula. - Os valores da probabilidade encontrados no Apêndice III refe- rem-se sempre ao intervalo entre o valor da média e o valor de Xi. - Para a solução do problema, existem várias possibilidades: o próprio valor encontrado na tabela, a soma ou subtração do valor da tabela de 0,5, a soma de 0,5 ao valor da tabela e subtração do valor menor do valor maior, encontrados na tabela. - Para facilitar a solução de problemas de probabilidade Nor- mal, recomenda-se sempre fazer o desenho da curva e indicar a área a ser conhecida. ESTATÍSTICA 25 - Outra alternativa é a determinação do valor de Xi em função da probabilidade desejada, conhecendo a média e o desvio-padrão. - Deve-se ter o cuidado para atribuir o sinal correto de z, pois os seus valores de z, à direita da média, são positivos e os localizados à esquerda, negativos. - Valores de variáveis discretas podem ser adaptados à distribuição normal, nas seguintes condições: número de observações ≥ 30; probabilidades de sucesso (p) e de fracasso (q) não serem muito próximas a zero e as médias de sucesso e de fracasso serem maiores do que cinco. - Na aproximação da Binomial à Normal deve-se fazer a correção de continuidade, pela soma ou subtração de 0,5 ao valor inteiro da variável discreta X (número de sucessos). Essa correção é necessária e deve ser feita de forma equitativa, pois entre dois números consecutivos da variável discreta há um es- paço vazio de uma unidade. - Os valores da média e do desvio-padrão são obtidos pelas fórmulas de cálculo das propriedades das variáveis discretas. Normalmente em concursos a banca traz os valores das tabelas na própria questão, visto que são muitos valores para serem memori- zados. Então não se preocupe com isso, o importante é o entendimento e como se faz os cálculos. Valor esperado Na tentativa de resumir o comportamento de uma variável aleatória vamos estudar uma medida que estuda a tendência central da variável aleatória, chamada de esperança ou valor esperado de uma variável aleatória.Para ilustrar os vários momentos em que lidamos com o valor esperado vamos apresentar alguns exemplos. Exemplos: 1) Em um restaurante quando pedimos nossa comida e perguntamos para o garçom quanto tempo leva para ficar pronto, ele vai nos fornecer um valor esperado, ou seja, o tempo médio em que a comida deve demorar a ficar pronta. 2) Quando estamos em um ponto de ônibus e perguntamos para a pessoa ao lado, quanto tempo leva até que o próximo ônibus ve- nha, ela prontamente vai nos dar o valor esperado, o qual ela conseguiu constatar depois de algum tempo de experiência. Nos exemplos acima o garçom e a pessoa que esperava no ponto de ônibus resumiram toda a informação de um modelo em um único número, o valor esperado. Nesta seção iremos estudar como se obter a esperança ou valor esperado de uma variável aleatória, estudare- mos algumas de suas propriedades, e também a função geradora de momentos, responsável por gerar todos os limites centrais. Propriedades do valor esperado Veremos algumas importantes propriedades do valor esperado de uma variável aleatória. Em cada caso, admitimos que todos os valores esperados mencionados, existem. P1. Se com uma constante real, então . De fato, se é uma variável aleatória discreta, temos que P2. Seja uma constante real e uma variável aleatória. Então, De fato, no caso discreto temos que De modo análogo, temos no caso contínuo, que P3. Sejam e duas variáveis aleatórias quaisquer. Então, De fato, no caso discreto, considere a função de probabilidade conjunta e e as funções de probabilidade marginais de e respectivamente. Então, temos que de onde segue que Portanto, concluímos que ESTATÍSTICA 26 Se e são variáveis aleatórias contínuas, considere a função densidade de probabilidade conjunta e e as funções densidade de probabilidade marginais de e respectivamente. Então ou seja, demonstrando o resultado. P4. Sejam variáveis aleatórias . Então, A demonstração deste caso é análoga a anterior. Basta fazer uma indução sobre . P5. Sejam e variáveis aleatórias independentes. Então, De fato, suponha que e são variáveis aleatórias independentes com função de probabilidade conjunta para o caso discreto ou função densidade de probabilidade conjunta para o caso contínuo. Como, por hipótese, e são independentes, temos do Teorema 3.1.2 que no caso discreto e do Teorema 3.2.1 que no caso contínuo. Desta forma, se e são variáveis aleatórias discretas independentes, temos que de onde segue que Analogamente, para o caso contínuo, temos que ou seja, demonstrando assim o resultado. P6. (Desigualdade de Jensen)Seja uma função convexa e uma variável aleatória integrável, ou seja, . Então temos que Ressaltamos que uma função é dita convexa se seu gráfico for convexo, ou seja, dado quaisquer pontos a reta que passa pelos pares ordenados e não intercepta o gráfico de em nenhum ponto no intervalo . Uma definição equivalente seria que para quaisquer e para todo temos que: De fato, se é uma função convexa então dado um par ordenado no gráfico de , temos que existe uma reta tal que a reta passa pelo ponto e deixa a curva toda acima dela, ou seja, existe um tal que . Então temos que Portanto, se aplicarmos o valor esperado em ambos os lados obtemos: