Logo Passei Direto
Buscar
Material
páginas com resultados encontrados.
páginas com resultados encontrados.

Prévia do material em texto

<p>ESTATÍSTICA</p><p>Juliane Silveira Freire da Silva</p><p>Distribuições contínuas</p><p>de probabilidade</p><p>Objetivos de aprendizagem</p><p>Ao final deste texto, você deve apresentar os seguintes aprendizados:</p><p>� Comparar as principais distribuições contínuas de probabilidade.</p><p>� Identificar as características das distribuições contínuas.</p><p>� Usar a tabela da distribuição normal para encontrar probabilidade</p><p>desejada.</p><p>Introdução</p><p>Neste capítulo, você identificará quando uma variável em estudo segue um</p><p>modelo de distribuição contínua de probabilidade, conhecerá as principais</p><p>distribuições contínuas de probabilidade e aprenderá a utilizar a mais</p><p>importante de todas as distribuições em estatística: a distribuição normal.</p><p>Distribuições contínuas de probabilidade</p><p>Existem distribuições discretas e contínuas de probabilidade. No primeiro caso,</p><p>temos variáveis aleatórias discretas, ou seja, valores resultantes de contagens.</p><p>Então, no caso das distribuições discretas de probabilidade, podemos calcular</p><p>probabilidade do valor da variável que se quer investigar. Temos funções</p><p>matemáticas que fornecem essas probabilidades.</p><p>Porém, nas distribuições contínuas de probabilidade, estamos lidando com</p><p>variáveis aleatórias contínuas, ou seja, que resultam de uma medição. Nesses</p><p>casos, não temos valores únicos em uma escala, mas, sim, em intervalos, pois,</p><p>na variável aleatória contínua, podemos ter qualquer valor na reta dos reais.</p><p>Dessa forma, a função densidade de probabilidade (FDP), que terá uma</p><p>função matemática associada, necessitará uma integral para a resolução do</p><p>cálculo de probabilidade. Nesse caso, estamos calculando intervalos abaixo</p><p>de uma curva, como mostrado na Figura 1.</p><p>Figura 1. Curva de distribuição contínua.</p><p>Fonte: Freund (2006, p. 215).</p><p>Conforme podemos observar na Figura 1, para obtermos a probabilidade,</p><p>no caso da distribuição contínua, não podemos obtê-la em um ponto único,</p><p>mas apenas em intervalos, como em um intervalo entre os pontos e quaisquer</p><p>abaixo de uma curva. Concluímos, então, que, na distribuição contínua de</p><p>probabilidade, não existe probabilidade no ponto.</p><p>Matematicamente, a resolução dessas probabilidades se dá com a integração</p><p>da função da distribuição em estudo. Isso nem sempre é simples, pois nem</p><p>todas as integrações de funções de probabilidade são de fácil resolução. Para</p><p>isso, funções comumente utilizadas contêm tabelas para auxiliar no cálculo</p><p>de probabilidade.</p><p>Esse é o caso da distribuição normal, a mais importante distribuição de</p><p>probabilidade em estatística. É do pressuposto de normalidade dos dados que</p><p>muitas inferências são possíveis.</p><p>Mas, independentemente de estarmos estudando distribuições discretas</p><p>ou distribuições contínuas de probabilidade, alguns axiomas continuam va-</p><p>lendo, como: 0 ≤ f(x) ≤ 1 e a área total abaixo da curva sempre somarão 1 na</p><p>distribuição acumulada.</p><p>Características das distribuições contínuas</p><p>Veremos, aqui, as características de algumas distribuições de probabilidade</p><p>contínuas além da distribuição normal. Mais adiante, trataremos da distri-</p><p>buição de Gauss (normal), à qual, por ser a mais importante, daremos um</p><p>maior destaque.</p><p>Distribuições contínuas de probabilidade98</p><p>Para o caso da distribuição de probabilidade exponencial, segundo Doane</p><p>e Seward (2014), no modelo exponencial, o foco está no tempo de espera até o</p><p>evento subsequente: uma variável contínua. A função densidade de probabi-</p><p>lidade exponencial aproxima-se de zero à medida que o valor de x aumenta.</p><p>Isso é útil para calcular tempo de vida de alguns componentes.</p><p>f(x) = λe–λx se x ≥ 0</p><p>0 se x < 0</p><p>onde:</p><p>λ é a taxa média pelo tempo ou espaço;</p><p>x é o valor da variável aleatória que se quer obter a probabilidade.</p><p>Representamos a distribuição exponencial por x~Exp(λ), ou seja, a variável</p><p>x aproxima-se de uma distribuição exponencial de parâmetro λ, conforme</p><p>gráfico da Figura 2.</p><p>Figura 2. Distribuição exponencial.</p><p>Fonte: Adaptada de Portal Action (2017, documento on-line).</p><p>1.7</p><p>1.6</p><p>1.5</p><p>1.4</p><p>1.3</p><p>1.2</p><p>1.1</p><p>1.0</p><p>0.9</p><p>0.8</p><p>0.7</p><p>0.6</p><p>0.5</p><p>0.4</p><p>0.3</p><p>0.2</p><p>0.1</p><p>0.0</p><p>0.0 0.5 1.0 1.5 2.0 3.0 4.0 5.0 6.02.5 3.5 4.5 5.5</p><p>x</p><p>λ = 1/2</p><p>λ = 1</p><p>λ = 3/2</p><p>Fu</p><p>nç</p><p>ão</p><p>d</p><p>en</p><p>sid</p><p>ad</p><p>e</p><p>de</p><p>p</p><p>ro</p><p>ba</p><p>bi</p><p>lid</p><p>ad</p><p>e</p><p>99Distribuições contínuas de probabilidade</p><p>Temos, também, a distribuição de probabilidade de Laplace, também cha-</p><p>mada de exponencial dupla, pois, algumas vezes, é como se tivéssemos uma</p><p>exponencial positiva junto a uma exponencial negativa. Pode ser utilizada para</p><p>dados de modelagem em biologia e finanças. Tem por função a distribuição</p><p>de probabilidade:</p><p>f(x) = 1</p><p>2σ e , –∞ < x < ∞, –∞ < μ < ∞, –∞ < σ < ∞</p><p>|x – µ|</p><p>σ( )</p><p>onde:</p><p>𝜎 é o desvio-padrão;</p><p>μ é a média;</p><p>x é o valor da variável aleatória que se quer obter a probabilidade.</p><p>Representamos a distribuição Laplace por x~Laplace(μ, 𝜎), ou seja, a</p><p>variável x aproxima-se de uma distribuição Laplace de parâmetros μ e 𝜎. A</p><p>forma da distribuição de Laplace é semelhante à normal, porém com um pico</p><p>bem mais fino e acentuado, como na Figura 3.</p><p>Figura 3. Distribuição Laplace comparada à distribuição</p><p>normal.</p><p>Fonte: Suporte ao Minitab (c2017a, documento on-line).</p><p>Outra distribuição de probabilidade contínua de grande utilização é a</p><p>distribuição logística, utilizada mais largamente para dados demográficos e</p><p>de vendas, quando se investiga o crescimento. A função é definida por:</p><p>Distribuições contínuas de probabilidade100</p><p>f(x) = , –∞ < x < ∞, –∞ < μ < ∞, –∞ < σ < ∞</p><p>e</p><p>(x – µ)</p><p>σ–</p><p>( )(x – µ)</p><p>σ–σ 1 + e</p><p>2</p><p>𝜎 é o desvio-padrão;</p><p>μ é a média;</p><p>x é o valor da variável aleatória que se quer obter a probabilidade.</p><p>Representamos a distribuição logística por x~Logist(μ, 𝜎), ou seja, a variável</p><p>x aproxima-se de uma distribuição logística de parâmetros μ e 𝜎. A forma da</p><p>distribuição logística é semelhante à normal, porém com caudas mais longas,</p><p>como na Figura 4.</p><p>Figura 4. Distribuição logística.</p><p>Fonte: Suporte ao Minitab (c2017b, documento on-line).</p><p>Grá�co de distribuição</p><p>logística; Loc = 1</p><p>0,25</p><p>0,20</p><p>0,15</p><p>0,10</p><p>0,05</p><p>0,00</p><p>D</p><p>en</p><p>sid</p><p>ad</p><p>e</p><p>–50 50 75–25 250</p><p>x</p><p>Escala</p><p>1</p><p>5</p><p>10</p><p>Ainda temos a distribuição de pareto, utilizada para modelar fenômenos</p><p>sociais, físicos e econômicos. O princípio de pareto diz que aproximadamente</p><p>80% dos efeitos provêm de 20% das causas.</p><p>Além dessas distribuições citadas, ainda há outras tantas, como a distri-</p><p>buição beta, de Cauchy, de Maxwell, etc.</p><p>101Distribuições contínuas de probabilidade</p><p>Highlight</p><p>Distribuição normal</p><p>Como já mencionado, esta é a distribuição de probabilidade contínua mais</p><p>importante e utilizada dentro da estatística. Muito da inferência estatística</p><p>parte do pressuposto da normalidade dos dados, além, é claro, de grande parte</p><p>das variáveis encontradas seguir esse modelo de distribuição.</p><p>Essa distribuição tem como parâmetros a média que é uma medida de</p><p>posição e o desvio-padrão que é a medida de variabilidade. Então, o formato</p><p>dessa distribuição depende da variabilidade — quanto mais achatada for a</p><p>distribuição, maior será a variabilidade dos dados e, ao contrário, quanto mais</p><p>estreita for a distribuição, menor será a variabilidade. Já a média situa no eixo</p><p>em que os dados se concentram.</p><p>É com base na teoria da distribuição de probabilidade normal que podemos</p><p>estruturar testes de hipótese, estabelecer intervalos de confiança e calcular</p><p>tamanhos de amostra.</p><p>A função matemática que descreve a distribuição de probabilidade normal</p><p>é dada por:</p><p>f(x) = , –∞ < x < ∞, –∞ < μ < ∞, –∞ < σ < ∞</p><p>(x – µ)2</p><p>2σ2–1</p><p>√2�σ</p><p>e</p><p>Representamos a distribuição normal por x~N(μ, 𝜎), ou seja, a variável</p><p>x aproxima-se de uma distribuição normal de parâmetros μ (média) e 𝜎</p><p>(desvio-padrão).</p><p>O formato da distribuição normal é parecido com um sino. Por esse motivo,</p><p>alguns a chamam de distribuição em forma de sino, ou distribuição de Gauss</p><p>(Figura 5).</p><p>Veja, a seguir, as propriedades da distribuição normal.</p><p>� A distribuição normal é simétrica em torno da média (μ).</p><p>� A média, a moda e a mediana são iguais e localizam-se no pico mais</p><p>alto da distribuição.</p><p>� Quanto maior for o desvio-padrão, mais achatado será o gráfico da</p><p>distribuição normal.</p><p>� A área total abaixo da curva soma 1 (1 corresponde a 100%).</p><p>� Os parâmetros são a média (μ) e o desvio-padrão (𝜎).</p><p>� Não existe probabilidade menor do que zero, nem maior do que 1.</p><p>Distribuições contínuas de probabilidade102</p><p>Figura 5. Distribuição normal.</p><p>Fonte: Doane e Seward (2014, p. 254).</p><p>0,09</p><p>0,08</p><p>0,07</p><p>0,06</p><p>0,05</p><p>0,04</p><p>0,03</p><p>0,02</p><p>0,01</p><p>0,00</p><p>f(x</p><p>)</p><p>60 70 80 9065 75 85</p><p>FDP normal</p><p>Velocidade (milhas por hora)</p><p>Como se pode perceber, a resolução de uma integral para a FDP da normal</p><p>é bastante elaborada. Por esse motivo, fazemos uso de uma tabela para nos</p><p>auxiliar no cálculo de probabilidade.</p><p>Como a média e o desvio-padrão variam de variável para variável e só</p><p>temos uma tabela, estabeleceu-se, para fins de cálculo da tabela, que a média</p><p>seria igual a zero, e o desvio-padrão igual a 1. Claramente, na vida real, as</p><p>médias das variáveis não são iguais a 1, e o desvio-padrão também não é igual</p><p>a 0. Precisamos, então, antes de usarmos a tabela, padronizar a nossa variável</p><p>com a seguinte fórmula:</p><p>Z =</p><p>x – µ</p><p>σ</p><p>Padronizamos a variável x com sua média e seu desvio-padrão específicos</p><p>e transformamos na variável z com média 1 e desvio-padrão 0, para podemos</p><p>fazer uso da tabela da normal padrão.</p><p>Existe apenas uma tabela, porém existem apresentações distintas dela.</p><p>Em uma delas, é apresentada a área total abaixo da curva, sendo acumulada</p><p>de – ∞ até + ∞. A outra forma de apresentação é apenas com metade da curva</p><p>normal de 0 até + ∞. Veja o Quadro 1, a seguir.</p><p>103Distribuições contínuas de probabilidade</p><p>Quadro 1. Distribuição normal</p><p>Vamos utilizar um exemplo para aprendermos como encontrar as pro-</p><p>babilidades nessa tabela. Suponha uma financeira que empresta, em média,</p><p>R$ 2.000,00 para seus clientes com um desvio-padrão de R$ 900,00. Calcu-</p><p>laremos a probabilidade de a financeira emprestar menos de R$ 2.200,00 a</p><p>um cliente.</p><p>P(X < 2200) = P z < = P(z < 0,22)2200 – 2000</p><p>900( )</p><p>Observem que, até aqui, apenas fizemos a padronização da variável com</p><p>média de 2.000 e desvio-padrão de 900 em uma variável z com média 1 e</p><p>Distribuições contínuas de probabilidade104</p><p>desvio-padrão 0. Depois da padronização, precisamos observar a tabela para</p><p>encontrarmos a probabilidade.</p><p>Procuramos, na tabela, o cruzamento da linha com o 0,2 até a coluna do</p><p>0,02, que é a nossa segunda casa decimal. Nesse cruzamento, encontramos o</p><p>valor de 0,08706. Estamos trabalhando em uma tabela que tem apenas metade</p><p>da distribuição. Nesse caso, precisamos adicionar a outra metade que não</p><p>está na tabela a esse valor de probabilidade encontrado. A área de cálculo é</p><p>mostrada na Figura 6.</p><p>Figura 6. Área de cálculo da tabela apresentada.</p><p>Fonte: Freund (2006, p. 492).</p><p>0 z</p><p>P(X < 2200) = 0,08706 + 0,5 = 0,58706 = 58,71%</p><p>Agora queremos calcular a probabilidade de a financeira emprestar mais</p><p>de R$ 2.100,00. Primeiramente, vamos calcular a probabilidade de emprestar</p><p>menos de R$ 2.100,00.</p><p>( )P(X < 2100) = P z < = P(z < 0,11)2100 – 2000</p><p>900</p><p>Olhamos na linha do 0,1 até a coluna do 0,01 da tabela e encontramos o</p><p>valor de 0,04380. Para encontrar (P > 0,11) temos que fazer a subtração, pois</p><p>a tabela forneceu o valor de P(z < 0,11). Assim:</p><p>P(X > 2100) = 0,5 – 0,04380 = 0,45620</p><p>Se quisermos calcular a probabilidade de a financeira emprestar entre</p><p>R$ 2.100,00 e R$ 2.200,00, este seria o cálculo:</p><p>105Distribuições contínuas de probabilidade</p><p>P(2100 < X < 2200) =</p><p>P z < = 0,222200 – 2000</p><p>900( )</p><p>( )P z < = 0,112100 – 2000</p><p>900</p><p>Olhamos, na tabela, os valores referentes a essas duas padronizações e</p><p>encontramos, respectivamente, 0,08706 e 0,04380.</p><p>P(2.000 < X < 2.200) = 0,08706 – 0,0438 = 0,04326 = 4,33%</p><p>Vale ressaltar que, com a tabela normal com a área total abaixo da curva,</p><p>a utilização é diferente para encontrarmos a probabilidade.</p><p>Ainda como exemplo de distribuições contínuas de probabilidade, temos a</p><p>distribuição t-student (Figura 7). Ela tem uma curva muito semelhante à nor-</p><p>mal, também tem parâmetros de média e desvio-padrão, porém é influenciada</p><p>pelo tamanho da amostra. Quando n tende a infinito, a distribuição normal</p><p>e a distribuição t são equivalentes. A distribuição t-student é utilizada nos</p><p>casos em que temos amostras de tamanho inferior a 30 ou não conhecemos</p><p>o desvio-padrão populacional, quando a população tem distribuição aproxi-</p><p>madamente normal.</p><p>Figura 7. Distribuição t com 2 graus de liberdade.</p><p>Fonte: Suporte ao Minitab (c2017c, documento on-line).</p><p>Grá�co de distribuição</p><p>T; gl–2</p><p>0,4</p><p>0,3</p><p>0,2</p><p>0,1</p><p>0,0</p><p>–5,0 5,0 7,5–2,5 2,50,0</p><p>x</p><p>D</p><p>en</p><p>sid</p><p>ad</p><p>e</p><p>Distribuições contínuas de probabilidade106</p><p>DOANE, D. P.; SEWARD, L. E. Estatística aplicada à administração e economia. 4. ed. Porto</p><p>Alegre: AMGH, 2014.</p><p>FREUND, J. E. Estatística aplicada: economia, administração e contabilidade. 11. ed.</p><p>Porto Alegre: Bookman, 2006.</p><p>PORTAL ACTION. Distribuição exponencial. 2017. Disponível em: <http://www.porta-</p><p>laction.com.br/probabilidades/612-distribuicao-exponencial>. Acesso em: 3 jan. 2018.</p><p>SUPORTE AO MINITAB. Distribuição de Laplace. c2017a. Disponível em: <https://sup-</p><p>port.minitab.com/pt-br/minitab/18/help-and-how-to/probability-distributions-and-</p><p>random-data/supporting-topics/distributions/laplace-distribution/>. Acesso em:</p><p>3 jan. 2019.</p><p>SUPORTE AO MINITAB. Distribuição logística. c2017b. Disponível em: <https://support.mi-</p><p>nitab.com/pt-br/minitab/18/help-and-how-to/probability-distributions-and-random-</p><p>data/supporting-topics/distributions/logistic-distribution/>. Acesso em: 3 jan. 2019.</p><p>SUPORTE AO MINITAB. Selecione a distribuição e os parâmetros. c2017c. Disponível em:</p><p><https://support.minitab.com/pt-br/minitab/18/help-and-how-to/graphs/how-to/pro-</p><p>bability-distribution-plot/create-the-graph/select-the-distribution-and-parameters/#t>.</p><p>Acesso em: 3 jan. 2019.</p><p>107Distribuições contínuas de probabilidade</p>

Mais conteúdos dessa disciplina