Prévia do material em texto
Praticando Estatística e Probabilidade 1. Itens iniciais Apresentação Praticar é fundamental para o seu aprendizado. Sentir-se desafiado, lidar com a frustração e aplicar conceitos são essenciais para fixar conhecimentos. No ambiente Praticando, você terá a oportunidade de enfrentar desafios específicos e estudos de caso, criados para ampliar suas competências e para a aplicação prática dos conhecimentos adquiridos. Objetivo Ampliar competências e consolidar conhecimentos através de desafios específicos e estudos de caso práticos. 1. Estudo de Caso Tomada de Decisão Baseada em Probabilidade Condicional Caso Prático Lucas é um gerente de marketing de uma empresa de tecnologia localizada em São Paulo. Recentemente, ele foi incumbido de lançar uma nova campanha publicitária para um produto inovador. Para isso, Lucas precisa decidir entre duas abordagens: uma campanha nas redes sociais ou uma campanha tradicional na televisão. A decisão precisa ser baseada em dados quantitativos sobre o comportamento dos consumidores, recolhidos ao longo do último ano. Lucas possui dados que indicam que a probabilidade de um consumidor adquirir o produto após ver a campanha nas redes sociais é de 0,7, enquanto a probabilidade de compra após ver a campanha na televisão é de 0,5. No entanto, ele também precisa considerar que a probabilidade de um consumidor ver a campanha nas redes sociais é de 0,4 e na televisão é de 0,6. Os dados mostram que, independentemente do meio, a probabilidade de compra é influenciada também pela satisfação prévia do consumidor com a marca, que é alta para 60% dos consumidores. Diante dessas informações, Lucas precisa tomar uma decisão estratégica sobre qual abordagem adotar, considerando que o orçamento permite investir em apenas uma das campanhas. Ele se encontra em uma situação complexa que exige uma análise detalhada dos dados disponíveis para maximizar as vendas. Considerando a situação descrita, qual abordagem Lucas deve escolher para a campanha publicitária? Utilize os conceitos de probabilidade condicional e independência discutidos nos materiais fornecidos para justificar sua decisão. Chave de resposta Para decidir qual abordagem Lucas deve escolher para a campanha publicitária, podemos calcular a probabilidade condicional de um consumidor adquirir o produto, dado que ele viu a campanha em uma das duas mídias disponíveis. Primeiro, a probabilidade de um consumidor adquirir o produto após ver a campanha nas redes sociais (P(B|A1)) é de 0,7, e a probabilidade de ver a campanha nas redes sociais (P(A1)) é de 0,4. A probabilidade de um consumidor adquirir o produto após ver a campanha na televisão (P(B|A2)) é de 0,5, e a probabilidade de ver a campanha na televisão (P(A2)) é de 0,6. Para encontrar a probabilidade total de compra para cada meio, multiplicamos as probabilidades: Para redes sociais: P(A1) * P(B|A1) = 0,4 * 0,7 = 0,28 Para televisão: P(A2) * P(B|A2) = 0,6 * 0,5 = 0,30 Embora a probabilidade de compra após ver a campanha seja maior nas redes sociais, a probabilidade total de compra é maior na televisão. Portanto, Lucas deve escolher a campanha na televisão, pois ela oferece uma probabilidade maior de alcançar consumidores que efetivamente comprem o produto. Esse cálculo mostra a importância de considerar não apenas a eficácia de cada abordagem, mas também a probabilidade de exposição dos consumidores a cada campanha. Além disso, a consideração da satisfação prévia com a marca pode ser um fator adicional a ser integrado em uma análise mais detalhada para ajustar as estimativas de sucesso das campanhas. No entanto, com base nos dados fornecidos, a televisão parece ser a escolha mais eficaz. Para saber mais sobre esse conteúdo, acesse: Tema: Probabilidade condicional e independência Tema: Análise de dados quantitativos 2. Desafios Análise de dados quantitativos Desafio 1 Você é um analista de dados em uma empresa de pesquisa de mercado e recebeu uma amostra de dados que precisa ser analisada para um relatório importante. A amostra é composta por valores expressos em uma mesma unidade e você deve calcular as principais medidas estatísticas para entender melhor o comportamento dos dados. Amostra: 36, 38, 26, 40, 40, 28, 46, 40, 38, 28 Com base nessa amostra, determine a veracidade das seguintes afirmações: A A média é igual à mediana. B A média é maior do que a moda. C Se retirarmos um dos valores da amostra, a média, necessariamente, será alterada. D A mediana é maior do que a moda. E A mediana é maior do que a média. A alternativa E está correta. A) A média é igual à mediana: Incorreta. A média é a soma dos valores dividida pelo número de valores. Calculando a média: A mediana é o valor central em um conjunto ordenado. Ordenando a amostra: 26,28,28,36,38,38,40,40,40,4626, 28, 28, 36, 38, 38, 40, 40, 40, 4626,28,28,36,38,38,40,40,40,46. Média A mediana, neste caso, é a média dos dois valores centrais (38 e 38), que é 38. Portanto, a média não é igual à mediana. B) A média é maior do que a moda: Incorreta. A moda é o valor que aparece com mais frequência na amostra. A moda é 40, pois aparece três vezes. A média é 36, que é menor que a moda. C) Se retirarmos um dos valores da amostra, a média, necessariamente, será alterada: Incorreta. A média será alterada se um valor for removido, mas o impacto pode ser pequeno dependendo do valor removido. Isso não garante que a mudança será significativa ou perceptível sem cálculos específicos. D) A mediana é maior do que a moda: Incorreta. A mediana é 38 e a moda é 40, logo a mediana não é maior que a moda. E) A mediana é maior do que a média: Correta. Como calculado anteriormente, a mediana é 38 e a média é 36. Portanto, a mediana é maior que a média. Para saber mais sobre esse conteúdo, acesse o módulo 2 Mediana (MD) "Disposto o conjunto de dados em ordem crescente ou decrescente, a mediana é o elemento que ocupa a posição central, isto é, divide o conjunto de dados em duas partes iguais, de forma que metade dos dados está acima e a outra metade está abaixo da mediana.” Modal (MO) “Moda é o valor mais frequente no conjunto de dados. Para determinar a moda nesse caso, basta ver o valor que mais se repete no conjunto de dados.” Desafio 2 Imagine que você é um pesquisador na área de estatística e está ensinando uma turma sobre os diferentes tipos de variáveis. Durante uma aula, você decide aplicar um exemplo prático onde os alunos precisam identificar o conceito de variável quantitativa discreta. Assinale a alternativa que apresenta corretamente o conceito de variável quantitativa discreta: A É aquela que expressa o valor de uma contagem, por exemplo, idade, quantidade de televisores numa casa, quantidade de habitantes de uma cidade. B É aquela que separa os indivíduos em classes com uma determinada ordem, por exemplo, nível de escolaridade: fundamental, médio e superior. C É aquela que expressa uma medida como um valor real, por exemplo, peso e altura. D É aquela que separa os indivíduos em classes, porém não é possível estabelecer uma ordem, por exemplo, sexo (masculino e feminino) e esporte praticado (futebol, basquete, ciclismo). E É aquela que não representa uma ordem natural, por exemplo, nomes, estado civil, sexo. A alternativa A está correta. A) É aquela que expressa o valor de uma contagem, por exemplo, idade, quantidade de televisores numa casa, quantidade de habitantes de uma cidade: Correta. Variáveis quantitativas discretas são aquelas que assumem valores contáveis, geralmente inteiros. Elas representam contagens distintas, como o número de filhos em uma família ou o número de carros em um estacionamento. B) É aquela que separa os indivíduos em classes com uma determinada ordem, por exemplo, nível de escolaridade: fundamental, médio e superior: Incorreta. Esta descrição refere-se a variáveis qualitativas ordinais, que classificam categorias com uma ordem específica. C) É aquela que expressa uma medida como um valor real, por exemplo,peso e altura: Incorreta. Isso descreve variáveis quantitativas contínuas, que podem assumir qualquer valor dentro de um intervalo. D) É aquela que separa os indivíduos em classes, porém não é possível estabelecer uma ordem, por exemplo, sexo (masculino e feminino) e esporte praticado (futebol, basquete, ciclismo): Incorreta. Esta descrição é de variáveis qualitativas nominais, que classificam os dados em categorias sem uma ordem intrínseca. E) É aquela que não representa uma ordem natural, por exemplo, nomes, estado civil, sexo: Incorreta. Isso também descreve variáveis qualitativas nominais, onde os valores não têm uma ordem natural. Para saber mais sobre esse conteúdo, acesse o módulo 1 Análise exploratória de dados “Variáveis são características de interesse em um estudo qualquer. Elas podem ser classificadas em: Quantitativas, quando assumem valores numéricos, e Qualitativas, quando seus possíveis valores não são numéricos. Dentro das quantitativas, distinguimos entre variáveis discretas, que assumem valores contáveis, e contínuas, que podem assumir qualquer valor dentro de um intervalo. Essa classificação é crucial para determinar o tipo de análise estatística a ser realizada, pois diferentes técnicas são aplicáveis a variáveis de diferentes tipos.” Desafio 3 Você é um consultor financeiro realizando uma pesquisa sobre os salários dos funcionários de uma empresa. Foram coletados os seguintes valores mensais: R$ 3.000, R$ 3.500, R$ 4.200, R$ 4.800 e R$ 25.000. Após a análise inicial, você precisa identificar um valor que pode ser considerado um outlier. Qual dos seguintes é o valor que mais provavelmente representa um outlier? A R$ 3.000. B R$ 3.500. C R$ 4.200. D R$ 4.800. E R$ 25.000. A alternativa E está correta. A) R$ 3.000: Incorreta. Este valor está próximo dos demais valores menores e não se destaca significativamente como um outlier. B) R$ 3.500: Incorreta. Assim como R$ 3.000, este valor está próximo dos outros valores menores e não é um outlier. C) R$ 4.200: Incorreta. Este valor também está dentro da faixa dos salários menores e não é atípico em relação aos outros valores menores. D) R$ 4.800: Incorreta. Este valor é maior que os outros valores menores, mas ainda não é atípico o suficiente para ser considerado um outlier. E) R$ 25.000: Correta. Este valor é significativamente maior do que os outros valores na amostra e, portanto, é considerado um outlier. Ele se destaca claramente e influencia a média de forma substancial. Para saber mais sobre esse conteúdo, acesse o módulo 1 Análise exploratória de dados “A análise exploratória de dados é a parte da estatística responsável pelo primeiro contato com as informações. Essa técnica nos dá um indicativo de como os dados estão distribuídos. Além disso, é útil na detecção de erros, de valores extremos (outliers), na verificação de suposições relacionadas à inferência estatística, na seleção preliminar de modelos estatísticos, entre outras utilidades.” Probabilidades Desafio 1 Imagine que você é um gestor de uma grande empresa e está analisando a eficiência dos equipamentos da sua companhia. Sua tarefa é determinar a probabilidade de que um equipamento escolhido aleatoriamente esteja inativo ou seja do tipo A. A tabela a seguir apresenta a distribuição dos equipamentos ativos e inativos por tipo. Com base nesses dados, qual é a probabilidade de que um equipamento selecionado aleatoriamente esteja inativo ou seja do tipo A? A 06/27 B 14/27 C 20/27 D 06/11 E 09/11 A alternativa B está correta. Para resolver essa questão, utilizamos a fórmula da probabilidade da união de dois eventos: . Precisamos somar a probabilidade de um equipamento estar inativo e a probabilidade de ser do tipo A, subtraindo a interseção (equipamentos inativos e do tipo A) para não contar duas vezes. Como: A) 06/27: Incorreta. Esta opção não está expressa em uma fração correta e é incoerente com os dados fornecidos. B) 14/27: Correta. Usando a fórmula da união de eventos, somamos as probabilidades individuais de estar inativo e de ser do tipo A, subtraindo a interseção, resultando em 14/27. C) 20/27: Incorreta. Esta opção ignora a subtração da interseção das probabilidades, resultando em um valor superior ao correto. D) 06/11: Incorreta. Esta opção não está expressa em uma fração adequada para representar probabilidades. E) 09/11: Incorreta. Esta opção também não está expressa corretamente em fração. Para saber mais sobre esse conteúdo, acesse o módulo 3 Regra da Adição "Na teoria dos conjuntos, a conjunção “ou” está relacionada à união de eventos. Consequentemente, na regra da adição, estamos interessados em determinar . Considere dois eventos quaisquer, digamos A e B: Desafio 2 Você é um analista esportivo responsável por prever os resultados de jogos de basquete. Sabe que a probabilidade de um jogador acertar um arremesso de três pontos é de 40%. Como essa informação é crucial para suas análises, qual é a probabilidade de esse jogador errar um arremesso de três pontos? A 10% B 20% C 40% D 60% E 90% A alternativa D está correta. Para calcular a probabilidade de erro, subtraímos a probabilidade de acerto de 1, uma vez que a soma das probabilidades de todos os resultados possíveis de um evento é igual a 1. Assim, = 1 - = 1 - 0,40 - 0,60. A) 10%: Incorreta. Esta probabilidade é muito baixa e não corresponde ao complemento da probabilidade de acerto. B) 20%: Incorreta. Esta opção subestima a probabilidade de erro, considerando um cenário em que o jogador é excepcionalmente preciso. C) 40%: Incorreta. Esta opção não considera que estamos buscando a probabilidade de erro, que é o complemento da probabilidade de acerto. D) 60%: Correta. A probabilidade de erro é o complemento da probabilidade de acerto. Se a probabilidade de acerto é 40%, a de erro será 60%. E) 90%: Incorreta. Esta probabilidade é muito alta e ignora o fato de que a probabilidade de acerto já ocupa 40%. Para saber mais sobre esse conteúdo, acesse o módulo 1 Teoremas de probabilidade "Teorema 3 Se é o complemento do evento , logo ” Desafio 3 Imagine que você é responsável por calcular probabilidades em experimentos de seleção aleatória. Você tem uma caixa contendo 5 bolas vermelhas, 3 bolas verdes e 2 bolas azuis. Se duas bolas são retiradas sucessivamente, sem reposição, qual é a probabilidade de que ambas sejam vermelhas? A 1/4. B 2/9. C 5/14. D 5/28. E 10/28. A alternativa B está correta. Para calcular essa probabilidade, precisamos multiplicar a probabilidade de retirar uma bola vermelha na primeira retirada pela probabilidade de retirar outra bola vermelha na segunda retirada, sem reposição. A fórmula é: A) 1/4: Incorreta. Esta probabilidade é simplificada demais e não leva em conta a redução do espaço amostral após a primeira retirada. B) 2/9: Correta. A probabilidade é calculada corretamente considerando a retirada sucessiva sem reposição. C) 5/14: Incorreta. Esta probabilidade não considera corretamente o espaço amostral e a mudança de probabilidades após a primeira retirada. D) 5/28: Incorreta. Esta opção subestima a probabilidade de retirada de duas bolas vermelhas sucessivamente. E) 10/28: Incorreta. Esta opção não simplifica corretamente as frações envolvidas no cálculo. Para saber mais sobre esse conteúdo, acesse o módulo 3 Regra da multiplicação (independência estatística) "Diferente da regra da adição, na regra da multiplicação, o interesse é calcular a probabilidade de que os eventos ocorram simultaneamente, isto é, desejamos determinar a ocorrência do evento A e do evento B. Desse modo, queremos determinar . Logo, se a ocorrência do evento A não interfere na ocorrência do evento B, temos: " Probabilidade Condicional e Independência Desafio 1 Como supervisor de qualidade em uma fábrica de brinquedos, você está responsável por avaliar a qualidade de um lote de bolas. Um dos lotes contém 6 bolas brancas e 4 pretas. Se duas bolas forem retiradas sucessivamente e sem reposição,qual é a probabilidade de que ambas sejam pretas? A 2/5. B 1/6. C 1/5. D 1/4. E 2/15. A alternativa E está correta. Para calcular a probabilidade de retirar duas bolas pretas sucessivamente sem reposição, devemos considerar: 1. A probabilidade de retirar uma bola preta na primeira tentativa: preta na 1a tentativa 2. A probabilidade de retirar outra bola preta na segunda tentativa, dada a primeira retirada: preta na 2a tentatival preta na 1 antativa A probabilidade de ambas as retiradas serem pretas é o produto das duas probabilidades: duas pretas A) 2/5: Incorreta. Representa apenas a probabilidade de retirar a primeira bola preta, não ambas sucessivamente. B) 1/6: Incorreta. Esse valor não corresponde à multiplicação das probabilidades de ambas as retiradas. C) 1/5: Incorreta. Subestima a probabilidade real, não representando o cálculo correto. D) 1/4: Incorreta. Similar às anteriores, não é o produto das probabilidades das duas retiradas. E) 2/15: Correta. Calculada corretamente considerando a multiplicação das probabilidades de retirar duas bolas pretas sucessivamente sem reposição. Para saber mais sobre esse conteúdo, acesse o módulo 2 Independência " A partir da lei da multiplicação, vemos que: Pela definição de independência vimos que se A e B são independentes, segue que: Supondo que A e B sejam independentes, poderíamos substituir por na lei da multiplicação, obtendo a fórmula: Desafio 2 Você é um engenheiro de produção responsável por avaliar a qualidade dos produtos em uma linha de montagem. Em uma urna, há quatro bolas brancas e duas bolas pretas. Se duas bolas forem retiradas sucessivamente e sem reposição, qual é a probabilidade de que ambas as bolas retiradas sejam da mesma cor? A 7/15. B 8/15. C 2/3. D 1/3. E 1/5. A alternativa A está correta. Para calcular a probabilidade de retirar duas bolas da mesma cor, consideramos as duas possíveis situações: ambas as bolas brancas ou ambas pretas. 1. Probabilidade de retirar duas bolas brancas: branca branca branca duas brancas 2. A probabilidade total de retirar duas bolas pretas: preta preta preta duas pretas A probabilidade total de retirar duas bolas da mesma cor é a soma das probabilidades: mesma cor A) 7/15: Correta. Essa é a probabilidade correta de retirar duas bolas da mesma cor, considerando as probabilidades de retirar duas brancas ou duas pretas. B) 8/15: Incorreta. Exagera a probabilidade de retirar duas bolas da mesma cor. C) 2/3: Incorreta. Representa uma probabilidade maior do que a calculada, não levando em conta a multiplicação correta das probabilidades. D) 1/3: Incorreta. Subestima a probabilidade real de retirar duas bolas da mesma cor. E) 1/5: Incorreta. Essa probabilidade é muito baixa e não representa o cálculo correto. Para saber mais sobre esse conteúdo, acesse o módulo 2 Independência "A partir da lei da multiplicação, vemos que: Pela definição de independência vimos que se A e B são independentes, segue que: Supondo que A e B sejam independentes, poderíamos substituir por na lei da multiplicação, obtendo a fórmula: ." Desafio 3 Como meteorologista responsável por prever o tempo, você sabe que a ocorrência de chuva hoje influencia a probabilidade de chover amanhã. Admitindo-se que, se chover hoje, a probabilidade de chover amanhã é de 0,7, e se não chover hoje, a probabilidade de chover amanhã é de 0,4. Sabendo que choveu hoje, qual a probabilidade de chover depois de amanhã? A 0,49. B 0,28. C 0,61. D 0,12. E 0,21. A alternativa C está correta. Para calcular a probabilidade de chover depois de amanhã, considerando que choveu hoje, precisamos utilizar a probabilidade condicional e a regra da multiplicação de probabilidades: 1. Probabilidade de chover amanhã, dado que choveu hoje: 2. Probabilidade de chover depois de amanhã, dado que choveu amanhã: A probabilidade conjunta de chover amanhã e depois de amanhã é o produto das probabilidades: Considerando a probabilidade de não chover amanhã: A probabilidade de chover depois de amanhã, dado que não choveu amanhã: A probabilidade de chover depois de amanhã é: A) 0,49: Incorreta. Representa apenas a probabilidade de chover consecutivamente dois dias. B) 0,28: Incorreta. Subestima a probabilidade real, considerando apenas parte das probabilidades. C) 0,61: Correta. Calculada corretamente como a soma das probabilidades de chover após um dia chuvoso ou não chuvoso. D) 0,12: Incorreta. Apenas considera a probabilidade de chover após um dia sem chuva. E) 0,21: Incorreta. Similar à alternativa B, subestima a probabilidade real. Para saber mais sobre esse conteúdo, acesse o módulo 1 Lei da probabilidade condicional "A probabilidade condicional é um conceito extremamente importante. Se tivermos informação adicional sobre um experimento, poderemos ser forçados a reavaliar as probabilidades dos eventos a ele associados. Para se obter , é necessário que os elementos satisfaçam a ambas as condições, isto é, sejam elementos que pertençam a A e B." Variáveis Aleatórias Unidimensionais Desafio 1 Como analista financeiro de uma empresa de loteria, você foi solicitado a avaliar um novo jogo de dados introduzido recentemente. No jogo, os jogadores apostam em um dado de seis faces e recebem uma quantia em dinheiro dependendo do número que cai. Se o dado cai no número 1, o jogador ganha R$ 2; se cai no número 2, ganha R$ 4; se cai no número 3, não ganha nada; se cai no número 4, ganha R$ 1; se cai no número 5, perde R$ 2 e, se cai no número 6, ganha R$ 3. Qual é o valor esperado dos ganhos de um jogador em uma única jogada? A R$ 1,33. B R$ 1,67. C R$ 2,00. D R$ 2,33. E R$ 2,50. A alternativa A está correta. A) R$ 1,33: Correta. O valor esperado é calculado pela soma dos produtos de cada resultado possível com sua respectiva probabilidade. A probabilidade de cada face do dado é 1/6. Portanto, o valor esperado é: O valor esperado é a média ponderada dos possíveis resultados, e neste caso, soma 1,33. B) R$ 1,67: Incorreta. Esta alternativa não leva em conta a probabilidade correta ou erra na soma dos produtos dos valores dos ganhos com suas respectivas probabilidades. A fórmula do valor esperado não resulta nesse valor quando aplicada corretamente. C) R$ 2,00: Incorreta. Este valor não reflete a soma ponderada das probabilidades dos resultados do dado. No estudo, menciona que a esperança de X é a média dos valores possíveis ponderados por suas probabilidades, o que não corresponde a R$ 2,00 neste caso. D) R$ 2,33: Incorreta. Este valor é superestimado e não corresponde ao cálculo correto do valor esperado. O valor correto, de acordo com o cálculo do valor esperado é 1,33. E) R$ 2,50: Incorreta. Este valor é um erro de cálculo e não reflete a soma correta das probabilidades ponderadas dos ganhos. O valor esperado deve ser calculado conforme a média ponderada explicada, resultando em 1,33. Para saber mais sobre esse conteúdo, acesse o módulo 2 Valor Esperado “O valor esperado de uma variável aleatória X, , é a média dos valores que X assumiria em infinitas repetições do experimento. Podemos escrever a fórmula do valor esperado para os casos discreto e contínuo da seguinte maneira: E(X)= ∑x x ⋅ P(X = x). A esperança de X é também chamada de média de X. Vale notar que não é um valor que se espera que ocorra, podendo ser (e, em geral, é) um valor que não ocorre.” Desafio 2 Você trabalha como estatístico em uma empresa de meteorologia que está desenvolvendo um modelo para prever a quantidade de chuva em um dia (X) e a quantidade de água coletada em um reservatório (Y). A empresa possui um modelo estatístico completo para X e está tentando calcular a probabilidade de um evento associado a Y. Considerando que B é o evento de que a quantidade de água coletada Y está entre 50 e 100 litros, qual das abordagens a seguir é a correta para encontrar a probabilidade de B? A Calcular a probabilidade diretamente usando o modelo de Y. B Encontraros valores de X para os quais G(X) está entre 50 e 100 e, em seguida, usar o modelo de X para calcular a probabilidade. C Ignorar o evento equivalente e estimar a probabilidade com base em dados passados. D Multiplicar a probabilidade de X pela probabilidade de Y. E Usar apenas a média de X para estimar a probabilidade de B. A alternativa B está correta. A) Calcular a probabilidade diretamente usando o modelo de Y: Incorreta. A probabilidade direta usando o modelo de Y não é possível sem considerar a transformação da variável X para Y através da função G. A transformação deve ser considerada para obter a probabilidade correta. B) Encontrar os valores de X para os quais G(X) está entre 50 e 100 e, em seguida, usar o modelo de X para calcular a probabilidade: Correta. Esta abordagem é correta porque envolve encontrar os valores de X que mapeiam para o intervalo desejado de Y usando a função de transformação G(X) e depois aplicar a distribuição de X para calcular a probabilidade. A probabilidade de eventos equivalentes é calculada dessa forma. C) Ignorar o evento equivalente e estimar a probabilidade com base em dados passados: Incorreta. Ignorar o evento equivalente não fornece uma estimativa precisa para a probabilidade de Y cair entre 50 e 100 litros, pois não leva em consideração a relação entre X e Y. O documento enfatiza a importância de considerar a função de transformação. D) Multiplicar a probabilidade de X pela probabilidade de Y: Incorreta. Multiplicar as probabilidades de X e Y não é uma abordagem válida, pois X e Y não são eventos independentes. Conforme explicado, a dependência deve ser considerada através da transformação de variáveis. E) Usar apenas a média de X para estimar a probabilidade de B: Incorreta. Usar apenas a média de X não fornece informações suficientes para calcular a probabilidade de Y estar entre 50 e 100 litros. destaca que a média não é suficiente para tais cálculos de probabilidade. Para saber mais sobre esse conteúdo, acesse o módulo 1 Distribuição da Função de uma Variável Aleatória “Seja X uma variável aleatória discreta definida no espaço amostral S, e y=H(X) uma função X. Então, Y=H(X) é também uma variável aleatória. Sejam Rx e Ry os contradomínios de X e Y, respectivamente. Para qualquer evento A ⊂ Ry, temos que: P(A)= P(X ∈ RX: H(X) ∈ A). Pela definição de evento equivalente, podemos dizer que a probabilidade de um evento A associado ao contradomínio de Y é definida como a probabilidade do evento equivalente em termos de X (ou seja, x ∈ Rx tal que H(x)∈ A).” Desafio 3 Você está trabalhando como agrônomo em uma empresa de agricultura e foi designado para estudar o crescimento das plantações de trigo ao longo do ano em termos de altura. A altura média das plantações é modelada como uma variável aleatória contínua H, com uma função de distribuição acumulada F(H) conhecida e diferenciável ao longo do domínio. Qual das seguintes opções melhor representa a taxa de variação da altura média das plantações em um determinado momento H0? A F(H0). B P(H=H0). C A integral de F(H) de 0 até H0. D A derivada de F(H) no ponto H0. E A média de F(H) de 0 até H0. A alternativa D está correta. A) F(H0): Incorreta. F(H0) é a função de distribuição acumulada avaliada no ponto H0, representando a probabilidade de que a altura média seja menor ou igual a H0, não a taxa de variação. No estudo, esclarece que a taxa de variação é obtida pela derivada da função de distribuição. B) P(H=H0): Incorreta. A probabilidade de uma variável contínua assumir um valor exato é zero. Portanto, P(H=H0) não representa a taxa de variação. A função densidade, é usada para calcular a probabilidade de intervalos, não pontos específicos. C) A integral de F(H) de 0 até H0: Incorreta. A integral de F(H) de 0 até H0 não representa a taxa de variação, mas sim a área sob a curva de F(H) nesse intervalo. A integral representa a função de distribuição, não a taxa de variação. D) A derivada de F(H) no ponto H0: Correta. A derivada de F(H) em relação a H no ponto H0 representa a taxa de variação da função de distribuição acumulada, ou seja, a função de densidade de probabilidade naquele ponto. A função densidade é a derivada da função de distribuição acumulada. E) A média de F(H) de 0 até H0: Incorreta. A média de F(H) de 0 até H0 não representa a taxa de variação, mas uma média dos valores de F(H) nesse intervalo. A taxa de variação é dada pela derivada. Para saber mais sobre esse conteúdo, acesse o módulo 1 Função de distribuição acumulada "A função de distribuição acumulada descreve como probabilidades são associadas aos valores ou aos intervalos de valores de uma variável aleatória. Ela representa a probabilidade de uma variável aleatória ser menor ou igual a um determinado valor real. A função de distribuição acumulada F(x) associa, a cada valor x∈ℝ, a probabilidade de que X seja menor ou igual a x. A função de distribuição acumulada possui as seguintes propriedades: (1) (2) (3) No caso discreto, F(x) é contínua à direita. Já no caso contínuo, F(x) é contínua. (4) No caso contínuo, podemos obter a função de densidade f(x) ao derivarmos F(x) em relação a x (se essa derivada existir). " Variáveis Aleatórias Discretas Unidimensionais Desafio 1 Suponha que você é um estudante universitário que está se preparando para um exame de múltipla escolha. Cada questão pode ser marcada corretamente ou incorretamente. Considerando uma distribuição de Bernoulli, qual das alternativas abaixo melhor representa a natureza da variável aleatória X nesse contexto? A Número total de questões no exame. B Cor da caneta usada para marcar as respostas. C Probabilidade de o estudante acertar uma questão específica. D Identificação única de cada questão no exame. E Média aritmética das respostas corretas do estudante. A alternativa C está correta. A) Incorreta. O número total de questões no exame é uma constante e não uma variável aleatória que pode assumir diferentes valores em diferentes tentativas. A distribuição de Bernoulli é focada em variáveis que representam sucesso ou falha em um experimento com dois resultados possíveis: "Cada tentativa independente tem uma probabilidade fixa de sucesso (P) e falha (Q = 1 - P)" (Módulo 2, Distribuições de Bernoulli e Binomial). B) Incorreta. A cor da caneta não é relevante para a distribuição de Bernoulli, pois não é uma variável que influencia a probabilidade de sucesso ou fracasso em um experimento de Bernoulli. Este atributo não se encaixa na definição de uma variável aleatória no contexto de Bernoulli. C) Correta. A probabilidade de o estudante acertar uma questão específica é a variável aleatória que se ajusta ao modelo de Bernoulli, onde o sucesso é acertar a questão e a falha é errar. "A variável aleatória representa o resultado de cada tentativa de um experimento com dois resultados possíveis: sucesso ou fracasso" (Módulo 2, Distribuições de Bernoulli e Binomial). D) Incorreta. A identificação única de cada questão no exame é uma característica estática e não uma variável aleatória. Ela não varia de tentativa para tentativa em um experimento de Bernoulli. A variável deve representar a ocorrência de um evento, como o sucesso ou falha em responder corretamente. E) Incorreta. A média aritmética das respostas corretas do estudante é um cálculo realizado após a avaliação e não uma variável aleatória individual que representa cada tentativa. A média é uma medida de tendência central, não a descrição de uma variável aleatória única. Para saber mais sobre esse conteúdo, acesse o módulo 2 Distribuição de Bernoulli "Considere uma única tentativa de um experimento que só tem dois possíveis resultados: Sucesso com probabilidade p e fracasso com probabilidade q, na qual p+q=1. Seja a variável aleatória X que representa o sucesso nessa única tentativa. Então, podemos dizer que X pode assumir dois valores: 0 (fracasso) e 1 (sucesso). Assim, a função de probabilidade da variável X pode ser dada por: ." Desafio 2 Como analistade qualidade em uma fábrica, você está monitorando a qualidade das bolas produzidas. Em uma urna contendo 30 bolas, sendo 10 vermelhas e 20 azuis, deseja-se retirar uma amostra de 5 bolas sem reposição. Considerando a distribuição hipergeométrica, qual das alternativas abaixo melhor representa a natureza da variável aleatória X nesse contexto? A Número total de bolas na urna. B Cor das bolas na amostra selecionada. C Probabilidade de uma bola vermelha ser selecionada na amostra. D Identificação única de cada bola na urna. E Média aritmética do número de bolas vermelhas na amostra. A alternativa E está correta. A) Incorreta. O número total de bolas na urna é uma constante e não uma variável aleatória que pode assumir diferentes valores. A distribuição hipergeométrica trata da variabilidade do número de sucessos em uma amostra extraída sem reposição de uma população finita. B) Incorreta. A cor das bolas na amostra selecionada não é uma variável que pode ser tratada diretamente na distribuição hipergeométrica. Esta alternativa não capta a essência da variável aleatória X. A variável deve representar o número de sucessos (bolas vermelhas) na amostra. C) Incorreta. A probabilidade de uma bola vermelha ser selecionada é uma função da distribuição hipergeométrica, mas não representa diretamente a variável aleatória que conta o número de bolas vermelhas na amostra. "A distribuição hipergeométrica é usada para modelar situações onde amostras são retiradas sem reposição" (Módulo 3, Distribuições Geométrica e Hipergeométrica). D) Incorreta. A identificação única de cada bola na urna é um dado fixo e não uma variável aleatória que varia com cada extração. A variável aleatória deve representar uma característica que pode variar entre as diferentes amostras. E) Correta. A média aritmética do número de bolas vermelhas na amostra é uma forma de descrever a variável aleatória X na distribuição hipergeométrica, que conta o número de sucessos (bolas vermelhas) na amostra extraída sem reposição. "A função de probabilidade é dada por Onde é o tamanho da população, é o número de sucessos na população, é o tamanho da amostra e é o número de sucessos na amostra" (Módulo 3, Distribuições Geométrica e Hipergeométrica). Para saber mais sobre esse conteúdo, acesse o módulo 3 Distribuições Geométrica e Hipergeométrica "Considere uma população com N elementos dos quais r têm determinada característica. A retirada de um desses r elementos é definida como sucesso. Retiramos dessa população uma amostra sem reposição de tamanho n. ...Daí, " Desafio 3 Você é o gerente de uma empresa de delivery de pizzas e está interessado em analisar a ocorrência de pedidos durante a noite. Sua empresa recebe uma média de 4 pedidos por hora. O número de pedidos recebidos em um intervalo contínuo de 2 horas segue uma distribuição de Poisson. Qual das seguintes afirmações sobre a distribuição de Poisson é correta para esse contexto? A A média e a variância do número de pedidos recebidos em 2 horas são iguais a 4. B A distribuição de Poisson é adequada para modelar o número de pedidos recebidos em um intervalo contínuo de tempo. C O parâmetro λ, que representa a taxa média de ocorrência de eventos, é igual a 8. D Os eventos de pedidos são dependentes entre si. E A distribuição de Poisson é aplicada somente a eventos frequentes. A alternativa B está correta. A) Incorreta. Para a distribuição de Poisson, a média e a variância são iguais ao parâmetro λ. Em um intervalo de 2 horas, com uma taxa média de 4 pedidos por hora, a média e a variância seriam 8, não 4. "A função de probabilidade é dada por , onde λ é a taxa média de ocorrência" (Módulo 4, Distribuição de Poisson). B) Correta. A distribuição de Poisson é usada para modelar o número de eventos em um intervalo fixo de tempo ou espaço, quando esses eventos ocorrem com uma taxa constante e independentemente uns dos outros. Esse modelo se aplica perfeitamente à situação de receber pedidos de pizza ao longo do tempo. "É adequada para modelar eventos que ocorrem independentemente com uma taxa constante" (Módulo 4, Distribuição de Poisson). C) Incorreta. O parâmetro λ para um intervalo de 2 horas, com uma taxa de 4 pedidos por hora, seria λ = 4 * 2 = 8. No entanto, esta alternativa não está correta no contexto da questão, pois o foco está na adequação do modelo. A distribuição de Poisson deve ser compreendida no contexto do intervalo de tempo considerado. D) Incorreta. Um dos pressupostos da distribuição de Poisson é que os eventos são independentes entre si. A dependência entre eventos invalidaria o uso da distribuição de Poisson. "Os eventos devem ocorrer independentemente uns dos outros" (Módulo 4, Distribuição de Poisson). E) Incorreta. A distribuição de Poisson não se aplica apenas a eventos frequentes. É adequada para modelar eventos que ocorrem de forma rara ou frequente, contanto que ocorram de maneira independente e com uma taxa constante. A aplicação da Poisson é versátil, sugere, "adequada para eventos raros e frequentes" (Módulo 4, Distribuição de Poisson). Para saber mais sobre esse conteúdo, acesse o módulo 4 Distribuição de Poisson "É um processo no qual eventos discretos ocorrem em intervalos contínuos (tempo, comprimento, área, volume...). Exemplos de processos de Poisson: Acidentes de trânsito por dia. Focos de incêndio por área. Número de chamadas telefônica por minuto. Número de trocas de pneu por km2. Seja X a variável aleatória discreta que representa o número de sucesso em um processo de Poisson. Então, dizemos que X segue uma distribuição de Poisson, com a seguinte função de probabilidade: , em que λ é a taxa média de ocorrência." 3. Conclusão Considerações finais Continue explorando, praticando e desafiando-se. Cada exercício é uma oportunidade de crescimento e cada erro, uma lição valiosa. Que sua jornada de aprendizado seja repleta de descobertas e realizações. Bons estudos e sucesso na sua carreira! Compartilhe conosco como foi sua experiência com este conteúdo. Por favor, responda a este formulário de avaliação e nos ajude a aprimorar ainda mais a sua experiência de aprendizado! https://forms.office.com/r/JXV3zaZitX https://forms.office.com/r/JXV3zaZitX Praticando 1. Itens iniciais Apresentação Objetivo 1. Estudo de Caso Tomada de Decisão Baseada em Probabilidade Condicional 2. Desafios Análise de dados quantitativos Probabilidades Desafio 1 Probabilidade Condicional e Independência Variáveis Aleatórias Unidimensionais Variáveis Aleatórias Discretas Unidimensionais 3. Conclusão Considerações finais