Prévia do material em texto
NOTA-9
Questão 1
Texto da questão
Considere dois pontos de venda da boneca falante com as seguintes características: primeiro ponto com local de exposição ruim da boneca, preço da boneca de 289,99 reais, gastos mensais com publicidade de 90 mil reais e idade média da população local de 39 anos. Segundo ponto com bom local de exposição da boneca e preço da boneca de 399,99 reais.
Figura - Árvore de decisão ajustada às vendas do produto de varejo
Fonte: Elaborada pelo autor.
Use a árvore que construímos para o caso da boneca falante (novamente exibida aqui) e assinale a alternativa que indica corretamente a estimativa de vendas para esse ponto de venda:
a.Vendas altas e altas, respectivamente.
b.Vendas altas, apenas.
c.Vendas altas e baixas, respectivamente.
d.Vendas baixas e altas, respectivamente.
e.Vendas baixas e baixas, respectivamente.
Questão 2
Texto da questão
O modelo de regressão linear simples desenvolvido pelo estatístico para a predição do valor esperado para o imóvel em função da sua área foi:
Ao tomar como base esse modelo, que foi ajustado aos dados da amostra cedida pela corretora ao estatístico, podemos estimar que o valor esperado para um apartamento de área igual a 58,0 metros quadrados é igual a (arredondando para mil reais):
a.253.
b.352.
c.326.
d.322.
e.329.
Questão 3
Texto da questão
A estatística descritiva usa de métodos numéricos para resumir dados, também chamados de sumários estatísticos, e de gráficos para a visualização dos dados. A jovem cientista de dados usou algumas técnicas de visualização de dados para analisar sua amostra, mas deixou outras de lado.
Analise as afirmativas a seguir e veja quais estão coerentes com sua análise descritiva dos dados.
I. Na sua análise descritiva dos dados da amostra, a jovem cientista de dados usou histogramas para a visualização dos dados quantitativos das amostras, que são a renda mensal das pessoas e seus gastos médios com o cartão de crédito.
II. Na sua análise descritiva dos dados da amostra, a jovem cientista de dados usou diagramas de barras para a visualização dos dados quantitativos das amostras, que são a renda mensal das pessoas e seus gastos médios com o cartão de crédito.
III. Histogramas e diagramas de barras são formas tradicionais de visualização gráfica de dados quantitativos e qualitativos, respectivamente, na estatística e na ciência dos dados.
IV. A jovem cientista de dados usou, para este caso, apenas histogramas, e preferiu apenas lançar mão da função table() do software estatístico R, para determinar a frequência com que os níveis das variáveis qualitativas se manifestaram na amostra estudada, sem fazer uso de diagramas de barras, o que poderia ter feito, se quisesse.
Está correto o que se afirma em:
a.II e III, apenas.
b.I, III e IV apenas.
c.I e II, apenas.
d.I e IV, apenas.
e.IV, apenas.
Questão 4
Texto da questão
Na análise descritiva do volume de vendas da boneca falante, foram estudadas as variáveis relativas aos dados coletados pela gerente comercial do fabricante da boneca. Dentre elas, há a variável dos gastos do fabricante da boneca com publicidade, cuja relação com vendas altas ou baixas é exibida no gráfico adiante.
Figura: Efeito dos gastos com publicidade nas vendas
Fonte: Elaborada pelo autor.
Quanto à relação entre gastos mensais com publicidade e o volume de vendas (vendas altas ou baixas), analise as afirmativas a seguir:
I. Ao estudarmos este caso, percebemos que vendas altas ocorrem mesmo quando os gastos com publicidade são apenas ligeiramente maiores.
II. Visualmente, podemos perceber que a mediana (linha sólida dentro da caixa) dos gastos com publicidade é da ordem de 20 mil reais por mês para vendas altas e da ordem de 8 mil reais por mês para vendas baixas.
III. O gráfico de visualização da relação entre os gastos mensais com publicidade e o volume de vendas não mostra qualquer efeito dos gastos com publicidade sobre o volume de vendas da boneca.
IV. O gráfico de visualização da relação entre os gastos mensais com publicidade e o volume de vendas mostra que vendas altas ocorrem quando os gastos com publicidade são significativamente maiores.
Está correto o que se afirma em:
a.II e IV, apenas.
b.I e II, apenas.
c.I, apenas.
d.III e IV, apenas.
e.III, apenas.
Questão 5
Texto da questão
A escolha de grupos formados por um algoritmo de agrupamento hierárquico pode ser feita por meio da leitura do dendrograma resultante. Escolhe-se a altura (Height) desejada, se traça uma linha horizontal a partir dessa altura, que cruzará com as linhas verticais dos grupos formados nesta altura. O cientista de dados decide se esses grupos são adequados para a sua análise.
Veja, por exemplo, a figura abaixo.
Figura - Dendrograma do agrupamento de oito estados
Fonte: Elaborada pelo autor
Com respeito da leitura deste dendrograma, analise as afirmativas a seguir e assinale V
para a(s) Verdadeira(s) e F para a(s) Falsa(s).
I. ( ) A altura 4 cruza com duas linhas verticais, que indicam dois grupos, o primeiro deles formado pelos estados {Connecticut, Delaware}, e o segundo deles formado pelos estados {Colorado, Arizona, California, Alaska, Alabama, Arkansas}.
II. ( ) A altura 4 cruza com três linhas verticais, que indicam três grupos, o primeiro deles formado pelos estados {Connecticut, Delaware}, o segundo deles formado pelos estados {Colorado, Arizona, California}, e o terceiro deles formado pelos estados {Alaska, Alabama, Arkansas}.
III. ( ) A altura 3 cruza com duas linhas verticais, que indicam dois grupos, o primeiro deles formado pelos estados {Connecticut, Delaware}, e o segundo deles formado pelos estados {Colorado, Arizona, California, Alaska, Alabama, Arkansas}.
IV. ( ) A altura 3 cruza com três linhas verticais, que indicam três grupos, o primeiro deles formado pelos estados {Connecticut, Delaware}, o segundo deles formado pelos estados {Colorado, Arizona, California}, e o terceiro deles formado pelos estados {Alaska, Alabama, Arkansas}.
a.F, V, V, F.
b.V, F, V, F.
c.F, V, V, F.
d.V, F, F, V.
e.F, V, F, V.
Questão 6
Texto da questão
Quando os dados se referem a múltiplas variáveis quantitativas, é possível exibir múltiplos gráficos de dispersão entre pares dessas variáveis, duas a duas. No software estatístico R, isto pode ser feito com a função gráfica pairs(). Adiante apresentamos um output típico da função pairs() quando aplicada a quatro variáveis quantitativas de um determinado conjunto de dados.
Figura 4: Múltiplos gráficos de dispersão entre as variáveis de USArrest
Fonte: Elaborada pelo autor.
A respeito deste output típico da função gráfica pairs() do software estatístico R, para a exibição de múltiplos gráficos de dispersão entre variáveis quantitativas, analise as afirmativas a seguir e assinale V para a(s) Verdadeira(s) e F para a(s) Falsa(s).
I. ( ) O gráfico de y = Murder versus x = Assault mostra uma tendência de aumento de Murder para um aumento de Assault.
II. ( ) O gráfico de y = Murder versus x = UrbanPop mostra uma grande dispersão dos pontos sem uma tendência clara de subida ou descida.
III. ( ) O gráfico de y = Murder versus x = Rape mostra uma tendência de aumento de Murder para um aumento de Assault, porém com uma dispersão dos pontos um pouco maior que para o caso de y = Murder versus x = Assault.
IV. ( ) Como são quatro variáveis quantitativas (Murder, Assault, UrbanPop e Rape), então ao total são 12 gráficos de dispersão, de cada uma delas contra as outras três.
a.V, V, V, V.
b.F, V, F, V.
c.F, V, V, V.
d.F, V, V, F.
e.V, V, V, F.
Questão 7
Texto da questão
Entre as técnicas das quais lançou mão para a visualização dos dados da amostra, uma jovem cientista de dados usou boxplots (diagramas de caixas). Como cientista de dados, ela sabia exatamente em que situações empregar boxplots. E você, será que você também já sabe?
Analise as afirmativas a seguir e assinale V para a(s) Verdadeira(s) e F para a(s) Falsa(s).
I. ( ) Para examinar visualmente a relação entre duas variáveis, em que uma é quantitativa e a outra é qualitativa,não é possível a utilização de gráficos de dispersão.
II. ( ) Boxplots são uma solução inteligente para a visualização da relação entre uma variável quantitativa e uma variável qualitativa, em que no eixo horizontal indicamos os níveis da variável qualitativa e no eixo vertical, a variação dos valores observados para a variável quantitativa.
III. ( ) Para examinar visualmente a relação entre duas variáveis quantitativas, um dos gráficos preferidos é o diagrama de caixas, também conhecido como boxplot.
IV. ( ) Na construção de um boxplot, podemos representar no eixo vertical os níveis da variável qualitativa e no eixo horizontal, os valores da variável quantitativa. Nesse caso, a visualização da variação dos dados da variável quantitativa é exibida horizontalmente, e os níveis (classes) da variável qualitativa são exibidos verticalmente.
Assinale a alternativa que apresenta a sequência correta.
a.V, V, F, F.
b.V, F, F, V.
c.F, V, V, F.
d.V, V, F, V.
e.F, F, V, V.
Questão 8
Texto da questão
A estatística, a ciência da computação, a mineração de dados e a ciência dos dados são áreas correlacionadas. Dentre essas, a mais antiga é a estatística, seguida da ciência da computação, depois da mineração de dados, e finalmente da ciência dos dados, a mais nova dessas quatro áreas de conhecimento.
Com referência ao relacionamento entre essas quatro áreas de conhecimento humano, analise as afirmativas a seguir:
I. Algoritmos de machine learning nasceram na ciência da computação. Hoje são usados na estatística, na mineração de dados e na ciência dos dados.
II. Dentre as diversas áreas citadas, é a estatística que possui os melhores fundamentos para a interpretação de fenômenos aleatórios.
III. A estatística é considerada a mais sutil, e a mais ampla, quando nos referimos a análise de dados. É aplicada a todas áreas de atividade humana.
IV. Sabemos que, na ciência dos dados, podem-se utilizar de muitos termos diferentes, herdados das outras áreas, para se referir a um mesmo conceito.
a.I, II, III e IV.
b.II e III apenas.
c.I, II e III apenas.
d.I, II e IV apenas.
e.I, III e IV apenas.
Questão 9
Texto da questão
A visualização da relação entre duas variáveis é, habitualmente, feita por meio de gráficos de dispersão, de boxplots (diagramas de caixas) ou de mosaic plots, este último ainda não visto aqui. Mas o emprego dessas modalidades de gráficos segue regras bem precisas, especificamente a que duas variáveis eles podem representar de forma visual.
Referente ao exposto, analise as afirmativas a seguir e assinale V para a(s) Verdadeira(s) e F para a(s) Falsa(s).
I. ( ) Para examinar visualmente a relação entre duas variáveis, em que uma é quantitativa e a outra é qualitativa, não é possível a utilização de gráficos de dispersão.
II. ( ) Boxplots são uma solução inteligente para a visualização da relação entre uma variável quantitativa e uma variável qualitativa, em que, no eixo horizontal, indicamos os níveis da variável qualitativa e, no eixo vertical, a variação dos valores observados para a variável quantitativa.
III. ( ) Para examinar visualmente a relação entre duas variáveis quantitativas, um dos gráficos preferidos é o diagrama de caixas, também conhecido como boxplot.
IV. ( ) Na construção de um boxplot, podemos representar, no eixo vertical, os níveis da variável qualitativa e, no eixo horizontal, os valores da variável quantitativa. Nesse caso, a visualização da variação dos dados da variável quantitativa é exibida horizontalmente e os níveis (classes) da variável qualitativa são exibidos verticalmente.
Assinale a alternativa que apresenta a sequência correta.
a.F, V, V, F.
b.V, V, F, V.
c.V, F, F, V.
d.F, F, V, V.
e.V, V, F, F.
Questão 10
Texto da questão
No decorrer desta unidade, apresentamos uma série de exemplos de problemas de regressão e problemas de classificação. A diferença entre eles reside no tipo da variável resposta, se quantitativa ou qualitativa. Problemas de regressão são aqueles em que a variável resposta é quantitativa. As variáveis de entrada, também chamadas de regressoras ou preditoras, podem ser quantitativas ou qualitativas.
Em relação a problemas de regressão, analise as afirmativas a seguir e assinale V para a(s) Verdadeira(s) e F para a(s) Falsa(s).
I. ( ) A predição da redução da massa corporal de uma pessoa, em quilos, em função do tipo de dieta alimentar e das horas semanais dedicadas à prática de atividades físicas, é um problema de regressão.
II. ( ) A predição da resistência à tração de uma liga metálica, em Pascal (1 Pascal = 1 Newton/m2), em um ensaio de tração, em função da sua composição, granulometria e condições gerais do processo de fabricação da liga, é um problema de regressão.
III. ( ) A predição da taxa de mortalidade anual por melanoma maligno, em mortes a cada 100.000 habitantes, em função da latitude da região na qual habita a pessoa, é um problema de regressão.
IV. ( ) A predição do consumo de combustível de um veículo, em litros de combustível por quilômetro rodado, em função do seu peso, do número de cilindros do seu motor, e do volume do seu motor, é um problema de regressão.
Assinale a alternativa que apresenta a sequência correta:
a.F, V, V, F.
b.V, V, V, V.
c.F, F, V, V.
d.V, F, V, F.
e.F, F, V, F.