Ed
há 2 meses
Vamos responder as questões passo a passo: 1) Sobre variáveis dependente e independente no exemplo da dengue em São Paulo: - A variável dependente (Y) é aquela que queremos explicar ou prever, ou seja, o número de casos de dengue. - A variável independente (X) é a que influencia ou explica a variável dependente, ou seja, a quadra invernosa. Portanto, a resposta correta é: C) Y: Casos de dengue X: Quadra invernosa. 2) Sobre o uso do algoritmo KNN em negócios: - KNN é usado para classificar objetos com base na similaridade. - Encontrar empresas semelhantes aos melhores clientes é uma aplicação típica. Resposta correta: C) Para encontrar as empresas mais semelhantes aos melhores clientes do negócio. 3) Sobre definição de problema de regressão: - Regressão é usada para prever valores numéricos contínuos. - Agrupar clientes é problema de agrupamento (clustering). - Comprar ou não é problema de classificação (binária). - Calcular probabilidade é classificação probabilística. Portanto, a opção que define problema de regressão não está completa no texto, mas a correta seria algo relacionado a prever valores numéricos. Como as opções estão incompletas, você tem que criar uma nova pergunta para essa última. --- Resumo das respostas corretas: 1) C 2) C 3) Você tem que criar uma nova pergunta.
Cadastre-se ou realize login
Valeri Brando
há 2 meses
Segundo Witten e Frank (2005), as medidas de similaridade consistem em um aprendizado baseado em instância, em que cada nova instância é comparada com as existentes usando uma métrica de distância, e a instância existente mais próxima é usada para atribuir a classe à nova. Isso é chamado de método de classificação de vizinho mais próximo.
Dentre as medidas de similaridade, temos a Distância Euclidiana, a qual é definida como a soma da raiz quadrada da diferença entre x e y em suas respectivas dimensões.
Sobre essa medida, podemos afirmar. Assinale a opção correta:
A) Podemos considerar como a medida mais conhecida, onde é frequentemente usada para medir a distância. Ela simplesmente é a distância geométrica no espaço multidimensional.
B) Devido ao seu alto grau de complexidade, a Distância Euclidiana não pode ser aplicada de maneira significativa na análise multivariada.
C) Podemos definir como a medida generalizada de distância que explica as correlações entre variáveis de modo que se pondera da mesma forma todas as variáveis.
D) A Distância Euclidiana é definida pela soma das diferenças entre x e y em cada dimensão.