Ed
há 2 meses
Para determinar o número ideal de clusters (k) em um algoritmo de aprendizado não-supervisionado, o epidemiologista precisa de uma técnica que avalie a qualidade dos clusters formados, sem ter acesso a subtipos pré-definidos. Vamos analisar as opções: 1. Regressão Logística: Essa técnica é usada para modelar a probabilidade de um evento ocorrer, mas não é adequada para determinar o número de clusters em aprendizado não-supervisionado. 2. Informação Mútua Normalizada (NMI): Essa técnica mede a quantidade de informação compartilhada entre dois agrupamentos, mas requer um agrupamento real para comparação, o que não se aplica aqui, já que não há subtipos conhecidos. 3. Índice de Rand Ajustado (ARI): Assim como o NMI, o ARI mede a similaridade entre o resultado do algoritmo e um agrupamento real, o que também não é aplicável na ausência de subtipos verdadeiros. 4. Coeficiente de Silhueta (Silhouette): Essa técnica avalia a coesão (quão próximos estão os pontos dentro de um cluster) e a separação (quão distantes estão os clusters entre si). É uma abordagem adequada para determinar a qualidade dos clusters formados sem precisar de subtipos conhecidos. Diante dessa análise, a opção correta é: Coeficiente de Silhueta (Silhouette), pois avalia a coesão e a separação dos clusters formados.
Já tem uma conta?
Ao continuar, você aceita os Termos de Uso e Política de Privacidade