Ed
ano passado
O algoritmo Thompson Sampling utiliza a distribuição Beta. Essa distribuição é especialmente útil em problemas de seleção de ações, como no contexto de bandits, onde se busca maximizar recompensas.
Já tem uma conta?
Ao continuar, você aceita os Termos de Uso e Política de Privacidade