Inferência bayesiana e a Porta dos Desesperados

A partir de observações, como você pode inferir/deduzir algo? A inferência frequentista baseia-se na regularidade estatística das frequências relativas e sustenta que a probabilidade de um dado acontecimento pode ser medida observando a frequência relativa do mesmo acontecimento, em uma sucessão numerosa de experiências idênticas e independentes.

Já na inferência bayesiana, a ideia é trabalhar com o grau de confiança. Por exemplo, quando alguém pergunta “Qual a chance (ou quanto você confia) de ter vida em Marte?”, não é possível realizar esse “experimento” várias vezes. Outro ponto é que as incertezas são modificadas após observações de novos dados ou resultados. Exista também a questão de se colocar informação que não está nos dados – pode ser uma outra fonte um mesmo um “chute”.

Uma de suas aplicações está nos filtros anti-spam. A probabilidade “Pr(spam|palavra)” de um e-mail ser um spam por conter determinada palavra é igual à probabilidade “Pr(palavra|spam)” de aparecimento daquela palavra em e-mails que sejam marcados pelo usuário como spam, multiplicada à probabilidade geral “P(spam)” de spams por total de e-mails recebidos e dividida pela probabilidade geral “P(palavra)” de aparecimento daquela palavra. Amostras de mensagens consideradas spams ou não para gerar as estatísticas ficam em bancos de dados, resultado do feedback dos usuários.

A formulação acima vem do Teorema de Bayes, um corolário da lei da probabilidade total – regra fundamental que relaciona probabilidades marginais (variáveis contidas no subconjunto) e probabilidades condicionais (depende de uma dada condição). Veja mais sobre Probabilidade condicional e Teorema de Bayes no post do link.

Porta dos Desesperados (Problema de Monty Hall)

O problema de Monty Hall surgiu a partir de um concurso televisivo dos Estados Unidos chamado “Let’s Make a Deal”, exibido na década de 1970 e apresentado por Monte Halperin. No Brasil, foi adaptado para o Programa “Oradukapeta” do Sérgio Mallandro (no SBT). Neste quadro, os participantes escolhiam entre três portas, sendo que atrás de uma delas havia prêmios (brinquedos, bicicletas, etc) e nas outras havia “monstros” fantasiados. Mallandro ainda perguntava se a criança não queria trocar de porta, ou se não queria ficar com um brinquedo ao invés de abrir a porta.

  1. Na 1ª etapa, cada criança escolhe uma porta (que ainda não são abertas)
  2. Depois, a porta escolhida por uma das crianças é aberta e sai um monstro (ou seja, o prêmio não está lá)
  3. A criança que continua no jogo agora tem duas opções, sendo que uma delas está com o prêmio
  4. O apresentador oferece: quer continuar com a mesma opção ou mudar de porta?

No início, quando se escolheu uma das portas, havia 1/3 de probabilidade de ganhar o prêmio, ou seja, 33,33%. Não existia razão para essa probabilidade mudar até o apresentador ter aberto uma das portas que não era premiada. Aparentemente, a nova situação resume-se a uma probabilidade de 50% em acertar e 50% em errar a porta com o prêmio.

No entanto, esta análise intuitiva é errada, pois a porta que o apresentador abre depende da porta que escolhida inicialmente. O apresentador sabe desde o começo onde está o prêmio e assim ele nunca abrirá uma porta premiada na primeira tentativa. Se a primeira criança tiver escolhido inicialmente uma porta não-premiada (as chances disso acontecer são maiores do que acertar logo de primeira), o apresentador não tem liberdade de escolha e só pode abrir a porta não-premiada que lhe resta, obrigando-o a continuar mantendo fechada a única porta premiada.

Veja esse exemplo: a criança escolheu a porta de número 2. As outras duas portas não escolhidas tinham em conjunto 2/3 de probabilidade de ocultarem o prêmio. Ao abrir uma dessa portas e revelar que não havia o prêmio, o apresentador está dando uma informação valiosa: se o prêmio estava nas outras portas que não escolheu (1 ou 3), então agora ele só pode estar na porta que você não escolheu e não foi aberta (a porta 1). Ou seja, se a primeira criança errou ao escolher uma porta – e as chances disto são de 2/3 – então ao abrir uma das outras portas não-premiadas o apresentador está lhe dizendo onde está o prêmio.

Assim, sempre é mais vantajoso trocar. A probabilidade de ganhar o prêmio se trocar de porta é maior do que se não o fizer, pois a probabilidade em acertar a porta premiada passa de uma em três (33,33%) para duas em três (66,67%). Veja o esquema com as três situações possíveis, considerando-se que sempre a criança vai trocar de porta após ser revelado uma das portas sem prêmio:

A criança tem uma chance inicialmente igual de selecionar o prêmio, o Monstro A ou o Monstro B. A troca após revelar uma porta sem prêmio resulta em uma vitória 2/3 das vezes
A criança tem uma chance inicialmente igual (1 em 3) de selecionar o prêmio, o Monstro A ou o Monstro B. A troca após revelar uma porta sem prêmio resulta em uma vitória 2/3 das vezes

O exemplo dado aconteceu no programa do Sérgio Mallandro e o vídeo está logo abaixo (atualização: vídeo foi removido do YouTube). A menina de azul escolheu porta 2 e menina de rosa escolheu porta 3. A menina de rosa abriu porta 3 e não tinha prêmio. A menina de azul podia então escolher entre as portas 1 e 2 mas manteve a 2; abre e aparece um “monstro” – a porta 1 que estava com o prêmio.

Nesse outro exemplo (atualização: vídeo foi removido do YouTube), a menina escolhe porta 2, e o menino escolhe a 3. Depois ele muda de ideia e escolhe a 1; quando abre, tem um monstro. A menina tem como opções as portas 2 e 3, mas continua na 2; abre e ganha o prêmio.

Dentre os prêmios mais famosos que o programa dava, estavam uma bicicleta e o videogame Dynavision. Já a matemática envolvida demonstra muito bem como nosso cérebro não foi feito para lidar intuitivamente com tais tipos específicos de problemas.

Fontes e veja mais

2 comments

Leave a Reply

O seu endereço de e-mail não será publicado. Campos obrigatórios são marcados com *

Esse site utiliza o Akismet para reduzir spam. Aprenda como seus dados de comentários são processados.