Sunday, March 02, 2008

Visão Bayesiana do Método Científico




Estudando processos estocásticos, eu acabei indo parar no livro "Stochastic Processes in Physics and Chemistry" de N. G. van Kampen. O livro, um clássico para aqueles que precisam usar análise estatística de sistemas (o povo de quântica e de físico-química por exemplo...), é excelente para qualquer pessoa que tenha algum interesse nesse assunto. Não é um primeiro livro, é necessário estudar um pouco de probabilidade antes - pra quem fez engenharia elétrica ou de controle, os livros de probabilidade e estatística para engenharia como o do Gubner ou o do Leon-Garcia são muito bons, apesar da notação de engenharia ser um pouco diferente da notação dos físicos (eu tô citando livros em inglês porque são os que eu conheço mas com certeza livros sobre o tema em português existem). Oops. Digressão.

Voltando ao título do post, em dado momento o livro escreve sobre o grande paradoxo do método científico e de como abordar este problema utilizando probabilidades. Recomendo a vocês lerem por conta própria (p. 25 na edição de 1992), porque eu vou distorcer o que eu li aqui embaixo.

O problema fundamental da ciência é que estamos tentando formular princípios e leis, generalizações de fenômenos que regem a natureza a partir de um número necessariamente finito de observações - sempre crescente, mas sempre finito. A partir da lógica pura isso não é possível, pois recai no problema clássico de indução finita sobre uma natureza infinita, e portanto maior. Em bom português, isso quer dizer que toda lei geral é construida por um número limitado de observações e que uma nova observação tem sempre um potencial de desconstruir a toria anterior. Por exemplo, a idéia extremamente genial e interessante de que somos completamente determinados pelo DNA é desconstruída pela simples observação de que gêmios univitelinos são diferentes. Se algum dia, um desses malucos conseguir gerar um motor que não precise de energia, o princípio da conservação de energia terá que ser revisto. É por isso que no método científico, a observação é mais importante que a teoria!

Mas isso não quer dizer que a elaboração de um princípio é por si só inútil. E é aí que idéia de probabilidade bayesiana é bastante útil. Probabilidade bayesiana é aquela que relaciona a probabilidade de um evento a partir do conhecimento de uma informação prévia. O problema do Sérgio Malandro e a porta dos desesperados, é um clássico deste conceito de que informação te ajuda a tomar decisões melhores. No caso da ciência, a informação que temos são as observações e o modelo de probabilidade é a teoria que construímos. Dado que as órbitas dos planetas são elípticas em torno do Sol, qual é a probabilidade de que a força gravitacional é inversamente proporcional ao inverso do quadrado da distância?

Então, de certa forma, o que os cientistas fazem ao criar um modelo a partir de uma observação é construir um modelo e avaliar quais as chances de aquele modelo estar correto a partir das observações disponíveis? Após este primeiro passo (formulação da hipótese), se faz a inversão bayesiana do conceito para obter a probabilidade das próximas observações dada a hipótese, escolhemos os experimentos que têm a maior chance de darem errado e vamos atrás deste experimento (projeto de experimentos que podem contradizer a hipótese) e verificamos o resultado do experimento. Se o resultado é positivo, fazemos outro experimento, se o resultado é negativo, voltamos para fazer uma nova hipótese.

A partir deste conceito, dá pra entender o que significa uma teoria científica de alto valor e o que é uma teoria de baixo valor. A teoria de alto valor é aquela que é tem as menores chances de estar certa a partir das observações mas que resulta em uma predição correta de novos experimentos. A relatividade é um exemplo disso: quem, nas primeiras décadas do século XX, quando nem laser existia para medir distâncias, em sã consciência diria que massa deforma o espaço? Mas isso não quer dizer que podemos sair abraçando qualquer teoria maluca que aparecer por aí, porque elaborar uma hipótese que tem poucas chances de estar correta é um tanto quanto idiota: só deve ser feito quando você está enxergando um motivo bastante forte, uma crença ou um instinto, pelo qual aquela hipótese deve ser adotada como verdade.

Acho que a capacidade de saber quando arriscar e quando seguir em frente é o que separa os cientistas dos burocratas. Lógico que dizer isso, tão cedo na carreira, é um pouco pretensioso então eu me reservo ao direito de voltar atrás sobre as minhas opiniões.

5 comments:

  1. Eu fiquei horas, talvez dias, para realmente compreender o problema da porta dos desesperados... o problema é ter que lutar contra todos os seus instintos. A boa Ciência é igualmente contra o instinto pois vc tem que tentar destruir a sua querida hipótese antes dos outros...

    ReplyDelete
  2. Olá Shridhar!

    O livro "Machine Learning" do Tom Mitchell também contem algumas baginas bastante filosoficas e muito interessantes relacionando método cientifico, bayesianismo, navalha de occam, minimum description length (MDL) principle... É bem legal...

    Uma coisa ficou um pouco vaga pra mim: O que voce quer dizer com "logica pura"? Em lógicas (e mais especificamente em Proof Theory), geralmente se estudam sistemas compostos de axiomas e regras de inferencia. No caso de logicas de segunda ordem, por exemplo, é bastante comum e útil (no caso de se trabalhar com aritmetica) adotar o axioma de inducao. É "impuro" usar logicas de segunda ordem (muitos foundationalists pensam que sim) com axioma da inducao? É impuro assumir quaisquer axiomas?

    Quando se admite o principio da inducao finita como axioma, o model (nao confundir "model" da logica, com "modelo" em fisica ou biologia. É exatamente o oposto...) descrito normalmente se torna isomorfico ao conjunto dos numeros naturais, que tem cardinalidade contavel, mas ainda infinita. Resumindo: inducao finita, mas model ("natureza") infinito. (Uma das suas frase leva a crer que com inducao finita só se tem modelos finitos. na verdade, só se tem modelos contaveis. Isso está relacionado aos dois teoremas de Löwenheim-Skolem, que tratam das diferencas de expressibilidade entre logicas de primeira ordem e de outras ordens superiores).

    O problema que voce levantou poderia entao ser melhor reformulado da sequinte forma: a natureza é contavel? ou incontavel? (Aparentemente, voce assume que ela é incontavel, nao?) Acho que isso é um grande problema pra fisica e pra filosofia debaterem e pesquisarem, mas a logica e a matematica tem ferramentas pra descreverem e trabalharem com ambos os casos. (outra pergunta relacionada seria: a natureza é discreta? ou continua?)

    Uma outra coisa relacionada pra pensar: os numeros reais sao incontaveis. Apesar disso, eles sao especificados por um conjunto finito de axiomas... Ou seja, tem-se uma natureza infinita e incontavel sendo descrita por um conjunto finito de axiomas. (O problema aqui é que o axioma de segunda ordem que exige que a relacao de ordem nos reais seja dedekind-complete nao pode ser empiricamente testado em um numero contavel de testes...). Talvez seja aqui que entre a "crenca ou instinto" que voce citou: a audacia de inventar e assumir um axioma de segunda ordem sobre a realidade, baseando-se apenas em um numero finito (ou, no limite, infinito mas contavel) de experimentos.

    Assumindo agora que a natureza seja incontavel, acho que as ideias acima permitem concluir duas coisas:
    1) o empiricismo nao é suficiente para explicar a natureza ou o metodo cientifico. (necessita-se do instinto/crenca/intuicao...)
    2) existe um "approach" puramente logico para chegar a conclusoes parecidas com as que voce citou, e de uma maneira bem rigorosa (i.e. Löwenheim-Skolem theorems).


    Aparentemente, voce tambem sugere que metodos estatisticos e bayesianos estejam alem da logica e sejam mais poderosos que essa. Mas certamente existem logicas probabilisticas que correspondem a inferencias bayesianas. Além disso (no pior caso), metodos estatisticos e bayesianos trabalham com numeros reais, e estes sao facilmente axiomatizaveis em logica. Bastaria adicionar alguns axiomas a mais a respeito dos predicados de probabilidade e probabilidade condicional e voce poderia passar a usar a logica para fazer inferencias bayesianas.

    É tarde.. Vou parar por aki.. :-)
    Espero ter contribuido com um "logical approach" para a sua ideia!

    ReplyDelete
  3. Pois é. Essa frase sobre lógica e infinito eu copiei sem vergonha alguma do texto do livro que por sua vez cita um trecho de um livro de Popper. Eu imagino que o princípio da indução que ele cita não é o da indução finita sobre o conjunto dos inteiros, mas a idéia de indução sobre os inteiros. Mas ela é mais ou menos semelhante a uma indução sobre os números reais.

    A diferença é que, ao contrário dos números naturais onde vc tem uma regra de construção para todos os números, o conjunto real, e o conjunto de possíveis experimentos/observações não tem uma regra de transição entre um termo e o termo seguinte. O conjunto real ainda tem uma regra de pertinência, mas o das observações nem isso tem, não temos como saber se uma observação é válida ou não.

    Mas eu não acho que a probabilidade seja mais potente que a lógica, até porque ela é montada em cima de lógica de segunda ordem, se eu não me engano. É só que é mais fácil pensar pra mim pensar em termos de probabilidades do que de regras, apesar da formalização dos conceitos ser bem mais tortuosa...

    Eu não sei se eu entendi o que vc falou ou se eu consegui responder o que vc queria... e eu também não sei muito de lógica então talvez eu esteja boiando na minha resposta.

    ReplyDelete
  4. Queria te convidar para a comunidade Blogs de Ciência, recentemente criada no Orkut!
    http://www.orkut.com/Community.aspx?cmm=51659033

    Ensino de Química

    ReplyDelete