Capa do artigo "Será mesmo que teorias científicas simples são melhores?", em Ano Zero. Na imagem, vê-se uma navalha de barbear, para elucidar a chamada "Navalha de Ockham".

Será mesmo que teorias científicas simples são melhores?

Em Ciência, Consciência, Filosofia por Elliott SoberComentário

Por que o mais simples é melhor?

A Nava­lha de Ockham diz que a sim­pli­ci­dade é uma vir­tude cien­tí­fica, mas a jus­ti­fi­ca­tiva dessa filo­so­fia é estra­nha­mente ilu­só­ria.


Duas obras arqui­tetô­ni­cas de Bar­ce­lona são tão dife­ren­tes quanto podem ser. A Sagrada Famí­lia, pro­je­tada por Antoni Gaudí, fica a ape­nas algu­mas milhas do pavi­lhão ale­mão, cons­truído por Mies van der Rohe. A igreja de Gaudí é extra­va­gante e com­plexa. O pavi­lhão de Mies é tran­quilo e sim­ples. Mies, o após­tolo da arqui­te­tura mini­ma­lista, usou o slo­gan “menos é mais” para expres­sar o que ele estava pro­cu­rando. Gaudí nunca disse ‘mais é mais’, mas seus edi­fí­cios suge­rem que isto é o que ele tinha em mente.

Uma rea­ção ao con­traste entre Mies e Gaudí é esco­lher lados com base em uma con­vic­ção sobre como toda a arte deve ser. Se toda a arte deve ser sim­ples ou se toda a arte deve ser com­plexa, a esco­lha é clara. No entanto, ambas as nor­mas pare­cem absur­das. Não é óbvio que alguma arte esti­má­vel é sim­ples e algu­mas são com­ple­xas? É ver­dade, pode haver extre­mos que estão além dos limi­tes; somos ali­e­na­dos pela arte que é dema­si­ado com­plexa e ente­di­a­dos com a arte que é muito sim­ples. No entanto, entre estes dois extre­mos existe um vasto espaço de pos­si­bi­li­da­des. Dife­ren­tes artis­tas tive­ram obje­ti­vos dife­ren­tes. Os artis­tas não estão tra­ba­lhando para des­co­brir o único grau cor­reto de com­ple­xi­dade que todas as obras de arte devem ter. Não existe tal ideal atem­po­ral.

A ciên­cia é dife­rente, pelo menos de acordo com mui­tos cien­tis­tas. Albert Eins­tein falou por mui­tos quando disse que “difi­cil­mente pode ser negado que o obje­tivo supremo de toda a teo­ria é fazer com que seus ele­men­tos bási­cos e irre­du­tí­veis sejam tão sim­ples e tão pou­cos quanto pos­sí­vel, sem ter que se ren­der a uma repre­sen­ta­ção ade­quada de um único dado da expe­ri­ên­cia”. A busca de teo­rias sim­ples, então, é uma exi­gên­cia do empre­en­di­mento cien­tí­fico. Quando as teo­rias ficam muito com­ple­xas, os cien­tis­tas che­gam com a Nava­lha de Ockham, o prin­cí­pio da par­cimô­nia, para fazer o corte. Este prin­cí­pio diz que uma teo­ria que pos­tula menos enti­da­des, pro­ces­sos ou cau­sas é melhor do que uma teo­ria que pos­tula mais, desde que a teo­ria mais sim­ples seja com­pa­tí­vel com o que se observa. Mas o que “melhor” quer dizer? É óbvio que as teo­rias sim­ples podem ser boni­tas e fáceis de enten­der, lem­brar e tes­tar. O pro­blema difí­cil de expli­car é por que o fato de uma teo­ria ser mais sim­ples do que outra diz algo sobre como o mundo é.

Um dos mais famo­sos endos­sos cien­tí­fi­cos da Nava­lha de Ockham pode ser encon­trado em Prin­cí­pios Mate­má­ti­cos da Filo­so­fia Natu­ral (1687), de Isaac New­ton, onde ele afirma qua­tro “regras de raci­o­cí­nio”. Aqui estão as duas pri­mei­ras:

Regra I. Não deve­mos admi­tir mais cau­sas para as coi­sas natu­rais do que aque­las que forem ver­da­dei­ras e sufi­ci­en­tes para expli­car as suas apa­rên­cias. Como dizem os filó­so­fos: a natu­reza não faz nada em vão, e mais cau­sas são em vão quando menos sufi­ci­en­tes. A natu­reza é sim­ples e não entra no luxo de cau­sas supér­fluas.

Regra II. Por­tanto, aos mes­mos efei­tos natu­rais deve­mos, na medida do pos­sí­vel, atri­buir as mes­mas cau­sas. Exem­plos são a causa da res­pi­ra­ção no homem e ani­mal, ou da queda de pedras na Europa e na Amé­rica, ou da luz de um incên­dio na cozi­nha e do Sol, ou da refle­xão da luz sobre a nossa Terra e nos outros pla­ne­tas.

New­ton não fez muito para jus­ti­fi­car estas regras, mas em um comen­tá­rio iné­dito sobre o livro de Apo­ca­lipse, ele diz mais. Aqui está uma das suas “Regras para a metodização/construção do Apo­ca­lipse”:

Esco­lher aque­las cons­tru­ções que, sem esforço, redu­zem as coi­sas à maior sim­pli­ci­dade pos­sí­vel. A razão disso é… [que] a ver­dade sem­pre será encon­trada na sim­pli­ci­dade, e não na mul­ti­pli­ci­dade e con­fu­são das coi­sas. É a per­fei­ção das obras de Deus que são todas fei­tas com a maior sim­pli­ci­dade. Ele é o Deus da ordem e não da con­fu­são. E, por­tanto, na medida em que eles com­pre­en­des­sem como fun­ci­ona o mundo, eles deve­riam se esfor­çar em redu­zir todo conhe­ci­mento ao máximo de sim­pli­ci­dade pos­sí­vel, e isso deve­ria ser rea­li­zado atra­vés da ten­ta­tiva de enten­der o que per­ce­be­ram (sobre o mundo).

New­ton acha que pre­fe­rir teo­rias mais sim­ples faz sen­tido, seja para inter­pre­tar a Bíblia ou para des­co­brir as leis da física. A Nava­lha de Ockham é certa em ambos os casos, por­que o uni­verso foi cri­ado por Deus.

No século XX, filó­so­fos, esta­tís­ti­cos e cien­tis­tas fize­ram pro­gres­sos na com­pre­en­são de por que a sim­pli­ci­dade de uma teo­ria é rele­vante para ava­liar o que e como o mundo é. Suas jus­ti­fi­ca­ti­vas da nava­lha de Ockham não depen­dem de teo­lo­gia, nem invo­cam a tese gran­di­osa de que a natu­reza é sim­ples. Há pelo menos três “para­dig­mas da par­cimô­nia” den­tro dos quais a nava­lha pode ser jus­ti­fi­cada.

O pri­meiro é exem­pli­fi­cado pelo con­se­lho dado a estu­dan­tes de medi­cina que eles deve­riam “evi­tar per­se­guir zebras”. Se os sin­to­mas de um paci­ente podem ser expli­ca­dos pela hipó­tese de que ele tem uma doença comum C, e tam­bém podem ser expli­ca­dos pela hipó­tese de que ela tem a doença rara R, deve pre­fe­rir o diag­nós­tico C em vez do R. C é enten­dido como mais par­ci­mo­ni­oso. Neste caso, a hipó­tese mais par­ci­mo­ni­osa tem a maior pro­ba­bi­li­dade de ser ver­da­deira.

Há uma outra situ­a­ção em que as teo­rias mais sim­ples têm mai­o­res pro­ba­bi­li­da­des. Envolve a ver­são da Nava­lha de Ockham, que eu chamo de “a nava­lha do silên­cio”. Se você tiver pro­vas de que C1 é uma causa de E, e nenhuma evi­dên­cia de que C2 é uma causa de E, então C1 é uma expli­ca­ção melhor de E do que C1 e C2 podem ser. O filó­sofo do século 19, John Stu­art Mill, estava pen­sando em tais casos, quando disse que o prin­cí­pio da par­cimô­nia é

um caso de prin­cí­pio geral prá­tico, de não acre­di­tar em nada que não haja evi­dên­cia alguma… A supo­si­ção de uma causa supér­flua é uma crença sem pro­vas; como se fôs­se­mos supor que um homem que foi morto por cair num pre­ci­pí­cio devesse ter tomado veneno tam­bém.

Mill está falando sobre a nava­lha do silên­cio. A melhor expli­ca­ção de E é man­ter silên­cio sobre C2; ele não nega que C2 seja uma causa. O pro­blema muda se você con­si­de­rar duas hipó­te­ses con­jun­ti­vas. Qual é a melhor expli­ca­ção para E: C1 & não-C2 ou C1 & C2? A nava­lha do silên­cio não for­nece ori­en­ta­ção alguma, mas outra nava­lha, a nava­lha da nega­ção, o faz. Nos diz para pre­fe­rir­mos a pri­meira. Infe­liz­mente, não está claro que jus­ti­fi­ca­ção pode­ria haver para esta rei­vin­di­ca­ção se você não tem pro­vas, de um modo ou de outro, quanto ao fato de C2 ser ver­dade. A nava­lha do silên­cio é fácil de jus­ti­fi­car; jus­ti­fi­car a nava­lha da nega­ção é mais difí­cil.

Pos­tu­lar uma única causa comum é mais par­ci­mo­ni­oso do que pos­tu­lar um grande número de cau­sas inde­pen­den­tes, sepa­ra­das.

No exem­plo das doen­ças raras e comuns, as duas hipó­te­ses con­fe­rem a mesma pro­ba­bi­li­dade nas obser­va­ções. O segundo para­digma da par­cimô­nia con­cen­tra-se em situ­a­ções em que uma hipó­tese mais sim­ples e uma hipó­tese mais com­plexa con­fe­rem dife­ren­tes pro­ba­bi­li­da­des sobre as obser­va­ções. Em mui­tos casos, as pro­vas favo­re­cem a teo­ria mais sim­ples sobre seu com­pe­ti­dor mais com­plexo. Por exem­plo, supo­nha que todas as luzes no seu bairro apa­guem ao mesmo tempo. Você, então, con­si­de­rará duas hipó­te­ses:

(H1) algo acon­te­ceu à usina elé­trica às 20h00, na terça-feira, o que afe­tou todas as luzes; ou

(H2) algo acon­te­ceu a cada uma das lâm­pa­das, às 8:00 na terça-feira, que influ­en­ciou se a luz con­ti­nu­a­ria.

Pos­tu­lar uma única causa comum é mais par­ci­mo­ni­oso do que pos­tu­lar um grande número de cau­sas inde­pen­den­tes, sepa­ra­das. O escu­re­ci­mento simul­tâ­neo de todas essas luzes é mais pro­vá­vel se H1 for ver­dade em vez de H2. Com base em ideias desen­vol­vi­das pelo filó­sofo Hans Rei­chen­bach, você pode pro­var mate­ma­ti­ca­mente (a par­tir das hipó­te­ses que H1 e H2 estão refle­tindo) que as obser­va­ções favo­re­cem H1 sobre H2. O mate­ma­ti­ca­mente curi­oso pode­ria ter um olhar para o meu livro de Ockhams Razors: A Users Manual (2015).

Um exem­plo bio­ló­gico impor­tante em que cau­sas comuns são pre­fe­rí­veis às cau­sas dis­tin­tas pode ser encon­trado na hipó­tese de Char­les Darwin, de que toda a vida atual remonta a um ou alguns pro­ge­ni­to­res ori­gi­nais. Os bió­lo­gos moder­nos estão na mesma página quando apon­tam para a uni­ver­sa­li­dade perto do código gené­tico, favo­re­cendo tão for­te­mente a hipó­tese de ances­tra­li­dade comum uni­ver­sal sobre a hipó­tese de múl­ti­plos ante­pas­sa­dos. O código com­par­ti­lhado seria uma coin­ci­dên­cia sur­pre­en­dente se dife­ren­tes gru­pos de orga­nis­mos resul­tas­sem de dife­ren­tes pon­tos de par­tida. Seria muito mais pro­vá­vel se toda a vida atual fosse ras­tre­ada até uma única ori­gem.

De acordo com o ter­ceiro para­digma da par­cimô­nia, a par­cimô­nia é rele­vante para esti­mar a pre­ci­são com que um modelo irá pre­ver novas obser­va­ções. Um resul­tado cen­tral na parte de esta­tís­ti­cas cha­ma­dos “teo­ria de sele­ção de mode­los” é devido a Hiro­tugu Akaike, que pro­vou um teo­rema sur­pre­en­dente que demons­trou essa rele­vân­cia. Este teo­rema é a base de um cri­té­rio de ava­li­a­ção modelo que veio a ser cha­mado AIC (Cri­té­rio de Infor­ma­ção Akaike). O AIC diz que a capa­ci­dade de um modelo de pre­ver novos dados pode ser esti­mada ao ver o quão bem ele encaixa dados anti­gos e vendo como são sim­ples.

Aqui está um exem­plo. Você está diri­gindo por uma estrada rural no final do verão e per­cebe que exis­tem dois gran­des cam­pos de milho, um de cada lado da estrada. Você para seu carro e colhe uma amos­tra de 100 plan­tas de milho de cada campo. Você acha que a altura média na pri­meira amos­tra é de 52 pole­ga­das e a altura média na segunda amos­tra é de 56 pole­ga­das. Uma vez que seja no final da esta­ção de cres­ci­mento, você assume que as altu­ras médias nos dois cam­pos enor­mes não vão mudar ao longo dos pró­xi­mos dias. Você pre­tende vol­tar aos dois cam­pos no dia seguinte, e colher novas amos­tras de 100 plan­tas de milho de cada lado. Qual das duas pre­vi­sões seguin­tes você con­si­dera ser mais pre­cisa?

Pre­di­ção A: as 100 plan­tas que você colher no dia seguinte da pri­meira colheita terão, em média, 52 pole­ga­das; e as 100 plan­tas que você colher no dia seguinte da segunda colheita terão, em média, 56 pole­ga­das.

Pre­vi­são B: cada uma das duas amos­tras terão, em média, 54 pole­ga­das.

A teo­ria da sele­ção de mode­los diz que este pro­blema pode ser resol­vido ao con­si­de­rar os dois seguin­tes mode­los das altu­ras médias das duas popu­la­ções:

DIFF: a altura média na pri­meira popu­la­ção = h1, e a altura média na segunda popu­la­ção = h2.

NULL: a altura média na pri­meira popu­la­ção = altura média na segunda popu­la­ção = h.

Nenhum modelo diz quais são os valo­res de h1, h2, e h; estes são cha­ma­dos de ‘parâ­me­tros ajus­tá­veis’. O modelo NULL tem esse nome por­que ele diz que as duas popu­la­ções não dife­rem em suas altu­ras médias. O nome que dão ao modelo DIFF é um pouco enga­na­dor, uma vez que o modelo não diz que as duas popu­la­ções dife­rem em suas altu­ras médias. DIFF per­mite esta pos­si­bi­li­dade, mas tam­bém per­mite que as duas popu­la­ções pos­sam ter a mesma altura média.

O que DIFF e NULL pre­veem sobre os dados que você irá dese­nhar a par­tir dos dois cam­pos de ama­nhã? Os mode­los por conta pró­pria não for­ne­cem núme­ros. No entanto, você pode ade­quar cada modelo aos dados anti­gos ao esti­mar os valo­res dos parâ­me­tros ajus­tá­veis ​​(H1, H2, e h) nos dois mode­los. O resul­tado é os dois mode­los embu­ti­dos seguin­tes:

f(DIFF): H1 = 52 pole­ga­das, e H2 = 56 pole­ga­das.

f(NULL): h = 54 pole­ga­das.

A ques­tão de qual modelo irá pre­ver com maior pre­ci­são os novos dados é inter­pre­tada para dizer: qual é o modelo que, quando equi­pado com os dados anti­gos que você tem, vai pre­ver com maior pre­ci­são os novos dados que você ainda não tem?

DIFF, você pode estar pen­sando, tem que ser ver­da­deiro. E NULL, você tam­bém pode estar pen­sando, deve ser falsa. Quais são as chan­ces de que essas duas gran­des popu­la­ções de plan­tas de milho devem ter exa­ta­mente a mesma altura média? Se seu obje­tivo fosse dizer qual dos dois mode­los é ver­da­deiro e qual é falso, tudo esta­ria feito. Mas esse não é o pro­blema em ques­tão. Em vez disso, você quer ava­liar os dois mode­los para as suas pre­ci­sões de pre­vi­são. Um dos fatos sur­pre­en­den­tes sobre mode­los como NULL e DIFF é que um modelo conhe­cido por ser falso, às vezes, faz pre­vi­sões mais pre­ci­sas do que um modelo conhe­cido para ser ver­da­deiro. NULL, embora falso, pode sig­ni­fi­car perto da ver­dade. Se for, pode ser melhor que você use NULL para pre­ver novos dados, ao invés de usar DIFF para fazer a sua pre­vi­são. Afi­nal, os dados anti­gos podem não ser repre­sen­ta­ti­vos! NULL o man­tém na reta e à estreita; DIFF o con­vida a se des­viar.

Não há ques­tões de gosto em dis­puta quando se trata do valor da sim­pli­ci­dade e da com­ple­xi­dade nas obras de arte. Mas a sim­pli­ci­dade, na ciên­cia, não é uma ques­tão de gosto.

O AIC ava­lia NULL e DIFF, tendo em conta dois fatos: f(DIFF) ade­qua os dados anti­gos melhor do que f(NULL) faz, e DIFF é mais com­plexo do que NULL. Aqui, a com­ple­xi­dade de um modelo se dá pelo número de parâ­me­tros ajus­tá­veis ​​que o modelo con­tém. Como eu men­ci­o­nei, a AIC é base­ada no teo­rema de Akaike, o que pode ser des­crito infor­mal­mente, como segue:

Uma esti­ma­tiva impar­cial da pre­ci­são da pre­vi­são do modelo M = [quão bem f(M) se ajusta aos dados anti­gos] menos [o número de parâ­me­tros ajus­tá­veis que ​​M con­tém].

Um resul­tado mate­má­tico, por­tanto, pode esta­be­le­cer que a par­cimô­nia é rele­vante para esti­mar a pre­ci­são da pre­vi­são.

O teo­rema de Akaike é um teo­rema, o que sig­ni­fica que ele é deri­vado de supo­si­ções. Há três. A pri­meira é que os con­jun­tos de dados anti­gos e novos são gera­dos a par­tir da mesma rea­li­dade sub­ja­cente; esta hipó­tese é satis­feita no nosso exem­plo, sobre se a altura média de cada popu­la­ção per­ma­nece inal­te­rada enquanto os con­jun­tos de dados anti­gos e novos são dese­nha­dos. A segunda hipó­tese é que as esti­ma­ti­vas repe­ti­das de cada um dos parâ­me­tros de um modelo irá for­mar uma dis­tri­bui­ção em forma de sino. A ter­ceira hipó­tese é que um dos mode­los con­cor­ren­tes é ver­dade, ou é perto da ver­dade. Essa supo­si­ção está satis­feita no exem­plo do milho, uma vez que NULL ou DIFF deve ser ver­dade.

Gaudí e Mies lem­bram-nos que não há ques­tões em dis­puta de gosto quando se trata de ava­liar o valor da sim­pli­ci­dade e com­ple­xi­dade nas obras de arte. Eins­tein e New­ton dizem que a ciên­cia é dife­rente — sim­pli­ci­dade, na ciên­cia, não é uma ques­tão de gosto. Rei­chen­bach e Akaike for­ne­cem algu­mas razões pelas quais isso é assim. O resul­tado é que exis­tem três para­dig­mas da par­cimô­nia que expli­cam como a sim­pli­ci­dade de uma teo­ria pode ser rele­vante para dizer sobre como o mundo é:

Para­digma 1: às vezes, as teo­rias mais sim­ples têm mai­o­res pro­ba­bi­li­da­des.

Para­digma 2: às vezes, as teo­rias mais sim­ples são melhor supor­ta­das pelas obser­va­ções.

Para­digma 3: às vezes, a sim­pli­ci­dade de um modelo é rele­vante para esti­mar a sua pre­ci­são pre­di­tiva.

Estes três para­dig­mas têm algo impor­tante em comum. Se um deter­mi­nado pro­blema se encaixa em qual­quer um deles, isso depende de pre­mis­sas empí­ri­cas sobre o pro­blema. Essas hipó­te­ses podem ser ver­da­dei­ras para alguns pro­ble­mas, mas fal­sas para outros. Embora a par­cimô­nia seja com­pro­va­da­mente rele­vante para for­mar um juízo sobre como é o mundo, não há, ao fim das con­tas, nenhuma jus­ti­fi­ca­ção incon­di­ci­o­nal de pres­su­pos­tos para a Nava­lha de Ockham.


Artigo tra­du­zido por Alys­son Augusto e ori­gi­nal­mente publi­cado em Aeon.


Seja patrono do AZ para tra­du­zir­mos mais arti­gos como este.
CLIQUE AQUI e esco­lha sua recom­pensa.


Newsletter AZ | sabedoria budista


Você pode que­rer ler tam­bém:

O pior ini­migo da ciên­cia é seu melhor amigo?
As 20 mulhe­res que muda­ram a ciên­cia (e o mundo)

Elliott Sober
Professor pesquisador na Universidade de Wisconsin, Madison.

Compartilhe