Proof: The Uncertain Science of Certainty
El llibre "Proof: The Uncertain Science of Certainty" d'Adam Kucharski explora la naturalesa de la certesa, la veritat i la prova en la ciència i la societat, examinant com les diferents disciplines han intentat discernir entre el que és cert i el que és fals, i què passa quan aquests mètodes fallen. L'autor, un matemàtic i professor especialitzat en epidèmies, ha treballat en anàlisis en temps real per a governs i agències de salut, com les epidèmies d'Ebola, Zika i COVID-19.
El llibre s'estructura en capítols que aborden diferents facetes, des de la lògica matemàtica antiga fins a la intel·ligència artificial moderna.
La Prova i la Certesa: Una Introducció
Kucharski introdueix la idea que la prova no només es tracta del que és veritat, sinó de convèncer-nos a nosaltres mateixos i als altres que alguna cosa és veritat, sovint sota una gran urgència, com en un judici o la implementació d'una vacuna. Les diferents situacions exigeixen diferents enfocaments per a la prova, ja sigui des de la perspectiva d'un filòsof, un advocat, un informàtic o un estadístic. El llibre busca explorar les llacunes en la nostra comprensió del que és veritat i per què ho és, i com les idees han ajudat a les societats i científics a prendre decisions i reduir errors.
Un exemple clau d'aquesta incertesa és el problema de Monty Hall, un trencaclosques matemàtic simple però contraintuïtiu que va generar una gran controvèrsia, fins i tot entre matemàtics d'alt nivell com Paul Erdős, que inicialment va creure que canviar de porta no alterava les probabilitats. La solució (que és millor canviar) sovint no s'entén intuïtivament, fins i tot quan es demostra per "prova per esgotament" (examinant totes les combinacions possibles) o per "prova per simulació" (executant el joc milers de vegades). Aquest problema il·lustra que fins i tot les veritats aparentment simples poden ser divisòries i que l'acceptació de la prova pot dependre de factors socials, més enllà de l'evidència.
Axiomes Nacionals i la Lògica Euclideana
El llibre comença examinant la influència dels "Elements" d'Euclides, un text de 2.000 anys d'antiguitat que va establir un sistema per al coneixement, construint veritats universals a partir de definicions i axiomes autoevidents (com ara "el tot és més gran que la seva part"). Aquest enfocament, que va ser un best-seller (segon només a la Bíblia), va influir profundament en el pensament occidental, no només en matemàtiques sinó també en la política.
John Locke, per exemple, va prendre orientació de l'estructura lògica d'Euclides per establir els "drets naturals" de la societat, definint conceptes per derivar declaracions autoevidents sobre la llibertat i la igualtat. De manera similar, pensadors de la Il·lustració com Voltaire i Immanuel Kant van creure que el raonament objectiu podria portar a veritats universals en moral i estètica, comparable a la geometria.
Els Pares Fundadors dels Estats Units, especialment Thomas Jefferson i Benjamin Franklin, van utilitzar un estil lògic similar al d'Euclides per redactar la Declaració d'Independència, basant-la en "veritats autoevidents". Abraham Lincoln va estudiar Euclides per afinar la seva lògica, utilitzant la "prova per contradicció" (una tècnica euclidiana que assumeix que una afirmació és falsa per demostrar que condueix a conclusions contradictòries, provant així que l'afirmació original és veritable) per argumentar contra l'esclavitud. Lincoln va assenyalar que la veritat autoevident de la igualtat en la Declaració era, en realitat, una "proposició a provar" donada la persistència de l'esclavitud.
No obstant això, el llibre també destaca les limitacions dels sistemes axiomàtics rígids. Els intents de codificar lleis completament, com en els codis prussià i napoleònic, van fallar perquè sempre hi havia escenaris no coberts o inconsistències, demostrant que la incertesa legal no es pot eliminar per "pura força bruta". Les societats, com les teories científiques, han de ser flexibles per adaptar-se i fins i tot abraçar contradiccions.
La Lògica Crea Monstres Matemàtics: Els Límits de la Intuïció
El llibre s'endinsa en el concepte de "monstres matemàtics", funcions o entitats que desafien la intuïció. Comença amb les paradoxes de Zenó d'Elea (com la d'Aquil·les i la tortuga), que mostraven com la lògica podia produir conclusions que semblaven contràries a la realitat, deixant una pregunta sense resoldre durant segles sobre la fiabilitat dels principis lògics.
Aquesta crisi es va agreujar amb el treball de Karl Weierstrass, qui va crear una funció contínua però "sense seccions suaus" (és a dir, sense derivades calculables en cap punt), desafiant la creença comuna que totes les funcions contínues tenien parts "suaus". Aquesta funció, inicialment anomenada "monstre" per Henri Poincaré, es va construir amb "lògica concreta" (prova per construcció) i va demostrar que la intuïció física no és una base fiable per a les teories matemàtiques. La definició rigorosa de Weierstrass va resoldre la paradoxa de Zenó, demostrant que distàncies infinitament petites es poden recórrer en temps zero.
Tot i que inicialment van ser rebutjats, aquests "monstres" van trobar acceptació en la ciència, ja que van resultar útils per descriure fenòmens del món real. Albert Einstein va utilitzar idees relacionades amb els "monstres" de Weierstrass per explicar el moviment brownià (el moviment aleatori de partícules) i la geometria no euclidiana per desenvolupar la seva teoria general de la relativitat. La necessitat de rigor va portar a Kiyoshi Itō a crear un "diccionari" rigorós per a la teoria de la probabilitat, fundant el "càlcul estocàstic", utilitzat ara en camps com les finances (fórmula de Black-Scholes) i l'epidemiologia.
El llibre també discuteix els teoremes d'incompletud de Kurt Gödel, que demostren que qualsevol sistema axiomàtic consistent d'aritmètica contindrà afirmacions veritables que no es poden provar dins d'aquest sistema. Gödel fins i tot va veure "contradiccions internes" en la Constitució dels EUA que podrien permetre legalment l'ascens d'un dictador.
Cent Culpables i Un Innocent: Justícia i Probabilitat
El sistema de justícia s'enfronta al doble desafiament de definir el que és correcte i incorrecte, i de tractar amb els acusats. L'absolució de William Armstrong per part de Lincoln, utilitzant un almanac com a "avís judicial" de fet indiscutible, il·lustra el poder dels fets verificables.
El concepte de "prova més enllà de tot dubte raonable" és fonamental en la justícia. El llibre examina el "ràtio de Blackstone" ("és millor que deu persones culpables escapin que una innocent pateixi"), una ponderació dels errors judicials.
La justícia moderna s'ha basat cada cop més en la probabilitat:
- El "teorema del jurat" de Condorcet calculava que un jurat més gran augmentaria la probabilitat d'una decisió correcta si els jurats individuals eren majoritàriament encertats.
- El cas del testament de Howland va ser un dels primers a utilitzar la probabilitat com a prova en tribunals dels EUA, amb Benjamin Peirce calculant la probabilitat (1 entre 900 mil milions) que les signatures falsificades fossin coincidència.
- El llibre adverteix contra la "fal·làcia del fiscal" (confondre la probabilitat de l'evidència donada la culpabilitat amb la probabilitat de la culpabilitat donada l'evidència, com en el cas de la infermera Lucia de Berk).
- El "paradoxa de l'autobús blau" il·lustra el perill d'aplicar arguments de probabilitat de població a casos individuals.
També es discuteixen les limitacions de l'evidència, com la manca de fiabilitat dels testimonis oculars i de l'anàlisi forense (cal·ligrafia, marques de mossegada). El cas de la Post Office del Regne Unit (on errors informàtics van portar a processaments falsos de subdirectors de correus) subratlla el perill de suposar que els sistemes informàtics són infal·libles, i es qualifica com el "més gran error judicial de la història anglesa moderna".
La creixent popularitat dels algorismes de justícia penal (com l'Avaluació de Seguretat Pública, PSA) per predir el risc de reincidència genera preocupació per biaixos (explícits o implícits) i la dificultat de garantir la imparcialitat. Aquests "caixes negres" algorítmiques fan difícil comprendre o desafiar les decisions.
Tastant Te Estadístic i Elaborant Cervesa Científica: Causa i Efecte
El llibre examina com la ciència intenta determinar si una cosa influeix en una altra. La investigació de Francis Galton sobre l'eficàcia de la pregària (comparant l'esperança de vida de la reialesa amb altres grups) va ser un dels primers intents d'abordar una qüestió no científica amb la estadística, enmig d'una "crisi de fe".
Janet Lane-Claypon va ser una pionera, utilitzant estudis de cohort retrospectius (sobre l'alimentació de nadons) i estudis de cas-control (sobre el càncer de mama) per entendre les causes i efectes en la salut.
El treball de William Sealy Gosset ("Student"), un cerveser de Guinness, va ser fonamental per entendre l'impacte de l'atzar en petits experiments. La seva recerca sobre l'"error probable d'una mitjana" va ajudar a evitar conclusions errònies en estudis petits. Gosset valorava l'eficiència i l'ús pràctic de les dades, fins i tot si els resultats no eren "estadísticament significatius" segons els criteris establerts.
Ronald Fisher va ser clau en la conceptualització de la metodologia científica. El seu famós experiment de tast de te amb Muriel Bristol va destacar la importància de la aleatorització i la hipòtesi nul·la (que mai es pot provar, només refutar). Fisher també va popularitzar el valor p del 5% com a llindar de "significació estadística", tot i que la seva adopció va ser una barreja de conveniència i un ús "arbitrari".
El llibre detalla la tensió entre l'enfocament de Fisher (centrat en si una hipòtesi nul·la era incorrecta) i el de Jerzy Neyman i Egon Pearson (centrat en la decisió de quina hipòtesi acceptar o rebutjar, introduint els conceptes d'errors de tipus I i tipus II). Aquesta tensió va portar a una "confusió" en els llibres de text d'estadística que van masegar ambdós enfocaments. Neyman també va desenvolupar els intervals de confiança, una manera de quantificar la incertesa en les estimacions d'una mostra.
Un dels avenços més importants en medicina han estat els Assajos Controlats Aleatoritzats (ACR). El primer ACR modern en medicina (per la estreptomicina contra la tuberculosi el 1947, liderat per Austin Bradford Hill) va demostrar el poder de l'aleatorització i el cegament per evitar biaixos i determinar la veritable eficàcia d'un tractament. Els ACRs s'han estès a la política social (amb figures com Judy Gueron liderant els primers assajos en programes de benestar). El llibre destaca com els experiments naturals (esdeveniments que creen grups de control i tractament aleatoris de manera natural, com una vaga de metro o una loteria escolar) poden ser tan valuosos com els ACRs planificats.
No obstant això, els ACRs tenen limitacions: només proporcionen un "efecte mitjà" (que pot no ser rellevant per a un individu), i pateixen el "problema del transport" (l'eficàcia en un ACR pot no traduir-se en l'efectivitat en el món real). També hi ha dilemes ètics quan un tractament ja sembla molt eficaç, fent que un ACR no sigui "clínicament equilibrat" (com amb l'ECMO per a nadons, que va portar a l'ús d'assaigs de "jugar al guanyador"). Malgrat ser el "patró d'or", el llibre argumenta que no sempre són la millor o única opció, i que una "jerarquia de l'evidència" que els posa al capdavant no hauria de ser una regla rígida.
El llibre introdueix l'escala de causalitat de Judea Pearl, que distingeix entre veure (associació), fer (intervenció) i imaginar (contrafactuals), destacant que la ciència busca pujar aquests esglaons per entendre per què passen les coses i com intervenir-hi. També s'aborda la "triangulació", que implica combinar estudis amb diferents fonts de biaix per obtenir conclusions més fiables, en lloc de simplement repetir el mateix tipus d'estudi.
Esquerdes de Paradigma i Grans Mentides: Ciència i Desinformació
La pandèmia de COVID-19 va il·lustrar la tensió entre la recerca de la veritat científica i la urgència de la presa de decisions, amb dades complexes i la necessitat d'actuar ràpidament. El llibre analitza com la ciència progressa a través de la inducció (d'Abu Bakr Muhammad al-Karaji) i l'abducció (la "millor explicació" de Charles Peirce, que Holmes utilitzava), que són diferents de la deducció.
El filòsof Karl Popper va argumentar que la ciència avança mitjançant la falsificabilitat (la possibilitat de refutar una teoria). No obstant això, el llibre també explora la idea de Thomas Kuhn sobre els "canvis de paradigma" en la ciència, que suggereixen que els científics sovint canvien a una teoria dramàticament diferent per "fe" més que per una falsificació simple, veient la ciència amb "defectes humans i comportament de ramat".
El llibre dedica una secció important a la desinformació. La "prova per intimidació" (apel·lar a l'autoritat sense explicació) o la "prova per afirmació" (repetir una afirmació fins que es creu) són tàctiques nocives. Els estàndards legals per acceptar proves científiques (com els estàndards Frye i Daubert als EUA) intenten combatre això exigint validesa científica i acceptació general.
Una "crisi de replicació" s'ha estès en la ciència, amb molts resultats publicats que no es poden reproduir en estudis posteriors, sovint a causa de biaixos en la publicació (els articles amb resultats "significatius" són més propensos a ser publicats) i la manipulació de dades. La preinscripció d'estudis intenta mitigar això.
El llibre destaca que "l'absència d'evidència no és evidència d'absència", exemplificat pel cas de Frances Kelsey que va bloquejar l'aprovació de la talidomida als EUA malgrat la manca inicial de proves concloents de dany, evitant una tragèdia que va succeir a Europa.
La desinformació, especialment la "gran mentida" (un terme encunyat per Hitler per a falsedats massives) es propaga aprofitant la vulnerabilitat emocional i la tendència a la "veritat il·lusòria" (la repetició augmenta la creença). Combatre la desinformació requereix comprendre per què la gent dubta i abordar aquests dubtes, en lloc de recórrer a tàctiques de por.
En les Màquines Confiem: Intel·ligència Artificial i Prova
El capítol final explora la confiança en la intel·ligència artificial (IA), especialment quan no entenem el "per què" de les seves decisions. Els algorismes de "caixa negra" (models complexos i opacs) sovint són més precisos que els de "caixa blanca" (transparents). El dilema ètic amb els cotxes autònoms i el "problema del trolley" il·lustra la nostra necessitat d'explicació quan les conseqüències són greus. No obstant això, en medicina (desfibril·lació, anestèsia) i aviació, acceptem tecnologies que funcionen sense entendre completament el seu mecanisme subjaent.
El llibre mostra l'evolució de la IA:
- Raonament simbòlic (IA antiga): Segueix instruccions explícites (com les proves d'Euclides).
- Xarxes neuronals (IA moderna): Aprenen de dades sense regles explícites, imitant el cervell (reconeixement d'escriptura a mà).
- Deep learning: Xarxes neuronals amb múltiples capes.
- Transformers i grans models de llenguatge (LLM): Utilitzen "atenció" per processar i generar text a escala industrial, com GPT.
- La "prova per esgotament" computacional (resolent un gran nombre de possibilitats, com en el Sudoku o el Go, amb AlphaGo) ha esdevingut crucial per a problemes complexos que superen la capacitat humana. També existeixen les "proves de coneixement zero", que permeten demostrar coneixement sense revelar-ne els detalls.
La qüestió de la confiança en el coneixement descentralitzat es posa de manifest amb exemples com la moneda de pedra "rai" de l'illa de Yap (on el consens de la comunitat manté el valor sense possessió física o autoritat central). La blockchain de Bitcoin utilitza l'esforç computacional ("prova de treball") per establir el consens i verificar transaccions de manera descentralitzada, tot i que això té costos energètics i riscos de col·lusió. Les aplicacions de rastreig de contactes durant la pandèmia també van mostrar la tensió entre la recollida de dades per a la salut pública i la protecció de la privacitat.
Quant Perdem? (Comunicació de la Incertesa i Futur de la Prova)
Kucharski reflexiona sobre el repte de comunicar la incertesa, especialment quan les estimacions són alarmants i no hi ha proves publicades. Subratlla que la transparència i la disponibilitat pública de l'evidència són fonamentals per a un debat i polítiques millors.
El llibre conclou que, a mesura que la ciència es torna més complexa i computacional, la prova es basarà cada cop més en la confiança en els investigadors, les institucions i les màquines. La veritat és sovint "filla del temps", però les decisions urgents requereixen una interpretació ràpida de l'evidència, fins i tot quan és incompleta. Per navegar per aquesta complexitat, hem de "rebuscar en un bosc espès d'errors i biaixos", "enfrontar-nos als monstres" i "abraçar la incertesa", buscant totes les dades útils, qüestionant, mesurant i triangulant. El coneixement científic no és democràtic i, un cop demostrat, no és opinable, tot i que la seva aplicació pot tenir problemes a causa de la naturalesa humana dels qui l'apliquen [veure resum anterior, però el tema de fons és similar, la ciència proporciona les eines, però la societat decideix com utilitzar-les i interpretar-les, un tema transversal al llibre de Kucharski també]. El llibre és un recordatori que la ciència és un procés de construcció constant, on a vegades "una paret sencera s'ensorra" si els fonaments no són els correctes.