El llibre "Causal Inference: What If" de Miguel A. Hernán i James M. Robins, actualitzat el 27 de maig de 2025, no es presenta com una descripció exhaustiva de totes les metodologies d'inferència causal, sinó que se centra en ajudar els científics, especialment els de les ciències de la salut i socials, a generar i analitzar dades per fer inferències causals que siguin explícites tant sobre la pregunta causal com sobre les suposicions que sustenten l'anàlisi de dades. Els autors subratllen la necessitat d'articular la pregunta causal i de delinear els rols separats de les dades i les suposicions per a la inferència causal, amb l'objectiu de fer les inferències menys "casuals" i prevenir la confusió.
El llibre se centra en la identificació i estimació d'efectes causals en poblacions, definits com a quantitats numèriques que mesuren canvis en la distribució d'un resultat sota diferents intervencions. No és un llibre de filosofia, sinó que busca ajudar els qui prenen decisions a prendre'n de millors a través d'una inferència causal accionable.
El llibre està dividit en tres parts de dificultat creixent:
- Part I: Inferència Causal sense Models (identificació no paramètrica d'efectes causals).
- Part II: Inferència Causal amb Models (estimació d'efectes causals amb models paramètrics).
- Part III: Inferència Causal a partir de Dades Longitudinals Complexes (estimació d'efectes causals de tractaments que varien en el temps).
A continuació, es detalla el contingut del llibre per parts:
Part I: Inferència Causal sense Models
-
Definició d'Efecte Causal [Capítol 1]:
- Un efecte causal individual es defineix si el resultat de l'individu sota tractament (Y_a=1) és diferent del resultat sota no tractament (Y_a=0) [1.1, 21]. Aquests s'anomenen resultats potencials o contrafactuals.
- El llibre se centra principalment en els efectes causals mitjans en una població , ja que els efectes causals individuals generalment no són identificables.
- Es fan suposicions clau com la no interferència (el tractament d'un individu no afecta el resultat d'altres) i la no existència de múltiples versions del tractament (totes les formes del tractament 'a' produeixen el mateix resultat).
- La causació es distingeix clarament de l'associació: la causació compara resultats en la mateixa població sota diferents valors de tractament, mentre que l'associació compara resultats en subconjunts disjunts de la població segons el tractament realment rebut .
-
Experiments Aleatoritzats [Capítol 2]:
- En un experiment aleatoritzat ideal, la aleatorització garanteix l'intercanviabilitat entre el grup tractat i el no tractat, permetent identificar els efectes causals.
- Es presenten dues metodologies principals per estimar efectes causals en experiments aleatoritzats condicionals: la estandardització i la ponderació de probabilitat inversa (IP weighting) [2.3, 2.4, 47, 51]. Ambdues són equivalents sota certes condicions. La IP weighting crea una "pseudo-població" on el tractat i el no tractat són incondicionalment intercanviables.
-
Estudis Observacionals [Capítol 3]:
- Els estudis observacionals es poden conceptualitzar com a experiments aleatoritzats condicionals si es compleixen les condicions d'identificabilitat:
- Intervencions ben definides: Els valors del tractament corresponen a intervencions clares i unívoques .
- Intercanviabilitat (condicional): Els grups tractats i no tractats són comparables un cop s'ajusta per certes covariables (L).
- Positivitat: Totes les combinacions de tractament i covariables tenen una probabilitat no nul·la d'observar-se .
- Consistència: L'observat es correspon amb el contrafactual que s'hauria observat sota el tractament realment rebut.
- La inferència causal a partir de dades observacionals requereix l'assumpció d'aquestes condicions d'identificabilitat, que no estan garantides per disseny com en els experiments aleatoritzats .
- S'introdueix el concepte de "target trial" (assaig objectiu): especificar el protocol d'un experiment aleatoritzat hipotètic que es voldria realitzar, i després descriure com les dades observacionals s'utilitzarien per emular-lo .
- Els estudis observacionals es poden conceptualitzar com a experiments aleatoritzats condicionals si es compleixen les condicions d'identificabilitat:
-
Modificació de l'Efecte i Interacció [Capítols 4 i 5]:
- Modificació de l'efecte: Una variable (V) és modificadora de l'efecte si l'efecte causal mitjà del tractament varia segons els nivells de V .
- Estratificació es pot utilitzar per identificar la modificació de l'efecte.
- Interacció: Requereix una intervenció conjunta de dos o més tractaments (A i E) i s'analitza a través dels 16 tipus de respostes contrafactuals possibles . La interacció de causa suficient s'endinsa en els mecanismes causals. El llibre utilitza el marc contrafactual ("què passa?") més que el de causa suficient ("com passa?") per a l'estimació d'efectes.
-
Representació Gràfica dels Efectes Causals (DAGs) [Capítol 6]:
- Els diagrames causals (DAGs) són eines gràfiques per representar el coneixement expert i les suposicions sobre l'estructura causal d'un problema, ajudant a aclarir problemes conceptuals .
- Un DAG dirigeix la inferència: una fletxa indica un efecte causal directe; l'absència d'una fletxa indica l'absència de qualsevol efecte causal directe .
- Els DAGs també codifiquen informació sobre associacions. Els SWIGs (Single World Intervention Graphs) unifiquen els enfocaments contrafactuals i gràfics, incloent explícitament variables contrafactuals en el diagrama .
-
Classificació Estructural del Biaix [Capítols 7, 8, 9]:
- El biaix sistemàtic ocorre quan les dades són insuficients per identificar l'efecte causal, fins i tot amb una mida de mostra infinita.
- Confusió: Es produeix quan el tractament i el resultat comparteixen una causa comuna (L o U) que resulta en un camí "backdoor" o "de porta de darrere" obert entre ells. L'ajustament per confondre busca bloquejar aquests camins.
- Biaix de selecció: Sorgeix del procediment pel qual els individus són seleccionats per a l'anàlisi, generalment a causa del condicionament sobre un efecte comú (collider) de dues variables (una relacionada amb el tractament i l'altra amb el resultat). Exemples inclouen la pèrdua de seguiment diferencial, dades perdudes i el biaix del "treballador sa" ]. La IP weighting es pot utilitzar per ajustar-lo.
- Biaix de mesura: Resulta d'errors en la mesura de variables (tractament, resultat o confounders). Pot ser independent/dependent i no diferencial/diferencial El mesurament de confounders amb error també pot induir biaix.
-
Variabilitat Aleatòria [Capítol 10]:
- Diferència entre identificació (assumint mostra infinita) i estimació (treballant amb mostres finites) .
- Es discuteix el "mite de la superpoblació" com a base per a la inferència estadística, reconeixent la variabilitat de mostreig.
- El principi de condicionalitat i la "maledicció de la dimensionalitat" s'exploren en entorns amb moltes covariables, on els estimadors ajustats poden tornar-se no informatius .
Part II: Inferència Causal amb Models
-
Per què Models? [Capítol 11]:
- Les dades per si soles no sempre són suficients; sovint cal complementar-les amb un model, especialment quan el nombre de valors possibles del tractament és molt superior a la mida de la mostra.
- Els estimadors paramètrics permeten estimar quantitats no observables, però requereixen que el model estigui correctament especificat . Els estimadors no paramètrics no imposen restriccions a priori.
- Es discuteix la compensació entre biaix i variància en la selecció del model: models més complexos redueixen el biaix però augmenten la variància.
-
Ponderació de Probabilitat Inversa (IP Weighting) i Models Estructurals Marginals (MSMs) [Capítol 12]:
- L'IP weighting s'estén a l'ús de models per estimar la probabilitat condicional de rebre el tractament donades les covariables (el propensity score), essencial per a dades d'alta dimensionalitat .
- S'introdueixen els pesos estabilitzats (stabilized IP weights) per reduir la variància i mantenir la mida de la pseudo-població similar a la de l'estudi original .
- Els models estructurals marginals són models per a la mitjana contrafactual del resultat, que s'ajusten a la pseudo-població creada pels pesos IP .
- Es detalla com manejar el biaix de selecció degut a la censura o les dades perdudes en el resultat utilitzant pesos IP addicionals .
-
Estandardització i la G-fórmula Paramètrica [Capítol 13]:
- L'estandardització, com a alternativa a la IP weighting, també s'adapta a entorns d'alta dimensionalitat mitjançant l'ús de models paramètrics per estimar les mitjanes condicionals del resultat
- La g-fórmula paramètrica és una extensió de la estandardització per a quantitats més complexes, que "plug-in" estimacions de distribucions condicionals .
- S'introdueixen els estimadors doblement robustos (doubly robust estimators), que són consistents si almenys un de dos models (el del tractament o el del resultat) està correctament especificat, oferint una major protecció contra l'especificació incorrecta del model .
-
G-estimació de Models Estructurals Nius (Structural Nested Models - SNMs) [Capítol 14]:
- La g-estimació és un tercer "g-mètode" que estima els paràmetres de models anomenats models estructurals nius.
- Aquests models són semiparamètrics (fan menys suposicions sobre certs paràmetres) i quantifiquen l'efecte causal mitjà del tractament dins dels nivells de les covariables .
- La g-estimació busca trobar un valor per als paràmetres del model que faci que una variable auxiliar sigui independent del tractament, basant-se en la propietat d'intercanviabilitat condicional.
-
Regressió del Resultat i Puntuacions de Propensió (Propensity Scores) [Capítol 15]:
- Es discuteixen mètodes paramètrics d'ús comú. La regressió del resultat estima directament la relació entre tractament, covariables i resultat .
- Les puntuacions de propensió (probabilitat de rebre tractament donades les covariables) són una "puntuació de balanceig" que permet ajustar per confusió reduint la dimensionalitat de L [15.2, 362, 363].
- La estratificació per propensió i el aparellament per propensió s'utilitzen per crear grups comparables en funció de la puntuació de propensió, tot i que poden excloure part de la població i dificultar la transportabilitat dels efectes .
-
Estimació amb Variables Instrumentals (IV) [Capítol 16]:
- Les variables instrumentals són un mètode alternatiu per estimar efectes causals quan hi ha confusió no mesurada.
- Requereixen tres condicions clau:
- Rellevància: L'instrument Z està associat amb el tractament A .
- Restricció d'exclusió: L'instrument Z no té un efecte directe sobre el resultat Y, excepte a través del tractament A .
- No confusió no mesurada de l'instrument-resultat: No hi ha causes comunes no mesurades de Z i Y .
- Amb aquestes condicions i l'assumpció addicional d'homogeneïtat (l'efecte és el mateix per a tothom) o monotonicitat (ningú faria el contrari del que s'espera si el tractament canvia), l'estimador IV usual identifica l'efecte causal mitjà .
- Es discuteixen els problemes dels instruments febles (associació dèbil entre Z i A), que poden amplificar el biaix i la variabilitat .
-
Anàlisi de Supervivència Causal [Capítol 17]:
- Adapta els mètodes a resultats de temps fins a l'esdeveniment (failure time outcomes), considerant mesures com probabilitat de supervivència, risc i hazard .
- S'explica com manejar la censura (administrativa, pèrdua de seguiment, esdeveniments competidors) .
- Els g-mètodes (IP weighting i g-fórmula paramètrica) s'estenen per ajustar confounders en l'anàlisi de supervivència .
-
Selecció de Variables i Dades d'Alta Dimensionalitat [Capítol 18]:
- Ofereix pautes per seleccionar les variables L per a l'ajustament, reconeixent que el coneixement del subjecte és clau.
- Discussió de les variables que indueixen o amplifiquen el biaix (e.g., mediadors i colliders) .
- S'introdueixen els estimadors de machine learning per manejar dades d'alta dimensionalitat i la "maledicció de la dimensionalitat", especialment amb estimadors doblement robustos de machine learning que fan ús de la divisió de mostres i l'entrenament creuat (cross-fitting) [18.3, 18.4, 242, 243, 245, 246].
Part III: Inferència Causal a partir de Dades Longitudinales Complexes
-
Tractaments que Varien en el Temps [Capítol 19]:
- Es defineixen els tractaments que poden canviar de valor per a un mateix individu al llarg del temps.
- Es diferencien les estratègies de tractament (regles per assignar tractament en cada moment): estàtiques (sempre tractar/mai tractar) i dinàmiques (dependents de la història de covariables) .
- La intercanviabilitat seqüencial és la condició clau per identificar efectes causals de tractaments variables en el temps, assegurant que els grups tractats i no tractats són intercanviables a cada moment, condicionant la història prèvia de covariables i tractament .
-
Retroalimentació Tractament-Confounder [Capítol 20]:
- Es descriu una estructura causal complexa on els confounders (factors L) són afectats pel tractament previ (A) .
- Aquesta retroalimentació fa que els mètodes d'ajustament tradicionals (com l'estandardització o IP weighting de punt-tractament) produeixin biaix, ja que el condicionament en un confounder afectat pel tractament passat pot introduir biaix de selecció .
-
G-Mètodes per a Tractaments que Varien en el Temps [Capítol 21]:
- Els g-mètodes (g-fórmula, IP weighting, g-estimació) són la solució per al biaix en presència de retroalimentació tractament-confounder.
- La g-fórmula (o g-computation) simula la distribució conjunta dels contrafactuals sota una estratègia de tractament, generalitzant l'estandardització per a múltiples punts de temps i covariables .
- La IP weighting crea una pseudo-població en què l'intercanviabilitat seqüencial no condicionada es manté . Els models estructurals marginals s'utilitzen en combinació amb els pesos IP per modelar la mitjana del resultat sota estratègies complexes .
- S'introdueixen estimadors doblement i múltiples robustos per a tractaments que varien en el temps, combinant models del resultat i del tractament per a una major robustesa .
- La g-estimació de SNMs també s'estén a tractaments que varien en el temps, buscant paràmetres que facin la història de resultats i covariables independent del tractament futur .
- La censura (pèrdua de seguiment o esdeveniments competidors) es tracta com un tractament que varia en el temps, i els g-mètodes s'adapten per estimar efectes si ningú hagués estat censurat.
- La "big g-formula" és una expressió general per a la distribució de qualsevol resultat contrafactual sota qualsevol estratègia de tractament .
-
Emulació de l'Assaig Objectiu (Target Trial Emulation) [Capítol 22]:
- Es formalitza l'enfocament d'emular experiments aleatoritzats (target trials) utilitzant dades observacionals, especialment per a estratègies de tractament sostingudes.
- Es distingeixen els efectes "intention-to-treat" (ITT) (basats en l'assignació aleatòria inicial) i els efectes "per-protocol" (PP) (basats en l'adherència al tractament), i les seves contraparts observacionals . L'efecte per-protocol sovint és l'estimació més rellevant per a la presa de decisions.
- La importància del "temps zero" o línia de base en l'anàlisi observacional per alinear-la amb el disseny d'un assaig aleatoritzat .
- S'argumenta que la no adherència als protocols dels assajos aleatoritzats, si s'analitza correctament amb g-mètodes, pot ser avantatjosa per emular altres assajos objectius.
- L'emulació de l'assaig objectiu proporciona un marc unificat per a la inferència causal, tant per a dades d'assajos aleatoritzats com per a dades observacionals, mitjançant l'articulació de preguntes causals ben definides.
-
Mediació Causal [Capítol 23]:
- S'aborda l'estudi dels mecanismes causals a través dels quals el tractament afecta el resultat.
- Es revisen conceptes com l'efecte directe pur (pure direct effect) i l'efecte indirecte total (total indirect effect), que descomponen l'efecte total .
- S'introdueix una teoria intervencionista de la mediació, que reformula la pregunta de mediació com a pregunta sobre els efectes d'intervencions en components substantivament significatius i separables del tractament (e.g., N i O per a un tractament A).
- Aquesta teoria permet la verificació empírica de les suposicions de mediació mitjançant assajos aleatoritzats hipotètics que intervindrien en els components separables. Destaca que els efectes poden existir fins i tot si les intervencions en el mediador no estan ben definides.
En resum, el llibre "Causal Inference: What If" proporciona una presentació cohesionada de conceptes i mètodes per a la inferència causal, destacant la importància de la claredat en les preguntes causals, la comprensió de les suposicions subjacent (especialment intercanviabilitat, positivitat i consistència amb intervencions ben definides), i l'aplicació de mètodes d'ajustament avançats (g-mètodes, IV) per a dissenys complexos, com els estudis longitudinals amb tractaments que varien en el temps i la retroalimentació tractament-confounder. En última instància, busca dotar els professionals amb les eines per fer inferències causals menys casuals i més robustes.
Bahama Soul Club