Biotech lost archive. Fueling AI with the lost knowledge of biotech failures
A continuació, es presenta un resum detallat de l'informe "The Forgotten Files Project" de Ruxandra Teslo:
1. Resum del Projecte "The Forgotten Files Project" proposa un mecanisme legalment fonamentat per democratitzar els expedients de la FDA (Food and Drug Administration). L'objectiu és aprofitar la legislació de fallides dels Estats Units per crear una biblioteca de codi obert d'expedients de la FDA "orfes" (específicament sol·licituds de nou fàrmac en investigació (IND), sol·licituds de nou fàrmac (NDA) i sol·licituds de llicència de productes biològics (BLA)) i resultats d'assaigs clínics anonimitzats de patrocinadors de fàrmacs fallits. Aquests documents, que contenen detalls "incomparables" sobre el disseny d'assaigs clínics, processos de fabricació, avaluacions de seguretat i correspondència amb revisors, actualment no estan disponibles públicament. En alliberar-los de l'obscuritat, alimentaran eines d'intel·ligència reguladora impulsades per IA que "reduiran dràsticament" els costos de compliment, acceleraran els terminis d'aprovació i igualaran les condicions per a les petites empreses de biotecnologia, equips acadèmics i organitzacions sense ànim de lucre, amb l'objectiu final d'oferir teràpies noves als pacients de manera més ràpida i assequible.
2. Motivació
-
Els EUA estan perdent la cursa de la biotecnologia:
- La Xina ha designat la biotecnologia com una indústria estratègica des de 2011, ha simplificat les regulacions de desenvolupament de fàrmacs des de 2015 i ha compromès desenes de milers de milions de dòlars en R+D.
- La Xina ha superat els Estats Units en el nombre d'assaigs clínics actius i s'està convertint en una font dominant de candidats a fàrmacs amb llicència global.
- Les startups xineses, gràcies a un sistema regulador més flexible, poden entrar en assaigs clínics en 18 mesos des de la seva fundació, enfront de diversos anys per als seus homòlegs nord-americans.
- El finançament en fase inicial als EUA ha disminuït, cosa que genera preocupació sobre la capacitat dels EUA per mantenir la seva competitivitat global en biotecnologia.
-
La innovació és impulsada per startups, però la regulació afavoreix les grans empreses consolidades:
- Les petites i mitjanes empreses biofarmacèutiques lideren la descoberta i l'avanç de nous fàrmacs innovadors.
- Les empreses més petites (incloent-hi el món acadèmic i les col·laboracions) són la font de més fàrmacs oncològics "first-in-class" (els primers de la seva categoria) que les grans empreses.
- No obstant això, aquests actors més petits s'enfronten a barreres reguladores significatives que les grans empreses estan millor equipades per superar, ja que manquen d'equips reguladors interns, correspondència prèvia amb la FDA i biblioteques d'arxius històrics.
- Això porta les startups a dependre de consultors cars o d'assaigs i errors, i reporten dificultats per interpretar precedents, desitgen un major accés a expedients històrics i reben una orientació inconsistent dels assessors externs.
- La complexitat reguladora afavoreix les grans empreses, amb anàlisis que mostren que la familiaritat amb els processos reguladors pot explicar entre el 30% i el 55% de l'avantatge que gaudeixen les grans empreses en els terminis d'aprovació.
- La desregulació de dispositius mèdics ha demostrat que la reducció de l'escrutini regulador va portar a una major qualitat i quantitat d'innovació, amb un augment del 200% en l'entrada de noves empreses, especialment les petites.
-
La FDA posseeix una "mina d'or" de dades no utilitzades:
- Les presentacions a la FDA, conegudes com a Common Technical Documents (CTDs), són documents extensos (sovint de 10.000 a 20.000 pàgines) que cobreixen tots els aspectes del desenvolupament d'un nou fàrmac: dades administratives, etiquetatge, mètodes detallats de fabricació, dades d'estudis en animals, resultats d'assaigs clínics i comunicacions amb la FDA.
- Aquests documents constitueixen un dels "dipòsits més exhaustius de pràctiques científiques i negociació reguladora del món real".
- No obstant això, l'accés a aquesta informació és "molt difícil" perquè la FDA la considera confidencial, especialment els secrets comercials o la informació sensible per al negoci, d'acord amb l'Exempció 4 de la Llei de Llibertat d'Informació (FOIA). Això es tradueix en publicacions de FOIA molt redactades que manquen dels detalls tècnics necessaris per a les petites empreses.
- Les dades de Química, Fabricació i Controls (CMC), que representen entre el 13% i el 17% de les despeses totals de R+D i són crucials per a la qualitat i la seguretat del fàrmac, són particularment difícils d'obtenir sota la FOIA.
-
La IA pot alliberar valor si s'alliberen les dades:
- La IA té el potencial de "simplificar dràsticament" el procés regulador, amb la mateixa FDA ja incorporant IA en la seva presa de decisions per accelerar els temps de revisió.
- La investigació acadèmica suggereix que la IA podria estalviar milers de milions en costos reguladors.
- No obstant això, aquests esforços es limiten actualment a l'ús intern, i els patrocinadors no tenen accés a eines similars.
- Les grans empreses farmacèutiques estan construint els seus propis sistemes d'IA utilitzant els seus "grans dipòsits" de CTDs i resultats d'assaigs clínics, cosa que podria "ampliar la bretxa" entre empreses grans i petites.
- Un exemple d'ús és Novo Nordisk, que va utilitzar la seva base de dades interna per automatitzar la redacció d'informes d'estudis clínics, reduint el temps de 12 setmanes a 10 minuts, amb informes de major qualitat i estalviant potencialment 15 milions de dòlars al dia en ingressos per cada dia que un medicament arriba abans al mercat.
- Més enllà de l'automatització de documents, la IA podria oferir coneixements predictius sobre els resultats reguladors, identificant patrons per a aprovacions reeixides o motius de rebuig. Això permetria pronosticar la probabilitat d'aprovació en cada etapa, prioritzar recursos i abordar proactivament possibles problemes abans que esdevinguin obstacles costosos.
-
El mercat per si sol no solucionarà el problema:
- La majoria de CTDs, fins i tot de fàrmacs fallits, romanen bloquejats indefinidament per les exempcions de la FOIA, creant un "problema de coordinació" on cap empresa individual té incentius per alliberar dades, tot i que el valor col·lectiu seria transformador.
- Tot i que la divulgació indiscriminada de CTDs complets de fàrmacs en desenvolupament actiu podria soscavar els incentius a la innovació, una gran quantitat de coneixement científic de "costos irrecuperables" existeix en empreses biotecnològiques fallides (gairebé la meitat fracassen en cinc anys). Aprofitar els CTDs d'aquestes empreses fallides podria permetre un "renaixement regulador impulsat per IA" sense comprometre el potencial comercial d'empreses vives.
3. La Solució Proposada: El Fons de Transparència Reguladora d'IA
-
Mecanisme Legal i Finançament:
- En lloc d'una reforma legal complexa i incerta de la FOIA o de la definició de "secret comercial" (que la decisió de la Cort Suprema de 2019 va fer més àmplia), la proposta utilitza un enfocament més "immediat i pragmàtic".
- Establir un Fons de Transparència Reguladora d'IA (AI Regulatory Fund), capitalitzat mitjançant finançament federal i/o suport filantròpic.
- Aquest fons adquirirà els expedients reguladors de les empreses biotecnològiques que han entrat en fallida.
- El mecanisme legal es basa en la llei de fallides dels EUA (11 U.S.C. § 363), que atorga als jutges de tribunals de fallides "amplis poders" per transferir la propietat de qualsevol actiu d'una empresa fallida, inclosos els drets sobre dades i informació dels expedients de la FDA (INDs, NDAs, BLAs).
- Això s'ha utilitzat amb èxit a petita escala en el passat, amb transferències d'expedients CTD per 25.000 dòlars cadascun.
- L'enfocament evita la necessitat d'implicar la FDA com a part divulgadora, el que el lliura de conflictes amb l'Exempció 4 de la FOIA i les proteccions de secrets comercials.
-
Adquisició i Cost:
- El fons tindrà un equip d'experts legals i enginyers de dades per monitoritzar casos de fallida que involucren patrocinadors de biotecnologia.
- Es presentaran "ofertes calibrades" per assegurar drets no exclusius sobre la informació dels expedients.
- S'estima que el cost d'acoblar una biblioteca fundacional de 100 expedients CTD (20 CTDs per a cadascuna de cinc modalitats de fàrmacs) seria d'aproximadament 2,5 milions de dòlars. Aquest cost és "molt baix" en comparació amb els centenars de milions de dòlars que pot costar generar aquestes dades des de zero.
-
Processament i Accés de les Dades:
- Un cop adquirits, cada expedient es digitalitzarà íntegrament, amb els identificadors personals eliminats per preservar la privacitat, assegurant que es mantingui el raonament científic i la correspondència reguladora.
- Els arxius s'introduiran en un repositori segur basat en el núvol, amb cerca de text complet i indexació cronològica.
- Aquest sistema es pot modelar a partir del sistema EDGAR (Electronic Data Gathering, Analysis, and Retrieval) de la SEC (US Securities and Exchange Commission), que ja fa que la informació reguladora estigui lliure i sistemàticament disponible.
-
Aplicació de la IA:
- Amb aquest corpus de dades, els desenvolupadors podran entrenar un model de llenguatge especialitzat que "entengui els criteris de decisió implícits de la FDA".
- Els investigadors podrien consultar el model en llenguatge natural i rebre orientació "precisa i sensible al context" sobre estratègies de validació d'assaigs o consideracions de disseny d'estudis.
- Els equips de projectes serien capaços de pronosticar possibles preocupacions reguladores, redactar esborranys inicials de documents de presentació que s'ajustin a les expectatives dels revisors i reduir el nombre de cicles d'esmenes costosos.
- Això crearà una "infraestructura duradora" per al coneixement regulador per a petites empreses, investigadors acadèmics i organitzacions sense ànim de lucre.
4. Impacte i Beneficis Aquesta iniciativa representa una "empresa ambiciosa però pràctica" que requereix recursos modestos en comparació amb el seu impacte. Té el potencial de:
- Catalitzar un renaixement impulsat per IA en la ciència reguladora.
- Igualar el camp de joc competitiu per als petits innovadors.
- Accelerar els terminis d'aprovació de fàrmacs i reduir els costos de compliment.
- Finalment, oferir noves teràpies als pacients de manera més ràpida i assequible.