Ciencia Regulatoria

Investigación

La IA ya puede redactar y verificar trabajo regulado de ensayos clínicos. Un humano todavía tiene que decidir si es correcto, y un paciente vive con esa decisión. Hoy esa decisión suele apoyarse en una puntuación de confianza, y una probabilidad nunca ha sido algo que se pueda llevar a una inspección. Nuestra investigación plantea una pregunta más exigente: cómo producir evidencia de que un resultado asistido por IA es sólido, evidencia que un humano nombrado pueda sostener y que un inspector pueda reverificar de forma independiente. En América Latina, COFEPRIS, INVIMA y ANMAT modernizan sus marcos regulatorios. La pregunta permanece: cómo validar un sistema de IA que produce artefactos regulatorios para múltiples jurisdicciones simultáneamente.

Prueba, no probabilidad. Evidencia, no sustitución. El humano decide.

Esta página reúne el trabajo detrás de ese estándar. Es una contribución a un campo que todavía se está definiendo, incluidas las partes que aún no hemos resuelto. Preferimos enunciar la pregunta abierta con claridad antes que disimularla.

El Poster del DIA 2026

Nuestro trabajo ancla se presentó en el DIA 2026 Global Annual Meeting en Filadelfia: Formal Verification as Regulatory Validation for AI Across the Clinical Trial Lifecycle (Abstract 116114, Thompson, 2026). Sostiene que la manera de gobernar la IA en la investigación regulada no es hacer que el modelo tenga más confianza, sino envolver su resultado en evidencia verificable y responsabilidad humana obligatoria. Introduce la arquitectura de tres puertas a continuación y la mapea frente a los principios rectores conjuntos de IA de la FDA y la EMA de enero de 2026.

Formal Verification as Regulatory Validation for AI

Abstract 116114 · Thompson · DIA 2026 Global Annual Meeting

Leer el poster (PDF)

El Marco de Tres Puertas

Cada resultado asistido por IA pasa por tres verificaciones independientes antes de contar, sobre un principio: nada aprueba su propio trabajo, y el sistema que genera un resultado nunca lo verifica. Una clasificación de riesgo se ejecuta primero y decide cuánto exige cada puerta, de modo que el esfuerzo siempre es proporcional a lo que está en juego.

Gate 1

Puerta 1 — Jurisdicción

El resultado se lee frente a las reglas efectivamente vigentes para el centro específico al que pertenece: regulación, el protocolo bloqueado, los PNT del centro y las condiciones éticas. Un centro, un libro de reglas, sin filtración transfronteriza. El resultado es un veredicto claro con la regla exacta citada por nombre y versión, nunca una caja negra.

Gate 2

Puerta 2 — Prueba Formal

La arquitectura está diseñada para portar una prueba formal y matemática de que la estructura del resultado es sólida, una que cualquiera puede reverificar de forma independiente sin confiar en nosotros. Prueba que el documento está bien formado. No pretende probar que el documento es clínicamente correcto, y enuncia ese límite con claridad. Esta puerta está diseñada, no en producción.

Gate 3

Puerta 3 — Supervisión Humana

Un humano nombrado atestigua el resultado, en el registro, a una profundidad fijada por el riesgo antes de que comience el ensayo. El certificado es evidencia que esa persona lee. Nunca reemplaza su juicio, y la responsabilidad permanece con las personas y las organizaciones, nunca con el modelo.

Un conjunto de informes de arquitectura que cubren cada puerta está disponible a solicitud.

Extender la Validación GxP a Sistemas No Deterministas

La validación de sistemas computarizados se construyó para software determinista, donde la misma entrada produce de forma fiable el mismo resultado validado. La IA rompe esa premisa. El mismo prompt puede producir texto diferente, que es exactamente por lo que la validación tradicional se tensiona ante ella.

El marco de tres puertas es una forma de devolver el trabajo asistido por IA a las expectativas GxP que los equipos regulados ya sostienen, en lugar de inventar un nuevo estándar para reemplazarlas. Está diseñado para hablar el lenguaje establecido:

La gestión de calidad basada en riesgo (ICH E6(R3)) corresponde a la clasificación de riesgo que se ejecuta antes de cualquier puerta y gobierna cuánta verificación y juicio humano requiere cada resultado.
La verificación basada en reglas (Puerta 1) corresponde a los controles documentados y trazables en el centro de la validación de sistemas computarizados.
La integridad de datos y ALCOA+ corresponden a la evidencia estructural de la Puerta 2 y a un registro de linaje donde nada se elimina o retrofecha en silencio.
El 21 CFR Part 11 y el control con humano en el circuito corresponden a la atestación electrónica nombrada y atribuible de la Puerta 3.

El hilo conductor es la dirección hacia la que los reguladores ya se mueven: esfuerzo de aseguramiento proporcional al riesgo, evidencia por encima de la documentación por sí misma. Construimos para que el trabajo regulatorio asistido por IA pueda alcanzar ese listón, no para pedir una excepción a él.

Compromiso Regulatorio Multiagencia

Nos comprometemos con los reguladores como contribuyentes a la conversación, no como reclamantes. Presentamos el marco al docket público pertinente de la FDA como contribución al registro abierto. Ahora estamos en diálogo activo en seis entornos regulatorios.

EMA

Arquitectura de tres puertas mapeada frente a los principios rectores conjuntos de IA de la FDA y la EMA de enero de 2026. Alineación con la clasificación de alto riesgo del EU AI Act.

FDA

Marco presentado al docket público. Compromiso continuo con CDER y CDRH sobre estándares de credibilidad de IA.

COFEPRIS / INVIMA / ANMAT

Expansión en desarrollo para los marcos regulatorios de México, Colombia y Argentina, a medida que LATAM moderniza la validación de IA en investigación clínica.

ANVISA

Blueprint codificado para Lei 14.874/2024 y RDC 945/2024. Marco presentado a la comunidad regulatoria brasileña.

CDSCO

Adaptador CDSCO activo. Compromiso del marco vía la alianza VeriTrial India en 25 centros.

PMDA

Compromiso iniciado. Alineación de la PMDA con el enfoque de validación basada en riesgo del ICH E6(R3).

Compromiso, no respaldo.

La Parte Honesta

La Pregunta Abierta

Aquí está la parte que el campo no ha resuelto. Cuando una regulación se convierte en una regla computable, alguien tuvo que traducirla. ¿Quién certifica que la codificación es fiel a la regulación de la que proviene? Un sistema de verificación puede probar que un resultado coincide perfectamente con una regla codificada y aun así estar verificando contra una traducción defectuosa. La pregunta no es quién construyó el verificador. Es quién es responsable de la codificación.

Nueve de los diez principios rectores conjuntos de la FDA y la EMA son abordados por la propia arquitectura. El décimo es este, y no pretendemos haberlo resuelto. En cambio, lo ponemos ante el campo.

Estamos realizando una encuesta pública sobre quién debería asumir esa responsabilidad. Agregue su perspectiva y vea dónde se posiciona el campo.

Únase a la discusión

Trabajo Complementario y Abierto

Este marco no se sostiene solo, y es más fuerte por ello. El estándar de implementación ARCH, escrito de forma independiente por Jessica Stuyvenberg y publicado abiertamente con un DOI, operacionaliza la arquitectura como un esquema de datos nativo del CDISC USDM, de modo que un certificado de verificación viaja con la presentación en lugar de convertirse en otro silo propietario. Dos trabajos complementarios, codesarrollados.

Presentamos el marco al docket público pertinente de la FDA como contribución al registro abierto. Nos comprometemos con los reguladores como contribuyentes a la conversación, y tenemos cuidado de no reclamar nada más que eso.

ARCH Framework v6.0

Jessica Stuyvenberg

Adaptive Regulatory Compliance and Human Oversight — una especificación de implementación a nivel de campo para anclar certificados de prueba de IA nativamente dentro del CDISC USDM.

DOI: 10.5281/zenodo.20495991

Leer en Zenodo

Comprométase con el Marco

Este es un espacio para pensar, y lo construimos para ponerlo a prueba bajo presión. Si trabaja en asuntos regulatorios, operaciones clínicas, estándares de datos, o está del lado de la agencia, valoramos su lectura, incluido donde crea que falla.

Iniciar una conversación

Suscríbase a NexTrial Dispatch

Celina orquesta. Los humanos deciden. Los pacientes acceden.