Forschung
KI kann reguliertes Arbeiten an klinischen Studien nun entwerfen und prüfen. Ein Mensch muss weiterhin entscheiden, ob es richtig ist, und ein Patient lebt mit dieser Entscheidung. Heute beruht diese Entscheidung meist auf einem Konfidenzwert, und eine Wahrscheinlichkeit war noch nie etwas, das man zu einer Inspektion mitnehmen kann. Unsere Forschung stellt eine anspruchsvollere Frage: Wie erzeugt man den Nachweis, dass ein KI-gestütztes Ergebnis fundiert ist, einen Nachweis, hinter dem ein benannter Mensch stehen kann und den ein Inspektor unabhängig erneut verifizieren kann? In Deutschland verlangt der EU AI Act eine Konformitätsbewertung für klinische KI-Systeme als Hochrisiko. Die Frage bleibt: Wie validiert man ein KI-System, das regulatorische Artefakte für BfArM, Ethikkommissionen und die DSGVO gleichzeitig produziert?
Beweis, nicht Wahrscheinlichkeit. Nachweis, nicht Ersatz. Der Mensch entscheidet.
Diese Seite versammelt die Arbeit hinter diesem Maßstab. Sie ist ein Beitrag zu einem Feld, das noch definiert wird, einschließlich der Teile, die wir noch nicht gelöst haben. Wir nennen die offene Frage lieber klar, als sie zu übertünchen.
Das DIA 2026 Poster
Unsere Ankerarbeit wurde auf dem DIA 2026 Global Annual Meeting in Philadelphia vorgestellt: Formal Verification as Regulatory Validation for AI Across the Clinical Trial Lifecycle (Abstract 116114, Thompson, 2026). Sie argumentiert, dass der Weg, KI in regulierter Forschung zu steuern, nicht darin besteht, das Modell zuversichtlicher zu machen, sondern sein Ergebnis in nachprüfbaren Nachweis und verpflichtende menschliche Verantwortung einzubetten. Sie führt die folgende Drei-Tore-Architektur ein und ordnet sie den gemeinsamen KI-Leitprinzipien von FDA und EMA vom Januar 2026 zu.
Formal Verification as Regulatory Validation for AI
Abstract 116114 · Thompson · DIA 2026 Global Annual Meeting
Das Drei-Tore-Rahmenwerk
Jedes KI-gestützte Ergebnis durchläuft drei unabhängige Prüfungen, bevor es zählt, nach einem Prinzip: Nichts genehmigt seine eigene Arbeit, und das System, das ein Ergebnis erzeugt, verifiziert es niemals. Eine Risikoklassifizierung läuft zuerst und entscheidet, wie streng jedes Tor arbeitet, sodass der Aufwand stets dem Risiko angemessen ist.
Tor 1 — Jurisdiktion
Das Ergebnis wird an den tatsächlich geltenden Regeln für das konkrete Zentrum gemessen, zu dem es gehört: Regulierung, das gesperrte Protokoll, die SOPs des Zentrums und die Ethikauflagen. Ein Zentrum, ein Regelwerk, kein grenzüberschreitendes Durchsickern. Das Ergebnis ist ein klares Urteil mit der exakten Regel, benannt nach Name und Version, niemals eine Blackbox.
Tor 2 — Formaler Beweis
Die Architektur ist darauf ausgelegt, einen formalen, mathematischen Beweis zu tragen, dass die Struktur des Ergebnisses fundiert ist, einen, den jeder unabhängig erneut verifizieren kann, ohne uns zu vertrauen. Er beweist, dass das Dokument wohlgeformt ist. Er behauptet nicht, zu beweisen, dass das Dokument klinisch korrekt ist, und nennt diese Grenze klar. Dieses Tor ist entworfen, nicht in Produktion.
Tor 3 — Menschliche Aufsicht
Ein benannter Mensch bestätigt das Ergebnis, aktenkundig, in einer vor Studienbeginn risikobasiert festgelegten Tiefe. Das Zertifikat ist Nachweis, den diese Person liest. Es ersetzt niemals ihr Urteil, und die Haftung bleibt bei Menschen und Organisationen, niemals beim Modell.
Eine Reihe von Architektur-Briefs zu jedem Tor ist auf Anfrage verfügbar.
GxP-Validierung auf Nicht-Deterministische Systeme Erweitern
Die Validierung computergestützter Systeme wurde für deterministische Software entwickelt, bei der dieselbe Eingabe zuverlässig dasselbe validierte Ergebnis liefert. KI bricht diese Annahme. Derselbe Prompt kann unterschiedlichen Text erzeugen, und genau deshalb gerät die traditionelle Validierung mit ihr in Spannung.
Das Drei-Tore-Rahmenwerk ist ein Weg, KI-gestützte Arbeit wieder unter die GxP-Erwartungen zu bringen, die regulierte Teams ohnehin halten, statt einen neuen Standard zu erfinden, der sie ersetzt. Es ist darauf ausgelegt, die etablierte Sprache zu sprechen, im Einklang mit dem EU Annex 11 und der DSGVO:
- Risikobasiertes Qualitätsmanagement (ICH E6(R3)) entspricht der Risikoklassifizierung, die vor jedem Tor läuft und bestimmt, wie viel Verifizierung und menschliches Urteil jedes Ergebnis erfordert.
- Regelbasierte Verifizierung (Tor 1) entspricht den dokumentierten, nachvollziehbaren Prüfungen im Kern der Validierung computergestützter Systeme.
- Datenintegrität und ALCOA+ entsprechen dem strukturellen Nachweis von Tor 2 und einem Herkunftsnachweis, in dem nichts stillschweigend gelöscht oder rückdatiert wird.
- 21 CFR Part 11 und die Human-in-the-Loop-Kontrolle entsprechen der benannten, zurechenbaren elektronischen Bestätigung von Tor 3.
Der rote Faden ist die Richtung, in die sich Regulierungsbehörden bereits bewegen: Sicherungsaufwand proportional zum Risiko, Nachweis statt Dokumentation um ihrer selbst willen. Wir bauen, damit KI-gestützte regulatorische Arbeit diese Messlatte erreichen kann, nicht um eine Ausnahme davon zu erbitten.
Multi-Agentur Regulatorisches Engagement
Wir engagieren uns bei Regulierungsbehörden als Beitragende zum Gespräch, nicht als Antragsteller. Wir haben das Rahmenwerk beim einschlägigen öffentlichen FDA-Docket als Beitrag zum offenen Protokoll eingereicht. Wir stehen nun in sechs regulatorischen Umfeldern im aktiven Dialog.
EMA
Drei-Tore-Architektur den gemeinsamen KI-Leitprinzipien von FDA und EMA vom Januar 2026 zugeordnet. Ausrichtung an der Hochrisiko-Klassifizierung des EU AI Act. Dialog mit dem BfArM zur Validierung klinischer KI in Deutschland.
FDA
Rahmenwerk beim öffentlichen Docket eingereicht. Laufendes Engagement mit CDER und CDRH zu KI-Glaubwürdigkeitsstandards.
ANVISA
Blueprint kodiert für Lei 14.874/2024 und RDC 945/2024. Rahmenwerk der brasilianischen Regulierungsgemeinschaft vorgestellt.
CDSCO
CDSCO-Adapter aktiv. Rahmenwerk-Engagement über die VeriTrial-India-Partnerschaft an 25 Zentren.
PMDA
Engagement eingeleitet. Ausrichtung der PMDA am risikobasierten Validierungsansatz des ICH E6(R3).
NMPA / CDE
Blueprint in Entwicklung. Zero-Egress-Architektur ausgerichtet an den Datenlokalisierungsanforderungen der PIPL.
Engagement, keine Billigung.
Die Offene Frage
Hier ist der Teil, den das Feld nicht geklärt hat. Wenn eine Regulierung zu einer berechenbaren Regel wird, musste jemand sie übersetzen. Wer bescheinigt, dass die Kodierung der Regulierung treu ist, aus der sie stammt? Ein Verifizierungssystem kann beweisen, dass ein Ergebnis einer kodierten Regel perfekt entspricht, und doch gegen eine fehlerhafte Übersetzung prüfen. Die Frage ist nicht, wer den Prüfer gebaut hat. Sie lautet, wer für die Kodierung verantwortlich ist.
Neun der zehn gemeinsamen Leitprinzipien von FDA und EMA werden von der Architektur selbst adressiert. Das zehnte ist dieses, und wir behaupten nicht, es gelöst zu haben. Wir legen es stattdessen dem Feld vor. In Deutschland kommt eine zusätzliche Ebene hinzu: die Koordination über mehrere Ethikkommissionen hinweg, jede mit eigener Auslegung.
Wir führen eine öffentliche Umfrage dazu durch, wer diese Verantwortung tragen sollte. Bringen Sie Ihre Sicht ein und sehen Sie, wo das Feld landet.
Ergänzende und Offene Arbeit
Dieses Rahmenwerk steht nicht allein, und es ist dadurch stärker. Der ARCH-Implementierungsstandard, unabhängig von Jessica Stuyvenberg verfasst und offen mit einem DOI veröffentlicht, operationalisiert die Architektur als CDISC-USDM-natives Datenschema, sodass ein Verifizierungszertifikat mit der Einreichung reist, statt zu einem weiteren proprietären Silo zu werden. Zwei ergänzende Arbeiten, gemeinsam entwickelt.
Wir haben das Rahmenwerk beim einschlägigen öffentlichen FDA-Docket als Beitrag zum offenen Protokoll eingereicht. Wir engagieren uns bei Regulierungsbehörden als Beitragende zum Gespräch und achten darauf, nicht mehr zu beanspruchen.
ARCH Framework v6.0
Jessica Stuyvenberg
Adaptive Regulatory Compliance and Human Oversight — eine Implementierungsspezifikation auf Feldebene, um KI-Beweiszertifikate nativ im CDISC USDM zu verankern.
Engagieren Sie sich mit dem Rahmenwerk
Dies ist ein Raum zum Nachdenken, und wir haben ihn gebaut, um unter Druck getestet zu werden. Wenn Sie in regulatorischen Angelegenheiten, klinischem Betrieb, Datenstandards arbeiten oder auf der Behördenseite sitzen, schätzen wir Ihre Lesart, einschließlich dort, wo es Ihrer Meinung nach bricht.
Celina orchestriert. Menschen entscheiden. Patienten erhalten Zugang.