Bonn: Was die KI bei Diffusionsmodellen wirklich macht

KI hilft bei der Suche nach neuen Medikamenten: Sie entwirft Moleküle. Eine Studie zeigt verständlich, wie das funktioniert.

Konzept der Gentechnik mit einer Medikamentenkapsel und einer Darstellung des menschlichen Gehirns vor dem Hintergrund einer Programmiersprache
Symbolbild: Einsatz von KI bei Medikamentenentwicklung
@ AdobeStock | Who is Danny


Auf der Suche nach neuen Medikamenten kommt Künstliche Intelligenz in Form von Diffusionsmodellen beim Wirkstoffdesign zum Einsatz. Was macht die KI dabei genau? Das haben Dr. Andrea Mastropietro und Prof. Dr. Jürgen Bajorath von der Life Science Informatics an der Universität Bonn und vom Lamarr Institute for Machine Learning and Artificial Intelligence untersucht.

Diffusionsmodelle wurden bisher hauptsächlich zur Erzeugung von Bildern und Videos eingesetzt. In jüngster Zeit hat sich ihr Anwendungsbereich auf neue Gebiete ausgeweitet, beispielsweise auf die Chemie zur Erzeugung neuer Moleküle. Für unsere Analyse haben wir auf Allgemeingültigkeit abgezielt und uns der Erklärung von Diffusionsmodellen für das Linker-Design von Molekülen mit unterschiedlichen Anwendungen genähert.

Ein Linker ist eine Teilstruktur eines Moleküls, die zwei oder mehr voneinander getrennte Atomfragmente miteinander verbindet. Das Linker-Design ist eine wichtige Aufgabe in der Arzneimittelentwicklung, da es eine zentrale Rolle bei der Entwicklung wirksamer Moleküle mit spezifischen Eigenschaften spielt.

Diffusionsmodelle lernen eine Datenverteilung und generieren durch Stichproben aus dieser Verteilung neue Daten. Das Diffusionsmodell selbst ist ein fortschrittliches KI-Modell. Wir versuchen, seine Generierungen nachzuvollziehen.

Das Hinzufügen und Entfernen von Rauschen ist das Kennzeichen von Diffusionsmodellen. Ausgehend von einer Stichprobe im Datensatz (einem Bild oder, in unserem Fall, einem Molekül) fügen sie „Rauschen“ hinzu, bis die ursprüngliche Stichprobe „zerstört“ ist – wie der Übergang von einem detaillierten Bild zu einem „Fernsehrauschen-Effekt“. Anschließend lernt das Modell, wie dieses hinzugefügte Rauschen entfernt werden muss, um eine gültige Stichprobe wiederherzustellen, und generiert so ein neues Bild (oder Molekül).

Für unsere Studie wählten wir ein hochmodernes Diffusionsmodell für das Linker-Design und entwickelten eine neuartige Strategie zur Erklärbarkeit, die ein bekanntes Konzept aus dem Bereich der erklärbaren künstlichen Intelligenz erweitert: die Shapley-Werte. Für unsere Methode, DiffSHAPer, haben wir den weit verbreiteten Shapley-Wert-Formalismus zur Erklärung von Vorhersagen des maschinellen Lernens auf Diffusionsmodelle angepasst. Unser Ziel war es, herauszufinden, welche Fragmentatome den größten Einfluss auf die Linker-Generierung hatten.

Wir haben festgestellt, dass Diffusionsmodelle zur Erzeugung chemisch valider Linker keine chemischen Prinzipien erlernen oder nutzen, sondern sich hauptsächlich auf Abstandsbeschränkungen zwischen Atomen stützen. Daher berücksichtigen sie wiederkehrende statistische Muster in den Daten, ohne verallgemeinerbare chemische Regeln zu erlernen.

Aus rechnerischer Sicht sind die Durchführung von Inferenzverfahren und die Erklärung der Generierung von Diffusionsmodellen zeitaufwändige Aufgaben. Aus methodischer Sicht stellt unser Ansatz eine Neuheit dar, weshalb wir den besten Weg finden mussten, unsere Ergebnisse wirkungsvoll zu präsentieren.

Unsere Methodik kann genutzt werden, um zu verstehen, was molekulare Diffusionsmodelle lernen. Im konkreten Fall des Linker-Designs ist es nützlich zu bestimmen, was die Generierung des Linkers antreibt. Linker sind im Wirkstoffdesign wichtig, da sie entscheidende molekulare Eigenschaften (wie Wirksamkeit und Stabilität) verbessern können. Folglich garantiert ein Linker, der ausschließlich auf der Grundlage von Abstands- und geometrischen Einschränkungen generiert wurde, keine Optimierung der Eigenschaften oder praktischen chemischen Verwendbarkeit.

Der erste Schritt wäre die Anwendung von DiffSHAPer auf molekulare Diffusionsmodelle, die auf verschiedene Aufgaben zugeschnitten sind. Zukünftige Forschung wird sich auf die Entwicklung von Modellen konzentrieren, die in der Lage sind, mehr chemischen Kontext in ihre interne Argumentation einzubeziehen. 


Weitere Informationen

Der Leuchtturm Digitale.Medizin.NRW bringt Akteur:innen der Digitalen Medizin in NRW aus Wirtschaft und Wissenschaft über die Disziplinengrenzen hinweg zusammen.

Gleichzeitig dient der Leuchtturm als zentrale Plattform für Vernetzung und Austausch in NRW.

Weitere Neuigkeiten aus NRW zu Innovationen, Forschungsergebnissen und Entwicklungen der innovativen Medizin finden Sie bei unseren News.


Beitrag teilen:
X
LinkedIn
Mail
Link kopieren