Geneformer: KI-Modell soll Suche nach therapeutischen Wirkstoffzielen beschleunigen

Ein neues Protokoll in Nature Protocols zeigt, wie das KI-Modell Geneformer die aufwendige Suche nach therapeutischen Wirkstoffzielen durch computergestützte Gensimulation dramatisch beschleunigen kann – und damit eine der teuersten Phasen der Medikamentenentwicklung grundlegend verändert.

Geneformer: KI-Modell soll Suche nach therapeutischen Wirkstoffzielen beschleunigen

In der biomedizinischen Forschung gehört die Identifikation geeigneter therapeutischer Angriffspunkte zu den zeitaufwendigsten und ressourcenintensivsten Phasen der Medikamentenentwicklung. Ein in Nature Protocols veröffentlichtes Protokoll beschreibt nun, wie das Large Language Model Geneformer diesen Prozess durch den Einsatz von KI-Methoden strukturiert unterstützen kann.

Transformer-Architektur trifft auf Genomik

Geneformer wurde speziell für genomische Daten entwickelt und nutzt Transformer-Architekturen – jene Modellklasse, die auch hinter modernen Sprachmodellen steht – um biologische Zellzustände zu analysieren und zu interpretieren. Das Modell wurde auf großen Mengen an Single-Cell-Transkriptomik-Daten trainiert, also auf Messungen der Genaktivität in einzelnen Zellen. Dieser Ansatz ermöglicht es dem Modell, komplexe regulatorische Zusammenhänge im Zellgenom zu erkennen, ohne dass für jede neue Fragestellung ein vollständig neuer Datensatz erhoben werden muss.

Das Protokoll, verfasst von Yujie Zhang, Madhavan S. Venkatesh und Christina V. Theodoris, beschreibt konkret, wie Forscherinnen und Forscher Geneformer einsetzen können, um sogenannte Kandidaten-Zielstrukturen für therapeutische Eingriffe zu identifizieren. Im Kern geht es darum, Gene oder Genprodukte zu bestimmen, deren gezielte Modulation – etwa durch ein Medikament – einen krankheitsrelevanten Zellzustand verändern könnte. Das Protokoll liefert dafür einen Schritt-für-Schritt-Rahmen, der die Methodik für andere Labore reproduzierbar machen soll.

In-silico-Perturbation: Tausende Genkombinationen ohne Labor testen

Der entscheidende Vorteil von Geneformer liegt im In-silico-Perturbationsansatz: Statt aufwendiger Laborexperimente simuliert das Modell rechnerisch, wie sich das Abschalten oder Verstärken einzelner Gene auf den Zellzustand auswirkt.

Auf diese Weise lassen sich hypothetisch Tausende von Genkombinationen testen, ohne aufwendige Laborexperimente durchführen zu müssen. Die Ergebnisse liefern dann priorisierte Kandidatenlisten, die im Labor gezielt validiert werden können – ein Verfahren, das den experimentellen Aufwand erheblich reduzieren soll.

Foundation Model für die Genomik

Hinter dem Ansatz steht die Überzeugung, dass vortrainierte Genomik-Modelle als generalisierbare Wissensbasis dienen können, ähnlich wie Foundation Models in der Bildverarbeitung oder Textanalyse. Geneformer wurde zunächst auf menschlichen Zelltypen trainiert und kann für spezifische Krankheitskontexte weiter angepasst werden – ein Prozess, den die Autoren als Fine-Tuning beschreiben. Dies macht das Modell potenziell flexibel einsetzbar:

Kardiovaskuläre Erkrankungen
Neurologische Störungen
Weitere Krankheitskontexte mit ausreichender Single-Cell-Datenlage

Die tatsächliche Übertragbarkeit muss dabei in jedem Anwendungsfall durch experimentelle Validierung bestätigt werden.

Relevanz für Pharmaunternehmen und Biotechs

Für Pharmaunternehmen und Biotechs im deutschsprachigen Raum ist die Veröffentlichung eines strukturierten Protokolls in Nature Protocols besonders relevant, weil sie eine methodische Grundlage bietet, die intern adaptiert werden kann.

„Teams können mit bioinformatischer Expertise systematisch Hypothesen generieren, bevor teure nass-laborbasierte Screenings beginnen.”

Die zunehmende Verfügbarkeit solcher KI-gestützter Workflows verändert die frühe Phase der Wirkstoffforschung grundlegend. Unternehmen, die bereits in Single-Cell-Genomik oder KI-gestützte Datenanalyse investieren, dürften am schnellsten in der Lage sein, Ansätze wie Geneformer in bestehende Pipelines zu integrieren – und den versprochenen Effizienzgewinn in der Target-Identifikation tatsächlich zu realisieren.

Quelle: Nature Protocols – Geneformer Protocol