KI-System identifiziert und generiert neue RNA-Strukturen für programmierbare Genexpression

Ein KI-Modell entschlüsselt die verborgene Sprache der RNA – und schreibt sie neu. Erstmals wurden IRES-Elemente nicht nur systematisch kartiert, sondern vollständig de novo erzeugt. Das könnte die Entwicklung von mRNA-Therapien, synthetischer Biologie und biopharmazeutischer Produktion grundlegend verändern.

KI-System identifiziert und generiert neue RNA-Strukturen für programmierbare Genexpression

Ein Forschungsteam hat mithilfe von Deep-Learning-Methoden interne Ribosomen-Eintrittsstellen in RNA-Sequenzen systematisch erschlossen und erstmals de novo erzeugt. Die in Nature Machine Intelligence veröffentlichte Studie könnte die Entwicklung neuartiger Therapeutika und biotechnologischer Werkzeuge beschleunigen – und eröffnet Unternehmen der Biotech- und Pharmaindustrie neue Möglichkeiten zur gezielten Steuerung der Proteinsynthese.

Was sind IRES-Elemente – und warum sind sie so schwer zu erforschen?

Im Mittelpunkt der Arbeit stehen sogenannte IRES-Elemente – Internal Ribosome Entry Sites –, also RNA-Strukturen, die es Ribosomen ermöglichen, die Translation eines Proteins unabhängig vom üblichen zellulären Mechanismus zu starten. Solche Strukturen sind in Viren bekannt, kommen aber auch in menschlichen Zellen vor.

Bislang war ihre Entdeckung aufwendig und die gezielte Erzeugung neuer IRES-Sequenzen kaum möglich – genau hier setzt das neue KI-Modell an.

Das von Yanyi Chu, Di Yin, Dan Yu und weiteren Forschenden um Le Cong und Mengdi Wang entwickelte Modell kombiniert Deep-Learning-Architekturen mit biologischen Sequenzdaten. Es lernte, welche Sequenzmerkmale und Strukturmuster funktionale IRES-Aktivität bedingen – ein Problem, das aufgrund der hohen strukturellen Komplexität von RNA für klassische bioinformatische Ansätze schwer zugänglich war.

Der entscheidende Schritt: Von der Entdeckung zur Synthese

Die Fähigkeit, nicht nur vorhandene Strukturen zu entdecken, sondern maßgeschneiderte IRES-Sequenzen rechnergestützt zu entwerfen, stellt den zentralen Fortschritt gegenüber bisherigen Methoden dar. Das Modell kartiert bekannte IRES-Elemente und generiert gleichzeitig vollständig neue Varianten – ein qualitativer Sprung in der KI-gestützten Molekularbiologie.

Anwendungspotenziale: mRNA-Therapien, Synthetische Biologie, Biopharmazeutika

Programmierbare Translation bedeutet im Kern: Forscher und Entwickler könnten künftig präziser steuern, wann, wo und in welchem Ausmaß ein bestimmtes Protein in einer Zelle produziert wird. Die Konsequenzen für angewandte Bereiche sind erheblich:

mRNA-basierte Therapien: IRES-Elemente könnten die Effizienz der Proteinproduktion verbessern oder zelltypspezifische Expressionsmuster ermöglichen – ohne auf virale Vektoren angewiesen zu sein.
Synthetische Biologie: Der Ansatz lässt sich auf die Entwicklung maßgeschneiderter Zelllinien übertragen.
Biopharmazeutische Produktion: Wer Translation gezielt programmieren kann, gewinnt mehr Kontrolle über industrielle Fermentationsprozesse und die Herstellung rekombinanter Proteine.

„Die Kombination aus Large Language Models und molekularbiologischer Grundlagenforschung reift zunehmend zu einem Werkzeugkasten heran, der industriell verwertbare Ergebnisse liefert.”

Die Studie wurde unter Beteiligung von Hani Goodarzi veröffentlicht, der für seine Arbeiten an RNA-Regulationsmechanismen bekannt ist – was den translationalen Anspruch der Forschung zusätzlich unterstreicht.

Relevanz für die deutsche Biotech- und Pharmaindustrie

Für Unternehmen in den Bereichen Biopharmazeutika, synthetische Biologie und RNA-Therapeutika ist die Studie ein Signal, das über akademisches Interesse hinausgeht. Unternehmen, die frühzeitig in KI-gestützte Sequenzdesign-Pipelines investieren oder entsprechende Forschungskooperationen eingehen, könnten mittelfristig entscheidende Wettbewerbsvorteile bei der Entwicklung nächster Generationen von RNA-basierten Produkten aufbauen.

Quelle: Nature Machine Intelligence