Botanische Expertise als Engpass für KI in der Agrar- und Biotechnologie

Künstliche Intelligenz revolutioniert die Pflanzenbiotechnologie – doch ein stiller Engpass gefährdet das Fundament dieser Entwicklung: Das taxonomische Fachwissen über Pflanzenarten schwindet, während die Nachfrage nach validierten Biodiversitätsdaten durch KI-Anwendungen rasant wächst.

Botanische Expertise als Engpass für KI in der Agrar- und Biotechnologie

Künstliche Intelligenz verspricht erhebliche Fortschritte in der Pflanzenbiotechnologie und Agrarforschung – doch die Qualität der zugrunde liegenden botanischen Daten bremst diese Entwicklung aus. Ein im Fachjournal Nature erschienener Kommentar macht deutlich, dass taxonomisches Fachwissen über Pflanzenarten zur kritischen Infrastruktur für KI-Anwendungen in der Biowirtschaft geworden ist.


Datengrundlage entscheidet über Modellqualität

Large Language Models und andere KI-Systeme, die in der Pflanzengenetik, Pharmaforschung oder Präzisionslandwirtschaft eingesetzt werden, sind in ihrer Leistungsfähigkeit direkt an die Qualität botanischer Datenbanken geknüpft. Fehlerhafte oder unvollständige Artklassifikationen führen zu fehlerhaften Trainingsdaten – mit entsprechenden Konsequenzen für die Verlässlichkeit von KI-Modellen in der Praxis.

Das Problem ist struktureller Natur: Die menschliche Expertise, die diese Datenbanken pflegt und aktualisiert, ist knapp und wird knapper. Taxonomen – also Wissenschaftler, die Pflanzenarten systematisch klassifizieren und beschreiben – sind eine kleiner werdende Fachgruppe. Universitäten und Forschungsinstitutionen haben entsprechende Stellen in den vergangenen Jahrzehnten kontinuierlich abgebaut, während die Nachfrage nach validierten Biodiversitätsdaten durch den Aufstieg von KI stark gestiegen ist.


Strukturelles Problem in der Forschungsförderung

Investitionen in KI-gestützte Anwendungen übersteigen bei weitem die Mittel, die für die Pflege der Datenbasis aufgewendet werden.

Der Beitrag von Chris Bivins in Nature zeigt ein gravierendes Missverhältnis auf: Botanische Sammlungen, Herbarien und taxonomische Datenbanken gelten als klassische Grundlageninfrastruktur – und werden entsprechend nachrangig finanziert.

Dabei sind diese Bestände nicht nur historisch bedeutsam. Sie liefern die validierten Referenzdaten, auf deren Basis:

  • Bilderkennungsmodelle Pflanzenarten identifizieren
  • Modelle für Ernteprognosen trainiert werden
  • KI-Systeme Resistenzeigenschaften von Nutzpflanzen analysieren

Ohne regelmäßige Pflege durch Fachexperten veralten diese Datensätze – und Modelle, die auf veralteten Klassifikationen aufgebaut werden, produzieren systematisch fehlerhafte Ergebnisse.


Auswirkungen auf Agrartechnologie und Pharmaforschung

Besonders deutlich werden die Folgen in zwei Bereichen:

Agrar-KI: Pflanzenidentifikation und Schädlingserkennung sind auf taxonomisch korrekte Trainingsdaten angewiesen. Fehlerhafte Artzuordnungen können direkte wirtschaftliche Schäden verursachen – von Fehldiagnosen im Pflanzenschutz bis zu falschen Behandlungsempfehlungen.

Pharmazeutische Wirkstoffforschung: Botanische Datenbanken dienen zur Identifikation von Pflanzen mit relevanten Inhaltsstoffen. Eine fehlerhafte Artzuordnung kann hier zu falsch zugeordneten Wirkstoffquellen führen – mit potenziell schwerwiegenden Folgen.

Viele Arten sind noch nicht wissenschaftlich beschrieben, bevor ihr Lebensraum zerstört wird. KI kann bei der Beschleunigung taxonomischer Arbeit helfen – aber nur, wenn ausreichend validierte Referenzdaten vorhanden sind.

Hinzu kommt die Dimension der Biodiversitätskrise: Der Wettlauf zwischen dem Verlust von Lebensräumen und der wissenschaftlichen Erfassung von Artenvielfalt wird durch mangelnde Datenqualität zusätzlich erschwert.


Einordnung für deutsche Unternehmen

Für Unternehmen im Agri-Tech-, Life-Sciences- und Bioökonomie-Bereich in Deutschland ist diese Debatte von unmittelbarer Relevanz. Wer KI-Anwendungen entwickelt oder einkauft, die auf Pflanzendaten basieren, sollte die Herkunft und Aktualität der verwendeten Trainingsdaten kritisch prüfen.

Die Verfügbarkeit kuratierter, taxonomisch valider Datensätze ist ein Qualitätsmerkmal, das bei Technologieentscheidungen zunehmend Gewicht bekommt. Förderprogramme wie das BMBF-Rahmenkonzept Bioökonomie oder EU-Initiativen zur digitalen Transformation im Agrarsektor könnten hier gezielt ansetzen – indem sie Investitionen in KI-Systeme mit der Förderung der zugrunde liegenden Dateninfrastruktur verknüpfen.


Quelle: Nature – Botanical expertise as a bottleneck for AI

Scroll to Top