KI-Projekte scheitern selten an der KI

Ein Pharmaunternehmen investiert sechs Monate in die Einführung eines KI-gestützten Dokumentenmanagementsystems. Am Ende läuft das Modell stabil, liefert Ergebnisse in Millisekunden – und niemand nutzt es. Der Grund: Die Daten, auf denen es trainiert wurde, spiegeln nicht die Wirklichkeit der Produktion wider. Vier verschiedene Teams hatten dasselbe Feld unterschiedlich befüllt. Das Modell hatte aus inkonsistenten Daten konsistente Muster gelernt. Falsche Muster.

Das ist kein Einzelfall. Es ist das häufigste Muster, das wir in KI-Einführungsprojekten sehen.

Das eigentliche Problem kommt vor dem Modell

Wenn Unternehmen über KI-Projekte sprechen, ist die Diskussion oft technisch: Welches Modell? Welcher Anbieter? Open Source oder proprietär? Finetuning oder Retrieval Augmented Generation?

Diese Fragen sind nicht falsch – sie kommen nur zu früh.

Die entscheidende Frage ist eine andere: Welche Daten hat das Unternehmen, in welcher Qualität, und wer ist dafür verantwortlich?

In der Praxis bedeutet das:

Datenverfügbarkeit: Sind die relevanten Daten überhaupt digital und zugänglich? Oder liegen Schlüsselinformationen in E-Mails, PDFs ohne OCR, lokalen Excel-Dateien oder in den Köpfen von Mitarbeitenden?

Datenqualität: Gibt es definierte Schemata, Validierungsregeln, klare Zuständigkeiten? Oder ist jedes System ein Silo mit eigener Logik – gewachsen über Jahre, ohne übergreifende Governance?

Datenkonsistenz: Wenn zwei Systeme dasselbe Konzept abbilden – sagen wir, einen Kunden oder ein Produkt –, verwenden sie dieselbe ID? Dieselbe Schreibweise? Dieselbe Definition von “aktiv”?

Wer diese Fragen nicht beantworten kann, wird mit einem KI-Projekt Probleme lösen, die kein Modell lösen kann.

Was KI-Governance konkret bedeutet

Der Begriff “KI-Governance” klingt nach Bürokratie. In der Praxis ist er ein nüchternes Konzept: Wer entscheidet, welche KI-Systeme eingesetzt werden, auf welchen Daten, mit welchen Qualitätsanforderungen – und wer trägt die Verantwortung, wenn etwas schiefgeht?

Ohne klare Antworten auf diese Fragen entstehen typische Folgefehler:

Modell-Proliferation: Verschiedene Teams führen verschiedene KI-Tools ein, ohne Abstimmung. Das Ergebnis ist ein Zoo aus Einzellösungen, die nicht interoperieren, Daten nicht teilen und Sicherheitsanforderungen unterschiedlich behandeln.

Fehlende Auditierbarkeit: Ein KI-System trifft eine Entscheidung – bei der Kreditvergabe, in der Personalauswahl, im Qualitätsmanagement. Wer kann nachvollziehen, wie diese Entscheidung zustande kam? In regulierten Branchen ist das keine akademische Frage.

Driften der Modelle: Ein Modell, das im Januar trainiert wurde, sieht die Welt von Januar. Wenn sich Produkte, Kunden oder Märkte verändern, verändert sich das Modell nicht automatisch mit. Ohne Monitoring und klare Re-Training-Prozesse verschlechtern sich Modelle still – ohne dass es jemand merkt.

Die EU AI Act ändert die Rahmenbedingungen

Seit August 2024 gilt der EU AI Act in wesentlichen Teilen. Für Unternehmen, die KI-Systeme in risikoreicheren Anwendungsfällen einsetzen – Personalentscheidungen, Kreditvergabe, kritische Infrastruktur, Strafverfolgung – entstehen daraus konkrete Pflichten: Risikoabschätzungen, technische Dokumentation, menschliche Aufsicht, Registrierungspflichten.

Das betrifft auch zugekaufte Systeme. Wer ein KI-System eines Drittanbieters in einen Hochrisikoanwendungsfall einbettet, trägt als Betreiber Mitverantwortung.

Die meisten mittelständischen Unternehmen haben damit noch kaum begonnen. Das ist verständlich – der Act ist komplex, die Auslegung läuft noch. Aber das Argument “wir schauen mal ab” funktioniert nur bis zu dem Zeitpunkt, an dem eine Prüfbehörde oder ein Schadensfall entscheidet, dass es nicht mehr genug Zeit ist.

Was ein realistischer erster Schritt aussieht

Nicht jedes Unternehmen muss mit einer vollständigen Data-Governance-Initiative beginnen. Es gibt einen pragmatischeren Einstieg:

Ein konkreter Anwendungsfall, ein konkretes Datenset. Nicht “wir KI-isieren unseren Dokumentenfluss”. Sondern: “Wir wollen, dass eingehende Supportanfragen automatisch kategorisiert werden. Dafür brauchen wir X historische Tickets, sauber gelabelt, mit konsistenten Kategorien.”

Dieser Fokus zeigt schnell, ob die Datengrundlage trägt – und was fehlt. Er ist klein genug, um zu scheitern und neu zu starten. Und er liefert Lernerfahrungen, die sich auf den nächsten Anwendungsfall übertragen lassen.

Das klingt bescheiden. Aber es ist der Weg, auf dem Unternehmen tatsächlich KI nutzen lernen – statt KI-Lizenzen zu kaufen und dann auf bessere Daten zu warten.