Case7 min Lesezeit

Warum wir einen KI-Piloten gestoppt haben — und warum das richtig war

Sechs Monate Entwicklung, 80'000 Franken, ein funktionierender Prototyp. Und am Ende die Entscheidung: nicht in Produktion. Ein Erfahrungsbericht aus einem Schweizer Verkehrsbetrieb.

Im Frühjahr 2025 starteten wir bei den Basler Verkehrs-Betrieben einen KI-Piloten: Ein Assistent, der dem Dispatching bei der Personalplanung helfen sollte. Schichten zuteilen, Krankheits-Vertretungen vorschlagen, Wünsche der Mitarbeitenden berücksichtigen. Klingt nach einem klaren Use-Case. Sechs Monate später haben wir Stopp gesagt. Hier ist, warum — und was wir daraus gelernt haben.

## Was gut lief

Technisch funktionierte das System. Wir hatten ein Open-Source-Modell (Mistral Large 2, gehostet bei Infomaniak) mit einem strukturierten Eingabeformat. Die Vorschläge waren in 78 Prozent der Fälle so gut wie die manuell erstellten — und entstanden in einem Bruchteil der Zeit. Die Dispatcher waren überrascht, wie brauchbar die ersten Iterationen waren.

## Wo es kippte

Das Problem war nicht die KI. Das Problem war das, was um die KI herum entstand. Erstens: Sobald der Algorithmus eine Schichteinteilung vorschlug, wurde die Diskussion mit den Sozialpartnern asymmetrisch. «Der Computer sagt» ist ein anderes Argument als «der Dispatcher meint». Wir merkten, dass wir mit dem Tool eine Machtverschiebung einleiteten, die wir nicht beabsichtigt hatten — und für die wir keine saubere Governance hatten.

Zweitens: Die Mitarbeitenden wollten nachvollziehen können, warum sie eine bestimmte Schicht bekommen hatten. Bei einem menschlichen Dispatcher ist die Antwort: «Weil A krank war und du in der Reihenfolge dran warst.» Bei der KI war die Antwort: «Das Modell hat es so empfohlen.» Das ist keine Antwort, die in einem regulierten Umfeld mit Mitwirkungsrechten akzeptabel ist.

Drittens — und das war der Auslöser für den Stopp: Eine Datenschutz-Folgenabschätzung ergab, dass die Schichtempfehlungen unter «automatisierte Einzelentscheidungen» fallen würden. Das bedeutet: Jede Person muss informiert werden, eine menschliche Überprüfung verlangen können, und der Algorithmus muss erklärbar sein. Die Erklärbarkeit war bei einem 123-Milliarden-Parameter-Modell nicht gegeben.

## Die Rechnung

Wir investierten rund CHF 80'000 in Entwicklung, Hosting und Personal. Das Geld ist nicht verloren — wir wissen jetzt sehr genau, was wir das nächste Mal anders machen. Aber es ist auch nicht in Produktion gegangen, und das wird einigen Stakeholdern erklärt werden müssen.

## Was wir daraus gelernt haben

Erstens: Die DSFA gehört an den Anfang, nicht ans Ende. Wir haben sie erst gemacht, als das System schon stand. Hätten wir sie zu Beginn gemacht, hätten wir das Projekt entweder anders zugeschnitten oder gar nicht erst begonnen — und 80'000 Franken gespart.

Zweitens: Use-Cases mit Personalbezug sind nicht «KI-Anfänger-Übungen». Sie sind hochkomplex, sobald Mitbestimmungsrechte ins Spiel kommen. Wer mit KI starten will, beginnt besser mit Dingen, die niemandes Arbeitsbedingungen direkt beeinflussen — etwa Wissensdatenbanken oder Mailklassifizierung.

Drittens: Ein gestoppter Pilot ist kein Misserfolg. Ein in Produktion gegangener Pilot, der drei Monate später eingestellt wird, weil der Personalverband klagt, ist ein Misserfolg. Wir haben rechtzeitig gemerkt, dass die Architektur nicht passt — und das ist der Sinn eines Piloten.

Ich werde diese Geschichte in den nächsten Jahren noch oft erzählen. Nicht weil sie uns ehrt, sondern weil sie das Gegenteil von dem ist, was üblicherweise in KI-Pitches vorkommt: ein ehrlicher Bericht über Grenzen.

Newsletter

Nächste Mission in Ihrem Posteingang.

Eine E-Mail pro Mission. Keine Werbung.

Weiterlesen

Case

Ein Offerten-Assistent in zwei Wochen — Erfahrungsbericht aus einem Treuhandbüro

David Papale

Meinung

Die «EU-konforme KI» auf AWS-Frankfurt — eine Schweizer Lebenslüge

Martin Debik

ALLE ARTIKEL →