Bestandsprognose im B2B-Handel mit KI: wie viel Vorhersage sich für den Mittelstand wirklich lohnt
Worum es geht: die Kurzfassung
- Bestandsprognose mit KI lohnt sich ab rund 500 aktiven Artikeln und mindestens 24 Monaten sauberer Historie. Unterhalb davon schlägt eine gut gepflegte Excel mit ABC-XYZ-Analyse die KI in den meisten Fällen, und ist deutlich billiger.
- Realistische Reduktion gebundener Lagermittel: 8–25 Prozent bei gleichbleibender Liefertreue (Quellen u. a. Studien von Roland Berger, BVL und Fraunhofer-IML zu Supply-Chain-Analytics). Werte über 30 Prozent stammen fast immer aus Setups ohne vorherige strukturierte Disposition.
- Die schwierige Disziplin ist nicht das Modell, sondern die Datenqualität. Saubere Lagerbewegungen, korrekte Lieferzeiten und gepflegte Stammdaten sind die Voraussetzung. Wer hier Lücken hat, repariert sie vor dem KI-Projekt.
- Unregelmäßige Bedarfe (intermittent demand) bleiben schwierig. Croston, DeepAR und TFT helfen, ersetzen aber keine erfahrene Dispositionsperson.
- Phasenaufbau: 2 Monate Datenarbeit, 2 Monate Modellbau, 2 Monate Schattenbetrieb. Produktiver Einsatz mit menschlicher Freigabe ab Monat 6.
Warum dieses Thema im B2B-Handel jetzt heiß wird
B2B-Händler im deutschen Mittelstand laufen seit drei Jahren zwischen zwei Polen: Lieferketten-Schocks haben Sicherheitsbestände nach oben getrieben, gleichzeitig drücken Zinsen und Kapitalkosten von der anderen Seite. Ein Lagerumschlag, der vor Corona noch akzeptabel war, ist heute eine Bilanzkennzahl mit Erklärungsbedarf.
Bestandsprognose ist deshalb 2026 wieder ein Top-Thema, bei dem KI tatsächlich liefern kann, weil die Datenlage in vielen B2B-Handelsbetrieben ungewöhnlich gut ist. Lagerbewegungen sind transaktional sauber erfasst, Lieferzeiten dokumentiert, Kundenstamm strukturiert. Anders als bei vielen anderen KI-Anwendungsfällen ist hier nicht die Datenqualität der Engpass, sondern die Methode, wie aus den vorhandenen Daten ein verlässlicher Vorschlag wird.
Was die KI besser kann als die Excel, und ab wann
Die ehrliche Antwort lautet: nicht immer. Eine sorgfältig gepflegte Excel mit ABC-XYZ-Klassifikation, einem Croston-Algorithmus für sporadische Bedarfe und einer regelmäßig überprüften Lieferzeit-Tabelle ist für viele kleinere Sortimente überlegen oder zumindest gleichwertig, und kostet keinen Cent zusätzlich.
Der KI-Vorteil entsteht in drei Konstellationen:
1. Hohe Sortimentsbreite. Sobald Sie 3.000+ aktive Artikel disponieren, wird die manuelle Pflege auf Artikelebene unmöglich. Eine Disposition betreut typisch 200–500 A-Artikel im engen Blick und der Rest läuft mit einem Standard-Wert mit. Genau dieser Rest ist der Bereich, in dem KI strukturell besser ist als der Standard-Wert, weil sie pro Artikel rechnet, nicht pro Klasse.
2. Externe Treiber. Wenn Ihre Nachfrage von externen Variablen abhängt (Bautätigkeit, Wetter, Konjunktur, Promotions), kann KI diese Treiber explizit modellieren. Eine Excel kann das im Prinzip auch, aber nur, wenn jemand sie pflegt; in der Realität tut das niemand über drei Saisons hinweg.
3. Sortimentswechsel und Neuanlagen. Neue Artikel ohne Historie sind der klassische Schwachpunkt der Excel. KI-Methoden wie Cold-Start-Forecasting oder Transfer Learning zwischen ähnlichen Artikeln liefern hier Schätzungen, die zumindest besser sind als nichts. Sie ersetzen nicht das Bauchgefühl eines erfahrenen Disponenten, aber sie liefern eine zweite Meinung.
Welche Methoden in der Praxis funktionieren
Die Methoden-Landschaft hat sich in den letzten drei Jahren stark verändert. Drei Familien dominieren heute den B2B-Handel:
- Klassische statistische Verfahren (ARIMA, Exponential Smoothing, Croston für sporadische Bedarfe): seit Jahrzehnten bewährt, transparent, schnell. Für viele Mittelstand-Sortimente immer noch die richtige erste Wahl. Open Source via statsmodels, sktime oder Nixtla.
- Gradient-Boosting-Modelle (LightGBM, XGBoost mit Lag-Features): das Arbeitspferd in vielen industriellen Forecasting-Projekten. Stabil im Betrieb, schnell trainiert, gut interpretierbar. Bewährt sich besonders, wenn externe Features (Preis, Promotion, Wetter) eine große Rolle spielen.
- Tiefe Lernverfahren (DeepAR, Temporal Fusion Transformer, N-BEATS): die jüngste Generation. Stark bei vielen verwandten Zeitreihen (etwa: tausende Artikel mit ähnlichen Mustern), gut für probabilistische Vorhersagen mit Unsicherheitsbandbreiten. Brauchen mehr Daten und mehr Rechenzeit.
In der Praxis gewinnt fast immer eine Ensemble-Lösung: klassisches Verfahren als Baseline, Gradient Boosting für die Mehrheit der Artikel, neuronales Modell für die schwierigen Fälle (saisonal, neuartig, mit vielen externen Treibern). Wer Ihnen ein einzelnes Modell als alleinige Lösung verkauft, hat im B2B-Handel selten produktiv ausgerollt.
Was Sie an Daten wirklich brauchen
Minimal:
- 24 Monate Verkaufshistorie pro Artikel auf Tages- oder Wochenbasis. Weniger reicht meist nicht, um eine Saisonalität sauber zu lernen. Genauer: Wer monatliche Daten hat, kann monatliche Prognosen rechnen, aber keine Wochengranularität, die im B2B-Handel oft entscheidend ist.
- Wareneingänge mit Lieferzeit und Lieferanten-ID. Die Lieferzeit-Verteilung ist mindestens so wichtig wie die Nachfrage-Verteilung. Der Sicherheitsbestand fällt fast immer auf die Lieferzeit zurück.
- Kalenderdaten: Feiertage pro Bundesland, Brückentage, Werksferien Ihrer Hauptkunden. Im B2B-Handel reicht die deutsche Feiertagsmatrix oft nicht. Wer in die Schweiz oder nach Österreich liefert, braucht die jeweiligen Kalender mit dazu.
Optional, aber wertvoll:
- Promotions- und Preishistorie. Wer Preise oder Aktionen nicht historisch dokumentiert hat, kann den Promotion-Effekt nicht modellieren, und der ist oft der größte einzelne Treiber.
- Externe Daten: Wetter (Bau, Garten, Saisonsortimente), Konjunktur-Indizes (Investitionsgüter), Bautätigkeitsstatistik. Frei verfügbar über DWD, Destatis und Bundesbank, mit überschaubarem Anbindungsaufwand.
Was Sie nicht brauchen: einen perfekt gepflegten Artikelstamm in jeder Dimension. Ein guter Forecast verträgt Lücken in Beschreibungstexten und Farbcodes. Er verträgt aber keine Lücken in den eigentlichen Verkaufs- und Bestandsdaten. Die Stammdaten-Frage ist trotzdem relevant, weil sie spätestens beim automatisierten Bestellvorschlag wieder hochkommt; wir haben dazu eine eigene Spoke geschrieben: Stammdaten als Engpass: warum KI-Projekte ohne sauberen Artikelstamm scheitern.
Realistische Wirtschaftlichkeit: die ehrliche Bandbreite
In dokumentierten B2B-Handelsprojekten liegt die typische Reduktion der gebundenen Lagermittel bei 8–25 Prozent, bei gleichbleibender oder leicht besserer Liefertreue. Die Bandbreite hängt im Wesentlichen davon ab, wie strukturiert die Disposition vorher war:
- War vorher Bauchgefühl: Der Sprung ist groß (20–30 Prozent möglich), aber das ist nicht der KI-Effekt. Das ist der Effekt jeder strukturierten Methode.
- War vorher Excel mit ABC-XYZ: Realistisch 8–15 Prozent zusätzliche Einsparung. Hier zeigt sich der echte KI-Hebel.
- War vorher ein klassisches Dispositionssystem (etwa Slim4 oder Relex): Realistisch 3–8 Prozent zusätzliche Einsparung. KI in Ergänzung, nicht als Ersatz.
Diese Bandbreiten passen zu den öffentlich verfügbaren Studien, etwa dem BVL-Lagepapier Supply Chain Excellence 2024, der Roland-Berger-Analyse zu Supply-Chain-Resilienz und einschlägigen Fraunhofer-IML-Veröffentlichungen. Wer Ihnen Werte oberhalb von 30 Prozent ohne Bandbreite verspricht, sollte mindestens drei produktive Referenzkunden mit Namensnennung in Ihrer Branche und Ihrer Sortimentsgröße liefern können.
Pilotaufbau in der Praxis: sechs Monate
Bewährtes Phasenmodell:
Monat 1–2: Datenexport und -aufbereitung. Verkaufsdaten, Lagerbewegungen, Lieferzeiten, Stammdaten. Datenqualität bewerten, Lücken schließen oder dokumentieren. Erste Sichtung der ABC-XYZ-Verteilung, oft die spannendste Stunde des gesamten Projekts.
Monat 2–3: Baseline-Modell und Benchmark. Klassische Verfahren (Croston, Exponential Smoothing) als Vergleichsbasis aufbauen. Erst dann moderne Methoden ausrollen. Wer ohne Baseline arbeitet, kann den Mehrwert nicht messen und nicht verteidigen.
Monat 3–4: Modellauswahl und Tuning. Ensemble aus klassisch + Gradient Boosting + neuronal, je nach Artikel-Klasse. Hyperparameter, Feature Engineering, Cross-Validation auf Zeitreihen.
Monat 4–6: Schattenbetrieb. Modell läuft parallel zur produktiven Disposition, ohne Eingriff. Tägliche Vergleichszahlen Soll/Ist, wöchentlicher Review mit der Disposition. Welche Artikel rechnet das Modell konsistent besser, welche schlechter, und warum.
Ab Monat 6: Schrittweise Produktivnahme. Erst die unkritischen Artikel-Klassen (C-Z, schnelldreher mit stabilem Muster), dann sukzessive die anspruchsvolleren. Dispositions-Freigabe bleibt am Menschen, jedenfalls oberhalb einer Wertgrenze.
Wenn die Prognose schreibt: vom Forecast zum Agenten
Ein moderner Bestands-Agent geht einen Schritt weiter als die reine Prognose: Er kombiniert die Vorhersage mit der aktuellen Bestandslage, den offenen Bestellungen, den Lieferanten-Konditionen und den Sicherheitsbestandsregeln, und erzeugt daraus einen konkreten Bestellvorschlag. Im 90-Tage-Pilotmuster, das wir im Pillar-Artikel zu KI-Agenten im Mittelstand 2026 beschrieben haben, ist genau das ein passender erster Anwendungsfall: Der Agent legt einen Vorschlag im ERP an, die Disposition gibt frei. Welche Schnittstellen dafür im Spiel sind und wie aufwendig die jeweils sind, hängt vom ERP ab. Details dazu in unserer Spoke zur ERP-Anbindung für KI-Agenten.
Fazit für Entscheider
Wenn Sie in Ihrem Unternehmen über Bestandsprognose mit KI nachdenken, prüfen Sie zuerst diese drei Punkte:
- Sortimentsbreite und Datenhistorie: Ab 500–1.000 aktiven Artikeln mit 24 Monaten Historie lohnt der Aufwand. Darunter eher Excel optimieren.
- Aktueller Reifegrad der Disposition: Wer noch nach Bauchgefühl disponiert, gewinnt mit jeder strukturierten Methode dramatisch. Fangen Sie nicht mit KI an, fangen Sie mit ABC-XYZ an.
- Datenqualität bei Lagerbewegungen und Lieferzeiten: Beides muss sauber dokumentiert sein. Ist es das nicht, ist das Vor-Projekt sechs bis acht Wochen Datenarbeit, bevor irgendein Modell sinnvoll ist.
KI-gestützte Bestandsprognose ist 2026 keine Spekulation mehr, sondern eine ausgereifte Methode mit dokumentierter Wirkung. Sie ist aber auch kein Allheilmittel. Sie ersetzt keine erfahrene Disposition, sondern entlastet sie.
Wenn Sie für ein konkretes Sortiment einen Plausibilitäts-Check brauchen (Datenlage, sinnvolle Methode, realistische Einsparung), meldet sich gern Tobias Egner zurück. Schreiben Sie an tobias@dagentic.de oder schauen Sie auf der Startseite vorbei.