Predictive Quality in der Fertigung: Wie KI Ausschuss senkt, bevor er entsteht
Worum es geht: die Kurzfassung
- Predictive Quality sagt Qualitätsabweichungen voraus, bevor sie zum Ausschuss werden, meist auf Basis von Maschinen-, Prozess- und Bilddaten.
- Computer Vision mit modernen CNN-Architekturen erkennt Defekte zuverlässiger als menschliche Stichprobe (95–99 % Erkennungsraten in dokumentierten Industrieprojekten), bei deutlich kürzerer Latenz.
- Realistische Ausschussreduktion: 15–40 % je nach Ausgangsniveau und Datenqualität (Quellen u. a. Fraunhofer-IPA-Whitepaper „KI in der Produktion” 2024, elunic-Industrie-Benchmarks). Die spektakulär klingenden 60 %+-Werte stammen meist aus Greenfield-Linien mit perfekter Datenlage, nicht aus klassischen Brownfield-Setups.
- Die KI ist meist nicht der Engpass. Sensoren, Kameras, Lichtsetup, Labeling-Aufwand und MES-Integration sind der Hauptaufwand.
- DSGVO-relevant wird es nur, wenn Personen erkennbar sind (Bediener, Werker auf den Bildern). Für reine Produkt- und Prozessdaten ist die DSGVO meist nicht der Blocker.
- Vom Pilot zur Linie: Realistisch sind 4–8 Monate von der Datensammlung bis zur produktiven Linienintegration. Schnellere Versprechen entlarven sich meist in der Pilotphase.
Predictive Maintenance hat jeder. Predictive Quality ist der nächste Hebel
Predictive Maintenance, die vorhersagende Instandhaltung von Anlagen, ist in vielen mittelständischen Fertigungsbetrieben angekommen. Sensoren messen Schwingungen, Temperaturen und Stromaufnahmen; Modelle warnen vor Lagerschäden, Werkzeugverschleiß oder Schmierproblemen, bevor die Maschine stehen bleibt. Wirtschaftlich rechnet sich das meist deutlich, weil ungeplante Stillstände die teuerste Form des Produktionsverlusts sind.
Predictive Quality geht einen Schritt weiter. Statt nur die Maschine zu schützen, schützt sie das Produkt: Sie erkennt Qualitätsabweichungen, bevor sie zu fehlerhaften Teilen werden, und greift wahlweise automatisch in die Prozessparameter ein oder weist den Werker darauf hin, dass eine Justierung fällig ist.
Der Unterschied zur klassischen Qualitätssicherung: Klassische QS prüft am Ende. Predictive Quality prüft während der Entstehung, mit den richtigen Daten oft sogar vor der Entstehung, auf Basis der Prozessparameter, die typischerweise einem Fehler vorangehen. Wo Maschinen, Material, Werker und Umwelt zusammenspielen, ist die Kombination aus Bilddaten und Sensordaten besonders wirksam.
Wie Computer Vision Fehler erkennt, die ein Mensch übersieht
Die zugrundeliegenden Architekturen sind seit zwei, drei Jahren in der industriellen Praxis angekommen. Vereinfacht laufen drei Mustertypen parallel:
- Klassifikation: „Ist das Bauteil i.O. oder n.i.O.?” Eingang ist ein Kamerabild, Ausgang ist eine Wahrscheinlichkeit. Klassische CNN-Architekturen (ResNet, EfficientNet) oder modernere Transformer-basierte Modelle (ViT). Gut für Sicht-Prüfungen mit klar definierten Defektklassen.
- Detektion und Lokalisierung: „Wo genau auf dem Bauteil ist der Defekt?” Algorithmen wie YOLO oder DETR ziehen Bounding Boxes um Defektstellen und ermöglichen damit auch Statistiken über die räumliche Verteilung, wertvoll für Ursachenanalyse.
- Anomaliedetektion: „Sieht etwas anders aus als sonst?” Anomaly-Detection-Modelle (PaDiM, PatchCore) lernen aus i.O.-Bildern und melden alles, was vom Normalbild abweicht. Großer Vorteil: Es braucht keine umfangreichen Defektbilder zum Training, was bei seltenen Fehlerbildern entscheidend ist.
In der Praxis wird oft kombiniert: eine schnelle Anomaliedetektion in der Linie, gefolgt von einer Klassifikation der gemeldeten Auffälligkeiten in einer Zweitlinie, in der ein Operator die finalen Entscheidungen trifft oder die Modelle nachtrainiert werden.
Die menschliche Sichtprüfung erreicht typischerweise 70–85 % Erkennungsrate bei wiederholten, gleichförmigen Defekten und sinkt nach der zweiten Schichtstunde sichtbar ab (Konzentration). Eine gut trainierte Vision-Pipeline arbeitet konstant, ist auch bei feinen Strukturen verlässlich (Mikro-Risse, Kratzer, Lackeinschlüsse) und gibt zusätzlich die Sicherheit ihrer Entscheidung mit aus, was bei Stichprobe oder Audit unschätzbar wertvoll ist.
KI-Agenten in der QS: vom Erkennen zum eigenständigen Eingreifen
Die klassische Predictive-Quality-Lösung erkennt, alarmiert und protokolliert. Der nächste Schritt, und das ist die Schnittmenge mit unserem Pillar-Artikel über KI-Agenten im Mittelstand, ist die Aktion. Ein QS-Agent kombiniert:
- die Vision-Erkennung in der Linie
- die Prozess- und Maschinendaten aus dem MES
- die Stammdaten zum gefertigten Teil
- die Historie früherer Defekte und Eingriffe
und entscheidet aus diesem Kontext, was zu tun ist: Aussortieren, eine Parameter-Justierung am Werkzeug anstoßen, eine Vorwarnung an den Schichtführer schicken, oder die Linie kurz stoppen, wenn die Defektrate über einer Schwelle bleibt. Bei kritischen Eingriffen bleibt der Mensch in der Entscheidungsschleife. Der EU AI Act stuft autonome Eingriffe in produktionssichere Prozesse schnell als „high risk” ein, und das gilt es zu vermeiden, indem die finale Hand am Hebel beim Menschen bleibt.
Was realistisch geht: 15–40 % Ausschussreduktion als ehrliche Bandbreite
Marketing-Materialien werben mit 60 % oder mehr. In klassischen Mittelstand-Brownfield-Fertigungen ist das selten. Realistische Bandbreiten in dokumentierten Projekten (siehe etwa Fraunhofer-IPA-Whitepaper „KI in der Produktion”, elunic-Industriereferenzen, VDMA-Trendreport):
- Sichtprüfung in der Linie ersetzt Stichprobe am Ende: typische Ausschussreduktion 15–25 %, weil Fehler früher erkannt werden und nicht erst nach mehreren Folgeprozessen.
- Prozessparameter-Vorhersage (Werkzeugverschleiß, Materialvariation): 10–20 % Ausschussreduktion, vor allem in Spritzguss, Stanzen, Drehen.
- Kombination Vision + Prozessdaten + Eingriffsautomatik: 25–40 % möglich, aber nur in Anwendungen mit konsistentem Produktportfolio und sauberer Datenbasis.
Wer mit 60 % wirbt, zeigt typischerweise einen Greenfield-Case mit ausgesuchter Linie und perfektem Kameraset-Up, nicht den klassischen Mittelstandskontext mit gewachsenen Anlagen.
Wichtig ist die Bezugsgröße. Bei einem Ausgangsausschuss von 4,5 % bringt eine 30 %-Reduktion 1,35 Prozentpunkte. Bei 200.000 Teilen pro Jahr und 8 € Materialkosten je Teil sind das gut 21.000 € jährlich nur am Materialwert, plus eingesparte Folgeprozesse. Bei einem Ausgangsausschuss von 0,8 % ist die absolute Wirkung deutlich kleiner, und der ROI verschiebt sich entsprechend.
Datenbasis: Was Sie brauchen, bevor Sie loslegen
Das ist der häufigste Show-Stopper. Predictive Quality braucht Trainingsdaten, und die müssen gelabelt sein, mindestens zu Beginn:
- Bilddaten: Mindestens 500–2.000 Bilder pro Defektklasse für eine erste Klassifikation. Mit Anomaliedetektion kommen Sie mit i.O.-Bildern (5.000+) und wenigen n.i.O.-Beispielen aus.
- Sensor-/Prozessdaten: 6–12 Monate historische Aufzeichnungen aus dem MES, idealerweise mit zeitlich synchronisierten QS-Befunden. Wer die Daten heute nicht hat, sammelt zuerst.
- Labeling-Aufwand: Realistisch 0,5–2 Minuten pro Bild für eine Klassifikation, mehr für Detektion. 2.000 Bilder = grob eine Personenwoche, allein für das Labeling.
- Sensoren und Kameras: Lichtsetup und Optik sind oft 50 % des Engineerings. Eine schlechte Beleuchtung lässt sich nicht durch ein besseres Modell ausgleichen.
- MES-/PLC-Schnittstellen: OPC UA ist Standard, aber nicht alle Anlagen liefern sauber dokumentierte Tags. Datenaufnahme ist oft die erste Hürde.
In unserer Erfahrung gehen 60–70 % des Pilotaufwands in Hardware-Aufbau, Datensammlung und Labeling, nur 30–40 % in die KI selbst.
Lokales oder Cloud-Modell: DSGVO-konform produzieren
Bei reinen Produkt- und Prozessdaten ist DSGVO selten ein Thema. Sie wird relevant, sobald Personen mit erfasst werden: Bediener im Kamerabild, Fingerabdrücke, biometrische Spuren. Hier gilt:
- Lokale Inferenz bevorzugen. Vision-Modelle laufen heute problemlos auf einer Industrie-GPU (NVIDIA Jetson, kleine T4-Karten) direkt am Bandende, ohne dass Bilder das Werk verlassen. Latenz: 10–50 ms pro Bild, schnell genug für Liniengeschwindigkeit.
- Cloud nur für nicht-personenbezogenes Training. Trainings-Runs lassen sich gut in EU-gehosteten Clouds laufen lassen (AWS Frankfurt, Azure Germany, OVH); produktive Inferenz dann wieder lokal.
- Datenminimierung: Personen im Bild unkenntlich machen (Blur am Edge), wenn der Defekt nur am Produkt sichtbar sein muss.
- Dokumentation: Datenschutz-Folgenabschätzung (DSFA) für die Linie, wenn Personenbezug nicht auszuschließen ist; Betriebsvereinbarung mit dem Betriebsrat ist Standard.
Eine vollständig lokale Pipeline ist im Mittelstand der pragmatischste Pfad. Sie nimmt die meisten Diskussionen vorweg und macht den Werker zum Verbündeten, nicht zum Überwachten.
Roadmap: Pilotanlage → Linie → Werk
Wer in die Predictive Quality einsteigen will, geht selten direkt auf das ganze Werk. Eine bewährte Stufung:
- Monat 1–2: Sondierung und Datensammlung. Ein Defekttyp, eine Linie, eine Kamera. Sammeln, ohne zu modellieren: Datenbasis schaffen.
- Monat 3–4: Erstes Modell + Labeling. Im Pilot-Datensatz wird klassifiziert oder Anomaliedetektion trainiert. Confusion Matrix ehrlich auswerten.
- Monat 5–6: Schattenbetrieb. Das Modell läuft live, ohne ins Sortieren einzugreifen. Sie vergleichen Modellurteil mit Werker-/Stichprobenurteil und identifizieren Drift.
- Monat 7–8: Linienintegration mit Eingriffslogik. Aussortierung, Alarmierung an den Schichtführer, Eingriff in Prozessparameter, schrittweise, mit menschlicher Aufsicht.
- Ab Monat 9: Skalierung. Weitere Linien, weitere Defekttypen, optional Erweiterung um Prozessdaten und Predictive-Maintenance-Kopplung.
Die meisten Pilotprojekte scheitern nicht an der KI, sondern an unterschätzter Datensammlung. Wer das umgekehrt plant (erst Datenbasis, dann Modell), verkürzt die Gesamtdauer messbar.
Häufige Fragen
Wie unterscheiden sich Predictive Maintenance und Predictive Quality? Predictive Maintenance schützt die Anlage, sagt also Ausfälle voraus. Predictive Quality schützt das Produkt, sagt also Qualitätsabweichungen voraus. Beide nutzen ähnliche Sensorik und ML-Methoden, haben aber unterschiedliche Zielgrößen (OEE-Verfügbarkeit vs. OEE-Qualität) und werden in der Praxis oft kombiniert.
Brauchen wir GPU-Hardware in der Linie? Für moderne CNN-Modelle: ja, mindestens eine kleine Edge-GPU (NVIDIA Jetson-Familie reicht für die meisten Anwendungen). Sehr leichte Modelle laufen auch auf Industrie-CPUs, aber die Inferenz wird langsamer und die Modelltiefe limitiert.
Was ist mit Open-Source-Modellen? YOLO (Ultralytics), SAM (Segment Anything), DINOv2 und PatchCore sind hervorragende Ausgangspunkte. Für viele Industrieanwendungen genügt ein Fine-Tuning auf eigenen Daten; eigene Architekturen lohnen sich erst bei sehr spezifischen Anforderungen.
Wie hoch ist die Investition für einen Pilot? Realistisch 40.000–120.000 € für eine erste Linienanwendung inkl. Hardware (Kamera, Licht, Edge-GPU), Modell-Training, MES-Integration und Schattenbetrieb. Skalierung auf weitere Linien wird deutlich günstiger, weil das Modell und der Aufbau wiederverwendet werden können.
Was ist mit dem EU AI Act? Reine QS-Klassifikation in der Linie ist meist „limited risk” (Transparenzpflicht). Sobald die KI personalbezogene Entscheidungen trifft (z. B. Schichtbewertung anhand der Defektquote pro Werker) oder selbstständig in sicherheitskritische Produktionsprozesse eingreift, droht „high risk”-Einstufung. In der Praxis halten wir die finale Eingriffsentscheidung beim Menschen. Das vermeidet die strengen High-Risk-Pflichten zuverlässig.
Wie messen wir den Erfolg? Drei Kennzahlen sollten Sie vor Projektbeginn definieren und nach Go-Live mitschneiden: Ausschuss in Prozent (Vergleich vor/nach), False-Negatives (durchgerutschte Defekte, gemessen über Stichproben oder Kundenreklamationen) und False-Positives (fälschlich ausgeschleuste Gutteile). Erst aus dem Verhältnis dieser drei ergibt sich der wahre wirtschaftliche Effekt.
Können wir das mit unserer bestehenden Bildverarbeitung kombinieren? Ja, in der Regel sinnvoll. Klassische regelbasierte Bildverarbeitung (Cognex, Keyence, MVTec) ist bei klar definierten geometrischen Prüfungen oft schneller und genauer als ein neuronales Netz. Die KI ergänzt dort, wo Variabilität und unbekannte Defektklassen ins Spiel kommen. Beides parallel ist häufig die robusteste Lösung.
Wo Sie anfangen, wenn Sie heute starten möchten
Suchen Sie nicht den spektakulärsten Defekttyp aus, sondern den, bei dem Sie heute schon die meisten verlässlichen Daten haben. Eine bestehende Sichtprüfungs-Station mit Kamera und Bildarchiv ist Gold wert, auch wenn dort heute nur regelbasiert geprüft wird. Auf dieser Basis lässt sich der erste Modell-Pilot in wenigen Wochen anstoßen.
Wer prüfen will, ob eine Linie predictive-quality-fähig ist, vereinbart ein Beratungsgespräch. Im Erstgespräch klären wir, welche Daten Sie schon haben, was an Hardware fehlt und ob ein Pilot in Ihrem Setup wirtschaftlich tragfähig ist.