FrAIday Blog #8

Vollautomatisch unterschiedliche Objekte in Bildern erkennen und unterscheiden

Heute knüpfen wir wieder an das letzte Interview mit KI-Experte Martin Schiele, Geschäftsführer der AI-UI GmbH an und besprechen das Thema Bildsegmentierung. Wir klären auf, was Segmentierung in diesem Zusammenhang bedeutet, wie es funktioniert und wie es in der Praxis eingesetzt wird.

Sie haben spezielle Fragen zum Thema KI? Dann senden Sie uns diese gern an blog@ai-ui.ai. Wir beantworten diese in den nächsten Interviews.

Wir haben bereits über Bildklassifikation gesprochen. Was bedeutet in diesem Zusammenhang Bildsegmentierung?

Bei der Bildklassifikation aus Blog VII haben wir ganze Bilder mit einem Label versehen, also ein komplettes Bild wurde einer Kategorie zugeordnet. Bei der Bildsegmentierung werden einzelne Pixel aus dem Bild verschiedenen Klassen zugeordnet. Folgendes Bild veranschaulicht dies sehr gut.

(Bildquelle: https://surjeetsaikia.medium.com/)

Bei der Bildklassifikation aus Blog VII haben wir ganze Bilder mit einem Label versehen, also ein komplettes Bild wurde einer Kategorie zugeordnet. Bei der Bildsegmentierung werden einzelne Pixel aus dem Bild verschiedenen Klassen zugeordnet. Folgendes Bild veranschaulicht dies sehr gut.

Wie genau funktioniert das?

Nehmen wir als Beispiel einen Bremsscheibenhersteller. Dieser Hersteller fotografiert seine fertigen Scheiben nach einem bestimmten Produktionsschritt und möchte nun ohne Zuhilfenahme einer subjektiv-menschlichen Entscheidung eine Qualitätskontrolle durchführen.

Mit Bildklassifikation ließe sich eine Aussage darüber treffen, ob das Produkt IO (in Ordnung) oder nIO (nicht in Ordnung) ist. Die Bildsegmentierung geht einen Schritt weiter, sie kann jeden einzelnen Fehler finden.

Gibt es hierfür ein bestimmtes Verfahren?

Auch hier werden wie bei der Bildklassifikation oft sogenannte CNNs (Convolutional Neural Networks) benutzt. Das generelle Vorgehen ist zudem IMMER gleich:

Der Kunde/Bremsscheibenhersteller muss jedes Bild labeln und zwar nicht mit IO/nIO, sondern alle Fehler im Bild für 200-500 Bilder einzeln einzeichnen (siehe Bild oben, Fehler-Rot: Grat und Fehler-Blau: Kratzer). Das kommt dem „Lehrer-Schüler-Prinzip“ nahe. Der Bremsscheibenhersteller bringt der KI bei, auf was sie zukünftig zu achten hat und tut dies, indem er genau die Pixel markiert, die für einen bestimmten Fehler stehen.

Wie geht es dann weiter?

Die Bilder werden zusammen mit einer neuronalen Netzwerkarchitektur trainiert und die KI generiert. Nach Fertigstellung kann der Algorithmus in komplett unbekannten Bildern die gleichen Fehler wiedererkennen, da diese die charakteristischen Merkmale aufweisen.

Grate beispielsweise werden sich immer am Rand befinden und scharfkantig sein, Kratzer wird man immer auf dem glänzenden Teil der Bremsscheibe selbst vorfinden. Morphologie und Lage sind wie auch für uns Menschen die Indikatoren für die korrekte Klassifikation.

Das Ergebnis sieht wie illustriert aus. Wir geben dem Algorithmus vor, welche Sicherheit wir selbst haben möchten und können darüber filtern, wie das Endergebnis aussieht.

Was sind typische Anwendungsfälle für Bildsegmentierung im unternehmerischen oder industriellen Kontext?

Diese Form der Bilderkennungs-KI lässt sich für nahezu jedes Unternehmen im industriellen Umfeld anwenden. Es ist damit möglich, in 2-4 Wochen mit günstiger Hardware zu erstaunlichen und sehr robusten Ergebnissen zu gelangen. Anwendung findet das Verfahren in der Qualitätskontrolle (siehe Bremsscheibe), der Robotik-Steuerung (Tracking von Objekten) oder Überwachung von Bereichen und Arbeitsplätzen. Die Frage, wann welches Objekt oder eine Person an einem bestimmten Ort war, lässt sich somit individuell überwachen.

„Ein Ansatz für alles, mit Bildsegmentierung jedes Problem lösen.“
Martin Schiele - AIUI
Martin Schiele
Geschäftsführer