Artifical Intelligence

Gastartikel – Ingo Nader, The unbelievable Machine Company

Wie KI am Beispiel von Bilderkennung funktioniert

Bild: The unbelievable Machine Company
Ingo Nader ist Senior Data Scientist bei The unbelievable Machine Company in Wien.
Bild: The unbelievable Machine Company

Das Interesse an Artificial Intelligence (AI) nimmt stetig zu – Siri, Alexa oder Google Assistant aber auch das Übersetzungsprogramm DeepL sind beste Beispiele dafür. Sie erleichtern bereits heute unseren Alltag in vielen Aspekten. Wie Bilderkennung mittels Deep Learning funktioniert erklärt Ingo Nader, Senior Data Scientist bei The unbelievable Machine Company.

Deep Learning ist eine Form von AI, die in den letzten Jahren stark an Popularität gewonnen hat. Die hohe Verfügbarkeit von Daten und die steigende Rechenleistung haben es ermöglicht, die Komplexität neuronaler Netze um ein Vielfaches zu erhöhen. Das Erkennen von komplexen Strukturen in Bildern und Sprache zählt zu den Stärken von Deep Learning. Es überrascht also nicht, dass Deep Learning daher vor allem bei Spracherkennung, automatisierter Übersetzung, und auch beim autonomen Fahren eingesetzt wird. Im Prinzip lernt der Algorithmus eine Funktion (eine Art Übersetzung; das eigentliche Modell), die die Eingangsdaten wie Bilder oder Audioclips in ein Ergebnis übersetzt. Dieses kann beispielsweise eine Beschreibung eines Bildes, erkannter Text, oder eine Klassifizierung eines Bildes sein.

Deep Learning ist nicht mit menschlichem Lernen vergleichbar 

Zwar sind neuronale Netze von Neuronen im menschlichen Gehirn inspiriert, haben aber in der Praxis nichts damit zu tun. Während der Mensch nur wenige Eindrücke benötigt, um daraus zu lernen, basiert Deep Learning auf einer sehr großen Anzahl von Beispielen. Außerdem ist es nicht in der Lage, zu generalisieren oder zu abstrahieren. Beispielsweise würde ein Modell, das auf Fotos von Sesseln trainiert wurde, eine Zeichnung eines Sessels vermutlich nicht als solchen erkennen. Ein weiterer Punkt ist die Nachvollziehbarkeit. Ohne zusätzliche Maßnahmen ist es schwierig zu verstehen, warum das Modell zu einer speziellen Entscheidung kommt – man spricht von einer Black Box. Für viele unternehmenskritische Prozesse ist diese Nachvollziehbarkeit unerlässlich. Wenn man diese Limitierungen kennt und bedenkt, ist es allerdings ein sehr mächtiges Werkzeug für eine Vielzahl an Unternehmensaufgaben.

Bild: The unbelievable Machine Company
Anhand einer Heatmap wird sichtbar, welche Teile des Bildes das neuronale Netzwerk zur Klassifizierung genutzt hat. Links oben befindet sich das zu klassifizierende Bild, rechts oben das Ergebnis der Klassifizierung (5 Kategorien, geordnet nach der Wahrscheinlichkeit), und die beiden Bilder darunter zeigen die Heatmaps der beiden wahrscheinlichsten Kategorien.
Bild: The unbelievable Machine Company

Wie Bilderkennung zu verstehen ist

Um die Klassifizierung von Bildern nachvollziehbar zu machen kann beispielsweise die Aktivierung bestimmter Ebenen des neuronalen Netzes in einer Heatmap visualisiert werden, und zwar mittels "gradient-weighted class activation mapping" (Grad-CAM). Anhand der Heatmap kann man erkennen, welche Teile des Bildes das neuronale Netzwerk zur Identifizierung genutzt hat. Im oben gezeigten Beispiel mit dem Elefanten ist gut zu erkennen, wie besonders die Region um das Ohr dazu beigetragen hat, dass das Modell zum Schluss kam, dass es sich wohl um einen afrikanischen Elefanten handeln muss. Auf diese Weise wird nachvollziehbar, warum eine Identifikation erfolgreich oder fehlerhaft ist. Mit den entsprechenden Werkzeugen muss ein neuronales Netzwerk also keine Black Box sein, sondern wird erklärbar und seine Entscheidungen werden nachvollziehbar. In dem Fall spricht man von Whitebox AI.

Lernende Ebenen  

Ein neuronales Netz besteht aus vielen sogenannten Ebenen, wovon jede mathematische Funktionen erlernt und bestimmte Filter anwendet. So sprechen die ersten Ebenen des Netzes beispielsweise auf sehr einfache Dinge, wie bestimmte Farben oder Kanten in bestimmten Winkeln auf den Bildern an. Die darauffolgenden Ebenen bauen auf diesen einfachen Merkmalen auf und setzen sie zu komplexeren Features zusammen. So können in tieferen Schichten dann Ecken, Kreise und später Augen oder Gesichtsteile erkannt werden. Je tiefer die Ebene, desto spezialisierter sind die erlernten Features. 

Konkrete Einsatzbereiche 

Diese Methode kann für viele Anwendungsbereiche eingesetzt werden. So kann Bilderkennung beispielsweise zur Erlernung von Typenbezeichnungen von Bauteilen genutzt werden, damit diese Informationen dann schnell einem Techniker zur Verfügung gestellt werden können. Ebenso kann über Deep Learning anhand von Abnutzungserscheinungen eines Bauteiles feststellen, wann der optimale Zeitpunkt für eine Wartung ist, um so Standzeiten zu minimieren. Voraussetzung ist immer, dass die Daten in entsprechender Menge und Qualität vorliegen, um ein solches Modell trainieren zu können. Artificial Intelligence ist also kein Mysterium, denn so komplex die Modelle auch sein mögen, so ist es doch möglich, sie zu verstehen und ihre Entscheidungen nachvollziehbar zu machen.

Ingo Nader arbeitet als Senior Data Scientist für die The unbelievable Machine Company und führt dabei verschiedenste nationale und internationale Projekte im Bereich Machine Learning und Data Science durch.

Mehr Artikel zum Thema: Artifical Intelligence

Chatbots – Digitale Assistenten als Umsatztreiber

Chatbots verändern das Service-Management und Marketing im...

Weiterlesen

KI nominiert für IDEAwards 2019

Wer Preise für innovative Projekte verleiht, sollte sich...

Weiterlesen

SAP gründet Ethik-Beirat für KI

SAP hat laut eigenen Angaben als "erstes europäisches...

Weiterlesen

IBM zeigt, wie KIs denken

Eine Cloud-basierte Software soll systematische Fehler in...

Weiterlesen

KI ist eine Chance für das IT Service Management

Herkömmliches ITSM genügt nicht, um die Herausforderungen,...

Weiterlesen

Auswirkungen der KI auf die Arbeitswelt

Die Digitalisierung und die neuen technologischen...

Weiterlesen

Webinar: Machine Learning - Wie geht das eigentlich?

Erleben Sie am 25. Juli von 10:00 bis 11:30 Uhr live eine...

Weiterlesen

Objekterkennung auf Oktoberfest-Niveau

Das Wiener Startup MoonVision liefert mit seiner Plattform...

Weiterlesen

Digitaler Arbeitsplatz: Wie man den Weg dorthin erfolgreich meistert

Im Meeting-Raum verbringen Mitarbeiter in der Regel mehr als...

Weiterlesen

KI im Kundenservice

Es gibt weiterhin signifikante Unterschiede zwischen...

Weiterlesen

KI: Wer lernt von wem?

In der Reihe "Homo Digitalis – Leben in der technisierten...

Weiterlesen

Das Netzwerk sieht alles

Was haben moderne Netzwerke mit Gehirnen, heißen Herdplatten...

Weiterlesen

Mit Neuronen auf Cybergangsterjagd

In der Cybersicherheits-Branche wird der Begriff "Machine...

Weiterlesen

KI: Beim Arzt hui, sonst pfui

Ein interessantes Ergebnis förderte eine Untersuchung des...

Weiterlesen

Was bedeutet KI für Cybersecurity?

Künstliche Intelligenz und Machine Learning liegen auch im...

Weiterlesen

Porsche beteiligt sich an KI-Start-up Anagog

Die Porsche Digital GmbH hat eine Minderheitsbeteiligung am...

Weiterlesen

Fachkräftemangel in Sachen Cybersicherheit – Fünf Ansätze

Gerade im Bereich Cybersicherheitsanalytik und -betrieb...

Weiterlesen

Smartphone als Porsche-Gehirn

Auf dem MWC 2018 zeigt Huawei, wie das Mate10 Pro einen...

Weiterlesen

KI als Security-Hilfsarbeiter

Vectra hat sich auf den Einsatz von künstlicher Intelligenz...

Weiterlesen

Dressierter Computerwurm balanciert

Computerprogramm oder lebendiges Wesen? An der TU Wien...

Weiterlesen