Gastartikel – Ingo Nader, The unbelievable Machine Company

Wie KI am Beispiel von Bilderkennung funktioniert

Bild: The unbelievable Machine Company
Ingo Nader ist Senior Data Scientist bei The unbelievable Machine Company in Wien.
Bild: The unbelievable Machine Company

Das Interesse an Artificial Intelligence (AI) nimmt stetig zu – Siri, Alexa oder Google Assistant aber auch das Übersetzungsprogramm DeepL sind beste Beispiele dafür. Sie erleichtern bereits heute unseren Alltag in vielen Aspekten. Wie Bilderkennung mittels Deep Learning funktioniert erklärt Ingo Nader, Senior Data Scientist bei The unbelievable Machine Company.

Deep Learning ist eine Form von AI, die in den letzten Jahren stark an Popularität gewonnen hat. Die hohe Verfügbarkeit von Daten und die steigende Rechenleistung haben es ermöglicht, die Komplexität neuronaler Netze um ein Vielfaches zu erhöhen. Das Erkennen von komplexen Strukturen in Bildern und Sprache zählt zu den Stärken von Deep Learning. Es überrascht also nicht, dass Deep Learning daher vor allem bei Spracherkennung, automatisierter Übersetzung, und auch beim autonomen Fahren eingesetzt wird. Im Prinzip lernt der Algorithmus eine Funktion (eine Art Übersetzung; das eigentliche Modell), die die Eingangsdaten wie Bilder oder Audioclips in ein Ergebnis übersetzt. Dieses kann beispielsweise eine Beschreibung eines Bildes, erkannter Text, oder eine Klassifizierung eines Bildes sein.

Deep Learning ist nicht mit menschlichem Lernen vergleichbar 

Zwar sind neuronale Netze von Neuronen im menschlichen Gehirn inspiriert, haben aber in der Praxis nichts damit zu tun. Während der Mensch nur wenige Eindrücke benötigt, um daraus zu lernen, basiert Deep Learning auf einer sehr großen Anzahl von Beispielen. Außerdem ist es nicht in der Lage, zu generalisieren oder zu abstrahieren. Beispielsweise würde ein Modell, das auf Fotos von Sesseln trainiert wurde, eine Zeichnung eines Sessels vermutlich nicht als solchen erkennen. Ein weiterer Punkt ist die Nachvollziehbarkeit. Ohne zusätzliche Maßnahmen ist es schwierig zu verstehen, warum das Modell zu einer speziellen Entscheidung kommt – man spricht von einer Black Box. Für viele unternehmenskritische Prozesse ist diese Nachvollziehbarkeit unerlässlich. Wenn man diese Limitierungen kennt und bedenkt, ist es allerdings ein sehr mächtiges Werkzeug für eine Vielzahl an Unternehmensaufgaben.

Wie Bilderkennung zu verstehen ist

Um die Klassifizierung von Bildern nachvollziehbar zu machen kann beispielsweise die Aktivierung bestimmter Ebenen des neuronalen Netzes in einer Heatmap visualisiert werden, und zwar mittels "gradient-weighted class activation mapping" (Grad-CAM). Anhand der Heatmap kann man erkennen, welche Teile des Bildes das neuronale Netzwerk zur Identifizierung genutzt hat. Im oben gezeigten Beispiel mit dem Elefanten ist gut zu erkennen, wie besonders die Region um das Ohr dazu beigetragen hat, dass das Modell zum Schluss kam, dass es sich wohl um einen afrikanischen Elefanten handeln muss. Auf diese Weise wird nachvollziehbar, warum eine Identifikation erfolgreich oder fehlerhaft ist. Mit den entsprechenden Werkzeugen muss ein neuronales Netzwerk also keine Black Box sein, sondern wird erklärbar und seine Entscheidungen werden nachvollziehbar. In dem Fall spricht man von Whitebox AI.

Lernende Ebenen  

Ein neuronales Netz besteht aus vielen sogenannten Ebenen, wovon jede mathematische Funktionen erlernt und bestimmte Filter anwendet. So sprechen die ersten Ebenen des Netzes beispielsweise auf sehr einfache Dinge, wie bestimmte Farben oder Kanten in bestimmten Winkeln auf den Bildern an. Die darauffolgenden Ebenen bauen auf diesen einfachen Merkmalen auf und setzen sie zu komplexeren Features zusammen. So können in tieferen Schichten dann Ecken, Kreise und später Augen oder Gesichtsteile erkannt werden. Je tiefer die Ebene, desto spezialisierter sind die erlernten Features. 

Konkrete Einsatzbereiche 

Diese Methode kann für viele Anwendungsbereiche eingesetzt werden. So kann Bilderkennung beispielsweise zur Erlernung von Typenbezeichnungen von Bauteilen genutzt werden, damit diese Informationen dann schnell einem Techniker zur Verfügung gestellt werden können. Ebenso kann über Deep Learning anhand von Abnutzungserscheinungen eines Bauteiles feststellen, wann der optimale Zeitpunkt für eine Wartung ist, um so Standzeiten zu minimieren. Voraussetzung ist immer, dass die Daten in entsprechender Menge und Qualität vorliegen, um ein solches Modell trainieren zu können. Artificial Intelligence ist also kein Mysterium, denn so komplex die Modelle auch sein mögen, so ist es doch möglich, sie zu verstehen und ihre Entscheidungen nachvollziehbar zu machen.

Ingo Nader arbeitet als Senior Data Scientist für die The unbelievable Machine Company und führt dabei verschiedenste nationale und internationale Projekte im Bereich Machine Learning und Data Science durch.

Weitere Artikel

Digitale Zwillinge werden Realität

PLM-Systeme liefern historische Daten, auf Basis derer ein…

Weiterlesen

KI in Forschung und Entwicklung

Egal, in welcher Branche man sich umhört – der Einsatz…

Weiterlesen
 © BRZ_Klaus Vyhnalek

„Blick aus User-Sicht ist entscheidend“

Das BRZ ist ein wichtiger Partner in der weiteren…

Weiterlesen

Die Zukunft aller Digitalisierungsprojekte

Der digitale Zwilling ist der Grundpfeiler aller…

Weiterlesen
Credit: SEPPmail-Deutschland

Land Oberösterreich setzt auf E-Mail-Verschlüsselung von SEPPmail

Die E-Mail ist im Verwaltungsalltag in Organisationen und…

Weiterlesen
Credit: Jana Krippel

Mehr als ein Jahr DSGVO: Ist der Sturm vorübergezogen?

Die Einführung der neuen DSGVO-Richtlinien vor etwas mehr…

Weiterlesen
Credit: Michael Dürr

„Es kann jedem passieren“

Markus Endres und Aleksandar Lacarak, Mitbegründer des…

Weiterlesen
Credit: Syngroup

Digitaler Schub

Die digitale Transformation benötigt in vielen Bereichen…

Weiterlesen
Grafik: Verlag Holzhausen GmbH

Integration der Zeitschrift "Monitor" in "Austria Innovativ"

Nach reiflicher Überlegung haben wir uns entschlossen, die…

Weiterlesen
Credit: Schulamt St. Pölten

Selfservice statt Zettelwirtschaft

Mit einer neuen Softwarelösung hat das Diözesan-Schulamt St.…

Weiterlesen
Credit: Fotalia

Die sichere Datenwolke

Die Cloud bietet viele Vorteile wie höhere Flexibilität zu…

Weiterlesen
Credit: A1 Digital

Über die technologische Seite hinaus denken

Die Digitalisierung nimmt in Österreich an Fahrt auf, weiß…

Weiterlesen
Foto: Universität Innsbruck

ERP Future Business 2019

Auf der Fachmesse stellen die teilnehmenden Anbieter von…

Weiterlesen
Bild: Eva Puella Photography

Markus Neumayr ab 2019 alleiniger Geschäftsführer

Zwanzig Jahre lang standen Firmengründer Univ.-Doz. Dr.…

Weiterlesen
Bild: UBIT

IKT Statusreport #4 zeigt akuten Handlungsbedarf

Konkrete Maßnahmen bei Informatikstudierenden und…

Weiterlesen
Bild: IGEL

Never change a winning team

Bei den Kursen des ICGEB in Triest kommen Studenten aus den…

Weiterlesen
Bild: NTT Security

5 Schritte für hohe Datensicherheit in der Cloud

Die Verlagerung von Geschäftsprozessen und Applikationen in…

Weiterlesen
Bild: CyberArk

DevOps-Risiken werden unterschätzt

Unternehmen nutzen verstärkt DevOps-Modelle für die…

Weiterlesen
Bild: presono/Anzhelika Kroiss

Ex-Microsoft Manager Keller wechselt zu presono

Lukas Keller geht als als neuer CEO zum 2015 in Linz…

Weiterlesen
Bild: Otago

Otago expandiert weiter

Bei der Wiener Online Consulting Agentur Otago stehen auch…

Weiterlesen